4月7日从安徽省量子计算工程研究中心获悉,本源量子计算科技(合肥)股份有限公司、合肥综合性国家科学中心人工智能研究院等机构联合攻关,在我国超导量子计算机“本源悟空”真机上,实现十亿参数级AI大模型微调任务的全球首次运行。
实验结果显示,在参数量减少76%的前提下,训练效果反而提升8.4%。这一成果不仅验证了量子计算助力实现大模型轻量化的可行性,更为破解大模型“算力焦虑”开辟了新路径。
微调是指在通用大模型的基础上,通过进一步训练特定领域数据,使其适应医疗诊断、金融风控等专业场景。量子计算凭借其叠加态和纠缠态特性,可同时探索海量参数组合,提升大模型微调的效率。
本源量子计算科技(合肥)股份有限公司副总裁窦猛汉介绍,团队创新设计了“量子加权张量混合参数微调”,将模型权重转化为量子神经网络与张量网络混合架构,量子神经网络通过量子门操作提取高维非线性特征,张量网络则压缩参数规模。“就好比给经典模型装上了‘量子引擎’,让两者协同发力。”窦猛汉说。
实验数据显示,优化后的模型在心理咨询对话数据集(CPsyCountD)上训练损失降低15%,数学推理任务(R1-Distill-SFT)的严格准确率从68%提升至82%。
合肥综合性国家科学中心人工智能研究院副研究员陈昭昀说:“这是量子计算首次‘真机实战’大模型任务,证明现有硬件已能初步支撑大模型微调。”
“本源悟空”是目前我国先进的可编程、已交付超导量子计算机,已为全球139个国家超2300万人次提供量子算力云服务,完成35万个量子运算任务。