中科曙光与海光信息成功适配DeepSeek V3和R1模型,推动国产化进程
2025-02-07 09:41:35 阅客
2月4日,中科曙光国家先进计算产业创新中心有限公司宣布,海光信息技术团队已成功完成DeepSeek V3和R1模型与海光DCU(深度计算单元)的国产化适配,并正式上线。这一突破标志着国产AI技术在高性能计算领域取得新的进展,为行业客户提供了更强大的AI加速计算方案。
DeepSeek V3和R1模型采用Transformer架构,融合了Multi-Head Latent Attention(MLA)和DeepSeek MoE两项核心技术。MLA通过减少KV缓存,有效降低内存占用,提高推理效率,使模型在处理大规模数据时更高效地利用计算资源,减少计算延迟。
DeepSeek MoE则借助辅助损失(auxiliary loss)实现专家负载的智能均衡,进一步优化模型性能。该机制确保各专家单元的计算任务均衡分布,从而提升整体推理能力和响应速度,使模型更加稳定高效。
海光DCU是海光信息推出的高性能GPGPU架构AI加速卡,旨在提供自主可控的全精度通用AI加速计算方案。该产品已在科教、金融、医疗、政务和智算中心等多个领域实现大规模应用,为行业客户提供强大计算支持。