中科曙光与海光信息成功适配DeepSeek V3和R1模型，推动国产化进程

2025-02-07 09:41:35 阅客

2月4日，中科曙光国家先进计算产业创新中心有限公司宣布，海光信息技术团队已成功完成DeepSeek V3和R1模型与海光DCU（深度计算单元）的国产化适配，并正式上线。这一突破标志着国产AI技术在高性能计算领域取得新的进展，为行业客户提供了更强大的AI加速计算方案。

DeepSeek V3和R1模型采用Transformer架构，融合了Multi-Head Latent Attention（MLA）和DeepSeek MoE两项核心技术。MLA通过减少KV缓存，有效降低内存占用，提高推理效率，使模型在处理大规模数据时更高效地利用计算资源，减少计算延迟。

中科曙光与海光信息成功适配DeepSeek V3和R1模型，推动国产化进程

DeepSeek MoE则借助辅助损失（auxiliary loss）实现专家负载的智能均衡，进一步优化模型性能。该机制确保各专家单元的计算任务均衡分布，从而提升整体推理能力和响应速度，使模型更加稳定高效。

中科曙光与海光信息成功适配DeepSeek V3和R1模型，推动国产化进程

海光DCU是海光信息推出的高性能GPGPU架构AI加速卡，旨在提供自主可控的全精度通用AI加速计算方案。该产品已在科教、金融、医疗、政务和智算中心等多个领域实现大规模应用，为行业客户提供强大计算支持。