张云泉委员：整合力量研发国家“主权级大模型”

2024.3.09

在2024全国两会上，全国政协委员、中国科学院计算技术研究所研究员张云泉就发展国家“主权级大模型”话题接受了《中国科学报》的采访。

张云泉委员。受访者供图 ?

他提出，大模型是实现新质智能生产力的重要手段，但目前我国在大模型研发及用于大模型训练的国产AI芯片方面显著落后，国家应该主导整合优质科研和产业力量，尽快训练出我国的“主权级大模型”。

张云泉解释说，“主权级大模型”是一个动态概念，指代一定时期内最高水平的基础大模型，它的通用智能水平最高、对算力要求最高，是一个国家AI水平的体现。同时，基础大模型的技术水平也深刻影响着大模型技术在行业落地应用中的智能水平。

目前，国产大模型的训练受到多方面的限制，其中尤以算力限制最为突出。为解决这个问题，张云泉专门做了调研。经过研判，他提出：“除了继续攻关人工智能芯片之外，我们能不能聚合中国的超算，为大模型预训练提供算力支撑？”

张云泉告诉《中国科学报》，训练大模型需要的算力特点，如大规模并行技术、高速互联网络等技术手段，超算系统都具备。同时，中国有一批超算方面的科学研究和工程技术人才，组织好人才开展技术攻关，研制大模型专用超算体系是可行的。

“我认为可以通过设立专项，研制支撑主权级大模型训练的超级计算机，以解燃眉之急。”张云泉提出，研制这样的超算设施，成本会高一些，但它解决的是主权大模型有或无的问题。同时，也要“两条腿走路”——国内人工智能芯片的研制要跟上，取得了突破后成本自然就会降下来。

他还提到，当前国产AI芯片的研发缺乏系统规划，各家各自为战，无法形成合力，这可能会延误高端国产AI芯片的进程。他建议国家相关部门应在顶层设计层面加以引导。

谈及希望上升到国家高度做这件事的原因，张云泉说，他注意到，国内一些企业倾向于使用国外的开源架构开发大模型，容易出现“重复造轮子”与“急于变现”的倾向，长此以往“容易错过原始创新”，还会延误主权级大模型的研发。

分析测试百科网