自主创新架构实现技术引领 京产大模型获世界互联网大会最高奖

11月6日晚,2025年世界互联网大会乌镇峰会上,大会最高奖项领先科技奖揭晓。总部位于北京的智谱公司与清华大学共同打造的“GLM大模型关键技术及规模化应用”获奖。

“只有从底层开始自主研发,才有机会‘摸高’与引领,获得更广阔的创新空间和更高的天花板。”智谱董事长刘德兵接受记者专访时说。

选择一条更难走的路

刘德兵介绍,GLM系列大模型研发之初,大模型还未在大众领域引爆关注。当时已在认知智能领域有多年积累的研发团队提出了基于自回归填空的通用预训练架构GLM。

这个决策并不简单。在当时,人工智能领域已有GPT为代表的国际同行所开拓的技术架构。跟随已有路线,前期研发成本更低、风险也更加可控。面对跟随主流路线的诱惑,团队基于清华的创新基因和团队对技术前景的判断,毅然选择了一条更难走的路。“在根本的技术路线上,我们选择了自主创新,而不是跟随。”刘德兵说。

这一自研框架通过引入掩码注意力机制,显著提升了模型的鲁棒性(即系统在面临内部结构或外部环境改变时也能维持其功能稳定运行的能力),降低模型“幻觉”产生率,模型理解复杂场景的能力和训练效率显著提高,并能更好地适配国产芯片架构。

2022年8月,智谱发布首款千亿级开源模型,很快在斯坦福大学评测中取得多个关键指标第一,成为亚洲唯一入选的模型。目前,智谱已推出的50余款模型中40余款开源,全球累计下载量超5000万次,其开源模型曾多次登顶GitHub、HuggingFace等国际开发平台热门榜单,在某些指标上超越同期国际知名模型。

“中国大模型具备全球竞争力”

技术与性能“摸高”的同时,自研路线也为GLM带来了落地应用优势。随着模型不断迭代,智谱搭建起高效、低成本的大模型应用。如今,智谱大模型关键技术已服务互联网、金融、政务、教育等20多个行业,日均API调用量超万亿次。

随着技术实力的提升,中国的大模型正逐步走向世界。近日,美国AI编程工具“第一梯队”Cursor和Windsurf宣布更新基座模型。随后,全球多地用户发现,在Cursor输出的代码中会频繁出现中文;Windsurf在回答用户提问时也明确表示其模型由中国“智谱AI”提供。记者从智谱获悉,Windsurf采用的新基座模型正是京产大模型GLM系列。此外,美国知名云平台Vercel、全球最大的AI推理芯片公司Cerebras等越来越多的海外科技公司也开始采用GLM系列模型。

“全球开发者正在选择他们认为最具性价比和技术实力的工具,中国的大模型已经具备全球竞争力。”刘德兵说,国内庞大的应用市场为模型迭代提供了最佳试验场,而坚定不移的开源战略有助于构建强大的生态护城河,包括智谱GLM在内的中国大模型在全球市场都展现出独特的竞争优势。

北京科创沃土培育AI领军者

回顾发展历程,刘德兵特别提到北京优越的科技创新环境对智谱的滋养。

“北京在人工智能领域的发展全国领先,智谱的快速成长正是得益于北京在人才、科研资源与政策支持等方面的综合优势。”刘德兵表示,清华大学等顶尖科研院校,为企业提供了坚实的人才与技术基础,并形成了活跃的学术与产业交流氛围。在政策层面,北京市持续加大对人工智能创新的支持力度,从算力资源、数据政策、应用落地鼓励机制等方面,为从事基础模型研发的企业提供了重要助力。

刘德兵分析,人工智能产业发展可分为基础模型研发和应用层创新两条主线。“应用层创新投入相对较低,但是门槛和护城河也相对较低;而基础模型的研发早期投入巨大,门槛较高,尤其需要政府在政策与资源上给予更长期、更稳定的支持。一旦在基础技术原始创新层面取得突破,将对现有的产业格局产生显著的引领作用。”他认为,北京正是在这一点上具备了显著协同优势,为智谱等坚持基础研发的企业持续提升智能上限提供了关键支撑。

针对大模型赋能生产力的“最后一公里”挑战,刘德兵认为,大模型在可靠性、行业适配和成本控制等方面仍需突破。特别是在金融、医疗、智能制造等领域,需要绝对的可信度,这要求模型厂商不仅要懂技术,还要懂行业。

展望蓬勃发展的人工智能产业,刘德兵表示,希望通过坚持大模型创新,实现“让机器像人一样思考”的愿景,用可信赖的AI让人类社会更美好。

世界互联网大会领先科技奖出炉

17个项目入选

11月6日,2025年世界互联网大会领先科技奖颁奖典礼在浙江乌镇举行。17个具有国际代表性的项目获奖,涵盖大模型、智联网、具身智能、量子计算等前沿领域。

据介绍,世界互联网大会领先科技奖是面向互联网领域的国际性科技奖项,旨在奖励全球年度最具领先性的互联网科技成果。今年共征集到来自34个国家和地区的400余项科技成果。

记者了解到,今年获奖的17个项目共分为3个类别,分别是基础研究组、关键技术组、工程研发组。其中,基础研究组获奖项目2个,分别为中国科学院计算技术研究所、中国科学院软件研究所的“启蒙:处理器芯片软硬件全自动设计”;清华大学的“忆阻器存算一体芯片器件及架构基础理论”。关键技术组获奖项目为10个,包括清华大学的“北斗三号卫星导航信号关键技术及应用”;中国电信等单位申报的“大众智能手机直连天通卫星系统的关键技术及规模应用”;清华大学、北京智谱公司的“GLM大模型关键技术及规模化应用”;百度公司的“剧本驱动多模协同的高拟真数字人技术”等。工程研发组获奖项目为5个,包括ALTORobotics公司申报的“实现制造业无缝自动化的创新方案NODE”;阿里云计算有限公司的“通义千问:开源开放的基础大模型”;中国科学院微小卫星创新研究院的“千帆星座卫星规模化研制”等。