北大张牧涵团队依托昇腾突破推理效率瓶颈大模型推理百万tokens 成本仅 1 元

2025-07-28 17:01:29 来源：今日热点网

小大

在人工智能领域，大语言模型的训练与推理成本一直是限制技术普及的关键因素之一。近日，北京大学人工智能研究院助理教授张牧涵团队在鲲鹏昇腾科教创新卓越中心（简称“卓越中心”）提供的算力支持下，成功研发出一套高效的大模型训练推理架构，实现了百万tokens输入成本低至1元，为产业提供了高效能、低成本的解决方案。

此研究成果包括三项关键技术创新。首先，目前广泛使用的相对位置编码存在较大的稀疏性，团队通过将每个注意力头中的位置信息和非位置信息分离，对位置编码进行了低秩压缩，仅使用3%的位置信息，即可维持原有表达能力。该方法通过优化昇腾硬件的flash-attention算子，使得注意力头的参数得到更高效利用。

第二，非位置编码信息在原始模型中通常处于被抑制状态。通过将位置编码与非位置编码分离，非位置编码得到了较大的压缩空间。团队采用了联合KV的低秩压缩方法，仅保留12.5%的KV Cache即可维持原始模型的能力。这一方法能够有效利用昇腾硬件高效的计算能力，减轻访存压力，显著提升推理效率。

最后，基于昇腾硬件在出色的并行计算能力，团队实现的Recurrent Decoding（RD）技术通过替换LM-head提升了训练数据利用率并加速了推理。在训练阶段，RD通过将解码出的多个tokens与target tokens进行对比，实现了训练数据的高效利用；在推理阶段，结合投机推理显著提高了tokens的采样通过率，进而提升了推理速度。

这一成果得到了学术界的广泛关注，不仅为科研提供了可复用的高效架构，也为AI大模型在企业中的应用大幅降低了成本。自去年6月成立以来，北京大学与华为在产业前沿课题的联合攻关持续推进，本次成果验证了昇腾算力平台支撑尖端科研的技术实力。卓越中心将继续深入开展大模型关键技术创新，为构建中国技术生态提供坚实支撑。

责任编辑：kj005

文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com

关键词：

中华网家电

北大张牧涵团队依托昇腾突破推理效率瓶颈大模型推理百万tokens 成本仅 1 元

高盛西湖智谷引进国家级专精特新“”小巨人“”落户惠州惠城

中兴通讯坚持算力与网络双轮驱动，深耕关键技术实现千亿营收

研祥金码实力开挂！破解汽车制造四大工艺读码盲区

匠心筑梦技赢未来！深圳市首届流体装卸操作工技能竞赛决赛圆满落幕

研祥智能SPC-8271C：电力设备圈“卷王”，重塑实力标杆！

当玉米搅团遇上国际味蕾：西农学子以食为媒架起文化桥

相关新闻

2025日本NMN哪个牌子效果好？小石丸黑科技助力体质抗衰

美妆新趋势下，宫芙如何以“黑马”之姿覆盖全圈层消费者？

超云发布R2425存储服务器：以全栈自研引领国产存储新方向

【健康分享】屁股上长的“火疖子”，为什么又痛又难搞？

“决战四季度冲刺全年红” 中国化学成达公司召开劳动竞赛启动会

圣奥科技：以绿色智能领跑行业，携全球伙伴共筑办公家具新生态

国家全文强制性标准《厂区工业设备和管道工程通用规范（送审稿）》审查会在中国化学成达公司成功召开

菜鸟无忧袁军中国网教育峰会发表主题演讲：以“科技+专业”双擎驱动重构大学生就业服务新范式

中国化学成达公司2025年“质量月”活动圆满收官

葵花药业加速“两翼”战略布局生物制药与化药创新取得新进展

家电推荐

家电图片

中兴通讯坚持算力与网络双轮驱动，深耕关键技术实现千亿营收

研祥金码实力开挂！破解汽车制造四大工艺读码盲区

匠心筑梦技赢未来！深圳市首届流体装卸操作工技能竞赛决赛圆满落幕

研祥智能SPC-8271C：电力设备圈“卷王”，重塑实力标杆！

当玉米搅团遇上国际味蕾：西农学子以食为媒架起文化桥

AI上岗，良率99%：华中日化巨头这样破解瓶身质检困局

新闻排行

双11品质之选：前行者旗舰产品限时特惠，高性能外设入手正当时

良品铺子团购年货节破局“有鲜有潮更有料”，干货满满年味足

碾压同类！伴鱼全链路 AI 私教凭硬核数据领跑

国际科研成果加速落地中国——细胞健康技术助力“健康中国2030”

飞阔科技颠覆行业：FLY·天璇系统让机器人舞蹈市场售价跌破百元

CeMAT 2025 | 一脑多态解锁AMR+具身智能新地图

六部委严选国家绿色数据中心互盟智算中心树立大湾区节能新标杆

胜利油田油气井下作业中心：他们把作业人的精气神凝成文化盛宴！

从“救火队”到“预言家”：HeroDash实时面板如何重塑客服实况管理

引领智能床垫进入L4时代喜临门aise宝褓成首家L4级智能AI床垫品牌

北大张牧涵团队依托昇腾突破推理效率瓶颈 大模型推理百万tokens 成本仅 1 元

相关新闻

家电推荐

家电图片

中兴通讯坚持算力与网络双轮驱动，深耕关键技术实现千亿营收

研祥金码实力开挂！破解汽车制造四大工艺读码盲区

匠心筑梦 技赢未来！深圳市首届流体装卸操作工技能竞赛决赛圆满落幕

研祥智能SPC-8271C：电力设备圈“卷王”，重塑实力标杆！

当玉米搅团遇上国际味蕾：西农学子以食为媒架起文化桥

AI上岗，良率99%：华中日化巨头这样破解瓶身质检困局

新闻排行

北大张牧涵团队依托昇腾突破推理效率瓶颈大模型推理百万tokens 成本仅 1 元

匠心筑梦技赢未来！深圳市首届流体装卸操作工技能竞赛决赛圆满落幕