关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者603人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

跟朱珠和张嘉倪学保养妙招 姐姐同款太好用了

每天只种一棵草 浏览 19213

骗取生育保险基金,主犯获刑十年!国家医保局曝光典型案例

环球网资讯 浏览 971

老人疑因吸氢气死亡:养生馆吸氢机卖4万 宣称可抗癌

潇湘晨报 浏览 84853

年过四十岁的女人,夏天多穿这些“过膝裙”,越老越气质优雅

静儿时尚达人 浏览 11136

美国否认参与伊朗爆炸事件

财联社 浏览 12897

夏日多巴胺演出现场,年轻人喜欢看的我们都有!

网易娱乐 浏览 16419

40万买纯电MPV,还送你一棵万元名树?

Autolab 浏览 10628

吹不动了!美职联官推崩溃,网友求梅西放水,名嘴:足坛奥本海默

我爱英超 浏览 14607

男子被忽悠贷款买车跑物流 公司跑了车被扣贷款甩不掉

潇湘晨报 浏览 74553

中年女性发型不能太随意 试试锁骨发和过肩卷发

成铭聊发型 浏览 17111

美官员谈布林肯访华:并不期待长长的可交付成果清单

环球网资讯 浏览 89666

特朗普与普京长时间通话 “会晤”与“战斧”成话题

极目新闻 浏览 912

细节优化,2025款大众高尔夫GTI实车图像曝光

天天汽车 浏览 12564

磁浮底盘/全铝车身 凯迪拉克新CT6上市28.99万起

网易汽车 浏览 841

小波特:我们需要所有人都能出战 这样化学反应才能达到最佳

直播吧 浏览 19115

浙江一家三口全部过世 留下的百万遗产确定继承人了

每日经济新闻 浏览 90495

雪花丨诗一首

正经社 浏览 805

亚马尔和网红参加节目时说皇马偷窃还抱怨,皮克表示同意

懂球帝 浏览 828

新基金业绩大分化

国际金融报 浏览 925

奥尼尔:投3分真太TMD爽了 羡慕现在的中锋 我打球时教练根本不让

直播吧 浏览 10818

入春后发现:上海满大街都是“奶奶西装、奶奶鞋”,洋气又时髦

潮人志Fashion 浏览 11583
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1