关闭广告

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者770人阅读


这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.26313v1)。对于关心人工智能发展的普通读者来说,这项研究解决了一个听起来很技术但实际影响深远的问题:如何让AI更好地学习和泛化知识。

当我们教孩子学习时,有两种不同的方式。第一种是让孩子反复抄写标准答案,这就像传统的监督微调方法,孩子能够完美复制,但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索,从错误中学习,这就像强化学习,虽然过程曲折,但孩子最终能举一反三。研究团队发现,第二种方法之所以更有效,关键在于孩子是在"真实练习"中学习,而不是只从固定的教材中死记硬背。

基于这个洞察,研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来,既保持了第一种方法的高效性,又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会,而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国基站现身阿布扎比 可远程遥控远在珠海的无人艇

枢密院十号 浏览 92527

俄就黑海"撞机"事件向苏-27战机多名飞行员颁奖

环球网 浏览 19164

11个月来首次进球,丹尼-英斯结束32场进球荒

懂球帝 浏览 11815

男子吐槽一家医院"收费贵"遭起诉 被判"道歉并赔偿"

封面新闻 浏览 34151

即将重新服役的俄军航母 正面临"更严酷的挑战"

枢密院十号 浏览 19019

现场:马竞绝杀国米6连胜!甘当替补的格子同样出色

体坛周报 浏览 346

外媒:安世半导体已暂停向中国工厂供应晶圆

澎湃新闻 浏览 11708

曾炒到1600元/粒的"中药茅"大跌价 公司市值蒸发1800亿

每日经济新闻 浏览 6617

贾玲《热辣滚烫》宣传失误,评论区大批质疑,火速调整营销亲情

萌神木木 浏览 12424

全网最火的剧,竟然也翻车了

独立鱼 浏览 19574

赚走中国女人600亿 被官媒揭穿的"防晒衣"套路太深

金错刀 浏览 92300

俄罗斯核潜艇在北太平洋成功试射超音速巡航导弹

环球网资讯 浏览 1637

OpenAI ChatGPT自动切换严格模型处理情感话题,用户却不知情

IT之家 浏览 1487

做个绿色珠宝珍藏家,让可持续成为真正的珍贵

iWeekly周末画报 浏览 19485

乘客说好送还手机付20元反悔 司机送到18公里外派出所

上游新闻 浏览 75017

比赛日前瞻:中国女足迎出线生死战,曼联纽卡英联杯强强对话

懂球帝 浏览 13817

敛财4.49亿"老虎"王波被判死缓:长期对其子失管失教

政知新媒体 浏览 5622

卡霍夫卡大坝爆炸前后卫星对比图

环球网资讯 浏览 16624

央媒痛批辛巴封路,是谁给你这么大权力?

趣看热点 浏览 25831

61岁吴宗宪宣布即将退圈,9亿财产分配曝光,或一分不留给儿子

扒虾侃娱 浏览 12498

多位珠海市民称更换新表后燃气用量激增 珠海燃气回应

南方都市报 浏览 64269
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1