关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者865人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

华裔考生"美国高考"几乎拿下满分 被六大名校拒之门外

长安剑 浏览 89721

43岁悄悄结婚的胡歌,被女儿戳穿了真实处境

小娱乐悠悠 浏览 258

大众20亿美元建的充电网络,美国排名倒数第一

汽车商业评论杂志 浏览 12953

中国“十五五”:未来五年,世界剧变!

宋鸿兵 浏览 784

一人毁整部电影!《第二十条》里的“关系户”,演技看着让人难受

娱乐圈笔娱君 浏览 12730

发投入同比“八连增”,贝壳Q3财报研发投入增长13.2%

市值Observation 浏览 625

京东造车!刘强东有新玩法?

百姓评车 浏览 974

全球首家!速腾聚创(02498)全栈自研数字激光雷达芯片通过AEC-Q认证,技术断代领先

智通财经 浏览 995

一车三动力:五菱星光730电/油/插混动力配置公布,10月15日预售

IT之家 浏览 1057

情侣连续9年在千年古树下合影:18岁喜欢的人还在一起

潇湘晨报 浏览 6605

19岁女孩留学9天遭遇电诈后自杀 父亲:我女儿太善良了

极目新闻 浏览 20204

除了800V,新Model Y还要上7座!

1号车盟 浏览 12910

王家卫的《繁花》,害人不浅!

Yuki女人故事 浏览 13327

库科奇:在东契奇身上看到了自己年轻的时候 我俩打球方式类似

直播吧 浏览 14078

美威胁停买"中国油" 专家:或闹乌龙 为"废弃食用油"

环球时报新闻 浏览 4675

0.95马赫!全球最快在役公务飞机Global 8000交付

IT之家 浏览 63

恩里克:0-0通常让人觉得比赛沉闷,但今天完全不是这样

懂球帝 浏览 61

快讯|阿里国际站在欧美6国同步上线半托管

网易科技频道 浏览 12138

国家统计局:2023年全国房地产开发投资110913亿元 比上年下降9.6%

国家统计局 浏览 12803

菲戈和伊尔迪兹获2025地中海卓越奖,颁奖典礼于10月20日进行

懂球帝 浏览 915

人脸识别技术的“边界”究竟在哪?

看看新闻Knews 浏览 14219
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1