关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者4243人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

世上没有免费的豆包

光子星球 浏览 891

凯恩:若卡尔继续表现出色,他绝对有机会为德国队踢世界杯

懂球帝 浏览 4054

限量3000台 广汽本田新飞度焕新价6.68万

网易汽车 浏览 3203

3岁女童16楼走道坠亡 父母起诉开发商、物业索赔51万

红星新闻 浏览 16631

激光雷达上车 比亚迪新款海豹06EV申报图曝光

网易汽车 浏览 3222

都灵主帅:我很尊重斯帕莱蒂,我们必须带着创造历史的信念比赛

懂球帝 浏览 3964

"周生生挂坠金含量争议"最新进展:挂坠已封存送检

极目新闻 浏览 87019

加拿大新外长就任后首次访华 外交部回应

新京报政事儿 浏览 9429

史上最强量产"911" 保时捷911 Turbo S 亚洲首秀

网易汽车 浏览 3952

上年纪的女人买“上衣”:避开3个坑,这样选时髦又显气质

静儿时尚达人 浏览 3023

限时售9.29万起 第五代瑞虎8正式上市

网易汽车 浏览 3906

在桃浦,解锁未来发展无限可能

上观新闻 浏览 3400

赵继伟伤退,广东击败辽宁,与浙江会师男篮决赛!

体坛周报 浏览 4012

官方:利雅得新月签下佛罗伦萨后卫巴勃罗-马里

懂球帝 浏览 3290

女子被判向出轨丈夫公开道歉15天 道歉视频引万人围观

大风新闻 浏览 13910

2025年热销的十款新能源车 卖得好真不是靠吹牛?

汽车天涯 浏览 3086

Meta裁员后续:田渊栋被过河拆桥,姚顺雨等集体「抢人」

机器之心Pro 浏览 4051

肖战官宣微博之夜!红西装造型要复刻?

孤城落日 浏览 2985

看来看去还是这些穿搭最高级,不老套、不死板,舒适又显气质

静儿时尚达人 浏览 2299

AI录音设备大混战

华尔街见闻官方 浏览 3038

张馨予减肥致体质差,170身高仅百斤两月发烧三次

把喜欢都给他 浏览 2900
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1