关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11349人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

佟丽娅晒海滩美照 化身执灯少女超温柔

深剖娱乐圈 浏览 19940

"农妇卖150份粉蒸肉被判赔5万"案最新进展:撤销原判

澎湃新闻 浏览 76055

澎湃读报丨央媒刊文追忆杨振宁先生:心系家国,功在世界

澎湃新闻 浏览 901

疫苗为何打在胳膊而不是屁股上?打针一边可以分为四类

趣看热点 浏览 25505

冬天别总只穿“羽绒服”,试试这些日常穿搭,简单舒适显身材

静儿时尚达人 浏览 180

滴滴自动驾驶不甘落后

虎嗅APP 浏览 1010

年底是购车黄金期吗?看懂购置税博弈再下订不迟!

百姓评车 浏览 799

AI眼镜,大厂第一战

脑极体 浏览 273

年末无风险收益逐渐在提升,明年市场流动性或有变

Wind万得 浏览 12809

安踏强势反腐背后 毛利率下滑 营销、采购是重灾区

21世纪经济报道 浏览 1566

全系四驱/全新三电/全套华为 岚图追光L开启预订

网易汽车 浏览 1480

俄媒:乌军侦察小组渗透进入俄别尔哥罗德州实施破坏行动

参考消息 浏览 17133

36岁张馨予携母亲看日落,56岁妈妈比女儿还时髦

娱絮 浏览 14551

古二录音被忽略的细节!秦雯闺蜜歧视妇女,业内编剧还在嫌弃观众

萌神木木 浏览 641

新款奥迪Q7到店,换装“新脸”还带“黑武士”装扮,外观更帅气

闻车品百魅 浏览 10765

新、旧“瑞幸”之争

21世纪经济报道 浏览 16665

牛弹琴:香港经历不眠之夜 对罕见火灾有两个"没想到"

北京日报客户端 浏览 29985

百色"锅底"村庄积水不退 村民:明年不想再种地 白费劲

澎湃新闻 浏览 3788

陈思诚现身佟丽娅新片首映 大赞前妻漂亮有演技

娱絮 浏览 14523

中俄最后一刻没保住伊朗 制裁重启哈梅内伊政权危险了

文雅笔墨 浏览 33519

赛琳娜或退出歌坛!自曝红斑狼疮还需药物控制

文艺圈娱乐号 浏览 12927
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1