关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西11349人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

佟丽娅晒海滩美照化身执灯少女超温柔

深剖娱乐圈浏览 19940

＂农妇卖150份粉蒸肉被判赔5万＂案最新进展：撤销原判

澎湃新闻浏览 76055

澎湃读报丨央媒刊文追忆杨振宁先生：心系家国，功在世界

澎湃新闻浏览 901

疫苗为何打在胳膊而不是屁股上？打针一边可以分为四类

趣看热点浏览 25505

冬天别总只穿“羽绒服”，试试这些日常穿搭，简单舒适显身材

静儿时尚达人浏览 180

滴滴自动驾驶不甘落后

虎嗅APP 浏览 1010

年底是购车黄金期吗？看懂购置税博弈再下订不迟！

百姓评车浏览 799

AI眼镜，大厂第一战

脑极体浏览 273

年末无风险收益逐渐在提升，明年市场流动性或有变

Wind万得浏览 12809

安踏强势反腐背后毛利率下滑营销、采购是重灾区

21世纪经济报道浏览 1566

全系四驱/全新三电/全套华为岚图追光L开启预订

网易汽车浏览 1480

俄媒：乌军侦察小组渗透进入俄别尔哥罗德州实施破坏行动

参考消息浏览 17133

36岁张馨予携母亲看日落，56岁妈妈比女儿还时髦

娱絮浏览 14551

古二录音被忽略的细节！秦雯闺蜜歧视妇女，业内编剧还在嫌弃观众

萌神木木浏览 641

新款奥迪Q7到店，换装“新脸”还带“黑武士”装扮，外观更帅气

闻车品百魅浏览 10765

新、旧“瑞幸”之争

21世纪经济报道浏览 16665

牛弹琴：香港经历不眠之夜对罕见火灾有两个＂没想到＂

北京日报客户端浏览 29985

百色＂锅底＂村庄积水不退村民:明年不想再种地白费劲

澎湃新闻浏览 3788

陈思诚现身佟丽娅新片首映大赞前妻漂亮有演技

娱絮浏览 14523

中俄最后一刻没保住伊朗制裁重启哈梅内伊政权危险了

文雅笔墨浏览 33519

赛琳娜或退出歌坛！自曝红斑狼疮还需药物控制

文艺圈娱乐号浏览 12927

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

山东舰现身吕...

66岁安帅径...

俄罗斯发动空...

求求你，别再...

中国驻英国使...

抖音提出AI...

美媒：美财政部长耶伦计划7月初访问北京

淘宝闪购参战、AI化改造加速，第17个双11，天猫有了新方向

小白鞋下岗了这双鞋才是今夏最洋气穿搭！

佟丽娅晒海滩美照化身执灯少女超温柔

＂农妇卖150份粉蒸肉被判赔5万＂案最新进展：撤销原判

澎湃读报丨央媒刊文追忆杨振宁先生：心系家国，功在世界

疫苗为何打在胳膊而不是屁股上？打针一边可以分为四类

冬天别总只穿“羽绒服”，试试这些日常穿搭，简单舒适显身材

滴滴自动驾驶不甘落后

年底是购车黄金期吗？看懂购置税博弈再下订不迟！

AI眼镜，大厂第一战

年末无风险收益逐渐在提升，明年市场流动性或有变

安踏强势反腐背后毛利率下滑营销、采购是重灾区

全系四驱/全新三电/全套华为岚图追光L开启预订

俄媒：乌军侦察小组渗透进入俄别尔哥罗德州实施破坏行动

36岁张馨予携母亲看日落，56岁妈妈比女儿还时髦

古二录音被忽略的细节！秦雯闺蜜歧视妇女，业内编剧还在嫌弃观众

新款奥迪Q7到店，换装“新脸”还带“黑武士”装扮，外观更帅气

新、旧“瑞幸”之争

牛弹琴：香港经历不眠之夜对罕见火灾有两个＂没想到＂

百色＂锅底＂村庄积水不退村民:明年不想再种地白费劲

陈思诚现身佟丽娅新片首映大赞前妻漂亮有演技

中俄最后一刻没保住伊朗制裁重启哈梅内伊政权危险了

赛琳娜或退出歌坛！自曝红斑狼疮还需药物控制

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

山东舰现身吕...

66岁安帅径...

俄罗斯发动空...

求求你，别再...

中国驻英国使...

抖音提出AI...

美媒：美财政部长耶伦计划7月初访问北京

淘宝闪购参战、AI化改造加速，第17个双11，天猫有了新方向

小白鞋下岗了 这双鞋才是今夏最洋气穿搭！

佟丽娅晒海滩美照 化身执灯少女超温柔

＂农妇卖150份粉蒸肉被判赔5万＂案最新进展：撤销原判

澎湃读报丨央媒刊文追忆杨振宁先生：心系家国，功在世界

疫苗为何打在胳膊而不是屁股上？打针一边可以分为四类

冬天别总只穿“羽绒服”，试试这些日常穿搭，简单舒适显身材

滴滴自动驾驶不甘落后

年底是购车黄金期吗？看懂购置税博弈再下订不迟！

AI眼镜，大厂第一战

年末无风险收益逐渐在提升，明年市场流动性或有变

安踏强势反腐背后 毛利率下滑 营销、采购是重灾区

全系四驱/全新三电/全套华为 岚图追光L开启预订

俄媒：乌军侦察小组渗透进入俄别尔哥罗德州实施破坏行动

36岁张馨予携母亲看日落，56岁妈妈比女儿还时髦

古二录音被忽略的细节！秦雯闺蜜歧视妇女，业内编剧还在嫌弃观众

新款奥迪Q7到店，换装“新脸”还带“黑武士”装扮，外观更帅气

新、旧“瑞幸”之争

牛弹琴：香港经历不眠之夜 对罕见火灾有两个＂没想到＂

百色＂锅底＂村庄积水不退 村民:明年不想再种地 白费劲

陈思诚现身佟丽娅新片首映 大赞前妻漂亮有演技

中俄最后一刻没保住伊朗 制裁重启哈梅内伊政权危险了

赛琳娜或退出歌坛！自曝红斑狼疮还需药物控制

小白鞋下岗了这双鞋才是今夏最洋气穿搭！

佟丽娅晒海滩美照化身执灯少女超温柔

安踏强势反腐背后毛利率下滑营销、采购是重灾区

全系四驱/全新三电/全套华为岚图追光L开启预订

牛弹琴：香港经历不眠之夜对罕见火灾有两个＂没想到＂

百色＂锅底＂村庄积水不退村民:明年不想再种地白费劲

陈思诚现身佟丽娅新片首映大赞前妻漂亮有演技

中俄最后一刻没保住伊朗制裁重启哈梅内伊政权危险了