关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西11344人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

俄官宣“末日鱼雷”完成核动力试验

环球网资讯浏览 700

闻泰科技回应：个别外籍高管试图颠覆公司治理结构

澎湃新闻浏览 4468

香港财政司考虑放宽首套房贷，地产界称有助于刺激中低楼价市场

环球网资讯浏览 16438

特朗普称赞高市：如果安倍知道你当首相肯定非常高兴

第一财经资讯浏览 10935

奔四奔五的女人，建议冬季掌握这些不费力的穿搭，又轻松又显气质

Yuki时尚酱浏览 13189

男子称爷爷坟里埋了200万女友给他272万发现其是老赖

潇湘晨报浏览 4635

被伪装快递盒炸伤女主播:嫌犯称准备16万彩礼想处对象

极目新闻浏览 3822

10月车企交付数据汇总：小米小鹏均超4万，零跑破7万

三言科技浏览 700

真正的三分大赛？全明星赛两队投进67记三分利拉德&哈利合计21记

直播吧浏览 12413

汪小菲现身张兰直播间妈妈为他系扣子笑容幸福

网易娱乐浏览 19126

外媒：俄国防部称击溃一支乌克兰特种部队

环球网资讯浏览 723

万亿美元豪赌，Open AI创始人：泡沫化的故事很诱人

21世纪经济报道浏览 920

切尔西本赛季英超10名不同球员破门，与阿森纳并列最多

懂球帝浏览 830

以色列和哈马斯代表团将于5日在埃及举行间接会晤

国际在线浏览 990

唐嫣分居风波后首露面，穿西装出席女性对话会，男方IP显示北京

萌神木木浏览 780

中东壕客下单：先订600台！飞行汽车海外最大订单来了

南方都市报浏览 988

湖南这一夜，郭碧婷的“水桶腰大饼脸”，是对内娱畸形审美的反击

娱乐圈笔娱君浏览 12702

肖战杨紫空降热搜第一，网传两人一起吃饭，疑似恋情引热议

扒虾侃娱浏览 12583

首个有期徒刑正式宣判，恒大、中植“关键人”一个都跑不了！

深蓝财经浏览 629

中恒电气：两款旗舰产品发布，重新定义AI数据中心供电技术标准

览富财经网浏览 709

又添新身份!人气带货主播李佳琦增补为上海青联委员

趣看热点浏览 25972

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

加密货币跌势...

＂太子集团＂...

美伊换囚成行...

本-福斯特谈...

杨怡携家人去...

欧洲对美方＂...

马克龙称瓦格纳事件反映俄军队脆弱遭扎哈罗娃回怼

宋祖儿背31万奢侈包逛街遭遇路人直指“偷税”，淡定自若成焦点

50+女性秋日别瞎打扮，这3招让你告别油腻感，优雅好气质

俄官宣“末日鱼雷”完成核动力试验

闻泰科技回应：个别外籍高管试图颠覆公司治理结构

香港财政司考虑放宽首套房贷，地产界称有助于刺激中低楼价市场

特朗普称赞高市：如果安倍知道你当首相肯定非常高兴

奔四奔五的女人，建议冬季掌握这些不费力的穿搭，又轻松又显气质

男子称爷爷坟里埋了200万女友给他272万发现其是老赖

被伪装快递盒炸伤女主播:嫌犯称准备16万彩礼想处对象

10月车企交付数据汇总：小米小鹏均超4万，零跑破7万

真正的三分大赛？全明星赛两队投进67记三分利拉德&哈利合计21记

汪小菲现身张兰直播间妈妈为他系扣子笑容幸福

外媒：俄国防部称击溃一支乌克兰特种部队

万亿美元豪赌，Open AI创始人：泡沫化的故事很诱人

切尔西本赛季英超10名不同球员破门，与阿森纳并列最多

以色列和哈马斯代表团将于5日在埃及举行间接会晤

唐嫣分居风波后首露面，穿西装出席女性对话会，男方IP显示北京

中东壕客下单：先订600台！飞行汽车海外最大订单来了

湖南这一夜，郭碧婷的“水桶腰大饼脸”，是对内娱畸形审美的反击

肖战杨紫空降热搜第一，网传两人一起吃饭，疑似恋情引热议

首个有期徒刑正式宣判，恒大、中植“关键人”一个都跑不了！

中恒电气：两款旗舰产品发布，重新定义AI数据中心供电技术标准

又添新身份!人气带货主播李佳琦增补为上海青联委员

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

加密货币跌势...

＂太子集团＂...

美伊换囚成行...

本-福斯特谈...

杨怡携家人去...

欧洲对美方＂...

马克龙称瓦格纳事件反映俄军队脆弱 遭扎哈罗娃回怼

宋祖儿背31万奢侈包逛街遭遇路人直指“偷税”，淡定自若成焦点

50+女性秋日别瞎打扮，这3招让你告别油腻感，优雅好气质

俄官宣“末日鱼雷”完成核动力试验

闻泰科技回应：个别外籍高管试图颠覆公司治理结构

香港财政司考虑放宽首套房贷，地产界称有助于刺激中低楼价市场

特朗普称赞高市：如果安倍知道你当首相 肯定非常高兴

奔四奔五的女人，建议冬季掌握这些不费力的穿搭，又轻松又显气质

男子称爷爷坟里埋了200万 女友给他272万发现其是老赖

被伪装快递盒炸伤女主播:嫌犯称准备16万彩礼想处对象

10月车企交付数据汇总：小米小鹏均超4万，零跑破7万

真正的三分大赛？全明星赛两队投进67记三分 利拉德&哈利合计21记

汪小菲现身张兰直播间 妈妈为他系扣子笑容幸福

外媒：俄国防部称击溃一支乌克兰特种部队

万亿美元豪赌，Open AI创始人：泡沫化的故事很诱人

切尔西本赛季英超10名不同球员破门，与阿森纳并列最多

以色列和哈马斯代表团将于5日在埃及举行间接会晤

唐嫣分居风波后首露面，穿西装出席女性对话会，男方IP显示北京

中东壕客下单：先订600台！飞行汽车海外最大订单来了

湖南这一夜，郭碧婷的“水桶腰大饼脸”，是对内娱畸形审美的反击

肖战杨紫空降热搜第一，网传两人一起吃饭，疑似恋情引热议

首个有期徒刑正式宣判，恒大、中植“关键人”一个都跑不了！

中恒电气：两款旗舰产品发布，重新定义AI数据中心供电技术标准

又添新身份!人气带货主播李佳琦增补为上海青联委员

马克龙称瓦格纳事件反映俄军队脆弱遭扎哈罗娃回怼

特朗普称赞高市：如果安倍知道你当首相肯定非常高兴

男子称爷爷坟里埋了200万女友给他272万发现其是老赖

真正的三分大赛？全明星赛两队投进67记三分利拉德&哈利合计21记

汪小菲现身张兰直播间妈妈为他系扣子笑容幸福