关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11344人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄官宣“末日鱼雷”完成核动力试验

环球网资讯 浏览 700

闻泰科技回应:个别外籍高管试图颠覆公司治理结构

澎湃新闻 浏览 4468

香港财政司考虑放宽首套房贷,地产界称有助于刺激中低楼价市场

环球网资讯 浏览 16438

特朗普称赞高市:如果安倍知道你当首相 肯定非常高兴

第一财经资讯 浏览 10935

奔四奔五的女人,建议冬季掌握这些不费力的穿搭,又轻松又显气质

Yuki时尚酱 浏览 13189

男子称爷爷坟里埋了200万 女友给他272万发现其是老赖

潇湘晨报 浏览 4635

被伪装快递盒炸伤女主播:嫌犯称准备16万彩礼想处对象

极目新闻 浏览 3822

10月车企交付数据汇总:小米小鹏均超4万,零跑破7万

三言科技 浏览 700

真正的三分大赛?全明星赛两队投进67记三分 利拉德&哈利合计21记

直播吧 浏览 12413

汪小菲现身张兰直播间 妈妈为他系扣子笑容幸福

网易娱乐 浏览 19126

外媒:俄国防部称击溃一支乌克兰特种部队

环球网资讯 浏览 723

万亿美元豪赌,Open AI创始人:泡沫化的故事很诱人

21世纪经济报道 浏览 920

切尔西本赛季英超10名不同球员破门,与阿森纳并列最多

懂球帝 浏览 830

以色列和哈马斯代表团将于5日在埃及举行间接会晤

国际在线 浏览 990

唐嫣分居风波后首露面,穿西装出席女性对话会,男方IP显示北京

萌神木木 浏览 780

中东壕客下单:先订600台!飞行汽车海外最大订单来了

南方都市报 浏览 988

湖南这一夜,郭碧婷的“水桶腰大饼脸”,是对内娱畸形审美的反击

娱乐圈笔娱君 浏览 12702

肖战杨紫空降热搜第一,网传两人一起吃饭,疑似恋情引热议

扒虾侃娱 浏览 12583

首个有期徒刑正式宣判,恒大、中植“关键人”一个都跑不了!

深蓝财经 浏览 629

中恒电气:两款旗舰产品发布,重新定义AI数据中心供电技术标准

览富财经网 浏览 709

又添新身份!人气带货主播李佳琦增补为上海青联委员

趣看热点 浏览 25972
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1