关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3780人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

英媒:意甲俱乐部在关注拉斯金,热刺和狼队也对其感兴趣

懂球帝 浏览 3811

61岁华西女教授创业冲刺港股IPO,估值超34亿元,腾讯、启明等参股

红星资本局 浏览 3141

唐一军16年敛财1.37亿获无期 曾通过妻子大搞权钱交易

界面新闻 浏览 9072

内塔尼亚胡:以色列将不得不做出"痛苦且重大"让步

环球网资讯 浏览 6232

19岁女孩留学9天遭遇电诈后自杀 父亲:我女儿太善良了

极目新闻 浏览 24573

50+女人快跳出“扮嫩”误区,学会4个技巧,就能穿出高级

静儿时尚达人 浏览 4061

“黑色大衣”今年冬天又火了,怎么搭都高级时髦

LinkFashion 浏览 2993

业内独家无孔真全面屏!努比亚Z80 Ultra获认证:支持90W快充

快科技 浏览 4763

美国要“收回”阿富汗空军基地 阿政府断然拒绝

环球网资讯 浏览 5013

女人到了三四十岁穿衣要显贵,这些穿搭值得借鉴,大方又好看

静儿时尚达人 浏览 2119

黄金、白银突然暴跌!发生了什么?

中国品牌 浏览 3280

1200亿天价订单疑云:宁德时代为何押注一家“小公司”?

野马财经 浏览 3141

现货金价再创历史新高,牛市还能走多远?

国是直通车 浏览 3162

成毅助理打人上热搜又反转!网友质疑是被公司黑

FancyMusic 浏览 2705

弹无虚发,凯恩德甲18次罚点全中

体坛周报 浏览 3869

群核科技,摸着李飞飞过河

极客公园 浏览 3409

NVIDIA牢牢把握独显市场92%份额!Intel终于突破1%

快科技 浏览 3713

恩里克:我的球员今天表现得很出色,不过在结果上略有遗憾

懂球帝 浏览 3622

泰军警告柬方:若敢用中国战略武器 将直接纵深打击

时时有聊 浏览 20179

南部战区:正告菲方停止在南海挑起事端

北京日报客户端 浏览 5036

广西国资9.42亿入局,黑芝麻这回能“胡”一把?

野马财经 浏览 3597
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1