关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西383人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

当众辱骂阿隆索!1.5亿欧熊皇惹怒老佛爷+更衣室 皇马准备处罚他

风过乡 浏览 825

夏末初秋的代表色 请投淡驼色100票!

YOKA网 浏览 15161

传华为将出售手机业务?官方辟谣:假信息,继续加大投入

网易手机 浏览 19522

博主成功拆解苹果 iPhone Air,刮去背板涂层打造“透明版”机型

IT之家 浏览 928

穿错显胖10斤 T恤到底怎么挑选才好看?

In风尚 浏览 17006

贝克汉姆一家出游,12岁小七发育过猛穿吊带短裙

好丹 浏览 14399

特朗普发布“致命打击”画面 委内瑞拉:美国不宣而战

上观新闻 浏览 1609

妃子最多的皇帝是哪一位?后宫最多有多少佳丽?

趣看热点 浏览 26537

抠门年轻人,开始流行买“顶配猫砂”

DT商业观察 浏览 600

黑芝麻控制权转让新进展:尽职调查10月底前收尾,国资注入能否解 “冲饮困局”?

时代周报 浏览 1009

浙商银行前三季度经营稳健,总营收489.31亿元

证券市场周刊 浏览 779

下个攻击线可能是这里:俄专家分析乌军反攻第一周

参考消息 浏览 16486

丰田章男再次“唱衰”电动车?丰田内部人士:断章取义

每日经济新闻 浏览 12359

关店100家!潘多拉败走中国,营收萎缩至1%,消费者:质量太差

木禾投研 浏览 853

斯基拉:马竞计划买断冈萨雷斯,费用为3200万欧+100万欧奖金

懂球帝 浏览 1017

《剪刀手爱德华》演员艾伦·阿金去世,曾合作赫本

好丹 浏览 15347

媒体:美军武器靠拆零件续命 对美国或是一种致命伤

新民周刊 浏览 6473

西方媒体称卢卡申科访华为疏远俄罗斯 向中国求助

新民晚报 浏览 19524

伊姐十一热推:电影《阿凡达:水之道》;电影《毕正明的证明》......

伊周潮流 浏览 979

巴黎时装周|来看,全世界最美的衣服

LinkFashion 浏览 986

今年夏天,穿得越放松越时髦!

LinkFashion 浏览 11350
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1