关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西3283人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马德兴:张瑷晖因脚踝受伤没参加U23国足第二日的合练

懂球帝 浏览 2756

业内曝窦骁遭遇豪门杀猪盘,被女方当跳板?

萌神木木 浏览 3678

专家:高市早苗收敛了一贯对华强硬的鹰派色彩

北京日报客户端 浏览 14405

荣梓杉塌房太离谱!出轨家暴还反咬?

东方不败然多多 浏览 3737

喊球迷别卖票自己却缺阵?76人0-2落后,大帝G3出战成疑

仰卧撑FTUer 浏览 240

京东工业港股上市首日平收,收报14港元/股,为刘强东第六家上市公司

红星资本局 浏览 3018

秋天穿衣真的一点都不难!从这些穿搭中收获灵感,舒适又耐看

静儿时尚达人 浏览 3364

拉加德暗示欧央行不急行动:政策处于有利位置,未预设利率路径,任何选项都应考虑

华尔街见闻官方 浏览 3004

包工头把交警儿子做进工资表冒领工地工资:我欠儿子钱

大风新闻 浏览 3836

刘强东“最值钱”的金融牌照,迎来75后掌舵人

经理人杂志 浏览 3738

罗马仕被曝正亏本清理库存充电宝:27000mAh型号售价45元

IT之家 浏览 2633

出行场景升级/还支持餐厅排队 方程豹钛7推送第二次OTA

网易汽车 浏览 2705

小鹏汽车2025年全年交付量达429,445台 同比增长126%

网易汽车 浏览 2842

深圳水贝疑有黄金原料供应商暴雷跑路:有人被卷400万

大风新闻 浏览 26400

谁是中国第一吐槽役?

仙女事件簿 浏览 3735

世体:马竞主场对阵巴萨门票早已售罄,并有望刷新上座纪录

懂球帝 浏览 1118

“美好”新国际!齐沃战胜师父,蓝黑登顶意甲

体坛周报 浏览 3756

春季躁动,AI软件应用迎来“奇点时刻”

懂财帝 浏览 2581

头部基金,争相申报巴西主题QDII!

券商中国 浏览 3777

今日热点:电影《飞驰人生3》定档春节;大麦否认与黄牛挂钩……

伊周潮流 浏览 2894

iPhone Air国行版要来了!联通eSIM预约通道正式开放

三言科技 浏览 3236
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1