网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

性能接近旗舰成本直降,Anthropic中档模型Sonnet 4.6重塑AI应用格局

2026-02-20来源:互联网编辑:瑞雪

Anthropic公司近日推出中档AI模型Claude Sonnet 4.6,在保持与前代相同定价策略的同时,实现了性能的显著提升。该模型每百万token输入定价3美元、输出15美元,却能在多项基准测试中比肩甚至超越价格高出五倍的旗舰产品Opus 4.6,引发行业广泛关注。

在真实软件编码能力测试SWE-bench Verified中,Sonnet 4.6以79.6%的得分紧追Opus 4.6的80.8%,同时领先OpenAI的GPT-5.2。在代理式金融分析任务中,该模型以63.3%的准确率超越所有竞争对手,包括Opus 4.6的60.1%和GPT-5.2的59.0%。办公任务评估GDPval-AA Elo评分显示,Sonnet 4.6以1633分超越Opus 4.6的1606分和GPT-5.2的1462分。

尽管在终端编码任务Terminal-Bench 2.0、代理式搜索BrowseComp和新颖问题解决测试ARC-AGI-2等高复杂度领域,Opus 4.6仍保持领先优势,但Sonnet 4.6在计算机使用能力方面展现出突破性进展。OSWorld-Verified基准测试中,该模型得分72.5%,较前代提升11.1个百分点,远超GPT-5.2的38.2%。这种能力使AI能够通过模拟人类操作完成复杂任务,为企业应用开辟了新场景。

保险科技公司Pace的测试显示,Sonnet 4.6在其保险计算机使用基准测试中达到94%的准确率,创下Claude系列模型新高。该模型还具备自我纠正能力,能够分析失败原因并调整策略。在安全防护方面,Sonnet 4.6对提示注入攻击的抵御能力较前代有显著提升,这对需要处理网页交互的企业应用至关重要。

企业用户反馈显示,Sonnet 4.6在保持成本优势的同时,性能表现接近旗舰模型。数据分析平台Hex Technologies已将大部分流量迁移至该模型,其CTO指出,通过自适应思考和高努力模式配置,除最困难的分析任务外,其他工作均达到Opus级别性能。云存储公司Box的测试表明,Sonnet 4.6在真实企业文档处理中的表现较前代提升15个百分点。

该模型配备100万token的超长上下文窗口,可处理完整代码库或法律文件等大型文档。在Vending-Bench Arena企业运营模拟测试中,Sonnet 4.6展现出战略决策能力:前十个模拟月大量投资产能,后期转向盈利能力提升,最终模拟余额达5700美元,较前代提升171%。

业务拓展方面,Anthropic在发布Sonnet 4.6当日宣布与印度IT巨头Infosys达成合作,将Claude模型集成至Topaz AI平台,服务银行、电信和制造业客户。同时,该公司在班加罗尔设立首个印度办事处,目前印度市场占Claude全球使用量的6%,仅次于美国。此举引发资本市场波动,部分软件企业股价出现调整。

为降低开发者使用门槛,Anthropic将免费层级默认升级至Sonnet 4.6,开发者可通过Claude API直接调用该模型。这一策略可能进一步改变AI市场竞争格局,特别是对成本敏感的企业用户产生显著影响。

科大讯飞Air 2 Pro与热门电子书阅读器大比拼,哪款能成你的智能办公好伙伴?
本文将对比科大讯飞智能办公本Air2Pro与其他几款同类电子书阅读器,分析它们的功能、设计、性价比等方面,帮助你做出更明智的选择。首先,科大讯飞智能办公本Air2Pro京东读书联名款以其墨水屏平板电脑的形式,…

2026-02-20

库克连续两年微博送新春祝福 马年视频传统科技共贺岁
当日上午九时四十一分,苹果公司首席执行官库克在其个人微博平台发布一段新春贺岁视频,向中国用户致以马年祝福。Happy Year of the Horse!”,内容融合了丰富而富有传统意蕴的马元素:灵动的皮影马…

2026-02-20

荣耀Magic8 RSR“变相降价”来袭,24GB+1TB顶配,奢华旗舰更值得入手
看到国产手机卖高价,很多消费者都会吐槽,觉得国产手机不值这么高的价格,但就阿维看来这是一种偏见,不可否认早期的国产高端旗舰确实撑不起高价,不仅使用体验不够好,外观设计也不够上档次,但这几年国产高端旗舰提升挺大…

2026-02-19

智能办公本怎么选?五款热门产品对比,科大讯飞Air 2 Pro等谁更适配你的需求?
相较之下,Remarkable2以其10.3英寸大屏和4096级压感手写笔构建了一个专业的笔记生态。设备配备10.2英寸的屏幕和可调节的暖光,但其语音功能仅支持基础录音,笔记同步需通过Kindle APP…

2026-02-19

三星Galaxy S26系列2月26日登场!2nm芯片加持,影像续航全面升级
看来今年的下一代旗舰芯片,迎来全新的突破,毕竟有2nm工艺制程加持,性能自然更上一层,尤其是CPU、GPU、AI算力等方面,助力新机全面发挥,带来更好的体验。此芯片搭载在S26/S26+版本上,仅部分地区,而…

2026-02-19

英伟达Meta强强联手:Meta将建超大规模数据中心 部署英伟达多类芯片
双方还将合作部署英伟达Vera CPU,该产品有望在2027年实现规模化应用,进一步拓展Meta高能效AI算力布局。 目前科技巨头在AI芯片上普遍采用“自研+采购”模式,例如谷歌在自研TPU芯片之时,也大量…

2026-02-19