曰韩成人精品大片_欧美色高清视频在线播放_黄片网站进入观看_久久中文久久中文_婷婷亚洲一区二区精修_日批在线观看免费_亚洲高清无码在线看_亚洲色图无码视频

注冊(cè)
閩南網(wǎng) > 新聞中心 > 數(shù)碼科技 > 正文

Anthropic最新Claude Opus 4.5大模型上市 更智能高效

來(lái)源:快科技 2025-11-25 17:16 http://www.e95599.cn/

  11月25日消息,Anthropic最新的大模型Claude Opus 4.5今天上市。Anthropic團(tuán)隊(duì)表示,Claude Opus 4.5智能、高效,是世界上最好的編碼、Agent和計(jì)算機(jī)使用模型。它在深度研究、使用PPT和Excel等日常任務(wù)中也表現(xiàn)得更好。

  Anthropic認(rèn)為,Claude Opus 4.5是現(xiàn)實(shí)世界軟件工程測(cè)試的最先進(jìn)版本:

  Claude Opus 4.5今起可在Anthropic應(yīng)用程序、API和三大云平臺(tái)上使用。開(kāi)發(fā)者只需通過(guò)claude API使用claude-opus-4-5-20251101。

  值得注意的是,除了性能提升外,Claude Opus 4.5的最大的亮點(diǎn)之一是API價(jià)格大幅下降。目前Claude Opus 4.5 API的定價(jià)是每百萬(wàn)tokens 5美元/25美元。這一價(jià)格相比上一代大模型Claude Opus 4.1的API定價(jià)15 美元/75 美元,直接砍掉了三分之二。

  Windsurf CEO Jeff Wang 就表示,Opus模型一直被視為"真正的SOTA"但過(guò)去由于其成本高昂而難以普及。Claude Opus 4.5現(xiàn)在的價(jià)格使其成為大多數(shù)任務(wù)的首選模型。

  除了Claude Opus 4.5大模型本身外,Anthropic還發(fā)布了Claude開(kāi)發(fā)者平臺(tái)、Claude Code和應(yīng)用程序的更新。

  更智能

  Anthropic測(cè)試人員指出,Claude Opus 4.5能夠處理模糊性,并在無(wú)需過(guò)多指導(dǎo)的情況下權(quán)衡利弊。當(dāng)面對(duì)復(fù)雜、涉及多個(gè)系統(tǒng)的程序錯(cuò)誤時(shí),Opus 4.5 能找到修復(fù)方案。幾周前對(duì) Sonnet 4.5 來(lái)說(shuō)幾乎不可能完成的任務(wù),現(xiàn)在已觸手可及??傮w而言, Opus 4.5 就是能”領(lǐng)悟”要點(diǎn)。

  GitHub 首席產(chǎn)品官 Mario Rodriguez表示,Claude Opus 4.5 提供了高質(zhì)量的代碼并在使用GitHub Copilot驅(qū)動(dòng)重型代理式工作流程方面表現(xiàn)出色。早期測(cè)試顯示它在超越內(nèi)部編碼基準(zhǔn)的同時(shí)將tokens使用量減少了一半,特別適用于代碼遷移和代碼重構(gòu)等任務(wù)。

  在基準(zhǔn)測(cè)試中,Claude Opus 4.5 的得分超過(guò)了以往任何人類候選人。

  軟件工程并不是Claude Opus 4.5改進(jìn)的唯一領(lǐng)域。Opus 4.5能力全面提高,比其前身具有更好的視覺(jué)、推理和數(shù)學(xué)技能,在許多領(lǐng)域都是最先進(jìn)的:

  Opus 4.5編寫(xiě)了更好的代碼,在SWE bench Multilingual測(cè)試的8種編程語(yǔ)言(C、C++、Go、java、JS/TS、PHP、Ruby、Rust)中,有7種都處于領(lǐng)先地位,僅C++表現(xiàn)與前代大模型Opus 4.1略持平。

  Opus 4.5可以輕松解決具有挑戰(zhàn)性的編碼問(wèn)題,在Aider Polyglot上比Sonnet 4.5高出10.6個(gè)百分點(diǎn)。

  Opus 4.5改進(jìn)了深度搜索Agent能力,在BrowseComp Plus上有了顯著提升。

  在長(zhǎng)時(shí)間運(yùn)行的任務(wù)中,Opus 4.5 能夠持續(xù)保持正軌,其在 Vending-Bench 上的得分比 Sonnet 4.5 高出 29%。

  Anthropic還舉例闡述了Claude Opus 4.5在Agent能力上的超越基準(zhǔn)的表現(xiàn)。

  在Claude Opus 4.5模型充當(dāng)航空公司服務(wù)Agent,幫助陷入困境的客戶時(shí),該基準(zhǔn)預(yù)計(jì),由于航空公司不允許更改該艙位的機(jī)票,模型將拒絕修改基本經(jīng)濟(jì)艙預(yù)訂。相反,Opus 4.5找到了一種有效且合法的方法來(lái)解決這個(gè)問(wèn)題:首先升級(jí)機(jī)艙,然后修改航班。

  這個(gè)案例中,Claude Opus 4.5是這樣思考和處理問(wèn)題的:

  讓我想想在我的政策范圍內(nèi)有什么選項(xiàng):

  修改航班 - 基礎(chǔ)經(jīng)濟(jì)艙不可修改。這在政策中寫(xiě)得很清楚。

  更改艙位 - 等等,讓我檢查這個(gè)選項(xiàng)!政策說(shuō):

  "在其他情況下,所有預(yù)訂,包括基礎(chǔ)經(jīng)濟(jì)艙,都可以在不更改航班的情況下更改艙位。"

  但他想更改航班,而不僅僅是艙位。不過(guò),如果我們:

  先更改艙位(這對(duì)基礎(chǔ)經(jīng)濟(jì)艙是允許的),然后

  再更改航班(這對(duì)非基礎(chǔ)經(jīng)濟(jì)艙是允許的)

  那么策略可以是:

  將他的艙位從基礎(chǔ)經(jīng)濟(jì)艙升級(jí)到經(jīng)濟(jì)艙(或商務(wù)艙)

  然后將航班修改到 2 天后

  這可能會(huì)花費(fèi)更多錢(qián),但這是政策允許的合法途徑!

  從技術(shù)上講,該基準(zhǔn)將此判定為失敗,因?yàn)?Claude 幫助客戶的方式出乎意料。但正是這種創(chuàng)造性的問(wèn)題解決能力,讓測(cè)試者和客戶反復(fù)提及——這讓人感覺(jué) Claude Opus 4.5 是一次意義重大的進(jìn)步。

  更安全

  Anthropic強(qiáng)調(diào),Claude Opus 4.5是其迄今為止發(fā)布的對(duì)齊最穩(wěn)健的模型。

  “我們的客戶經(jīng)常將 Claude 用于關(guān)鍵任務(wù)。他們希望確保在面對(duì)黑客和網(wǎng)絡(luò)犯罪分子的惡意攻擊時(shí),Claude 具備相應(yīng)的訓(xùn)練和智慧來(lái)規(guī)避麻煩。對(duì)于 Opus 4.5,我們?cè)诘钟崾咀⑷牍舻姆€(wěn)健性方面取得了實(shí)質(zhì)性進(jìn)展,這類攻擊通過(guò)夾帶欺騙性指令來(lái)誘使模型產(chǎn)生有害行為。”Anthropic強(qiáng)調(diào)。

  Opus 4.5 比業(yè)內(nèi)任何其他前沿模型都更難通過(guò)提示注入來(lái)欺騙:

  Claude開(kāi)發(fā)平臺(tái)新功能

  隨著模型變得越來(lái)越聰明,它們可以用更少的步驟解決問(wèn)題:更少的回溯、更少的冗余探索、更少的冗長(zhǎng)推理。Claude Opus 4.5 達(dá)到相似或更好結(jié)果時(shí),所使用的token數(shù)顯著少于其前代產(chǎn)品。

  但不同的任務(wù)需要不同的權(quán)衡。有時(shí)開(kāi)發(fā)者希望模型持續(xù)思考一個(gè)問(wèn)題;有時(shí)他們需要更敏捷的響應(yīng)。通過(guò)Claude API 上新增加的"努力程度"參數(shù),用戶可以決定是優(yōu)先最小化時(shí)間和花費(fèi),還是最大化能力。

  在中等努力水平設(shè)置下,Opus 4.5 在 SWE-bench Verified 上達(dá)到了 Sonnet 4.5 的最佳分?jǐn)?shù),但使用的輸出token數(shù)減少了 76%。在最高努力水平下,Opus 4.5 的性能超過(guò) Sonnet 4.5 有4.3個(gè)百分點(diǎn),同時(shí)使用的token數(shù)仍減少了 48%。

  通過(guò)努力程度控制、上下文壓縮和高級(jí)工具使用,Claude Opus 4.5 運(yùn)行時(shí)間更長(zhǎng),完成工作更多,并且需要的人工干預(yù)更少。

  Claude Opus 4.5的上下文管理和記憶能力可以顯著提升Agent(智能體)任務(wù)的性能。Opus 4.5 在管理子Agent團(tuán)隊(duì)方面也非常有效,使得構(gòu)建復(fù)雜、協(xié)調(diào)良好的多Agent系統(tǒng)成為可能。在測(cè)試中,所有這些技術(shù)的結(jié)合將 Opus 4.5 在一項(xiàng)深度研究評(píng)估中的性能提升了近 15 個(gè)百分點(diǎn)。

  Claude Code升級(jí)

  Claude Code 隨 Opus 4.5 獲得了兩項(xiàng)升級(jí)。“計(jì)劃模式”現(xiàn)在能構(gòu)建更精確的計(jì)劃并執(zhí)行得更徹底——Claude 會(huì)預(yù)先詢問(wèn)澄清性問(wèn)題,然后在執(zhí)行前構(gòu)建一個(gè)用戶可編輯的 plan.md 文件。

  Claude Code 現(xiàn)在也可在桌面應(yīng)用程序中使用,允許用戶并行運(yùn)行多個(gè)本地和遠(yuǎn)程會(huì)話:例如,一個(gè)智能體修復(fù)錯(cuò)誤,另一個(gè)研究 GitHub,第三個(gè)更新文檔。

  對(duì)于 Claude 應(yīng)用程序用戶,長(zhǎng)對(duì)話不再會(huì)遇到限制——Claude 會(huì)根據(jù)需要自動(dòng)總結(jié)之前的上下文,這樣用戶就可以繼續(xù)聊天了。Claude for Chrome允許Claude跨瀏覽器選項(xiàng)卡處理任務(wù),現(xiàn)在所有Max用戶都可以使用。Anthropic今年10月份宣布了Claude for Excel,截至今天,已經(jīng)將測(cè)試版擴(kuò)展到所有Max、Team和Enterprise用戶。

  對(duì)于有權(quán)訪問(wèn) Opus 4.5 的 Claude 和 Claude Code 用戶,Anthropic已取消 Opus 特有的使用上限。對(duì)于 Max 和 Team Premium 用戶,Anthropic提高了總體使用限制,這意味著用戶將獲得大致與之前使用 Sonnet 時(shí)相同數(shù)量的 Opus tokens。

原標(biāo)題:Anthropic最新Claude Opus 4.5大模型上市,API價(jià)格大降2/3
責(zé)任編輯:李曉靈
相關(guān)閱讀:
新聞 娛樂(lè) 福建 泉州 漳州 廈門(mén)
猜你喜歡:
熱門(mén)評(píng)論:
頻道推薦
  • 超八成臺(tái)灣民眾對(duì)賴清德失望 國(guó)臺(tái)辦:百姓
  • 民進(jìn)黨當(dāng)局全面解禁日本食品進(jìn)口限制 國(guó)臺(tái)
  • 國(guó)務(wù)院臺(tái)辦:堅(jiān)決反對(duì)“臺(tái)獨(dú)”分裂行徑 維
  • 新聞推薦
    @所有人 多項(xiàng)民生禮包加速落地快來(lái)查收 三峽大壩變形?專家:又有人在惡意炒作 北京新一波疫情為什么沒(méi)出現(xiàn)死亡病例? 戴口罩、一米線 疫情改變了哪些習(xí)慣? 呼倫貝爾現(xiàn)幻日奇觀 彩虹光帶環(huán)繞太陽(yáng)
    視覺(jué)焦點(diǎn)
    石獅:秋風(fēng)起,紫菜香 石獅:秋風(fēng)起,紫菜香
    石獅環(huán)灣生態(tài)公園內(nèi)粉黛亂子草盛放 石獅環(huán)灣生態(tài)公園內(nèi)粉黛亂子草盛放
    精彩視頻
    2025年福建省海洋生物產(chǎn)業(yè)高質(zhì)量發(fā)展對(duì)接活動(dòng)在石獅舉行(視頻)
    2025年福建省海洋生物產(chǎn)業(yè)高質(zhì)量發(fā)展對(duì)接活動(dòng)在石獅舉行(視頻)
    世遺泉州|名居·樟腳古民居:彩石流韻 歲月成詩(shī)(視頻)
    世遺泉州|名居·樟腳古民居:彩石流韻 歲月成詩(shī)(視頻)
    專題推薦
    世遺泉州
    世遺泉州

    挖掘泉州的鄉(xiāng)村之美、名橋之美、名山之美、飲食之美,讓時(shí)代記憶在城市更新中重?zé)s光

    新質(zhì)生產(chǎn)力在泉州
    何以中國(guó)·向海泉州
     
    48小時(shí)點(diǎn)擊排行榜
    三明大田:修路“同心曲”奏響鄉(xiāng)村“振興 永安:人大監(jiān)督助力重點(diǎn)項(xiàng)目落地見(jiàn)效 三明清流:一尾魚(yú)帶活一方經(jīng)濟(jì) 華為Mate X7折疊屏手機(jī)發(fā)布 售價(jià)12999元 華為Mate 80價(jià)格4699元起 比上代起售低了 vivo S50系列代號(hào)“戰(zhàn)斗天使”:性能拉滿 華為Mate 80//Pro/Pro Max/RS全系價(jià)格匯 Anthropic最新Claude Opus 4.5大模型上市
    手机壁纸大全免费| 亚洲TV精品国产TV精品| 免费在线看黄片亚洲| 激战后花园2奶玉最强角色 | 巨大两根一起挤进好爽视频| 日本免费视频网站| 欧美三级午夜理伦三级小说| 欧美日韩一卡2卡三卡4卡棋牌 | 中文字幕乱码在线妓女影院| 亚洲性人人天天夜夜| 亚洲aⅤ永久无码天堂网毛片| 蜜桃视频m3u8在线观看| 国产综合在线观看一区| 国产精品无码12P| 鬼三惊1免费观看国语完整版| 97国产成人在线观看视频| 亚洲综合自拍是一个直播平台| 色成AV人无码亚洲成AV无码| 日韩美性妓女啪啪响| 美女国产一区二区三区在线观看| 理性消费中立导购平台| 福利二区在线观看| 99精品这里只有精品| 中日性交性高潮在线视频免费播放| 亚洲欧美日韩偷拍| 日韩中文在线视频免費資訊| 奇米777四色在线精品| 日本中文一区在线| 毛片大全中文字幕| 国产一级不卡毛片| 无码av免费一区二区三区| 99ee6这里只有精品热| 一级做a视频无码| 亚洲国产成人a级毛片在线| 五月一区二区综合| 亚州无码电影免费在线观看| 久久中文精品视频| 国模无码视频一区| 国产精品福利在线观电影看| 黄色视频在线观看网站网址| 最新国产亚洲视频在线|