Articles in Turing Academy cover three major themes: ESG Net Zero Laboratory, AI Laboratory and Lean Management Laboratory. We will share articles on related topics from time to time. We also welcome students who are interested in the above topics to submit articles and share them with you. Insights (I want to contribute)

Claude Opus 4.5:當 AI 學會主動出擊,你準備好了嗎?

 

 

利創智能圖靈學院
科楠老師
2025-12-24

 

    2025 年 11 月 24 日,Anthropic 發布了 Claude Opus 4.5。這不只是又一次模型更新——它標誌著人機協作模式的根本轉變。在 SWE-bench Verified 測試中達到 80.9% 的解決率,成為首個在 Anthropic 內部招聘測試中擊敗人類工程師的 AI 模型。但真正讓開發者社群熱議的,不是這些數字。而是一個截然不同的問題:這個 AI 太主動了,我該怎麼跟它合作?


為什麼 Opus 4.5 感覺「不一樣」

 

    如果你用過之前的 Claude 模型,可能習慣了一種模式:你提問,AI 回答;你要求分析,AI 給你分析報告;你說「幫我改這段程式碼」,AI 修改後等你確認。

 

Opus 4.5 打破了這個節奏

 

    一位開發者在 Reddit 上分享了他的經歷:他請 Claude 分析一個效能退化問題,只是想要一些建議。等他喝完咖啡回來,Claude 已經重寫了整個架構,並宣布任務完成。

這不是 bug,這是設計。

 

Anthropic 在官方公告中特別強調:Opus 4.5 代表了「自我改進型 AI 代理」的突破,僅用 4 次迭代就能達到最佳性能,而其他模型在 10 次迭代後仍無法達到同樣水平。它被設計來「處理模糊性,權衡利弊,不需要手把手指導」。換句話說,Opus 4.5 不是一個等待指令的助手,而是一個會主動推進工作的協作者。


核心新功能一覽

 

    在討論如何使用之前,先了解 Opus 4.5 帶來了哪些實質性的能力提升。

 

無限對話(Infinite Chat)

 

    這解決了 Claude 使用者最大的痛點之一:上下文窗口限制。以前,長對話會突然「忘記」之前討論的內容,你必須重新開始或手動整理脈絡。現在,當模型接近上下文限制時,它會自動壓縮記憶,保留關鍵資訊,讓對話可以無縫延續。這對於需要長時間討論的複雜專案特別有用——論文撰寫、程式碼重構、研究分析,都不再需要分段進行。

 

工具搜尋(Tool Search)

 

    Opus 4.5 可以動態發現和載入工具,而不是一開始就把所有工具定義塞進上下文窗口。這意味著它可以處理數百甚至數千種工具的場景,只在需要時才調用相關工具。對於建構複雜 AI 代理的開發者來說,這是關鍵突破。

 

努力程度參數(Effort Parameter)

 

    這是 Opus 4.5 獨有的功能。你可以控制模型花多少「思考時間」來回應: 需要快速答案時調低,需要深度分析時調高。這讓你能在速度和品質之間靈活取捨。

 

Chrome 和 Excel 整合

 

    Claude for Chrome 讓 AI 可以直接在瀏覽器中協助你工作,而 Claude for Excel 則專門針對試算表和財務建模進行了最佳化。Anthropic 聲稱在內部測試中,Excel 相關任務的準確度提升了 20%,效率提升了 15%。

 

Claude Code 桌面版

 

    現在可以直接從桌面應用啟動 Claude Code,支援同時運行多個本地和遠端編碼工作階段。這讓 AI 輔助編程的工作流程更加順暢。


兩種截然不同的使用體驗

 

    發布後的第一週,Reddit 和 Twitter 上出現了有趣的現象:同一個模型,卻引發了兩極化的評價。

 

狂喜派的故事

 

    一位開發者讓 Opus 4.5 做他的「標準測試」,建造一款 3D 第一人稱射擊遊戲,包含敵人、道具強化、經驗值系統。這個測試之前所有 AI 模型都會失敗。Opus 4.5 一次完成。完整遊戲、粒子特效、音效、連擊計數器,全部到位。

 

另一位用戶說:「困擾我數月的問題,10 分鐘就解決了。」

還有人說:「我創造了我曾經夢寐以求的東西。」

 

挫折派的故事

 

    同一時期,另一批開發者在抱怨:「Opus 4.5 需要冷靜下來。」他們的經歷大同小異:請 Claude 分析問題,結果它直接動手改了程式碼;要求探索方案,它卻重寫了架構;希望討論再決定,它已經宣布任務完成。一位開發者寫道:「我發現這導致了糟糕的架構決策和大量的重複工作。」


差異的根源:協作模式不匹配

 

    仔細分析這兩群人的使用方式,會發現一個關鍵差異。成功的使用者有一個共同點:他們給予 Opus 完全的自主權。「它運行了 2-3 個小時進行修復,最後終於能用了」——他們讓 AI 跑,不干預,不中途檢查,完全信任。遇到困難的使用者呢?他們想要協作,想在執行前審查,想保持對流程的控制。這不是誰對誰錯的問題,而是協作模式的選擇。

 

Opus 4.5 被設計為一個自主型代理。它會主動識別問題、做出判斷、執行解決方案。當你的工作方式與這個設計相匹配時,它是超能力;當你期待的是一個聽命行事的助手時,它會讓你抓狂。


如何正確使用 Opus 4.5

 

    基於社群經驗和官方建議,以下是最大化 Opus 4.5 效率的具體策略。

 

情境一:原型開發和獨立專案

 

    這是 Opus 4.5 的最佳戰場。如果你在做副業專案、快速原型、或者解決一個孤立的技術問題,放手讓它跑。

 

具體做法:描述你的最終目標,不要過度限制實現方式。讓它自主探索、嘗試、甚至失敗後重來。你的角色是評估最終成果,而不是監督每一步。

 

範例提示:「建造一個能追蹤個人支出的 web app,包含圖表視覺化和月度報告功能。」然後讓它跑完。

 

情境二:生產環境和複雜架構

 

當你在有嚴格架構限制的系統中工作,決策會產生連鎖反應時,你需要明確設定邊界。關鍵策略是使用「限制性動詞」。Anthropic 官方文件也提到,Claude 4 系列模型需要更明確的指令。

有效的提示模式包括:

 

  • 「分析這個問題,列出可能的解決方案,但不要修改任何程式碼。」
  • 「探索這個架構的潛在問題,在提出任何變更之前先跟我討論。」
  • 「檢查這個函數的效能瓶頸,給我報告,等我確認後再動手。」
  • 注意動詞的選擇:「分析」「探索」「檢查」「報告」: 這些都是觀察性動詞。避免使用「修復」「改善」「重構」這類執行性動詞,除非你真的準備好讓它直接動手。

 

情境三:長期專案和知識累積

 

    善用 Infinite Chat 功能。對於需要跨多個工作階段的專案,你可以在同一個對話中持續推進,不用擔心上下文丟失。

 

建議做法:在每個工作階段開始時,簡短總結目前進度和今天的目標。雖然 Claude 會保留記憶,但明確的狀態同步能確保你們在同一頁上。

 

情境四:需要深度思考的任務

 

    利用 Effort Parameter。當你面對複雜的架構決策、困難的 debug、或需要創意解決方案的問題時,讓模型花更多時間思考。相反,對於簡單的格式轉換、routine 的程式碼生成,降低努力程度可以節省時間和成本。


心態調整:從「助手」到「同事」

 

    使用 Opus 4.5 最重要的心態轉變,是把它從「執行指令的助手」重新定位為「有主見的同事」。你會怎麼跟一個能力很強、但做事風格比較激進的同事合作?你會清楚說明期望、設定邊界、但也給予信任和空間。你不會期待他每一步都來問你,但重大決策前你會要求先討論。同樣的原則適用於 Opus 4.5。當你說「幫我看看這個問題」,一個積極的同事可能會直接給你解決方案,而不只是分析報告。如果你只想要分析,你需要明確說出來。這不是 AI 的缺陷,而是協作風格的差異。學會與這種風格共處,你會發現效率可以提升數倍。


結語:選擇適合你的協作方式

 

    Opus 4.5 的發布標誌著 AI 工具評估維度的擴展。我們不再只問「哪個模型更聰明」,還要問「哪個模型的工作方式適合我」。如果你喜歡快速迭代、願意信任 AI 的判斷、能夠評估和修正最終成果而不是監督過程,Opus 4.5 會是強大的夥伴。如果你偏好謹慎、漸進、每一步都確認的工作方式,你可能需要更多的提示工程來馴服它,或者考慮在某些任務上使用其他模型。兩種方式都沒有對錯。重要的是認識到這個選擇的存在,並有意識地做出適合你的決定。AI 模型現在有了「個性」。就像人類同事一樣,最有才華的有時候也是最難共事的。但一旦你找到正確的協作節奏,那種生產力的爆發是值得的。按下 “Return”鍵,然後信任它,或者明確告訴它你只想要分析。

 

選擇權在你手上。

 

 

參考資料

 

1. Anthropic 官方公告
   https://www.anthropic.com/news/claude-opus-4-5

2. Claude 官方文件 - What's New in Claude 4.5
   https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-5

3. GitHub Changelog - Claude Opus 4.5 公開預覽
   https://github.blog/changelog/2025-11-24-claude-opus-4-5-is-in-public-preview-for-github-copilot/

4. TechCrunch - Anthropic releases Opus 4.5 with new Chrome and Excel integrations
   https://techcrunch.com/2025/11/24/anthropic-releases-opus-4-5-with-new-chrome-and-excel-integrations/

5. The New Stack - Anthropic's New Claude Opus 4.5 Reclaims the Coding Crown
   https://thenewstack.io/anthropics-new-claude-opus-4-5-reclaims-the-coding-crown-from-gemini-3/

6. Microsoft Azure Blog - Introducing Claude Opus 4.5 in Microsoft Foundry
   https://azure.microsoft.com/en-us/blog/introducing-claude-opus-4-5-in-microsoft-foundry/

7. Simon Willison - Claude Opus 4.5, and why evaluating new LLMs is increasingly difficult   

8. Medium - AI 編碼速度太快,開發者們都懇求它慢下來
   Mohamed Abdelmoneim, 2025年12月5日