
利創智能圖靈學院
科楠老師
2025-12-24
2025 年 11 月 24 日,Anthropic 發布了 Claude Opus 4.5。這不只是又一次模型更新——它標誌著人機協作模式的根本轉變。在 SWE-bench Verified 測試中達到 80.9% 的解決率,成為首個在 Anthropic 內部招聘測試中擊敗人類工程師的 AI 模型。但真正讓開發者社群熱議的,不是這些數字。而是一個截然不同的問題:這個 AI 太主動了,我該怎麼跟它合作?
為什麼 Opus 4.5 感覺「不一樣」
如果你用過之前的 Claude 模型,可能習慣了一種模式:你提問,AI 回答;你要求分析,AI 給你分析報告;你說「幫我改這段程式碼」,AI 修改後等你確認。
Opus 4.5 打破了這個節奏
一位開發者在 Reddit 上分享了他的經歷:他請 Claude 分析一個效能退化問題,只是想要一些建議。等他喝完咖啡回來,Claude 已經重寫了整個架構,並宣布任務完成。
這不是 bug,這是設計。
Anthropic 在官方公告中特別強調:Opus 4.5 代表了「自我改進型 AI 代理」的突破,僅用 4 次迭代就能達到最佳性能,而其他模型在 10 次迭代後仍無法達到同樣水平。它被設計來「處理模糊性,權衡利弊,不需要手把手指導」。換句話說,Opus 4.5 不是一個等待指令的助手,而是一個會主動推進工作的協作者。
核心新功能一覽
在討論如何使用之前,先了解 Opus 4.5 帶來了哪些實質性的能力提升。
無限對話(Infinite Chat)
這解決了 Claude 使用者最大的痛點之一:上下文窗口限制。以前,長對話會突然「忘記」之前討論的內容,你必須重新開始或手動整理脈絡。現在,當模型接近上下文限制時,它會自動壓縮記憶,保留關鍵資訊,讓對話可以無縫延續。這對於需要長時間討論的複雜專案特別有用——論文撰寫、程式碼重構、研究分析,都不再需要分段進行。
工具搜尋(Tool Search)
Opus 4.5 可以動態發現和載入工具,而不是一開始就把所有工具定義塞進上下文窗口。這意味著它可以處理數百甚至數千種工具的場景,只在需要時才調用相關工具。對於建構複雜 AI 代理的開發者來說,這是關鍵突破。
努力程度參數(Effort Parameter)
這是 Opus 4.5 獨有的功能。你可以控制模型花多少「思考時間」來回應: 需要快速答案時調低,需要深度分析時調高。這讓你能在速度和品質之間靈活取捨。
Chrome 和 Excel 整合
Claude for Chrome 讓 AI 可以直接在瀏覽器中協助你工作,而 Claude for Excel 則專門針對試算表和財務建模進行了最佳化。Anthropic 聲稱在內部測試中,Excel 相關任務的準確度提升了 20%,效率提升了 15%。
Claude Code 桌面版
現在可以直接從桌面應用啟動 Claude Code,支援同時運行多個本地和遠端編碼工作階段。這讓 AI 輔助編程的工作流程更加順暢。
兩種截然不同的使用體驗
發布後的第一週,Reddit 和 Twitter 上出現了有趣的現象:同一個模型,卻引發了兩極化的評價。
狂喜派的故事
一位開發者讓 Opus 4.5 做他的「標準測試」,建造一款 3D 第一人稱射擊遊戲,包含敵人、道具強化、經驗值系統。這個測試之前所有 AI 模型都會失敗。Opus 4.5 一次完成。完整遊戲、粒子特效、音效、連擊計數器,全部到位。
另一位用戶說:「困擾我數月的問題,10 分鐘就解決了。」
還有人說:「我創造了我曾經夢寐以求的東西。」
挫折派的故事
同一時期,另一批開發者在抱怨:「Opus 4.5 需要冷靜下來。」他們的經歷大同小異:請 Claude 分析問題,結果它直接動手改了程式碼;要求探索方案,它卻重寫了架構;希望討論再決定,它已經宣布任務完成。一位開發者寫道:「我發現這導致了糟糕的架構決策和大量的重複工作。」
差異的根源:協作模式不匹配
仔細分析這兩群人的使用方式,會發現一個關鍵差異。成功的使用者有一個共同點:他們給予 Opus 完全的自主權。「它運行了 2-3 個小時進行修復,最後終於能用了」——他們讓 AI 跑,不干預,不中途檢查,完全信任。遇到困難的使用者呢?他們想要協作,想在執行前審查,想保持對流程的控制。這不是誰對誰錯的問題,而是協作模式的選擇。
Opus 4.5 被設計為一個自主型代理。它會主動識別問題、做出判斷、執行解決方案。當你的工作方式與這個設計相匹配時,它是超能力;當你期待的是一個聽命行事的助手時,它會讓你抓狂。
如何正確使用 Opus 4.5
基於社群經驗和官方建議,以下是最大化 Opus 4.5 效率的具體策略。
情境一:原型開發和獨立專案
這是 Opus 4.5 的最佳戰場。如果你在做副業專案、快速原型、或者解決一個孤立的技術問題,放手讓它跑。
具體做法:描述你的最終目標,不要過度限制實現方式。讓它自主探索、嘗試、甚至失敗後重來。你的角色是評估最終成果,而不是監督每一步。
範例提示:「建造一個能追蹤個人支出的 web app,包含圖表視覺化和月度報告功能。」然後讓它跑完。
情境二:生產環境和複雜架構
當你在有嚴格架構限制的系統中工作,決策會產生連鎖反應時,你需要明確設定邊界。關鍵策略是使用「限制性動詞」。Anthropic 官方文件也提到,Claude 4 系列模型需要更明確的指令。
有效的提示模式包括:
情境三:長期專案和知識累積
善用 Infinite Chat 功能。對於需要跨多個工作階段的專案,你可以在同一個對話中持續推進,不用擔心上下文丟失。
建議做法:在每個工作階段開始時,簡短總結目前進度和今天的目標。雖然 Claude 會保留記憶,但明確的狀態同步能確保你們在同一頁上。
情境四:需要深度思考的任務
利用 Effort Parameter。當你面對複雜的架構決策、困難的 debug、或需要創意解決方案的問題時,讓模型花更多時間思考。相反,對於簡單的格式轉換、routine 的程式碼生成,降低努力程度可以節省時間和成本。
心態調整:從「助手」到「同事」
使用 Opus 4.5 最重要的心態轉變,是把它從「執行指令的助手」重新定位為「有主見的同事」。你會怎麼跟一個能力很強、但做事風格比較激進的同事合作?你會清楚說明期望、設定邊界、但也給予信任和空間。你不會期待他每一步都來問你,但重大決策前你會要求先討論。同樣的原則適用於 Opus 4.5。當你說「幫我看看這個問題」,一個積極的同事可能會直接給你解決方案,而不只是分析報告。如果你只想要分析,你需要明確說出來。這不是 AI 的缺陷,而是協作風格的差異。學會與這種風格共處,你會發現效率可以提升數倍。
結語:選擇適合你的協作方式
Opus 4.5 的發布標誌著 AI 工具評估維度的擴展。我們不再只問「哪個模型更聰明」,還要問「哪個模型的工作方式適合我」。如果你喜歡快速迭代、願意信任 AI 的判斷、能夠評估和修正最終成果而不是監督過程,Opus 4.5 會是強大的夥伴。如果你偏好謹慎、漸進、每一步都確認的工作方式,你可能需要更多的提示工程來馴服它,或者考慮在某些任務上使用其他模型。兩種方式都沒有對錯。重要的是認識到這個選擇的存在,並有意識地做出適合你的決定。AI 模型現在有了「個性」。就像人類同事一樣,最有才華的有時候也是最難共事的。但一旦你找到正確的協作節奏,那種生產力的爆發是值得的。按下 “Return”鍵,然後信任它,或者明確告訴它你只想要分析。
選擇權在你手上。
參考資料
1. Anthropic 官方公告
https://www.anthropic.com/news/claude-opus-4-5
2. Claude 官方文件 - What's New in Claude 4.5
https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-5
3. GitHub Changelog - Claude Opus 4.5 公開預覽
https://github.blog/changelog/2025-11-24-claude-opus-4-5-is-in-public-preview-for-github-copilot/
4. TechCrunch - Anthropic releases Opus 4.5 with new Chrome and Excel integrations
https://techcrunch.com/2025/11/24/anthropic-releases-opus-4-5-with-new-chrome-and-excel-integrations/
5. The New Stack - Anthropic's New Claude Opus 4.5 Reclaims the Coding Crown
https://thenewstack.io/anthropics-new-claude-opus-4-5-reclaims-the-coding-crown-from-gemini-3/
6. Microsoft Azure Blog - Introducing Claude Opus 4.5 in Microsoft Foundry
https://azure.microsoft.com/en-us/blog/introducing-claude-opus-4-5-in-microsoft-foundry/
7. Simon Willison - Claude Opus 4.5, and why evaluating new LLMs is increasingly difficult
8. Medium - AI 編碼速度太快,開發者們都懇求它慢下來
Mohamed Abdelmoneim, 2025年12月5日
Copyright © 2025 利創智能科技股份有限公司 All rights reserved.
Replace this text with information about you and your business or add information that will be useful for your customers.
