AI 每日彙整

OpenAI Spud 模型外洩：或命名 GPT-6

這是什麼

2026年4月，OpenAI（就是開發 ChatGPT 的那家美國AI公司）內部一份高層備忘錄遭到外洩，揭露了代號「Spud」的下一代旗艦模型。根據備忘錄，Spud 的預訓練（就是讓AI在龐大資料上反覆學習的核心訓練階段）已於3月24日完成，目前正在進行安全評估，預測市場顯示在4月底前發布的機率高達78%。這個模型被列為 OpenAI Q2（第二季）企業業務最重要的戰略目標，預計讓 ChatGPT、Codex（程式碼輔助 AI 工具）與 Agent 平台（能自動幫人完成多步驟工作的AI系統）等所有產品「大幅提升」。命名邏輯很有趣：若 Spud 在 SWE-bench Pro（一個專門測試AI解決真實工程問題能力的評分系統，分數愈高代表能替工程師做愈多事）達到70分以上，就命名為 GPT-6；若只達60分段則命名為 GPT-5.5。目前競爭對手 Anthropic（Claude 的開發商）的 Mythos 模型已拿到77.80分，而 OpenAI 現有的 GPT-5.4 只有57.70分，落後明顯。為了替 Spud 釋出算力（就是AI訓練與運行所需的電腦計算資源），OpenAI 甚至宣布終止旗下影片生成產品 Sora，可見公司對這個模型的重視程度。

實際案例

假設我是一名工程師，每天需要用 AI 工具協助寫程式和修 Bug（程式錯誤）。目前用 GPT-5.4，它在 SWE-bench Pro 只拿57.70分，意思是遇到真實的工程問題，它只能可靠解決大約一半多一點。比如我叫它「幫我找出這段程式在高流量下為什麼會崩潰」，它可能給出一個看起來有道理但實際跑起來沒用的答案，因為它無法完整追蹤程式碼在不同套件（就是各個功能模組）之間的複雜互動關係。如果 Spud 真的達到70分以上並命名為 GPT-6，根據早期測試用戶反饋，它具備「更佳的依賴關係掌握」——意思是它能更完整地理解A功能壞掉會連帶影響B和C，從而給出真正可以直接套用的修復方案，而不是猜測性建議。差別是：用舊版AI，我還要花時間驗證它給的答案是否有效；用新版AI，直接執行的成功率更高。不過要注意，企業 API（付費串接AI服務的開發者）用戶要比 ChatGPT 訂閱用戶晚4-8週才能用，若有升級計畫需提前排好時程。

daily閱讀原文 →

Anthropic Glasswing AI 主動發現並修補零日漏洞

這是什麼

Anthropic（開發 Claude AI 的公司）宣布推出「Project Glasswing（玻璃翅計畫）」，這是一個利用 AI 主動找出並修補重大軟體漏洞的全球性安全計畫。計畫核心是一個尚未公開發售的全新 AI 模型「Claude Mythos Preview（Claude 神話預覽版）」，這個模型已經在全球每個主要作業系統（例如 Windows、Linux、macOS）和網頁瀏覽器中都找到了嚴重的「零日漏洞（就是尚未被公開、連廠商自己都不知道的安全破口，一旦被壞人先找到就可以直接攻擊）」。計畫由 Anthropic 聯合 AWS、Apple、Google、Microsoft、NVIDIA 等 12 家科技巨頭共同發起，另外超過 40 個組織也獲得系統存取權限來保護開源軟體。Anthropic 承諾投入 1 億美元的模型使用額度，並捐贈超過 400 萬美元給開源安全基金會，目標是在 AI 驅動的網路攻擊成為主流威脅之前，提前修補全球最重要的軟體基礎設施。Claude Mythos Preview 在 CyberGym（專業資安能力測試）中達到 83.1% 的漏洞重現率，遠高於現有公開版 Opus 4.6 的 66.6%，代表 AI 在資安領域的能力已大幅超越大多數人類安全專家。

實際案例

舉個具體例子：FFmpeg（一個幾乎所有影音播放器、串流平台都依賴的開源程式庫）裡有一個潛伏了 16 年的漏洞，過去五百萬次自動化安全測試從未發現它——人類和傳統工具都完全錯過了。Claude Mythos Preview 找到了這個漏洞，並提交給維護者修補。另一個案例是 OpenBSD（一個以安全聞名的作業系統）裡存在了 27 年的漏洞，這個漏洞允許攻擊者從遠端讓系統崩潰，對比舊做法（人工滲透測試、定期掃描），AI 能 24 小時不間斷地對整個程式碼庫做深度分析，看見人類長期忽略的盲區。Glasswing 計畫的核心邏輯就是：現在 AI 已強到能自動找出這些漏洞，如果防禦方不率先用它來修補，攻擊方就會用它來攻擊——所以要搶先一步。

📰 每日 AI 彙整