AI Daily Digest

📰 每日 AI 彙整

2026-05-04  ·  共 14 則報導
T1 爆炸重要T2 值得關注T3 一般資訊T4 參考用T5 可略過
T2
T2
PyTorch Lightning 供應鏈攻擊事件

PyTorch Lightning(一套廣受 AI 工程師採用的開源訓練框架,功能類似讓撰寫深度學習程式更輕鬆的輔助工具組)在 2026 年 4 月 30 日遭到供應鏈攻擊(攻擊者入侵你信任的軟體發布管道,把惡意程式夾帶進去,就像在正牌商品的生產線上偷動手腳)。駭客竊取了官方發布憑證後,在 PyPI(Python 語言的套件官方市集,功能類似 App Store,但是給開發者安裝程式函式庫用的)悄悄推送了被植入惡意碼的版本 2.6.2 與 2.6.3,從上架到下架僅約 42 分鐘,但這段時間已有用戶安裝。最危險的地方在於:只要工程師在程式裡寫下 `import lightning`(就是「啟動這套工具」的一行指令),惡意碼就會自動執行,完全不需要任何互動,便能竊取機器上儲存的雲端帳號金鑰(就是登入 AWS、Google Cloud 等服務的帳密)並傳送給攻擊者。由於 AI 訓練環境通常在同一台機器上同時持有模型資料與雲端高權限帳號,一旦中招,攻擊者可以橫跨多個雲端服務,造成大規模資料外洩甚至費用爆炸。

假設你是一位 AI 語音工程師,團隊正在一台配備高端 GPU(圖形運算晶片,AI 訓練的核心硬體)的伺服器上訓練語音辨識模型。4 月 30 日下午,一位同事為了修個小 bug,順手執行了 `pip install --upgrade lightning`(就是「更新這套工具到最新版」的指令),安裝了剛上架的 2.6.2。那台伺服器同時儲存著公司的 AWS 金鑰(用來把訓練好的模型存到雲端儲存桶)和 GitHub token(用來推程式碼)。下午你開啟訓練腳本,第一行 `import lightning` 一執行,惡意程式在背後悄悄啟動,幾秒內把 AWS 金鑰、GitHub token 打包傳送出去——你完全看不到任何異狀,訓練也照常進行。攻擊者拿到金鑰後,可以刪除你所有雲端資料、用你的帳號開虛擬機挖礦、甚至以公司名義在 GitHub 推送惡意版本污染你們的開源專案。相比之下,如果事前在 CI(持續整合系統,就是自動測試和部署的流水線)裡設定了「依賴雜湊鎖定」(每個套件版本有一組獨一無二的數位指紋,安裝前先比對是否一致),系統在安裝 2.6.2 時就會發現指紋不符,自動阻擋並告警,完全避開這次事件,一行惡意碼都不會跑到你的環境。

T2
Claude Security 開放公測

Anthropic(開發 ChatGPT 競品 Claude 的美國 AI 公司)於 2026 年 4 月 30 日推出 Claude Security 公開測試版,讓所有使用 Claude Enterprise(Anthropic 的企業級 AI 訂閱方案)的客戶都能透過網頁直接存取。這套工具不像傳統安全掃描程式只是對照規則找特定關鍵字,而是像人類資深工程師一樣,把整份程式碼庫(也就是軟體的所有原始碼檔案)完整讀過一遍,追蹤資料在不同檔案和模組(程式的功能分組)之間如何流動,從而找出藏在多個檔案互動中才看得出來的隱藏漏洞(程式中可能被駭客利用的安全缺陷)。系統由 Claude Opus 4.7(Anthropic 最新旗艦 AI 模型)驅動,掃描後會輸出每個漏洞的嚴重程度評分、被實際攻擊的可能性高低,以及分級的修補建議,修補方案需經人工確認後才會部署。早期測試期間,舊版系統已在真實開源軟體專案中發現超過 500 個存在長達數十年、從未被偵測到的安全漏洞;公開測試版更新增了排程自動掃描、Slack 與 Jira(常見的企業通訊與專案管理工具)整合,以及 CrowdStrike、Microsoft Security 等主流安全平台的串接。

假設我負責維護一套電商網站的後端程式碼,過去每年得花幾十萬元外包給資安公司做一次性滲透測試(就是請具有駭客思維的專家模擬攻擊、找出系統漏洞)。現在只要透過 Claude Security 把整個程式碼庫指向 AI 分析,它會自動追蹤所有程式檔案,找出例如「使用者輸入的資料在 A.py 接收、傳遞到 B 模組處理、最後在 C.py 執行資料庫查詢時,中途完全沒有做任何過濾,攻擊者可以夾帶惡意指令竊取整個資料庫(即 SQL Injection,SQL 注入攻擊)」這種跨多個檔案才看得出來的漏洞。掃描結果列出嚴重程度與修補方案,工程師確認後可直接部署修補。相比舊做法:傳統外包一年一次、費用高昂、結果只是一份快照報告;Claude Security 可排程定期自動掃描,讓安全審查變成每天都在運行的常態流程,邊際成本大幅降低。

T2
Mistral 發布三合一旗艦 Medium 3.5

Mistral AI(一家法國人工智慧公司)發布了旗艦新模型 Mistral Medium 3.5,把原本三個獨立產品——對話用的 Medium 3.1、強化推理的 Magistral、以及程式碼生成用的 Devstral 2——整合成一個單一模型,讓使用者不需要在不同 AI 工具之間切換。這款模型有 1280 億個參數(參數就像 AI 大腦的神經連結數量,越多通常能力越強),屬於 Dense(密集)架構,意思是每次回答時所有參數都會運算,不像某些模型只啟動一部分。它支援超長輸入,最多可處理 256,000 個 token(token 是文字的基本單位,大約等於 20 萬個中文字),還能同時理解圖片和文字。推理模式(讓模型深度思考再回答)可以透過 reasoning_effort 參數隨時開關,需要深度分析就打開,只需快速回答就關掉,節省成本又彈性。授權採用修改版 MIT 授權,允許商業自架,自建至少需要 4 張顯示卡、約 64GB 記憶體。

假設我是軟體工程師,要用 AI 自動修復 GitHub 上的程式錯誤報告(bug)。以 SWE-Bench Verified(一個專門評測 AI 解決真實 GitHub 問題能力的標準測試,分數越高代表自動修復能力越強)為例,Mistral Medium 3.5 拿到 77.6% 的成績,超越了體積比它大三倍的 Qwen3.5 397B 模型。實際使用時,我透過 API 傳入 bug 描述與相關程式碼,模型自動診斷問題、產出修復方案,再搭配新發布的 Vibe Remote Agents(一套可以在隔離沙箱——獨立安全測試環境——中自動執行任務的代理工具)串接 GitHub 流程、自動提交修復。舊做法需要分別呼叫「對話模型 API」、「推理模型 API」、「程式碼模型 API」三個端點,現在一個模型搞定;但代價是定價從前代每百萬 token 輸入 $0.4 漲到 $1.5,漲幅近四倍,大量呼叫前需重新估算成本。

T2
五角大廈簽約八大 AI 公司部署機密網路

2026 年 5 月 1 日,美國國防部(即五角大廈)與 Nvidia、Microsoft、AWS、Oracle、Google、SpaceX、OpenAI 及 Reflection AI 八家科技公司正式簽署協議,授權這些公司在美軍的機密電腦系統上部署 AI。這裡說的「機密系統」分兩個等級:IL6 是一般機密(類似軍事機密文件),IL7 則是最高等級的國安情報系統,平時根本不對外開放。國防部的目標是建立「以 AI 為核心的戰鬥力量」,讓 AI 輔助戰場決策和態勢判斷,目前已有超過 130 萬名軍事人員在非機密的平台上使用 AI。值得注意的是,Anthropic(也就是研發 Claude 這款 AI 的公司)因為拒絕接受「所有合法用途均可使用」的開放條款而被踢出局,國防部甚至把 Anthropic 列為「供應鏈風險」,雙方已進入訴訟,Anthropic 並在 2026 年 3 月取得法院禁止令,阻止政府逕自使用其 AI 模型。

假設你是一家 AI 公司的決策者,現在政府端來一份大合約,條件是你的 AI 必須允許「所有合法用途」——意思是政府日後可以把你的 AI 用在任何他們認定合法的場景,包括你當初沒有預期的軍事或情報用途。OpenAI 等七家公司選擇接受條款、拿下合約,進入了這個潛在金額極高的政府市場;但代價是:他們在合約中承諾的「禁止用於大規模監控、自主武器、高風險自動決策」這三項限制並未明確寫入合約正文,執行力根本存疑。Anthropic 則走了另一條路:拒簽、被踢出、打官司、取得禁止令,犧牲了市場機會,卻也在業界確立了「AI 倫理底線是可以有商業價值的」這個先例。這個案例正在重新定義 AI 公司與政府合作的邊界——接合約容易,但要怎麼確保 AI 不被濫用,目前業界還沒有答案。

T2
開源 AI 代理能力首次媲美 GPT-5.5

長期以來,最強大的 AI 模型(就是 ChatGPT、Claude 這種需要付費訂閱或呼叫 API 才能用的系統)都比免費開源的版本強很多。但 2026 年 4 月出現了重大轉折:多個開源 AI 大型模型(就是任何人都可以下載、自己架設在電腦或伺服器上的 AI)的能力大幅進步,已經逼近頂尖商業版本。其中最受矚目的是 DeepSeek V4 Pro——由中國公司深度求索開發、免費公開讓人下載的超大型 AI 模型(共 1.6 兆個參數,但實際運算時只啟動 490 億個,節省電力)。在「能不能連續幫你完成多步驟複雜任務」這項能力指標上,DeepSeek V4 Pro 被實際使用者描述為「第一個讓人感覺真的可以跟 Claude Code(Anthropic 提供的付費程式設計 AI 助手)比較的開源模型」。根據 AI 研究分析機構 Artificial Analysis 的智能指數評分,DeepSeek V4 Pro 拿到 54 分,Claude Opus 4.7 拿到 57 分,GPT-5.5 拿到 60 分——開源模型只差幾分就追上了商業頂尖水準,且支援 100 萬個字元的超長輸入(約 75 萬個英文單字),並持有開放商業使用的授權。同期另外兩款開源模型 Kimi K2.6(月之暗面)和 MiMo V2.5 Pro 也都達到 52–53 分,4 月整體被社群稱為「開源 AI 史上最強的一個月」。

我是一位小型新創公司的工程師,過去每個月要花大約 300 美元(約台幣 1 萬元)呼叫 Claude Code API,讓 AI 幫我自動讀程式碼、修 bug、撰寫測試。現在我可以把 DeepSeek V4 Pro 下載到公司自己的伺服器上,然後用同樣的方式指派多步驟任務——「先讀 user_service.py → 找出潛在安全漏洞 → 自動產生修補方案 → 寫測試驗證」。測試者在 Fireworks 推理服務上部署後,確認 DeepSeek V4 Pro 能穩定完成這類多輪程式開發流程,行為與 Claude Code 相近。以前做這些要花錢、資料還要傳到外部公司伺服器;現在跑本地開源模型的邊際成本接近零,資料也不用離開公司。差異就是:兩年前「本地跑、效果夠用」的方案根本不存在,現在真的有了。

T3
T3
Uber 四月燒盡全年 AI 預算的教訓

Claude Code 是 Anthropic(開發了與 ChatGPT 競爭的 AI 的公司)推出的一款 AI 程式撰寫助手(就是讓 AI 幫工程師自動寫程式碼的工具)。Uber 在 2025 年底全面開放這款工具給內部工程師使用,結果短短四個月就燒光了原本預估一整年的 AI 預算。根本原因是:企業用「買辦公室軟體授權」的舊思維(固定人頭費)來估算一個「依用量計費」(用多少付多少)的工具成本,嚴重低估實際花費。當工程師啟用「代理模式」(agentic mode,就是讓 AI 自己讀整個程式庫、跑測試、同時開多個任務分支、自動送出程式審核),每次操作消耗的「token」(AI 系統用來計費的基本單位,可以想像成 AI 每讀或寫一個字就消耗幾個 token)會指數級暴增。這起事件正在改變業界:高採用率不等於高投資報酬,企業必須把 AI 編程工具當作「可變成本基礎設施」來管理,而非固定席位軟體,並同步建立即時監控與預算配額機制。

假設一家公司的工程師要重構(就是重新整理、改善既有程式碼結構)一個有一萬行程式碼的服務。傳統做法是工程師自己看程式、逐步修改,花一週時間。改用 Claude Code 代理模式之後,工程師下指令「幫我把這個服務重構成微服務架構」,AI 自動讀取整個程式庫(大量 token)、分析依賴關係、同時在三個分支裡跑測試(每次測試又消耗 token),最後送出多份程式審核請求。原本預估「一個工程師一個月用量」的 token 預算,可能被這一個任務燒光。Uber 的失誤在於:從未設定每人每月的 token 上限,也沒有即時監控哪些任務在高速消耗資源,帳單出來才發現四個月燒掉全年額度。對比之下,成功控制成本的工程師通常只在「改 bug」或「寫測試」這類邊界清楚的任務上使用 AI,而非讓 AI 無限制跑大型重構——同樣的工具,每月只花 20 美元就達到顯著效益。

T3
Grok 4.3 大降價搶 Agent 市場

Grok 4.3 是 xAI(Elon Musk 旗下的 AI 公司)在 2026 年 4 月底悄悄發布的新款 AI 語言模型(就是 ChatGPT、Claude 這類可以幫你對話、分析、處理文件的 AI)。這次更新最醒目的是大幅降價:讓 AI 輸出的費用從每百萬 token(token 是 AI 理解文字的最小單位,一百萬 token 約等於 75 萬字)6 美元砍到 2.5 美元,降幅達 58%,也就是請同一個 AI 工作,成本少了一半以上。在「讓 AI 自主完成多步驟任務」的能力評分(業界稱為 Agentic 能力,就像讓 AI 自己規劃、執行、修正一整串工作的能力)上,Grok 4.3 從 1179 分跳升至 1500 分,進步幅度相當顯著。它同時支援一次餵入高達一百萬個 token,大約等於三四本長篇小說的文字量,可以一口氣處理超長文件而不需要人工切段。不過它仍落後市場領先的 GPT-5.5,且缺少 Claude 和 GPT 系列已有的 MCP 整合(讓 AI 工具之間互相溝通的標準介面)及跨對話記憶功能,目前的生態系統成熟度落後主要競品至少半年,是企業評估採用前必須考量的硬傷。

我想建一條 AI 自動化流程:讓 AI 讀取 100 頁的合約 PDF,自動逐條比對風險條款,再輸出一份摘要報告。如果用同價位的 Claude Sonnet 4.6,每百萬 token 輸出約需 3 美元;改用 Grok 4.3 只需 2.5 美元,批次跑大量長文件時,一個月累積下來的費用差距相當可觀。更重要的是,Grok 4.3 支援一百萬 token 的上下文窗口,整份 100 頁合約可以直接一次丟進去,AI 完整讀完再輸出跨頁比對結果,不需要切段再拼接。舊做法若用只支援 10 萬 token 的模型,同樣一份合約得手動切成 10 段分批送入、再讓 AI 匯整,過程中容易漏掉跨段落的條款關聯。Grok 4.3 的流程是:上傳完整文件 → AI 一次讀完 → 直接輸出完整比對報告,完整性和效率都明顯提升。但要注意,Grok 4.3 第一個字出現要等約 12.65 秒(即 TTFT——從送出請求到收到第一個回應的等待時間),適合在背景跑批次任務,不適合用在需要即時回應的對話場景。

T3
Qwen 3.6 vs Gemma 4 開源中型模型比較

Qwen 3.6 27B(阿里巴巴出品)與 Gemma 4 31B(Google DeepMind 出品)是 2026 年 4 月密集發布的兩款開源 AI 語言模型(就是可以直接裝在自己電腦或伺服器上、不需要透過雲端服務的 AI),兩者都可以免費商業使用,定位都是「消費級顯示卡能跑的中型模型」。社群用「讓 AI 一次性寫出一個可執行的吃豆人遊戲」來比較,結果 Gemma 4 分鐘就交出可執行成品,Qwen 則花了 18 分鐘、但輸出的推理過程近 5.5 倍詳細。然而在標準化的 agentic coding(就是讓 AI 自動完成多輪複雜程式任務)評分中,Qwen 以 70.6 分大幅領先 Gemma 的 41.6 分,差距高達 29 分。社群也指出這次比較方法論有問題:測試沒揭露使用的量化等級(量化是把模型「壓縮」以便在較小記憶體中運行的技術),且吃豆人程式碼極可能已存在於訓練資料中,導致結果無法複製也難以作為選型依據。

假設你要用本地模型建立一個「自動修 GitHub issue」的 AI 程式助手——它需要讀取 issue 描述、寫出修正程式碼、自我檢查錯誤、再反覆調整。這種需要多輪思考的 agentic 工作流程中,Qwen 3.6 27B 有「thinking preservation(思考過程保留)」特性,能在每輪對話中延續前一輪的推理脈絡,不用每次重新理解上下文,最終輸出更完整的修復方案;相比之下,傳統做法或 Gemma 在這類多輪任務中可能每次都從頭想起,容易出現前後矛盾。但 Qwen 目前有個明顯障礙:它和最流行的本地模型管理工具 Ollama 不相容,如果你現有流程依賴 Ollama,就必須改用 llama.cpp 重建整個工具鏈,增加一次性的技術遷移成本。硬體方面,Qwen 以 18GB 顯示記憶體可跑,Gemma 則需要 24GB,差距約 25-30%。

T3
科技巨頭 AI 投資 2026 年飆至 7250 億

2026 年,Google、Amazon、Microsoft、Meta 四家大型科技公司合計計畫砸下 7250 億美元(約新台幣 24 兆元)在 AI 相關基礎設施上,比 2025 年增加了 77%,是企業史上最大規模的單年度資本支出承諾。這筆錢主要用在三個地方:建設 AI 資料中心(存放並運行大量 AI 模型的大型機房)、採購記憶體晶片,以及開發自家 AI 晶片。然而這股龐大需求也讓供應鏈嚴重吃緊——AI 晶片所需的 CoWoS 封裝技術(台積電開發的一種讓多顆晶片緊密整合、大幅提升效能的製程)幾乎全被 Nvidia(全球最大 AI 晶片廠商)提前鎖定至 2026 年中;DRAM(動態隨機存取記憶體,AI 訓練大量消耗的一種記憶體)今年第一季漲價 95%、第二季預計再漲 58–63%;連資料中心的電力設備(如變壓器)交貨期都長達 128 週,導致全球約兩成規劃中的資料中心面臨延誤。Microsoft 財務長更坦承,1900 億美元資本支出中有 250 億直接歸因於記憶體成本飆升。

假設你是一家中型 AI 新創公司的技術長,計畫在 2026 年底前擴充算力來訓練自家模型。按照過去的做法,你只要聯絡 Nvidia 購買最新 GPU(繪圖處理器,也是 AI 訓練的核心計算硬體)即可。但現在的狀況是:Nvidia 高階 AI 晶片(H200、B200)所需的 CoWoS 封裝產能,已被各大科技公司提前包下,散戶訂單根本搶不到貨;DRAM 漲了近一倍,讓每套伺服器成本大幅攀升;你若想自建機房,變壓器還要等兩年多才交貨。實際可行的應對方式是轉向租用雲端算力(Google Cloud、AWS 等雲端平台),或改用異構算力(如 Google TPU 雲端服務)而非堅持自建 Nvidia GPU 叢集——不這麼做的話,很可能錢花了、設備卻買不到,時程直接爛尾。

T3
Apple 洩露用 Claude AI 設定檔

蘋果公司在 2026 年 4 月底,不小心在 Apple Support App(蘋果官方客服 App)的更新包裡夾帶了一份不該公開的內部設定文件——CLAUDE.md。這份文件是 Claude Code(Anthropic 推出的 AI 程式設計助手,功能類似一個懂你程式碼庫的 AI 隊友)的專案設定檔,用來告訴 AI「這個專案是什麼、怎麼運作、有哪些規範」,相當於給 AI 看的工作手冊,正常情況下只應存在於公司內部開發環境,絕不應出現在給用戶下載的正式版 App 裡。研究者 Aaron 在更新包中發現後,蘋果隔天就緊急推出 v5.13.1 把它刪掉。這份文件揭露了蘋果內部代號「Juno AI」的 AI 平台,用於輔助客服流程,架構涵蓋真人客服與 AI 助理協作,並有兩個僅限測試階段才應存在的編譯旗標(開發人員切換功能開關的控制碼)意外殘留。彭博社記者 Mark Gurman 因此直接說:「蘋果現在是跑在 Anthropic 上的。」這對 AI 產業的意義在於:即便是以「所有核心技術自己做」著稱的蘋果,在 AI 模型這一層也選擇向外採購而非自研,顯示自建大型語言模型(LLM,也就是 ChatGPT、Claude 這類會對話的 AI 核心技術)的成本對大多數公司來說仍難以正當化。

假設你是工程師,公司要導入 Claude Code 輔助開發,你會建立一份 CLAUDE.md,寫清楚專案架構、技術規範、哪些目錄不能改動——這讓 AI 每次打開專案就知道該怎麼幫你,而不是從頭摸索。這份文件是純粹的內部知識,就像公司內網的 Wiki,不應該出現在交給用戶的軟體包裡。蘋果的工程師就犯了這個包裝失誤:把只屬於開發環境的 CLAUDE.md 一起打包進正式版 App 推上 App Store,外界才第一次確認蘋果正在用 Anthropic 的 Claude 做客服 AI 基礎。舊做法下,蘋果用什麼 AI 技術完全是黑盒子,這次意外等於讓大家看到黑盒子裡的一角——包括內部平台代號、技術堆疊、以及 AI 與真人客服如何搭配運作。

T3
GitHub Copilot 開源外掛社群資源庫

GitHub Copilot 是微軟旗下的 AI 程式碼助手(就是整合在程式設計師編輯器裡、可以自動幫你補程式碼、解釋邏輯的 AI 工具)。awesome-copilot 是 GitHub 官方在 2025 年 7 月啟動的開源社群資源庫,讓全球開發者分享和整理各自設定好的 Copilot 客製化配置。截至 2026 年 3 月,這個資源庫已累積超過 31,900 顆星(相當於網友幫這個專案按讚的數量)、3,900 次被複製使用,裡面有超過 600 項社群貢獻,涵蓋 175 個以上的 agents(自動化助手腳本)、208 個以上的 skills(技能包)、176 個以上的 instructions(指令配置)等六大資源類型。2026 年 3 月,微軟宣布三項重大升級:推出支援全文搜尋的官方網站、新增 Learning Hub 教學中心、以及 Plugin(外掛)系統——讓開發者只需一行指令就能安裝整套助手配置,大幅降低自訂 Copilot 的入手門檻。

假設你是一個 Python 後端開發者,想讓 GitHub Copilot 更貼合你平常寫 FastAPI(一種 Python 網頁框架)的習慣與規範。以前,你需要自己研究怎麼撰寫「系統提示詞」(就是預先告訴 AI 背景知識和規則的說明文字),往往要花幾小時反覆試錯才能調出稍微好用的配置。現在,進入 awesome-copilot 的官方網站,搜尋「FastAPI」或「Python backend」,就能看到其他開發者分享、已驗證可用的 skill 組合,點一下預覽確認內容,再用一行安裝指令把整套配置裝進你的 VS Code 編輯器。裝完之後,Copilot 就會依照社群整理好的 FastAPI 最佳實踐來協助你寫程式,完全不需要從零摸索。對比舊做法:過去開發者只能靠個人部落格或社群媒體貼文四處散找技巧,品質良莠不齊;現在超過 600 項社群貢獻集中在同一平台,還有官網支援搜尋和安裝前預覽,讓整個過程快速且可靠。

T3
HF CEO 談開源 AI 與未來建構者

這是 Hugging Face(一個讓 AI 研究者共享模型與工具的平台,可以想成是「AI 界的 GitHub」)共同創辦人暨執行長 Clem Delangue 的深度訪談,談論開源 AI(就是程式碼和模型權重都公開、任何人都可以下載使用的 AI 技術)的現況與未來。Clem 的核心論點是:拿開源模型跟 OpenAI 這類封閉 API(就是你只能透過付費介面使用、看不到裡面怎麼運作的 AI 服務)相比,根本是「比引擎和整輛車」——API 背後藏著工具、路由、甚至多個模型,而開源社群提供的是原始引擎,兩者不是同一種東西。他預測全球 AI 建構者人數將從目前幾百萬暴增到未來一億人,理由是 fine-tuning(讓現有 AI 模型學習你的特定資料、調整成更適合你任務的技術)和 local AI(在自己電腦或伺服器上直接跑 AI 模型、不需送資料到外部)門檻正快速下降。此外,Hugging Face 旗下的開源桌面機器人 Reachy Mini 已售出近一萬台,也體現了「讓更多人動手建、才能改變對 AI 的觀感」的核心理念。訪談也談到美國正出現遊說力量試圖限制開源 AI,Clem 認為這對美國 AI 領導地位反而是傷害,因為美國今日的 AI 優勢本就建立在開源貢獻之上。

假設你是一家醫療診所的工程師,想做一個讓診所員工查詢藥物交互作用的 AI 問答系統。舊做法:串接 OpenAI GPT-4 的 API,每次查詢花 0.01~0.03 美元不等,而且問診資料必須傳到 OpenAI 伺服器,會觸發醫療資料合規問題(病人資訊不能送到第三方)。新做法:到 Hugging Face Hub 下載一個開源的小型醫療專用語言模型,用 llama.cpp(一套可以讓你在幾乎任何硬體上跑 AI 模型的免費工具)部署在診所自己的伺服器上,再用診所累積的藥品問答資料做 fine-tuning(讓模型學會你的術語與場景)。結果:每次查詢邊際成本接近零,病人資料永不離開診所內網,還能針對診所常見問題微調準確度。代價是初期設定需要工程時間,且對複雜的開放性問題可能略遜於前沿大模型——但對「特定藥物的交互作用查詢」這類定義明確的任務,調整過的本地模型表現往往不輸通用的大模型,而且省了大量費用與合規風險。

T4
T4
Futhark 移植 microGPT 實驗

Andrej Karpathy(知名 AI 工程師,OpenAI 創辦人之一)在 2026 年初發布了一個叫 microgpt 的極簡程式,僅 243 行 Python,是用來示範 GPT-2(ChatGPT 的前身,一種能生成文字的 AI 模型)如何運作的教學級實作。2026 年 4 月底,研究者 Mark J. Nelson 把這個程式改寫到 Futhark 語言上,Futhark 是一種純函數式(每個函式不改動外部狀態、只靠輸入產出輸出)、資料並行(可同時處理大量陣列資料)的程式語言,能直接編譯成 GPU(顯示卡上的高速運算晶片)或多執行緒 CPU 的原生程式碼。改寫的主要動機是 Python 版在模型規模稍大時會因遞迴深度超限(程式呼叫自己太多層)而崩潰,Futhark 版可避開此限制、擴展性更好。目前第一篇只介紹 forward pass(推論階段,AI 從輸入算到答案的過程),訓練實作與實際速度數據預計在 Part II 公布。

假設我想在非 NVIDIA 的 AMD GPU 上跑 GPT-2 式的 forward pass,而不想依賴 PyTorch(最主流的 AI 訓練框架,但 AMD 支援不穩)。Python 版 microgpt 雖然簡單,但模型一大就崩潰,且不能直接編譯成 AMD GPU 可執行的程式。改用 Futhark 版,程式碼透過 OpenCL(一種跨廠商的 GPU 計算介面)編譯,可在 AMD GPU 上直接執行,KV cache(儲存每一層注意力運算中間結果、避免重複計算的快取結構)也改成預先分配固定大小,不會因為句子越來越長而動態擴充到崩潰。代價是:原本 33 行的 forward pass 增加到 51 行,多層巢狀的 tabulate/map/reduce(函數式語言常見的並行迴圈寫法)讓程式碼可讀性下降。適合對 GPU 並行語言多元化或 Futhark 本身有興趣的開發者追蹤,但目前缺乏 benchmark 數據,不建議直接用於正式專案。

T4
AI 資料中心用水量被誇大了

AI 資料中心(就是放置大量電腦伺服器、讓 AI 模型能夠運作的大型建築)的用水量,長期被媒體報導得極為誇張。根據加州的研究數據,所有 AI 資料中心整年的用水量,只占加州人類用水總量的 0.055% 到 0.7%,而農業用水量比 AI 用水量多了將近兩個數量級(就是百倍以上的差距)。過去甚至曾發生媒體把某資料中心的用水量換算單位算錯、整整誇大了 1,000 倍,引發大眾恐慌。這篇分析指出:AI 用水衝擊高度依賴地點——美國資料中心大本營是維吉尼亞州和德州達拉斯,跟加州情況完全不同,把加州數字套用到全國是錯誤的;微軟正在引進密閉循環冷卻技術(一種讓水可以反覆回收、不蒸發散失的冷卻設計),可大幅降低實際耗水量;真正需要改革的,是西部水權制度讓歷史用戶幾乎免費取水、沒有節水誘因的結構性問題。

假設你是一位想評估 AI 對環境衝擊的政策研究員,看到新聞說「每問一次 AI 就喝掉半瓶水」,想知道這數字可不可信。UC Riverside 估算每 100 字的 AI 提示耗水 519 毫升(約一瓶礦泉水),但 OpenAI 執行長則說平均每次查詢只用了約十五分之一茶匙的水,兩者量級差了幾十倍——差距來自估算方法(例如是否把發電廠冷卻水也算進去)。若用這些精確數字做政策分析,正確結論會是:與其推動「限制 AI 使用以省水」,不如聚焦「資料中心選在哪裡蓋」(選在濕潤氣候的維吉尼亞州,遠比選在乾燥的加州省水)以及「要求企業採用密閉循環冷卻系統」,效益才真正顯著。舊做法是被媒體數字牽著走,新做法是先確認估算假設、再比較相對規模,得出可執行的政策建議。