DeepSeek(中國 AI 實驗室,以超低成本做出頂尖 AI 模型而聞名)首次對外尋求融資,目標募集至少 3 億美元,估值超過 100 億美元。這家公司過去一直由母公司幻方量化(一家靠演算法做股票交易的金融機構)獨力支撐,創辦人梁文鋒長期以「遠離商業壓力」為由拒絕外部投資,如今首度鬆口。轉向的主因是即將推出的新模型 V4 規模急劇擴張——擁有 1 兆個參數(參數就是 AI 模型的「神經元數量」,越多代表理論上越聰明、但也越燒錢),加上支援 100 萬字的超長上下文視窗(意思是 AI 一次可以「讀」一整本書再回答問題),母公司一個人負擔不起。更值得技術人員關注的是:V4 已將核心程式碼從 NVIDIA CUDA(英偉達獨家的晶片驅動語言,目前全球 AI 訓練幾乎都靠它)遷移至華為昇騰的 CANN(華為自研的晶片運算平台),若成功,這將是第一個不依賴美國 NVIDIA 晶片就能達到全球頂尖水準的大型 AI 模型,對中美科技脫鉤的格局影響深遠。
假設你是一家中小企業,想讓 AI 幫你自動撰寫客服回信,但用 OpenAI 或 Anthropic 的 API(就是「租用 AI 的接口」)每月費用讓你下不了手。DeepSeek 一貫的策略是「做出同等水準但便宜很多的模型」——上一代 R1 的訓練成本只花了約 600 萬美元,而 OpenAI 訓練 GPT-4 估計花了數十億美元。V4 預計以 Apache 2.0 授權開源(意思是完全免費、甚至可商業使用),你可以直接把模型下載到自己的伺服器跑,完全不用付 API 費。更大的意義在硬體層面:以前自架這種等級的 AI,幾乎只能買 NVIDIA 的高階 GPU(顯示卡,現在一張要價數十萬台幣),現在 V4 可以改跑在華為昇騰晶片上。對台灣、東南亞等受美國出口管制影響較小但 NVIDIA 貨源受限的地區,等於多了一條能跑頂尖 AI 的硬體路徑。對比舊情況:以前「高效能開源 AI = 必須備齊 NVIDIA GPU」,V4 若如期發布,這個預設就要被打破了。
Anthropic 的執行長 Dario Amodei 接受媒體採訪時拋出一句宣言:「彩虹沒有盡頭,彩虹本身就是目的地。」意思是他目前看不到 AI(人工智慧)持續「規模擴展」(scaling,就是用更多運算資源、更多資料訓練出更強的 AI)的任何天花板。這個說法直接挑戰了技術圈裡「AI 能力遲早撞牆」的悲觀聲音。與此同時,Anthropic 的最新研究模型 Mythos 在自主發現並利用「零日漏洞」(zero-day,指軟體公司自己都還不知道存在的安全漏洞,駭客能在官方修補前搶先利用)的測試中,成功率相比前一代大幅躍升,提供了技術層面的佐證。在政治面,Anthropic 在被五角大廈列為「供應鏈風險」、同時身陷法律訴訟的情況下,仍選擇三線並進:繼續訴訟、向川普政府簡報 Mythos 的防禦資安潛力、安排高層與白宮官員直接會談,試圖維持聯邦合約的入口。值得注意的是,Amodei 在同一次採訪中罕見地承認 AI 可能在五年內大量衝擊入門白領工作,而非用「AI 會創造更多工作」的慣用說辭迴避,這在 AI 公司高管中算是誠實的例外。
假設你是一名資安工程師,以往要找出一個新型系統漏洞,需要人工閱讀原始碼、執行滲透測試(就是模擬駭客攻擊自家系統找漏洞)、撰寫概念驗證程式,整個流程往往要數天甚至數週。如果 Mythos 等級的 AI 輔助工具進入資安市場,工程師可以用自然語言描述待測系統,讓 AI 自動掃描、嘗試利用潛在漏洞,並在幾小時內生成漏洞報告與修補建議。舊做法需要資深工程師親自執行、費時且依賴特定人才;新做法讓中階工程師也能在短時間內完成同等深度的安全審計,大幅降低人力門檻。但反面同樣成立:若此類工具落入惡意行為者手中,發動攻擊的門檻也同步大幅降低——這也是五角大廈擔憂 Anthropic 技術遭武器化的核心原因。
Meta(就是 Facebook、Instagram 的母公司)推出了第一個「閉源」前沿大模型(大型語言模型,也就是 ChatGPT 這種會對話、生成文字的 AI)Muse Spark,這是 Meta 的重大策略轉向。過去幾年 Meta 以「開源」(免費公開模型核心程式碼,讓任何人下載、修改、自行部署)的 Llama 系列聞名,吸引大批工程師和研究者。Muse Spark 改為閉源,代表外界無法下載模型、無法在自己的機器上執行,只能透過 API(透過網路連線呼叫 Meta 伺服器)使用,且目前性能仍落後 Google、Anthropic 與 OpenAI。與此同時,Meta 宣布裁員約 8,000 人(佔全球員工 10%),把省下的人力成本挹注 AI 基礎建設,2026 年資本支出預算高達 1,350 億美元,約為 2025 年的兩倍;並新設「Applied AI」部門,專攻自主 AI 代理(能自己規劃並執行多步驟任務的 AI,無需人類逐步下指令)。
假設你是一位工程師,過去習慣把 Llama 3 下載到公司內網伺服器上執行——資料不必傳出去,既省費用又符合資料隱私規定,還能對模型進行微調(Fine-tuning,用公司自己的資料再次訓練,讓 AI 更貼合業務需求)。現在 Meta 推出的 Muse Spark 是閉源的,每次查詢都必須把請求送到 Meta 的外部伺服器,本地部署(在自己機器上執行)、離線推論(不連網路也能跑)、自行微調這三種工作流程全部受阻。舊做法是:下載 Llama 模型檔 → 在公司內網直接跑 → 資料不出門;新做法則是:資料必須送出去呼叫 API → 回傳結果 → 隱私風險和網路依賴都上升。這意味著原本仰賴 Llama 開源生態的工程師,現在需要重新評估是否遷移到其他開源模型(如 Mistral、Qwen),或接受閉源 API 的限制。
Salesforce(全球最大的企業客戶管理軟體公司,幫企業追蹤業務、管理客戶資料)在 2026 年 4 月的 TDX 開發者大會發表「Headless 360」,是該公司 27 年來最大規模的架構轉型。「Headless(無頭)」代表軟體不再需要給人點擊的視覺介面——整個 Salesforce 平台、Agentforce(Salesforce 的 AI 業務自動化系統)與 Slack(企業即時通訊工具),現在全部透過 API(讓不同程式互相溝通的標準介面)、MCP(Model Context Protocol,一種讓 AI 模型以統一方式連接外部工具和資料來源的開放標準,由 Anthropic 提出)和 CLI(命令列,工程師打文字指令操作系統的方式)對外全面開放,首日提供超過 100 項工具與技能。核心理念是「API 本身就是使用介面」——AI Agent(能自動規劃並執行任務的 AI 程式)可以直接呼叫資料和工作流程,完全不需要人類介面。更重要的是,Agentforce 的收費模式也同步從「按使用座位(人頭)收費」改為「按完成的任務量計費」,正面承認 AI Agent 不登入帳號、只發 API 指令的現實,顛覆了 SaaS(雲端訂閱軟體)產業 30 年的授權邏輯。
假設一家公司的業務報告流程原本是:業務員每天登入 Salesforce、手動查詢客戶狀態、複製資料、貼到 Slack 群組通知團隊,主管確認後業務員再回去更新 CRM(客戶關係管理系統)記錄——整個流程需要人員輪流登入三個系統、重複複製貼上,每天耗費 30 分鐘。Headless 360 之後,企業可以部署一個 AI Agent:每天自動透過 Salesforce MCP 工具讀取所有客戶最新狀態,用 Slack API 發出摘要通知,並在主管於 Slack 回覆「確認」後自動更新 CRM 記錄——全程零人力介入。費用也不再計算「幾個員工買了座位」,而是計算「Agent 完成了多少筆任務」。對比舊做法,不只省下人工時間,企業也不必為每個 AI Agent 另購使用者授權,整個 IT 採購的計算邏輯從「人頭數」變成「任務完成量」。
這週 Anthropic(研發 Claude AI 的美國公司)和 OpenAI(研發 ChatGPT 的公司)同步推出多項重要產品,顯示 AI(人工智慧)正在從「單一聊天機器人」演化成三種截然不同的產品形態。第一種是「通用推理型」,代表是 Anthropic 新發布的 Claude Opus 4.7——這是 Claude(一款類似 ChatGPT 的 AI 對話助理)的最新旗艦版,在複雜軟體開發和長鏈推理(需要多步驟思考才能解決的難題)上更加精準可靠。第二種是「領域專家型」,代表是 OpenAI 的 GPT-Rosalind——這款 AI 專門為生物學、藥物研發和醫學研究打造,從頭針對生命科學的專業語言和工具深度訓練,而非把通用 AI 硬套進科學領域;同時 Anthropic 也推出 Claude Design,讓 Claude 從「能描述設計概念」升級為「能直接產出設計稿、原型、簡報」的視覺協作工具。第三種是「工作流 Agent 型」,代表是 OpenAI 新版 Codex——Codex(一種可寫程式的 AI 工具)現在不只能生成程式碼,還能自主操作電腦、使用各種軟體程式、記住使用者偏好、連接遠端環境,越來越像一個能獨立執行長期工程任務的數位助理,而非只是等著你輸入下一個指令的工具。此外,本週還有多篇值得關注的 AI 研究論文,包括改善擴散語言模型(一種非傳統架構的文字生成 AI)自我一致性的 I-DLM、Meta 提出讓 LLM(大型語言模型,就是 ChatGPT 這類 AI 的技術基礎)強化學習訓練更省算力的 experience replay 方法,以及阿里巴巴 Qwen 開源的新版高效率 agent 程式碼生成模型 Qwen3.6-35B-A3B。
以 OpenAI 新版 Codex 為例。假設我是一名 Web 開發工程師,任務是「把舊系統的資料庫從 MySQL 遷移到 PostgreSQL,並更新所有相關 API 程式碼」。舊做法是:我要自己開資料庫管理工具查看現有結構、逐一修改程式碼、去瀏覽器查技術文件、手動跑測試、再根據錯誤修改,整個流程需要我在多個工具之間來回切換協調。新版 Codex Agent(Agent 就是能自主執行多步驟任務的 AI 程式)的做法是:我只需下一個指令,它就能自己開啟終端機執行資料庫查詢、閱讀現有程式碼、上網查 PostgreSQL 文件、修改所有相關檔案、跑測試並根據錯誤繼續自動修正,直到任務完成。這個差異的關鍵不在於「它寫程式寫得更好」,而在於它從「幫我生成這一段程式碼」升級成了「幫我完成整個工程任務」,主動協調所有環節而不是被動等待。
Mozilla 基金會旗下的 MZLA Technologies 推出 Thunderbolt,一款開源的企業 AI 助手平台,直接挑戰 Microsoft Copilot 和 ChatGPT Enterprise。最大的差異是「資料主權」——傳統雲端 AI 助手會把你的對話和文件傳到微軟或 OpenAI 的伺服器,而 Thunderbolt 讓企業把整套系統裝在自己的電腦/伺服器上(即「自托管」,self-hosted,意思是自己架設、自己管理,資料不出門)。更重要的是,Thunderbolt 採用「模型無關」架構(model-agnostic,就是說這個平台不綁死某一家 AI,想用 OpenAI 就用 OpenAI、想換成本地跑的私人模型也行,一行設定就切換),讓企業不必因為今天選了某家 AI 就永遠被鎖死。Thunderbolt 也支援 MCP(Model Context Protocol,Anthropic 提出的開放標準,讓 AI 助手可以透過統一介面去讀取外部工具和資料庫)以及 ACP(Agent Client Protocol,多個 AI 代理互相協作的通訊協定),讓 AI 不只是聊天,還能串起複雜的多步驟工作流程。目前專案仍在早期開發階段,有兩個明顯問題值得注意:一是遙測(telemetry,指系統自動回傳使用數據給開發者)預設是開啟的,與「隱私優先」宣言有落差;二是「離線優先」目前仍只是設計目標,認證和搜尋功能實際上還需要連網。
假設你是一間法律事務所的 IT 負責人,律師們需要 AI 幫助草擬合約、整理判例,但客戶資料和案件內容屬於高度機密,絕不能上傳到 ChatGPT 或 Copilot 的雲端伺服器。舊做法:要麼冒著資料外洩風險使用雲端 AI,要麼完全放棄 AI 工具。現在用 Thunderbolt 的做法:在公司內部伺服器用 Docker Compose(一種容器化部署工具,類似用一份食譜一次把整套廚房設備架好)執行 `docker compose up` 把 Thunderbolt 後端跑起來,再用 Ollama(一個讓你在自己電腦上跑本地 AI 模型的工具)載入一個開源法律用語訓練的語言模型,把 Thunderbolt 的推論代理(inference proxy)指向這個本地端點。律師打開 Thunderbolt 前端介面提問「幫我整理這份 NDA 的核心風險條款」,問題和文件全程在公司內部處理,對外完全不發出任何網路請求(可透過封包監測工具確認)。哪天想換成效果更好的 Anthropic Claude API,只需改一行設定檔指向新端點,律師的工作流程介面完全不用動。相比之下,用 Copilot 的話,所有文件都會傳送至微軟的 Azure 伺服器,在 GDPR(歐盟個人資料保護法規)嚴格的合規場景下,這往往不被允許。
Cerebras Systems 是一家美國 AI 晶片新創公司,他們用一種叫做「整晶圓設計」的技術,把整片半導體晶圓(製造晶片用的那種矽圓盤)直接做成一顆超大晶片,叫做 WSE-3。這顆晶片的面積是 Nvidia H100(目前業界最主流的 AI 計算晶片)的 57 倍,內部記憶體頻寬(晶片讀寫資料的速度)達到每秒 27 PB(petabytes),超過 Nvidia 同類連接方案的 200 倍。這種極大化設計,讓 WSE-3 在「推論」(inference,就是讓 AI 模型回答你問題的那個過程)速度上遠超傳統方案——實測可以每秒 1,400 個 token(大約每秒生成 1,400 個字)的速度運行 Qwen 3 235B 這種大型 AI 模型,相比之下 Claude Haiku 約每秒 60 個 token、Claude Opus 約 30–40 個,差距達幾十倍。2026 年 4 月,Cerebras 第二度向美國 SEC 提交 IPO(公開上市)申請,以 230 億美元估值準備在 Nasdaq 掛牌,主要依靠 OpenAI 簽下的 200 億美元多年期推論算力合約撐起上市敘事,但高度集中於單一大客戶的風險也引發市場疑慮。
假設你要開發一個即時語音助理 App,使用者說完一句話,AI 要在 0.5 秒內完整回應,對話才不會感覺卡頓。傳統方案用 AWS 的 Nvidia GPU 跑中型開源模型(如 Llama 3 70B),每秒只能生成 30–50 個 token,0.5 秒只夠輸出十幾個字,使用者明顯感受到等待感。改用 Cerebras 的 WSE-3 雲端 API(Cerebras Cloud API,可直接申請帳號試用),同一個 70B 模型每秒可達 600–800 個 token,0.5 秒能給出一段完整回應,實現真正無感知延遲的即時對話體驗。差距就是:舊方案勉強能跑但延遲明顯,Cerebras 方案可做到與真人對話相當的流暢度。要注意的是,WSE-3 對需要超大記憶體存取的 MoE(混合專家,一種把多個小型 AI 模型組合成超大模型的架構)模型表現較差,且目前最大僅支援 128k 字元的對話上下文(即 AI 一次能記住的對話長度),對需要超長記憶的應用有所限制。
Recursive Superintelligence 是一家 2025 年底在倫敦成立的 AI 新創公司,核心目標是打造一套「能自我改進的 AI 系統」——也就是說,AI 會自動修改自己的演算法和訓練方式,完全不需要工程師手動介入,就能持續讓自己變得更強大。公司雖然不到 20 名員工、尚未推出任何公開產品,卻已完成至少 5 億美元融資,由 GV(Google 旗下的創投部門)主導、Nvidia(專門生產 AI 訓練所需繪圖晶片的大廠)參與,估值高達 40 億美元,市場押注的是技術潛力而非現有成果。創辦人 Richard Socher 曾任 Salesforce(美國大型企業軟體公司)AI 研究長,他認為現有 AI 開發最大的瓶頸是「人類驗證太慢」,因此希望讓 AI 自動完成從資料篩選(決定用哪些資料訓練)、模型訓練(讓 AI 學習)到研究方向選擇的整個流程。聯合創辦人 Tim Rocktäschel 的團隊曾以「Genie 互動式世界模型」(一種讓 AI 能生成並操控虛擬遊戲環境的技術)獲 ICML 2024(國際頂級機器學習研討會)最佳論文獎,為技術可信度背書;不過 Financial Times 指出,遞迴自我改進長時間運作的可靠性至今仍屬「未被驗證」,停留在研究階段,公司預計 2026 年 5 月正式對外發布第一個產品。
目前 AI 系統(例如 ChatGPT、Claude)每次升級,工程師都要手動設計訓練資料、調整模型結構、逐一評估輸出品質,一個版本迭代往往耗費數個月和龐大人力。Recursive Superintelligence 的主張是:若技術成熟,工程師只需給定一個目標(例如「讓這個 AI 更擅長寫程式」),系統就能自動跑評測、自動挑選訓練資料、自動調整訓練策略,甚至自動決定下一步要研究什麼——把迭代週期從數個月壓縮到數天甚至數小時。但這目前仍是願景:公司沒有任何公開可測試的產品,2026 年 5 月的發布才是第一個能驗證這套說法的關鍵節點;若屆時無法展示實質能力,40 億美元估值將面臨很大的修正壓力。
2026 年第一季,全球 App 上架數量年增 60%,iOS App Store 更高達 80%,到了 4 月兩大平台(iOS + Android)合計年增更衝上 104%。分析師認為最大推手是 AI 開發工具,尤其是 Claude Code(一種讓你用自然語言描述需求、AI 幫你寫好整個 App 程式碼的工具)和 Replit(一個線上程式編輯平台,AI 可以全程輔助從設計到完成的流程)——這些工具讓完全沒有程式基礎的人也能獨立完成甚至第一次完成一款 App。這波浪潮也帶來類別結構性轉變:生產力類(Productivity,就是幫人提升工作效率的應用,例如待辦清單、筆記、排程工具)首次進入 App Store 新上架前五名,工具類也從第 4 升至第 2——與 AI 輔助開發的各式效率工具高度吻合。同期 ChatGPT 在 2026 年 1 月創下 5,600 萬次下載的歷史新高,顯示 AI 應用本身也同步爆發。
假設你是一位沒有任何程式基礎的餐廳老闆,想做一款幫顧客線上訂位、自動提醒的小工具 App。過去的做法是:找外包工程師、寫需求文件、溝通數週、花費幾十萬台幣、等待三到六個月才能上線,中途還可能因溝通落差需反覆修改。現在用 Replit 或 Claude Code,只需要用白話文打出「我需要一個 App,讓顧客選日期、選人數、填名字電話完成訂位,並在用餐前一天自動發提醒簡訊」,AI 會自動產出可執行的程式碼、協助你測試功能、生成上架說明文字,整個流程可能壓縮到幾天內完成、費用大幅降低。這正是 App Store 上架數暴增的原因——以前的技術門檻消失了,大量原本「有想法但沒能力動手」的創作者現在都能直接入場,競爭者的組成正在根本性地改變。
2026 年 4 月,一篇發表在 arXiv(全球最大學術預印本平台,可理解為「論文草稿公開庫」)的研究論文發現:只需短短 10 到 15 分鐘的 AI(人工智慧聊天工具,如 ChatGPT)問答使用,就能在「事後不用 AI 的情況下」顯著降低人的解題能力與答題堅持度。研究共招募 1,222 名受試者,分三組進行數學推理與閱讀理解測試:有 AI 輔助組、對照組(完全不用 AI),以及可用 AI 但選擇不用的組。結果顯示,AI 組跳題的頻率幾乎是對照組的兩倍;其中 61% 的 AI 使用者選擇「直接要 AI 給答案」,這群人後來的表現最差。反過來,那些可以用 AI 卻選擇自己解題的受試者,表現竟然比什麼都沒有的對照組更好。研究者提出兩個解釋:一是 AI 重新校準了人對「難度」的感知,讓後來沒有 AI 的題目感覺特別難;二是用 AI 直接給答案,讓使用者跳過了「有益掙扎」(Productive Struggle,認知科學概念,意指解題過程中適度的困難感是幫助記憶與技能內化的關鍵步驟),結果反而沒學到東西。
假設你是一位剛入職的工程師,在學習新語言 Python 時遇到一個程式錯誤(bug)。你習慣性地把錯誤訊息貼給 ChatGPT,它立刻給你一段可以跑的程式碼,你複製貼上,問題解決,繼續往下走。這樣重複幾次之後,你發現自己遇到沒有網路的情況,完全不知道如何推理這個錯誤是從哪來的、為什麼那樣修就好了。對照另一個做法:遇到同樣的錯誤,先自己看文件嘗試 20 分鐘,理解錯誤的根本原因,才去問 AI 確認方向——這樣的你,三個月後能獨立 debug 的能力遠比前者強。本研究數據顯示,這不只是感覺上的差異,而是可以在測試中量測到的認知能力退化。對公司而言,若大量員工都走「直接問 AI 要答案」這條路,2 到 3 年後可能面臨員工核心能力空洞化的問題,初級工程師與分析師尤其脆弱。
Tesla(特斯拉電動車公司)的 Robotaxi(機器人計程車,由 AI 電腦全程自動駕駛、車內不需要人類司機的叫車服務)在 2026 年 4 月正式進入德州的達拉斯與休斯頓,加上原本的奧斯丁,全德州已有三座城市可使用此服務。不過實際規模極度有限——達拉斯和休斯頓各只有 1 輛車上路,奧斯丁目前也僅約 46 輛,對大城市而言形同試水溫。這項服務採用 Tesla 的 FSD(Full Self-Driving,完全自動駕駛,意思是 AI 自行應對所有路況,不仰賴人類介入)技術,車內完全沒有安全員監督。然而奧斯丁自 2026 年 1 月取消安全員後,短短一個月內就向監管單位申報了 14 起事故,安全性仍受外界質疑。
假設你住在達拉斯,好奇想搭一次 Tesla Robotaxi 體驗無人駕駛——理論上可透過 Tesla app 叫車,上車後沒有司機,AI 全程掌控方向盤與油門。但現實是整座城市只有 1 輛車在服務,等車時間可能遠超一般 Uber,更接近「搶名額體驗活動」而非真正可用的日常交通。相較之下,傳統叫車服務(Uber、Lyft)在同一城市可能有數千輛車隨時待命,實用性差距懸殊。對一般人來說,Tesla Robotaxi 目前仍是象徵性展示,距離取代日常計程車還差得遠。