DeepSeek V4 是中國 AI 公司 DeepSeek 於 2026 年 4 月 24 日發布的新一代大型語言模型(LLM,就是 ChatGPT、Claude 這類會對話、會寫程式的 AI),分為 V4-Pro 與 V4-Flash 兩個版本,均採 MIT 開放授權,任何人都可以免費下載使用或商業部署。V4-Pro 擁有 1.6 兆個參數(參數數量越大,代表模型「記憶」與「推理」能力越強),並配備高達 100 萬字元的超長上下文視窗(context window,就是 AI 一次能「讀進去」的文字量),讓你可以把整本書或整個程式碼庫一次丟給它分析。在軟體工程解題測試(SWE-bench Verified,以真實軟體缺陷修復任務評估 AI 的解題能力)中,V4-Pro 拿下 80.6 分,與當前閉源頂尖模型 Claude Opus 4.6 只差 0.2 個百分點,但價格卻只需約六分之一——每處理 100 萬個 token(token 是 AI 計算文字量的單位,大約等於 75 萬個英文字)輸入只要 1.74 美元。更值得關注的是,V4 完全用中國華為昇騰 950 晶片訓練,象徵高性能大模型不再必須依賴美國 NVIDIA 晶片,具有重大地緣政治意涵。
假設你是軟體工程師,手上有一個 50 萬行的大型程式碼庫,想讓 AI 幫你找出潛在的架構問題並提出重構建議。過去用頂尖閉源模型(如 Claude Opus 4.7),分析 100 萬 token 的程式碼一次大約要花 15 美元以上,一個月跑幾十次就是幾百美元,費用讓人卻步。現在改用 DeepSeek V4-Flash(輕量快速版),同樣的任務成本可降到約 3 美元,而模型在代理式工程任務(agent task,就是讓 AI 自主完成多個步驟的複雜工作)上的得分幾乎追平頂尖閉源對手。實際操作方式:把整個程式碼庫打包成文字透過 API(程式介面,讓你的軟體呼叫 AI)送進去,提問「找出高耦合模組並列出建議拆分方案」,V4-Flash 能回出帶有具體檔案路徑和修改建議的分析報告;若覺得回答不夠精細,再升級呼叫 V4-Pro 複核。舊做法需要大量人工審查或高昂費用,新做法讓這件事可以每天自動跑、幾乎零成本。
VS Code(微軟開發的程式碼編輯器,全球最多工程師使用)在 2026 年 4 月發布的 1.118 版本中,悄悄把 Copilot(微軟旗下的 AI 程式寫作助手)的「共同作者」標籤,自動插入開發者每一筆提交記錄(commit,就是工程師儲存並說明「這次改了什麼」的操作)中。問題在於,就算開發者根本沒使用 Copilot、甚至在設定中明確關掉了所有 AI 功能,這個標籤還是會被偷偷加進去,而且藏在提交畫面看不到的地方,所以工程師按下確認前完全察覺不到。此事件曝光後,GitHub(全球最大程式碼協作平台)上已有約四百萬筆提交記錄帶著這個從未實際使用過的 Copilot 署名,嚴重動搖了「提交記錄作為可信任法律文件」的基礎。微軟在外界壓力下承認這是錯誤,承諾在下一版(1.119)修復並把預設值改回關閉,但社群批評指出,這種設計從一開始服務的是微軟自己的「AI 採用率 KPI(關鍵績效指標,用來衡量有多少人在實際使用 AI 工具)」,而非開發者的利益。
假設你是一位工程師,今天手動修好了一個跟 AI 毫無關係的程式 bug,用 VS Code 提交後,你的提交記錄尾端悄悄多了一行「Co-authored-by: Copilot
ARC-AGI-3 是由 ARC Prize Foundation 設計的一套「互動式推理環境基準測試」(簡單說就是讓 AI 在一系列陌生的規則遊戲裡解題,每道題普通人類不需要任何訓練就能解出來)。ARC Prize Foundation 對 OpenAI 的 GPT-5.5 和 Anthropic 的 Opus 4.7(這兩款都是目前市面上最頂尖的 AI 對話系統)進行了 160 場測試,結果令人驚訝:GPT-5.5 只答對了 0.43%(花費約 7 萬台幣的運算費用),Opus 4.7 更只有 0.18%,而普通人類幾乎可以 100% 解出所有題目。研究者從測試數據中歸納出三個系統性缺陷:第一,AI 能辨認個別規則(例如「這格要塗紅色」),但無法把規則整合成一個連貫的整體理解;第二,AI 會把新環境誤認為訓練資料裡見過的舊情境,用不適用的邏輯來解題;第三,AI 有時靠「碰巧猜對」通過某關,結果反而強化了它用來猜題的錯誤假設,導致後續所有題目一起垮掉。研究者特別強調,這三種缺陷在現實世界中同樣會出現——例如讓 AI 幫你操作一個從未見過說明文件的軟體或工作流程。
假設我讓 AI 助理自動操作公司內部一套老舊採購系統(AI 完全沒見過這套系統的說明書)。AI 一看到介面有「輸入品項、點送出」的欄位,就以為這跟它學過的電商購物車一樣,直接套用舊邏輯下單——這是「把陌生環境誤認為舊情境」的錯誤(對應第二類缺陷)。第一筆訂單剛好格式僥倖符合,系統沒有報錯,AI 以為自己「成功了」,於是繼續用完全相同的錯誤格式送出後續 50 張採購單——結果全數格式錯誤、被系統退回(對應第三類缺陷:靠錯誤方式「通關」後反而固化了誤解)。如果換成人工逐筆操作,操作者在第一張被退回後就會立刻察覺並調整;但 AI 在「看起來沒報錯」之後一口氣錯到底。這個研究提醒開發者:在讓 AI 代理(agent)操作陌生系統之前,流程中必須加入明確的「假設驗證」步驟(例如要求 AI 說明它認為自己在做什麼、再由另一段邏輯確認),而不是讓 AI 自行判斷有沒有成功。
ChatGPT 免費版用戶現在預設會被行銷追蹤系統收集資料。OpenAI(就是開發 ChatGPT 這個 AI 對話工具的公司)從 2026 年 4 月 30 日起,在用戶不知情的情況下,預設啟用了行銷用的 Cookie(就是網站在你電腦裡放的小記錄檔,用來辨識你的身份)追蹤機制。這個系統會把你的裝置代碼和加密過的電子郵件地址分享給廣告合作夥伴,讓他們在 Instagram 等社群媒體平台上對你投放廣告,目的是說服你付錢升級到每月 20 美元的 ChatGPT Plus 付費版。OpenAI 強調不會共享你與 ChatGPT 的對話內容,但批評者指出,AI 聊天機器人掌握的是你每次提問背後的「意圖」——也就是你在想什麼、困惑什麼、準備做什麼決定——這比普通網站瀏覽行為含有遠更豐富的個人資訊。目前歐盟依法要求用戶「主動同意」才能追蹤(opt-in),美國用戶則必須自己找設定去「主動退出」(opt-out),形成明顯的雙重標準。
假設你平時用 ChatGPT 免費版查資料或寫東西。現在,只要你登入 ChatGPT,OpenAI 就會把一個和你帳號綁定的識別碼傳給廣告夥伴。幾天後,你在滑 Instagram 時,就可能看到 ChatGPT Plus 的付費升級廣告——這就是「再行銷廣告」(Remarketing,意思是:你用過我,我就在其他地方一直提醒你來付費)。以前你用免費服務只是「看廣告」,現在你本身變成了「廣告投放的目標商品」。若你想關閉這個追蹤,需要主動進入 ChatGPT App → Settings → Data Controls → Marketing Privacy,手動切換為關閉;不主動操作的話,預設就是開啟狀態。付費企業版(ChatGPT Enterprise)用戶不受影響,但如果公司有員工用個人免費帳號處理業務資料,IT 部門就需要評估是否違反公司資料治理政策——尤其是涉及歐盟 GDPR(歐洲個資保護法規)的情境。
Meta(Facebook 的母公司)在 2026 年 5 月宣布收購 Assured Robot Intelligence(ARI),一家成立僅約一年的人形機器人 AI 新創公司。ARI 的核心研究目標是讓機器人學會做家事等日常物理動作,特別的地方在於他們的方法:讓機器人「自己觀察人類怎麼做,然後自學」,而不是靠工程師一步一步手動遙控機器人來採集訓練資料(這種舊方法叫做 teleoperation,就像玩遙控車一樣由人即時操控機器人)。ARI 的兩位聯合創辦人——前 NYU 教授 Lerrel Pinto 和前 Nvidia 研究員 Xiaolong Wang——都是頂尖學術研究者,加入後將成為 Meta Superintelligence Labs(Meta 的 AI 超級智能研究部門)的核心成員。Meta 的目標是打造「Android 版」的人形機器人生態系——自己不製造機器人硬體,而是提供 AI 大腦軟體、讓各家機器人硬體廠商都能使用,就像 Android 作業系統能讓三星、小米等不同品牌手機共用同一套軟體環境。
假設你是家用服務機器人廠商,想讓你的人形機器人學會「把洗好的衣服摺好放進衣櫃」。用傳統 teleoperation 方式,需要工程師穿上動作捕捉裝備、一次一次親自操控機器人示範摺衣動作,採集幾千筆資料才能訓練——這個過程費時費力,每換一個新任務就要重來。ARI 技術的方向是讓機器人直接觀察真實人類摺衣服的影片,從中自主抽取動作模式,不需工程師一一示範。若 Meta 整合 ARI 技術後開放授權給機器人硬體廠商,廠商就能直接使用這個「從人類行為自學」的 AI 基礎模型(一種讓 AI 具備廣泛基礎能力的通用大型模型),不必從零建立資料採集流程,大幅降低讓機器人學習新家務任務的成本。
美國影藝學院(就是每年頒發奧斯卡金像獎的機構)在 2026 年 5 月宣布新規定:從第 99 屆奧斯卡(2027 年 3 月頒獎)起,AI(人工智慧)生成的表演與劇本不得參加評選。具體來說,表演類別要求演員「可被證明是由真人在本人同意下完成」,編劇類別則要求「劇本必須由人類撰寫」才能入圍。這條規定只禁止「創作主體」是 AI,並不禁止在製片過程中使用 AI 工具——電影可以繼續用 AI 做特效、服裝設計或背景音樂,但表演和劇本的核心創作者必須可舉證為人類。已有電影因此可能失去角逐資格,包括涉及以 AI 技術重現已故或年輕版演員的《復仇者聯盟:末日》與傳記片《麥可》。這項規定也被視為 2023 年好萊塢演員與編劇工會大罷工(當時工會核心訴求之一即限制 AI 侵蝕創作工作)的延續性回應。
假設我是一家幫好萊塢製片公司開發 AI 輔助劇本寫作工具的軟體開發者。過去我的工具只輸出最終劇本文字,不記錄哪些段落是 AI 自動生成的、哪些是人類編劇親手修改的。有了這條新規定,我的工具現在需要加入「創作歷程記錄」功能——也就是 audit trail(把誰在什麼時候做了什麼修改,全部依時間順序記下來的操作日誌),讓製片公司在提交奧斯卡評選時,能拿出這份記錄證明劇本的核心創作出自人類之手。舊做法:工具只產出最終文字檔,遇到奧斯卡要求舉證時完全無從應對,製片公司可能直接喪失入圍資格。新做法:工具記錄每一稿的修改歷程與人類編劇的決策過程,製片公司只要匯出這份日誌即可符合學院的合規要求,保住角逐機會。
Spotify 於 2026 年 4 月底推出了一個叫「Verified by Spotify(已由 Spotify 驗證)」的淺綠色打勾徽章,貼在真人藝術家的個人頁面上,AI 生成的假藝術家帳號則完全不能取得這個標記。這個政策的出現有其緊迫背景:根據另一個音樂串流平台 Deezer 的統計,AI 生成的音樂現在已佔平台每天新上傳音樂的 44%,等於幾乎每兩首新歌就有一首來自 AI 程式大量製造。Sony Music(全球三大唱片公司之一)也曾向平台申請下架超過 13.5 萬首冒充旗下藝術家風格的 AI 假歌。這個徽章的邏輯類似 Instagram 或 Twitter 的「藍勾勾」身份驗證,讓聽眾在看到藝術家頁面時,能確認背後有真實的人類創作者,而非 AI 批量製造的虛假帳號。
假設你是一名獨立音樂創作者,在 Spotify 上有自己的頁面。過去,你的頁面外觀和各種 AI 批量生成的「假藝術家」頁面毫無差異,路過的聽眾根本分不清真假。現在,若你符合申請條件——例如有可查的演唱會紀錄、連結了 Instagram 等社群帳號、且平台上有持續穩定的聽眾數據——就能申請取得這個淺綠色徽章,顯示在你的藝術家名字旁。此外,Spotify 同步推出了「Artist Profile Protection(藝術家頁面保護)」測試功能:新歌在公開前,你可以先審查確認,防止有人把未授權的 AI 生成音樂偷偷掛在你的名字底下。相較於舊做法(創作者完全沒有工具可保護自己),現在至少多了一層主動識別與防護機制,減少真人藝術家被 AI 音樂稀釋或冒充的風險。
加州 DMV(加州車輛管理局,負責管理汽車與駕照的政府機關)於 2026 年 4 月通過新法規,7 月 1 日起正式生效。這套規定針對自駕車(就是像 Waymo 那種沒有人坐在方向盤後面的全自動無人駕駛汽車)制定了全美最完整的違規執法框架。過去自駕車在路上違規,警察無法直接開罰單,因為法律只規定「駕駛人」要負責,而無人車根本沒有駕駛人——2025 年底舊金山大停電時 Waymo 車隊癱瘓市區,警察就因此束手無策。新規把法律責任從「駕駛人個人」改為「背後的營運公司」:發生違規時,政府向公司發違規通知,公司須在 72 小時內說明事件細節。地方官員現在也可以下達「電子圍欄」指令,要求自駕車在 2 分鐘內離開特定區域,業者系統須在 30 秒內回應。這個框架極可能成為美國其他州的立法參考模板,Waymo、Cruise 等業者需提前備好複製合規成本的應對計畫。
假設一輛 Waymo 無人計程車在舊金山市區違規停車,堵塞了消防車道。警察現場無法直接開罰單給「這台車」,改由執法單位向 Waymo 公司發出「AV 違規通知」。Waymo 工程師必須在 72 小時內調出該車的完整行車日誌(記錄時間、地點、感測器數據的電腦紀錄),回報 DMV 說明為何停在那裡。若是緊急情況,消防局長可發電子圍欄指令要求所有 Waymo 車輛立即離開某區域,Waymo 後台系統須在 30 秒內確認收到,車輛須 2 分鐘內駛離。若 Waymo 多次違規,DMV 可限縮其車隊數量、行駛速度或服務範圍,嚴重時可吊銷在加州的運營許可。過去 Waymo 在舊金山累積超過 6.5 萬美元停車罰款,但行駛違規幾乎無從追責——新規根本性地改變了這個局面,也對車隊後台系統提出即時回應的技術要求。
Ineffable Intelligence 是由大衛・席爾瓦(David Silver)在英國倫敦創辦的新 AI 研究機構。大衛・席爾瓦正是 AlphaGo 的靈魂人物——AlphaGo 是 2016 年那個以 4 比 1 擊敗世界圍棋冠軍李世石的 AI,被視為人工智慧史上里程碑式的突破。這家剛成立的公司,以「種子輪」(就是公司非常早期的第一筆對外募資)就拿到了 11 億美元(約台幣 350 億元)的投資,估值 51 億美元,創下歐洲史上最大種子輪紀錄,投資方包含紅杉資本、Lightspeed、NVIDIA 和 Google。Ineffable 的技術路線跟目前最流行的 ChatGPT、Claude 這類大型語言模型(LLM,就是靠大量吸收人類寫過的文字來學習的 AI)不同——他們走的是「強化學習(RL,讓 AI 透過不斷嘗試、得到回饋、從失敗中學習的方式,就像電玩遊戲中自動探索地圖的 AI 角色)」路線,讓 AI 從自身的互動經驗中學習,而不只是壓縮人類已有的資料。
假設我要訓練一個 AI 幫忙解決複雜的科學問題,例如設計新型藥物分子。用 LLM(目前主流)的方式:先餵進幾百萬篇醫學論文,讓模型背熟人類過去記錄的知識;但遇到人類從來沒探索過的全新分子結構,模型可能一本正經地給出錯誤答案(業界稱為「幻覺/hallucination」),因為它只會「複述和拼接」人類說過的話。用 Ineffable 走的強化學習方式:讓 AI 在模擬化學環境中反覆設計分子、觀察模擬實驗結果好壞、調整策略,不依賴既有文獻,自己摸索出新的有效結構。AlphaGo 就是這樣做到的——它最終用了人類棋手從未想過的走法,超越了頂尖棋士。Ineffable 想把這套邏輯拓展到更廣泛的問題:目標不是「能模仿人類說話的 AI」,而是「能靠自己的經驗超越人類知識邊界的 AI」。這兩條路線哪條最終勝出,業界尚無定論,但 11 億美元的押注說明資本市場認為這場賭注是認真的。
2026年4月,中國杭州市中級人民法院作出一個具歷史意義的裁定:企業不能單純以「引入AI(就是ChatGPT那類自動化人工智慧系統)取代人力」為理由合法裁員。此案中,一名品質保證主管被公司要求降薪40%以配合AI系統導入,拒絕後遭解僱,最終在仲裁、區級法院與二審三個階段均勝訴,獲賠約新台幣145萬元(約4.5萬美元)。法院認定,引入AI是企業自己的商業決策,不屬於「突發的不可預見外部衝擊」,因此不符合中國勞動法允許的非過失解僱條件。這代表在中國營運的企業若要導入AI自動化,法律現在要求必須先提供員工「轉換同等職位」或「接受再培訓」的選項,而不能直接解僱。全球而言,各國態度分歧明顯:美國大部分州採「隨意僱用」制,以AI取代為由裁員完全合法;歐盟的《AI法案》(規範企業如何使用AI做決策的一套法規)預計2026年8月生效,要求高風險AI系統(包含用於就業決策的AI)必須提供可解釋性文件,但不禁止AI驅動裁員。
假設一家在中國有業務的跨國電商公司,計畫導入AI自動化系統來處理原本由客服人員負責的訂單審核工作,預計可裁減20名客服專員。在這個判例出現前,企業可能直接以「組織結構調整、AI取代人力」為由發出資遣通知,員工即使不服也很難在法律上贏得賠償。現在按照這個判決確立的標準:企業必須先評估這20名員工是否能轉調到其他同等薪資的職位(例如AI系統的人工審核員、異常案例處理員),或提供再培訓計畫讓他們學習操作新AI系統;若跳過這個步驟直接裁員,員工可以主張解僱違法並請求賠償。工程團隊在設計AI自動化流程時,也需要同步規劃「哪些工作可以由人機協作替代純裁員」的過渡方案,並記錄下來作為合規文件備查。對於同時在中國、歐盟、美國佈局的企業,三地法規截然不同,必須制定差異化的AI導入合規策略。