當員工成為 AI 的訓練資料

2026 年 4 月 21 日,Reuters 披露 Meta 啟動了一項名為MCI 的計畫:在美國員工的工作電腦上部署追蹤軟體,擷取鍵盤輸入、滑鼠軌跡、點擊行為,並定期截取螢幕快照。

前言:一個正在發生的選擇

2026 年 4 月 21 日,Reuters 披露 Meta 啟動了一項名為 Model Capability Initiative(MCI) 的計畫:在美國員工的工作電腦上部署追蹤軟體,擷取鍵盤輸入、滑鼠軌跡、點擊行為,並定期截取螢幕快照。這些資料用來訓練 Meta 的 AI agent,讓它學會「人類使用電腦的方式」── 從下拉選單到鍵盤快捷鍵,從複製貼上到視窗切換。

幾天之內,CNBC、TechCrunch、Platformer 跟進報導。Meta 內部反應強烈:員工在辦公室貼出傳單,稱 MCI 為「員工資料萃取工廠」(Employee Data Extraction Factory)。CTO Andrew Bosworth 公開確認「沒有 opt-out 選項」── 員工要嘛接受,要嘛離職。歐洲員工因 GDPR 規範被排除在外。同一週,Meta 裁了 8,000 名員工。

這個事件之所以引發震撼,不只是「監控」二字。監控不是新聞 ── 任何大型企業都有 audit log、有合規系統、有 IT 安全紀錄。MCI 真正特別的地方在於:

員工的日常工作行為,不只是被記錄,而是被當成訓練 AI 的素材 ── 而這個 AI,未來可能取代他們自己。

這個現象不是孤例。從 Shopify 公開頻道、Amazon 內部 AI 蔓延、到 Anthropic 在 2025 年 9 月對消費者方案的政策大轉變,「員工 / 使用者資料用於 AI 訓練」這件事,正在快速從邊緣議題變成主流爭議

對金融業而言,這個議題不能再用「合規檢核表」回應。當銀行的徵/授信人員、理財專員、法遵人員、客服人員、稽核人員、作業部門人員等開始大規模使用 AI 工具,他們的 prompt、AI 的回應、操作軌跡,都可能成為某種形式的訓練資料 ── 不管是被銀行內部使用,還是流向外部 AI 供應商。

本文比較兩種代表性的路線:Meta 的「直接採集員工行為」與 Anthropic 的「合成資料 + 付費標註 + opt-in」路線,然後討論金融業該如何設計 AI 治理。本文採取客觀立場,會明確指出兩家公司各自的盲點與利益。


第一部分:Meta 怎麼做 ── MCI 計畫剖析

1.1 事實基礎

根據 Reuters、CNBC、TechCrunch 的報導與 Meta 內部備忘錄外洩內容,MCI 的核心事實如下:

採集對象:Meta 在美國的所有員工(不含歐洲,因 GDPR 限制)

採集內容:

  • 鍵盤輸入(每一次擊鍵)
  • 滑鼠軌跡與點擊
  • 螢幕內容快照(週期性擷取)

追蹤範圍:Gmail、LinkedIn、Wikipedia、GitHub、Slack、Atlassian、Threads、Manus 等數百個工作相關網站與應用程式 ── 也包括員工的個人 Gmail

官方理由(Meta 發言人 Andy Stone):「如果我們要建立能幫助使用者完成日常電腦任務的 agent,模型需要真實的範例,看人們實際上怎麼用電腦。」

用途:訓練 Meta Superintelligence Labs 在 2026 年 4 月推出的 Muse Spark 系統,目標是讓 AI 自主完成多步驟的辦公室工作流程。

沒有 opt-out(由 CTO Andrew Bosworth 確認)

1.2 為什麼 Meta 要這樣做?

理解 MCI 的策略動機,需要回到 2025 年 2 月的 Meta-Scale AI 交易。

Meta 在 2025 年 2 月以 143 億美元取得 Scale AI 49% 股份,並挖角 Scale AI 創辦人 Alexandr Wang 領導新設的 Meta Superintelligence Labs。Wang 的任務很清楚 ── 追上 OpenAI、Anthropic、Google 在生成式 AI 的差距

但這個任務有個結構性難題:OpenAI 有 ChatGPT 累積數億用戶的對話資料,Anthropic 有 Claude 用戶資料(且 2025/9 月起擴展為 5 年保留),Google 有搜尋與 Gmail 的歷史資料。Meta 雖然有 Facebook 與 Instagram,但這些是社交資料,不是「人類如何使用電腦完成工作」的資料

這正是 GUI 訓練資料的稀缺性問題 ── 模型在「點下拉選單、按 Tab 切換、用 Ctrl+C」這類細微操作上,表現遠遜於人類。網路上幾乎沒有人會把自己使用電腦的過程錄下來。員工日常工作恰好提供了大規模、高品質、有真實工作流程脈絡的真人軌跡。

所以從 Meta 的策略邏輯來看,MCI 不是「想監控員工」,而是「急於追上 AI 龍頭,而員工剛好是手邊唯一的大規模真人工作軌跡來源」。

1.3 Meta的MCI 計畫踩到的三條紅線

但策略邏輯成立,不代表執行可以無視代價。MCI 計畫至少踩到三條治理紅線:

紅線一:同意實質性

Meta 內部通知了員工,但 CTO 公開確認沒有 opt-out。在「拒絕 = 影響職涯」的隱性壓力下,所謂「告知同意」幾乎不可能算是自由意志。

由於GDPR 以及歐洲各國(如德國)強大的勞工委員會(Works Councils)法律限制,Meta 目前將 MCI 計畫嚴格限制在「美國本土」的員工與裝置上實施。

更關鍵的是時機 ── MCI 計畫與 8,000 人裁員同週發生。對員工而言,「同意被監控以訓練可能取代自己的 AI」的選擇,在裁員陰影下幾乎沒有真正的選擇空間。

紅線二:「用途蔓延」的歷史教訓

Meta 發言人聲明資料「不會用於績效評估」。這是政策聲明,不是架構限制。隱私法學長期觀察的一個歷史模式叫做 Function Creep(功能/用途蔓延):

  • 新加坡 TraceTogether(2020):疫情接觸者追蹤 App,公開承諾「資料僅用於疫情追蹤」。2021 年警方援引《刑事訴訟法》取得資料用於犯罪偵查,部長承認此前已用於一宗謀殺案調查。
  • 德國 Luca App(2021):COVID 接觸者追蹤,有嚴格隱私法保護。但 Mainz 市警方為調查一宗墜亡案,說服衛生主管機關釋出資料以追查 21 名潛在證人。
  • 澳洲 Tax File Number(1988):僅用於稅務的承諾,自 1991 起擴張到幾乎所有政府福利。學者評論:「法律中對隱私的承諾,可以在極短時間內失效。」

這些案例的共同點是:目的限制的承諾,會隨時間、隨組織壓力、隨新的「合理理由」逐步擴張,直到失守。MCI 採集的滑鼠軌跡、鍵盤輸入、螢幕快照,結構上完全可以用於績效評估、裁員依據、行為調查,差別只在 Meta「承諾不這樣用」── 而這個承諾的耐久性,完全依賴未來 5-10 年的管理層持續守住。

紅線三:訓練資料的污染

員工知道被錄,行為會改變(霍桑效應)。錄到的「人類使用電腦方式」其實是「員工在被監視時,表演給監視系統看的使用方式」── 寫得更工整、選擇更安全的路徑、避免敏感操作。

對訓練 agent 來說,這反而是有偏誤的資料。Meta 想要的「真實工作流程」,在採集行為被員工感知到的那一刻就消失了。

1.4 一個關鍵觀察 ── 監控與訓練只是表面差別

如果我們把 MCI 的本質剝開,會看到一個被低估的洞察:

「監控」與「訓練」的區別,對員工而言只是宣稱目的的差異。被擷取的資料是同一份。

組織宣稱是「監控」時,引發抗議;宣稱是「訓練 AI」時,包裝成技術需求。但對員工來說,鍵盤輸入、滑鼠軌跡、螢幕快照已經被儲存。目的可以變,資料一旦存在就無法刪除。今天說只訓練 agent,明天用同一份資料做績效分析,技術上完全可行。

這個觀察直接挑戰一個常見的辯護論述:「我們蒐集資料只是為了訓練 AI,不是監控」。這個區別在資料本身的層次上不成立 ── 它只存在於組織當下的承諾中。


第二部分:Anthropic 怎麼做 ── Computer Use 訓練

2.1 同樣的技術瓶頸,不同的解法

Anthropic 在 2024 年底推出 Computer Use 功能,讓 Claude 能操作圖形介面。這個功能面臨的訓練資料瓶頸,跟 Meta MCI 想解決的瓶頸完全一樣 ── GUI 互動訓練資料稀缺。

但 Anthropic 選擇了不同的解法。根據 Claude 4 System Card 的公開揭露,Anthropic 的訓練資料來自五個來源:

  1. 公開網路爬取(遵循 robots.txt 規範)
  2. 第三方授權的非公開資料(商業契約)
  3. 付費資料標註服務(與 Surge AI、Mercor、Scale AI 等合作)
  4. 選擇加入訓練的使用者資料(僅限消費者方案,且須明確 opt-in)
  5. Anthropic 內部產生的合成資料(基於 Constitutional AI 方法)

注意這個清單中沒有「員工資料」。Anthropic 的工程師、研究員、產品團隊的日常工作軌跡,不是 Claude 訓練資料的來源。

2.2 四個關鍵機制

把 Anthropic 路線拆開,有四個設計值得獨立看待:

機制一:合成資料路線(Constitutional AI)

Anthropic 的 Constitutional AI 方法,用「原則」生成合成訓練資料,部分取代人類標註。簡單說,就是讓一個 Claude 模型按照一組明確的「憲法」原則,自己生成訓練樣本給另一個 Claude 模型學習。

這條路線的策略意義:讓 Anthropic 不需要為每一筆訓練資料都付費給人類標註者。一旦憲法原則寫定,合成資料的邊際成本只是運算費用,不是勞動費用。

但需要老實說 ── 合成資料不是「不用人類」,而是「把人類介入點集中在憲法層」。憲法本身仍然是人類寫的,合成資料的品質仍然需要人類抽樣驗證,合成資料訓練出的模型仍然需要人類做 RLHF 對齊(機制二)。Constitutional AI 是降低人類資料量的設計,不是取消人類角色。

機制二:付費標註者(明確契約 + 受薪)

Anthropic 與 Surge AI、Mercor 等資料標註平台合作。這些平台的標註者有明確契約、有時薪(Surge AI 約 $18-25/hr,Mercor 平均 $95/hr)、有領域專業(Mercor 的醫療專家 $250-450/hr,VC 合夥人或 C-suite 高管可達 $500-1,000/hr)。

這條鏈的規模驚人:Anthropic 每年花約 10 億美元購買人類訓練資料,與 OpenAI、Meta、Google 同級。即便機制一的合成資料路線降低了對人類資料的依賴,人類介入的總成本仍然是 10 億美元等級。換句話說,Anthropic 的「不用員工」立場,是建立在「願意付錢給外部專家」的基礎上,不是「不需要人類」。

關鍵差別:這些人是被付錢做這件事的,而且他們知道自己在做什麼。這跟 Meta MCI「員工日常工作順便變成訓練資料」是兩種完全不同的勞動關係。

機制三:商用客戶預設不訓練

對於 Claude for Work、Claude Enterprise、Claude Gov、API 用戶,Anthropic 預設不使用客戶資料訓練模型。這在 Anthropic 的商業條款(Commercial Terms)中明確規定,不是隨時可改的政策聲明。

且這條規定有架構支撐:

  • API 標準保留期 7 天(2025/9 從 30 天縮短)
  • Enterprise 客戶可選 Zero Data Retention (ZDR) 模式
  • 資料不會被 Anthropic 員工存取(除非觸發安全審查)

機制四:Computer Use 的觸發式邊界

Computer Use 不是常駐側錄,而是使用者主動觸發任務時才擷取螢幕。沒有背景常駐式擷取、沒有滑鼠軌跡側錄、沒有鍵盤輸入監聽。

這跟 MCI 的「常駐式採集所有工作時段」形成直接對比。

2.3 但這條路有四個必須誠實面對的問題

如果論述只停在這裡,就會變成「Anthropic 好、Meta 壞」的二元對照。我必須誠實面對 Anthropic 路線的殘留問題,因為這四個問題對金融業特別有意義

問題一:2025 年 9 月的政策大轉變

2025 年 8-10 月,Anthropic 對消費者方案(Free/Pro/Max)做了一個關鍵的政策轉變:

項目變更前變更後
訓練預設不訓練(opt-out)訓練(opt-in,但預設 toggle 為 On)
資料保留期30 天5 年(若 opt-in)
UI 設計無 toggle大「Accept」按鈕 + toggle 預設 On

這個改變被獨立隱私分析師批評為「Privacy Pivot」── Anthropic 原本「不訓練消費者資料」的承諾不存在了。保留期從 30 天暴增為 5 年,是 60 倍的擴張

更值得注意的是 UI 設計:大「Accept」按鈕、預設 On 的 toggle,在歐盟法律框架下可能構成「dark pattern」,違反 GDPR 對「informed consent」的嚴格要求。獨立法律分析指出此設計可能引來監管機關注意,但截至 2026 年 3 月,尚未有實際監管行動。

這對金融業有什麼啟示? 如果員工在工作時偷偷使用個人 Pro 帳號(Shadow AI),這些對話可能包含客戶資料,且可能被用於訓練 Claude,並保留 5 年。商用契約再嚴格,擋不住員工從個人裝置打開個人帳號。

問題二:商用 / 消費者的雙重標準

Anthropic 對「資料是否用於訓練」採取明顯的雙重標準:

  • 商用客戶(Claude for Work、Enterprise、API、Gov):預設不訓練、合約保護、ZDR 選項
  • 消費者(Free、Pro、Max):2025/9 後改為 opt-in 訓練、預設 toggle On

這個雙重標準不是技術需要,是議價能力差異造成的。商用客戶會看條款、會議價、會告;個人不會。

對金融業的意義:Anthropic 在商業關係中守住的承諾,在個人關係中守不住。如果你的銀行採用 Claude for Work,你的銀行受保護。但這份保護不能擴展到員工的個人使用

問題三:安全審查的後門

Anthropic 的公開隱私文件明確說明:即使你 opt-out 訓練、即使你用 ZDR、即使你刪除對話,被觸發安全分類器的對話仍可能被人類審查者看到,並用於訓練 Safeguards 模型

換句話說,「opt-out」不是完全退出,只是退出能力訓練,沒有退出安全相關的訓練。

這對金融業的意義:任何 LLM 服務,只要它有「安全分類器」,就有一個你看不到的後門。被誤判為「異常」的金融對話(例如員工在討論裁罰案例、可疑交易、複雜衍生品結構)可能進入 Anthropic 的安全資料池。這個後門是合理的安全設計,但金融業必須意識到它的存在

問題四:Anthropic 也在「取代員工」的鏈條上

最關鍵的一點 ── Anthropic 自己沒把員工當訓練資料,不代表 Anthropic 跟「人類成為 AI 訓練資料」這件事無關

Anthropic 不用自家員工的工作軌跡,但它用全球付費標註者的明確勞動投入。透過 Surge AI、Mercor、Scale AI 等平台,Anthropic 每年購買約 10 億美元的人類標註勞動,內容包括:

  • RLHF 偏好資料:標註者看 Claude 對同一問題的多個回應,排序哪個更好、為什麼(這是 Surge AI 的核心服務,Anthropic 是指標客戶)
  • 領域專家評估:律師檢視 Claude 對合約條款的分析、醫師評估 Claude 對病例的回應、VC 評估 Claude 對商業策略的回答
  • Red Teaming:資安、CBRN 專家故意嘗試破壞 Claude 的安全護欄,找出漏洞

這條鏈的規模驚人:Surge AI 管理 5 萬名全球專家、Mercor 有 3 萬名專業評估者每天領出 150 萬美元評估費。專家時薪從 25 美元(語言專家)到 1,000 美元(VC 合夥人做商業策略評估)不等;醫療研究員 250-450 美元、律師 110-130 美元、CS/coding 專家 50-65 美元。

跟 Meta MCI 比較,這條鏈的勞動關係乾淨許多:明確契約、明確時薪、自願加入、可隨時退出、有專業契合度。但這個對比有一個重要前提:問題不是「Anthropic 對勞動者好不好」,而是「人類成為 AI 訓練資料」這件事的倫理重量,真的因為加上『付費』『自願』就消失了嗎?

幾個值得思考的點:

第一,規模轉移而非消失。Meta MCI 影響的是美國 Meta 員工(數萬人);Anthropic 的勞動鏈影響的是全球十多萬人。問題不是縮小了,是分散到不同地點、不同國籍、不同經濟條件的人身上。

第二,Anthropic 不揭露資料分布。Claude 4 System Card 只說了大類來源(公開爬取 + 第三方授權 + 付費標註 + opt-in 用戶 + 合成資料),但沒有揭露:各類的比例、付費標註的任務分布、領域專家的國籍分布、台灣或中文圈專家的參與程度。對金融業而言,這個資訊不對稱很具體 ── 你的銀行採用 Claude,但你不知道 Claude 對金融議題的判斷,是基於哪些金融專家的標註訓練出來的

第三,「AI 訓練師」這個職業缺乏勞動保護。目前沒有明確的職業傷害認定(尤其是 Red Team 工作中接觸大量有害內容造成的心理影響)、沒有工會、沒有跨國勞動規範。Anthropic 雇用的高薪專家當然不在乎這些(時薪 1000 美元的 VC 合夥人不需要工會),但這層勞動鏈的下層 ── Scale AI、Surge AI 的低階標註者(在全球南方國家時薪 2-15 美元)── 工作條件並不總是透明的。

Anthropic 在這條鏈上的角色其實是「軍火組裝廠」:

  • Anthropic 自己:用 Claude 取代自家工程師的工作(Anthropic 大部分內部程式碼由 Claude 協助產出)
  • Anthropic 賣 Claude:給企業客戶 → 客戶用 Claude 取代客戶的員工 → Anthropic 收費
  • Anthropic 教方法:Claude Code 開源、MCP 協定開源、Skills 系統公開,讓全世界更容易做出「取代員工的 AI」
  • Anthropic 用 partner 知識變現:LSEG、S&P、FactSet 提供金融領域知識 → Anthropic 包裝為 Cowork plugin → 賣給銀行 → 銀行取代分析師

Anthropic 不把自家員工當訓練資料,但 Anthropic 用 10 億美元的全球付費標註勞動,加上 partner 領域知識,組裝成可賣給銀行、律師事務所、醫療機構的「取代員工工具」。這個結構性事實在「Meta vs Anthropic」的對照中,經常被忽略。


第三部分:兩者比較

3.1 程序面對照(誠實版)

維度Meta MCIAnthropic Computer Use
訓練資料來源員工日常工作軌跡公開爬取 + 付費標註 + opt-in 用戶 + 合成資料
採集方式常駐軟體側錄使用者主動觸發
採集範圍鍵盤、滑鼠、螢幕、所有工作時段任務範圍內的 input/output/screenshot
同意實質性無 opt-out(CTO 確認)opt-in(但消費者方案 UI 設計有 dark pattern 爭議)
歐洲處理排除歐洲員工(因 GDPR)全球一致,但 GDPR 合規性受質疑
與裁員關係同週裁員 8,000 人(Anthropic 仍在擴張,不適用)
用途限制方式政策聲明(Andy Stone 承諾)商用合約 + 消費者 toggle
長期保留未公開商用 7 天 / 消費者 opt-in 5 年

從這張表可以看出,程序面 Anthropic 確實做得比 Meta MCI 好 ── 多元資料來源、明確同意機制(雖然消費者方案的同意實質性有疑慮)、商用合約保護、ZDR 選項。

但這個「比較好」不等於「沒有問題」,也不等於「可以照單全收」

3.2 對「員工被取代」這個更大問題

如果跳出「員工資料保護」這個小框架,看「員工被 AI 取代」這個更大的問題,兩家公司的角色其實有結構性相似:

Meta:用員工資料,訓練可能取代員工的 agent。取代鏈的下游使用者

Anthropic:不用員工資料,但賣工具給企業,讓企業取代員工。取代鏈的上游軍火商

兩家公司都在「AI 取代員工」的浪潮上,只是位置不同。Meta 直接做、引發爭議;Anthropic 賣工具、教方法、收取每年數十億美元,但不在第一線承擔員工抗議的成本。

對金融業學員而言,這個視角的意義是:不要被「Anthropic 在保護員工」的敘事誤導。Anthropic 保護的是「員工資料不被當訓練素材」,但 Anthropic 提供的工具,正是讓你的銀行可以「用 AI 取代員工」的基礎建設。

3.3 一個核心區別

把以上整合,Meta 與 Anthropic 的真正差別可以濃縮為一句話:

Meta 直接把員工當作 AI 訓練的原料;Anthropic 不需要這樣做,因為它賣的是「讓其他公司可以用更精緻的方式取代員工」的工具。

兩者都對員工就業有衝擊,差別在執行手法的優雅程度。Meta 的手法粗糙、引發抗議、有法律風險。Anthropic 的手法精細、被視為產業領導者、有商業上的「合規護城河」。

但對台灣金融業的銀行行員、授信主管、客服人員、AML 調查員而言,最後被取代的可能性是相似的


第四部分:金融業該怎麼設計 AI 治理

回到金融業實務。基於以上分析,銀行的 AI 治理設計應該考慮以下面向。本節不主張單一最佳解,但會點出幾個關鍵的設計選擇及其代價。

4.1 不要做的事:複製 Meta MCI 的錯誤

如果有外部廠商或內部 IT 提案「蒐集員工 AI 使用的全部紀錄,作為訓練未來行內 agent 的資料」── 這個提案在台灣不可行,理由如下:

  1. 個資法第 6 條與第 19 條:員工 prompt 中包含客戶資料時,其使用必須在「特定目的內利用」框架下,且需考慮特種個資的處理規範
  2. 勞動法理:台灣最高法院判例對員工監控採「目的正當、手段必要、程序透明」三原則,大規模採集員工工作軌跡作為訓練資料,「目的正當性」最容易被挑戰
  3. 金管會「金融業運用 AI 核心原則」(2024 年發布):第三條「保護隱私及客戶權益」要求金融機構於管理及運用客戶資料時必須充分尊重隱私
  4. EU AI Act(若銀行有歐洲業務):Annex III 將「員工管理 AI」列為高風險

更實質的問題是 ── 這條路即使技術上可行,也會引發 Meta 在 2026 年正在面對的所有員工反彈:傳單、組工會、Shadow AI 暴增、信任崩潰。

4.2 必須區分:三層資料的不同治理

金融業 AI 治理討論中常見的混淆,是把三件不同的事擠在「資料保護」這個框架下談。這三件事該分開:

第一層:客戶資料(舊問題,既有規範已涵蓋)

銀行員工本來就有權限看客戶資料 ── 授信查聯徵、客服查交易、AML 查可疑資金。員工用 AI 處理同一份客戶資料,本質上跟用傳統徵授信系統處理沒有差別。受個資法、銀行法、金管會核心原則規範,不需要為 AI 重新設計治理

第二層:員工 Prompt 與 AI Output(AI 才有的新問題)

這層是 AI 引入的新資料類別。員工怎麼問 AI、AI 怎麼回應,傳統系統沒有這層資料。這層治理對應的不是個資法,而是 Model Risk 框架(SR 26-2、金管會 AI 核心原則):

  • 可追溯性:每個 AI 輸出要可追溯到具體的 input、模型版本、時間戳
  • 可解釋性:AI 給出的判斷與建議必須可被人類審查
  • 責任歸屬:當 AI 給出錯誤建議導致客戶損失,責任屬於誰

第三層:資料是否離開銀行邊界(AI 引入的新風險)

如果使用外部 LLM(包括 Claude、GPT、Gemini),資料是否離開銀行?是否上雲?是否進入訓練?

這層需要區分:

  • 公雲 API(直接打 Anthropic / OpenAI API):資料離開銀行,雖有合約保護
  • 雲端託管(AWS Bedrock、Google Vertex AI):資料在雲端,但通常在指定 region 內
  • 自建模型(微調開源模型如 Llama、Qwen、Taiwan FinLLM):資料完全在內網

4.3 模型策略:微調開源模型主導,外部 LLM 點綴

這是金融業 AI 治理最被誤解的環節。許多銀行的 IT 主管面對「Anthropic vs 開源模型」的選擇時,陷入兩個常見的錯誤:

錯誤一:認為開源模型「不夠聰明」,所以核心業務只能用 Claude/GPT
錯誤二:認為自建開源模型就要「複製 Claude」,所以投入巨資追前沿模型

這兩個都是錯的。讓我用一個具體例子說明 ── 企業金融授信審批

拆解後才看得清楚:企金審批的真實 AI 需求

企金審批是金融業典型的「複雜判斷工作」,常被視為「LLM 不夠聰明做不來」的領域。但仔細拆解,會看到不同的圖像:

Stage工作內容佔審批時間AI 需求開源模型夠用嗎?
1. 資料蒐集整理蒐集財報、徵信、銀行往來、從不同格式抽出關鍵數字~30%文件理解 + 結構化抽取✅ 完全夠用
2. 財務分析比率計算、趨勢分析、同業比較、異常偵測~25%規則套用 + 統計✅ 完全夠用
3. 擔保品評估不動產估價、應收帳款驗證、擔保比例~15%規則套用 + 計算✅ 完全夠用(且有專業系統)
4. 合規對照行內授信準則、大額暴險、關係人交易、Basel/IRB~15%規則套用 + 文件比對✅ 完全夠用
5. 風險評估與建議整合資訊形成風險評等與授信建議~10%多步驟整合推理⚠️ 草擬可,但最後判斷必須人類(SR 26-2 原則)
6. 撰寫簽呈把分析結論寫成正式簽呈文件~5%文本生成✅ 完全夠用

這張表的關鍵洞察:企金審批中,約 85-95% 的工作量,開源模型微調後完全可以處理。真正「需要 Claude 等級智能」的部分,實際上不應該由 AI 做最後判斷,人類審查者必須在「人機協作」上(這正是 SR 26-2 的核心要求)。

換句話說 ──「開源模型不夠聰明所以不能做企金審批」這個論述,前提就是錯的。前提是「AI 要從頭到尾自主完成審批」,而這個前提本身違反金融業治理原則。

為什麼開源模型「夠用」?關鍵在於三個設計原則

要讓微調的開源模型在企金審批場景真正可用,有三個設計原則:

原則一:工具化分工,而非全自動 agent

把企金審批拆成 10-20 個明確的子任務,每個子任務用最適合的工具:

  • 文件抽取 → 微調過的開源模型
  • 數字驗證 → 傳統規則引擎
  • 比率計算 → Excel/SQL
  • 異常偵測 → 統計模型或傳統 ML
  • 文本摘要 → 微調過的開源模型
  • 風險判斷 → 人類

只有「跨工具整合、複雜編排」這層元任務,才真正需要前沿模型。而這層通常不直接接觸客戶資料,可以放心用外部 LLM(透過 Bedrock/Vertex 在境內)。

原則二:對齊微調 + 行內 RAG > 期待模型本身懂

許多銀行的 AI 團隊有兩個對立的誤解:

第一個誤解是「把所有金融知識塞進模型權重」── 這是錯的,且代價極高,因為法規會變、SOP 會改、案例會累積,寫進權重一週就過時。
第二個誤解是「只要有 RAG 就夠了,不用微調」── 這也錯,因為 RAG 補的是「事實知識」,補不了「語感、判斷慣性、合規反射」。

正確的設計是把兩件事分層處理:

微調負責「行為模式」(模型的內化能力):

  • 中文金融語感、台灣金融脈絡的判斷慣性
  • 銀行業推理風格(產業 → 公司 → 財務 → 擔保)
  • 合規意識的反射、拒絕越權問題的慣性
  • 輸出格式的自動內化(簽呈體例、覆審意見格式)

RAG 負責「事實知識」(運行時動態資料):

  • 法規條文(Basel III、IFRS 9、金管會解釋函令)
  • 行內 SOP 與授信準則(每季可能更新)
  • 歷史案例庫(持續累積)
  • 即時資料(客戶財報、市場利率、新聞)

這個架構下,模型的「金融知識上限」不重要,重要的是「能不能從 RAG 撈到對的資料、做正確的整合」── 這個任務開源模型完全夠用,且行內知識庫的品質,比模型本身的能力更決定最終結果

原則三:人機協作,不是橡皮圖章

SR 26-2 的「effective challenge」原則,在這裡是真正的安全網,不是合規裝飾:

  • AI 草擬分析:可以,且應該由開源模型做(成本低、可控、資料不出行)
  • 風險評等建議:可以,但必須附帶推理過程與 RAG 來源
  • 最終核貸決策:必須由有授信權限的人類做,且要能挑戰 AI 的判斷

如果這層人類審查是真實的,那 AI 不夠聰明就不是致命問題 ── 錯誤會被攔截。反之,如果人類審查變成橡皮圖章,即使用當前最聰明的大語言模型也擋不住 model risk

那 Anthropic 路線在哪裡有真正不可替代性?

也要誠實面對另一面 ── 開源模型「夠用」不代表 Anthropic 路線「沒價值」。Claude/GPT 的真正不可替代性,在金融業有三個場景:

  1. 高階推理(複雜衍生品、跨境結構性交易、Tax structuring):這類案件數量少、單筆金額大,本來就該人類主導 + 前沿 LLM 輔助
  2. 複雜多步驟代理(Computer Use 整合多系統):用於內部研發、流程原型驗證,但不該用於客戶面
  3. AI 開發加速:用 Claude Code 寫行內微調腳本、用 Claude 設計 prompt template,這層用前沿模型加速,然後成果用在開源模型上

這個分工的核心邏輯:前沿 LLM 用於「研發 / 設計」階段加速,開源模型用於「生產 / 業務」階段執行。前者跟客戶資料無關,後者完全在內網。

具體建議:三層混合策略

整合以上,台灣金融業的合理策略是:

Layer 1 ── 生產執行層(80% 業務工作量)

  • 用微調的開源模型(Llama 4 / Gemma 4 / Taiwan FinLLM)
  • 加上行內 RAG(法規、SOP、案例庫)
  • 完全在內網運行,客戶資料不出行
  • 場景:授信案件處理、AML 假警示濾除、客服 FAQ、文件分類

Layer 2 ── 高階推理層(10-15% 業務工作量)

  • 用 Claude/GPT 透過 Bedrock/Vertex(資料在境內)
  • 配合嚴格的 prompt 規範(客戶資料去識別化)
  • 場景:複雜衍生品、跨境交易結構、新型監管詮釋

Layer 3 ── 研發加速層(內部使用,不接觸客戶資料)

  • 用 Claude Code、Cursor、外部前沿 LLM
  • 加速行內 AI 工具的開發、prompt 設計、skill 撰寫
  • 場景:行內 AI 團隊的研發、原型、自動化腳本

這個分層的好處是:大部分業務工作用開源模型(資安最高、成本最低),只有真正需要前沿能力的少數場景才用 Claude/GPT,而最敏感的「客戶資料」永遠不會接觸到外部 LLM。

4.4 真正的競爭力:學「方法論」而非追「模型本身」

回到一個關鍵問題 ── 金融業可以學 Anthropic 嗎?

可以學「方法論」,但要清楚知道自己在學什麼、不在學什麼:

可以學的:

  • 用付費的領域專家(行內金融專家)做明確契約的標註工作
  • 把標註標準(rubric)結構化、版本化
  • 用 RLHF 思維做模型對齊(讓開源模型在金融場景說話得體、有合規意識)
  • 把「人類偏好」結構化為訓練訊號
  • Skills 系統、MCP 協定、Subagent 設計模式

學不到也不該學的(規模、資源、基底模型都不對等):

  • Anthropic 等級的對齊深度(他們有 5 萬名 Surge AI 標註者)
  • 全球頂尖領域專家評估(銀行請不到時薪 $1,000 的 VC 合夥人)
  • Constitutional AI 級的合成資料生成
  • 從零訓練前沿大模型

台灣金融業的 AI 策略,不應該是「成為小型 Anthropic」,而應該是「在自己的場景內,做好 Anthropic 學不會的事」── 也就是業務知識深度、台灣法規敏感度、客戶關係脈絡

這也回應前面提到的 Shadow AI 問題 ── 員工會偷用個人 ChatGPT/Claude 帳號,不是因為他們不在乎合規,而是因為內部工具不好用。當行內有夠用的微調開源模型 + 行內 RAG,員工自然會優先用內部工具。Shadow AI 的根本解,是把內部選項做得夠好。

4.5 Model Risk 框架的延伸

最後,把這些選擇放回 SR 26-2 與金管會 AI 核心原則的框架下,有幾個延伸思考:

Model Inventory 必須擴展為 AI Asset Inventory

傳統 model risk 的 inventory 是「模型清單」。LLM 時代,inventory 必須擴展為包括:

  • 使用的 LLM 模型(版本、供應商、合約類型、訓練資料對齊樣本)
  • 行內 RAG 知識庫(版本、責任部門、更新頻率)
  • 行內 skill 與 MCP 介面(權限、資料流向)
  • 對齊微調資料(評分標準、標註者、版本)
  • Subagent 編排架構(各 agent 的用途、能力、限制)

對齊資料本身也是 model risk 資產

如果銀行開始累積內部對齊資料(讓 LLM 學會行內合規意識的標註資料),這份資料本身就是受 SR 26-2 管轄的關鍵資產:

  • 標註資料不可用於評估標註者本人(架構鎖死,不是政策聲明)
  • 業務段隔離(法金、個金、投資銀行的標註資料分開)
  • 版本控制與保留期管理
  • 稽核可見性

用途蔓延)Function Creep) 的長期防範

最後一個提醒:今天設計的 AI 治理框架,要能撐過未來 5-10 年的管理層變動、組織壓力、稽核要求變更

最有效的 Function Creep 防範,不是寫進政策(政策可以改),而是寫進架構(架構難改):

  • 員工 AI 互動的個人原文,結構上不留存(只留 token 用量、時間戳)
  • 衍生資料的權限,結構上同步於原始資料
  • 對齊訓練資料,結構上隔離於人事系統

當壞用途在架構上做不到時,Function Creep 自然跑不起來。


結語:選擇的本質

回頭看 Meta MCI 與 Anthropic Computer Use 這兩條路線,真正的差別不在「對員工好不好」這個道德問題,而在對「人類成為 AI 訓練資料」這件事採取了什麼立場:

  • Meta 把自家員工當訓練資料源,引發爭議與抗議
  • Anthropic 不用自家員工,但用 10 億美元購買全球十多萬名付費標註者的勞動,搭配 partner 的領域知識,組裝成可賣給銀行、律師事務所、醫療機構的「取代員工工具」

兩條路線各自有不同的勞動倫理結構、不同的法律風險、不同的長期可持續性。但對最終被 AI 取代工作的員工而言,結果是相似的

對台灣金融業而言,真正該學的不是「Meta 還是 Anthropic」的二選一,而是建立自己的設計思維:

第一,把 AI 治理的對象拆清楚 ── 客戶資料的問題不是 AI 治理的新問題(既有規範已涵蓋),只有 Prompt 與 AI Output、以及資料是否離開銀行邊界,才是 AI 引入的新治理對象。

第二,在模型策略上,以微調的開源模型為主,前沿 LLM 為輔 ── 不是因為前沿 LLM 不好,而是因為金融業的核心業務(如企金審批)經過工具化分工後,85-95% 的工作量開源模型完全夠用,而真正需要前沿能力的部分,本來就不該由 AI 做最後判斷。

第三,用架構鎖用途,不要用承諾守用途 ── 今天的政策聲明,擋不住未來 5-10 年的管理層變動、稽核要求變更、業務壓力轉變。能撐過時間考驗的,只有在系統架構上讓「壞用途物理上做不到」的設計。

金融業的 AI 治理,不是技術問題,是組織選擇問題。Meta 與 Anthropic 各自走在自己選擇的道路上,各自承擔自己的代價。台灣金融業現在還在分岔路口,選擇本身就是答案


。本文資料來源包括:Reuters、CNBC、TechCrunch、Platformer、Anthropic Privacy Center、Claude 4 System Card、Stanford CRFM Foundation Model Transparency Index、Sacra Research、Surge AI 公開資料、金管會「金融業運用 AI 核心原則」與 2026 年 4 月調查報告。