大綱
前言:一個正在發生的選擇
2026 年 4 月 21 日,Reuters 披露 Meta 啟動了一項名為 Model Capability Initiative(MCI) 的計畫:在美國員工的工作電腦上部署追蹤軟體,擷取鍵盤輸入、滑鼠軌跡、點擊行為,並定期截取螢幕快照。這些資料用來訓練 Meta 的 AI agent,讓它學會「人類使用電腦的方式」── 從下拉選單到鍵盤快捷鍵,從複製貼上到視窗切換。
幾天之內,CNBC、TechCrunch、Platformer 跟進報導。Meta 內部反應強烈:員工在辦公室貼出傳單,稱 MCI 為「員工資料萃取工廠」(Employee Data Extraction Factory)。CTO Andrew Bosworth 公開確認「沒有 opt-out 選項」── 員工要嘛接受,要嘛離職。歐洲員工因 GDPR 規範被排除在外。同一週,Meta 裁了 8,000 名員工。
這個事件之所以引發震撼,不只是「監控」二字。監控不是新聞 ── 任何大型企業都有 audit log、有合規系統、有 IT 安全紀錄。MCI 真正特別的地方在於:
員工的日常工作行為,不只是被記錄,而是被當成訓練 AI 的素材 ── 而這個 AI,未來可能取代他們自己。
這個現象不是孤例。從 Shopify 公開頻道、Amazon 內部 AI 蔓延、到 Anthropic 在 2025 年 9 月對消費者方案的政策大轉變,「員工 / 使用者資料用於 AI 訓練」這件事,正在快速從邊緣議題變成主流爭議。
對金融業而言,這個議題不能再用「合規檢核表」回應。當銀行的徵/授信人員、理財專員、法遵人員、客服人員、稽核人員、作業部門人員等開始大規模使用 AI 工具,他們的 prompt、AI 的回應、操作軌跡,都可能成為某種形式的訓練資料 ── 不管是被銀行內部使用,還是流向外部 AI 供應商。
本文比較兩種代表性的路線:Meta 的「直接採集員工行為」與 Anthropic 的「合成資料 + 付費標註 + opt-in」路線,然後討論金融業該如何設計 AI 治理。本文採取客觀立場,會明確指出兩家公司各自的盲點與利益。
第一部分:Meta 怎麼做 ── MCI 計畫剖析
1.1 事實基礎
根據 Reuters、CNBC、TechCrunch 的報導與 Meta 內部備忘錄外洩內容,MCI 的核心事實如下:
採集對象:Meta 在美國的所有員工(不含歐洲,因 GDPR 限制)
採集內容:
- 鍵盤輸入(每一次擊鍵)
- 滑鼠軌跡與點擊
- 螢幕內容快照(週期性擷取)
追蹤範圍:Gmail、LinkedIn、Wikipedia、GitHub、Slack、Atlassian、Threads、Manus 等數百個工作相關網站與應用程式 ── 也包括員工的個人 Gmail
官方理由(Meta 發言人 Andy Stone):「如果我們要建立能幫助使用者完成日常電腦任務的 agent,模型需要真實的範例,看人們實際上怎麼用電腦。」
用途:訓練 Meta Superintelligence Labs 在 2026 年 4 月推出的 Muse Spark 系統,目標是讓 AI 自主完成多步驟的辦公室工作流程。
沒有 opt-out(由 CTO Andrew Bosworth 確認)
1.2 為什麼 Meta 要這樣做?
理解 MCI 的策略動機,需要回到 2025 年 2 月的 Meta-Scale AI 交易。
Meta 在 2025 年 2 月以 143 億美元取得 Scale AI 49% 股份,並挖角 Scale AI 創辦人 Alexandr Wang 領導新設的 Meta Superintelligence Labs。Wang 的任務很清楚 ── 追上 OpenAI、Anthropic、Google 在生成式 AI 的差距。
但這個任務有個結構性難題:OpenAI 有 ChatGPT 累積數億用戶的對話資料,Anthropic 有 Claude 用戶資料(且 2025/9 月起擴展為 5 年保留),Google 有搜尋與 Gmail 的歷史資料。Meta 雖然有 Facebook 與 Instagram,但這些是社交資料,不是「人類如何使用電腦完成工作」的資料。
這正是 GUI 訓練資料的稀缺性問題 ── 模型在「點下拉選單、按 Tab 切換、用 Ctrl+C」這類細微操作上,表現遠遜於人類。網路上幾乎沒有人會把自己使用電腦的過程錄下來。員工日常工作恰好提供了大規模、高品質、有真實工作流程脈絡的真人軌跡。
所以從 Meta 的策略邏輯來看,MCI 不是「想監控員工」,而是「急於追上 AI 龍頭,而員工剛好是手邊唯一的大規模真人工作軌跡來源」。
1.3 Meta的MCI 計畫踩到的三條紅線
但策略邏輯成立,不代表執行可以無視代價。MCI 計畫至少踩到三條治理紅線:
紅線一:同意實質性
Meta 內部通知了員工,但 CTO 公開確認沒有 opt-out。在「拒絕 = 影響職涯」的隱性壓力下,所謂「告知同意」幾乎不可能算是自由意志。
由於GDPR 以及歐洲各國(如德國)強大的勞工委員會(Works Councils)法律限制,Meta 目前將 MCI 計畫嚴格限制在「美國本土」的員工與裝置上實施。
更關鍵的是時機 ── MCI 計畫與 8,000 人裁員同週發生。對員工而言,「同意被監控以訓練可能取代自己的 AI」的選擇,在裁員陰影下幾乎沒有真正的選擇空間。
紅線二:「用途蔓延」的歷史教訓
Meta 發言人聲明資料「不會用於績效評估」。這是政策聲明,不是架構限制。隱私法學長期觀察的一個歷史模式叫做 Function Creep(功能/用途蔓延):
- 新加坡 TraceTogether(2020):疫情接觸者追蹤 App,公開承諾「資料僅用於疫情追蹤」。2021 年警方援引《刑事訴訟法》取得資料用於犯罪偵查,部長承認此前已用於一宗謀殺案調查。
- 德國 Luca App(2021):COVID 接觸者追蹤,有嚴格隱私法保護。但 Mainz 市警方為調查一宗墜亡案,說服衛生主管機關釋出資料以追查 21 名潛在證人。
- 澳洲 Tax File Number(1988):僅用於稅務的承諾,自 1991 起擴張到幾乎所有政府福利。學者評論:「法律中對隱私的承諾,可以在極短時間內失效。」
這些案例的共同點是:目的限制的承諾,會隨時間、隨組織壓力、隨新的「合理理由」逐步擴張,直到失守。MCI 採集的滑鼠軌跡、鍵盤輸入、螢幕快照,結構上完全可以用於績效評估、裁員依據、行為調查,差別只在 Meta「承諾不這樣用」── 而這個承諾的耐久性,完全依賴未來 5-10 年的管理層持續守住。
紅線三:訓練資料的污染
員工知道被錄,行為會改變(霍桑效應)。錄到的「人類使用電腦方式」其實是「員工在被監視時,表演給監視系統看的使用方式」── 寫得更工整、選擇更安全的路徑、避免敏感操作。
對訓練 agent 來說,這反而是有偏誤的資料。Meta 想要的「真實工作流程」,在採集行為被員工感知到的那一刻就消失了。
1.4 一個關鍵觀察 ── 監控與訓練只是表面差別
如果我們把 MCI 的本質剝開,會看到一個被低估的洞察:
「監控」與「訓練」的區別,對員工而言只是宣稱目的的差異。被擷取的資料是同一份。
組織宣稱是「監控」時,引發抗議;宣稱是「訓練 AI」時,包裝成技術需求。但對員工來說,鍵盤輸入、滑鼠軌跡、螢幕快照已經被儲存。目的可以變,資料一旦存在就無法刪除。今天說只訓練 agent,明天用同一份資料做績效分析,技術上完全可行。
這個觀察直接挑戰一個常見的辯護論述:「我們蒐集資料只是為了訓練 AI,不是監控」。這個區別在資料本身的層次上不成立 ── 它只存在於組織當下的承諾中。
第二部分:Anthropic 怎麼做 ── Computer Use 訓練
2.1 同樣的技術瓶頸,不同的解法
Anthropic 在 2024 年底推出 Computer Use 功能,讓 Claude 能操作圖形介面。這個功能面臨的訓練資料瓶頸,跟 Meta MCI 想解決的瓶頸完全一樣 ── GUI 互動訓練資料稀缺。
但 Anthropic 選擇了不同的解法。根據 Claude 4 System Card 的公開揭露,Anthropic 的訓練資料來自五個來源:
- 公開網路爬取(遵循 robots.txt 規範)
- 第三方授權的非公開資料(商業契約)
- 付費資料標註服務(與 Surge AI、Mercor、Scale AI 等合作)
- 選擇加入訓練的使用者資料(僅限消費者方案,且須明確 opt-in)
- Anthropic 內部產生的合成資料(基於 Constitutional AI 方法)
注意這個清單中沒有「員工資料」。Anthropic 的工程師、研究員、產品團隊的日常工作軌跡,不是 Claude 訓練資料的來源。
2.2 四個關鍵機制
把 Anthropic 路線拆開,有四個設計值得獨立看待:
機制一:合成資料路線(Constitutional AI)
Anthropic 的 Constitutional AI 方法,用「原則」生成合成訓練資料,部分取代人類標註。簡單說,就是讓一個 Claude 模型按照一組明確的「憲法」原則,自己生成訓練樣本給另一個 Claude 模型學習。
這條路線的策略意義:讓 Anthropic 不需要為每一筆訓練資料都付費給人類標註者。一旦憲法原則寫定,合成資料的邊際成本只是運算費用,不是勞動費用。
但需要老實說 ── 合成資料不是「不用人類」,而是「把人類介入點集中在憲法層」。憲法本身仍然是人類寫的,合成資料的品質仍然需要人類抽樣驗證,合成資料訓練出的模型仍然需要人類做 RLHF 對齊(機制二)。Constitutional AI 是降低人類資料量的設計,不是取消人類角色。
機制二:付費標註者(明確契約 + 受薪)
Anthropic 與 Surge AI、Mercor 等資料標註平台合作。這些平台的標註者有明確契約、有時薪(Surge AI 約 $18-25/hr,Mercor 平均 $95/hr)、有領域專業(Mercor 的醫療專家 $250-450/hr,VC 合夥人或 C-suite 高管可達 $500-1,000/hr)。
這條鏈的規模驚人:Anthropic 每年花約 10 億美元購買人類訓練資料,與 OpenAI、Meta、Google 同級。即便機制一的合成資料路線降低了對人類資料的依賴,人類介入的總成本仍然是 10 億美元等級。換句話說,Anthropic 的「不用員工」立場,是建立在「願意付錢給外部專家」的基礎上,不是「不需要人類」。
關鍵差別:這些人是被付錢做這件事的,而且他們知道自己在做什麼。這跟 Meta MCI「員工日常工作順便變成訓練資料」是兩種完全不同的勞動關係。
機制三:商用客戶預設不訓練
對於 Claude for Work、Claude Enterprise、Claude Gov、API 用戶,Anthropic 預設不使用客戶資料訓練模型。這在 Anthropic 的商業條款(Commercial Terms)中明確規定,不是隨時可改的政策聲明。
且這條規定有架構支撐:
- API 標準保留期 7 天(2025/9 從 30 天縮短)
- Enterprise 客戶可選 Zero Data Retention (ZDR) 模式
- 資料不會被 Anthropic 員工存取(除非觸發安全審查)
機制四:Computer Use 的觸發式邊界
Computer Use 不是常駐側錄,而是使用者主動觸發任務時才擷取螢幕。沒有背景常駐式擷取、沒有滑鼠軌跡側錄、沒有鍵盤輸入監聽。
這跟 MCI 的「常駐式採集所有工作時段」形成直接對比。
2.3 但這條路有四個必須誠實面對的問題
如果論述只停在這裡,就會變成「Anthropic 好、Meta 壞」的二元對照。我必須誠實面對 Anthropic 路線的殘留問題,因為這四個問題對金融業特別有意義。
問題一:2025 年 9 月的政策大轉變
2025 年 8-10 月,Anthropic 對消費者方案(Free/Pro/Max)做了一個關鍵的政策轉變:
| 項目 | 變更前 | 變更後 |
|---|---|---|
| 訓練預設 | 不訓練(opt-out) | 訓練(opt-in,但預設 toggle 為 On) |
| 資料保留期 | 30 天 | 5 年(若 opt-in) |
| UI 設計 | 無 toggle | 大「Accept」按鈕 + toggle 預設 On |
這個改變被獨立隱私分析師批評為「Privacy Pivot」── Anthropic 原本「不訓練消費者資料」的承諾不存在了。保留期從 30 天暴增為 5 年,是 60 倍的擴張。
更值得注意的是 UI 設計:大「Accept」按鈕、預設 On 的 toggle,在歐盟法律框架下可能構成「dark pattern」,違反 GDPR 對「informed consent」的嚴格要求。獨立法律分析指出此設計可能引來監管機關注意,但截至 2026 年 3 月,尚未有實際監管行動。
這對金融業有什麼啟示? 如果員工在工作時偷偷使用個人 Pro 帳號(Shadow AI),這些對話可能包含客戶資料,且可能被用於訓練 Claude,並保留 5 年。商用契約再嚴格,擋不住員工從個人裝置打開個人帳號。
問題二:商用 / 消費者的雙重標準
Anthropic 對「資料是否用於訓練」採取明顯的雙重標準:
- 商用客戶(Claude for Work、Enterprise、API、Gov):預設不訓練、合約保護、ZDR 選項
- 消費者(Free、Pro、Max):2025/9 後改為 opt-in 訓練、預設 toggle On
這個雙重標準不是技術需要,是議價能力差異造成的。商用客戶會看條款、會議價、會告;個人不會。
對金融業的意義:Anthropic 在商業關係中守住的承諾,在個人關係中守不住。如果你的銀行採用 Claude for Work,你的銀行受保護。但這份保護不能擴展到員工的個人使用。
問題三:安全審查的後門
Anthropic 的公開隱私文件明確說明:即使你 opt-out 訓練、即使你用 ZDR、即使你刪除對話,被觸發安全分類器的對話仍可能被人類審查者看到,並用於訓練 Safeguards 模型。
換句話說,「opt-out」不是完全退出,只是退出能力訓練,沒有退出安全相關的訓練。
這對金融業的意義:任何 LLM 服務,只要它有「安全分類器」,就有一個你看不到的後門。被誤判為「異常」的金融對話(例如員工在討論裁罰案例、可疑交易、複雜衍生品結構)可能進入 Anthropic 的安全資料池。這個後門是合理的安全設計,但金融業必須意識到它的存在。
問題四:Anthropic 也在「取代員工」的鏈條上
最關鍵的一點 ── Anthropic 自己沒把員工當訓練資料,不代表 Anthropic 跟「人類成為 AI 訓練資料」這件事無關。
Anthropic 不用自家員工的工作軌跡,但它用全球付費標註者的明確勞動投入。透過 Surge AI、Mercor、Scale AI 等平台,Anthropic 每年購買約 10 億美元的人類標註勞動,內容包括:
- RLHF 偏好資料:標註者看 Claude 對同一問題的多個回應,排序哪個更好、為什麼(這是 Surge AI 的核心服務,Anthropic 是指標客戶)
- 領域專家評估:律師檢視 Claude 對合約條款的分析、醫師評估 Claude 對病例的回應、VC 評估 Claude 對商業策略的回答
- Red Teaming:資安、CBRN 專家故意嘗試破壞 Claude 的安全護欄,找出漏洞
這條鏈的規模驚人:Surge AI 管理 5 萬名全球專家、Mercor 有 3 萬名專業評估者每天領出 150 萬美元評估費。專家時薪從 25 美元(語言專家)到 1,000 美元(VC 合夥人做商業策略評估)不等;醫療研究員 250-450 美元、律師 110-130 美元、CS/coding 專家 50-65 美元。
跟 Meta MCI 比較,這條鏈的勞動關係乾淨許多:明確契約、明確時薪、自願加入、可隨時退出、有專業契合度。但這個對比有一個重要前提:問題不是「Anthropic 對勞動者好不好」,而是「人類成為 AI 訓練資料」這件事的倫理重量,真的因為加上『付費』『自願』就消失了嗎?
幾個值得思考的點:
第一,規模轉移而非消失。Meta MCI 影響的是美國 Meta 員工(數萬人);Anthropic 的勞動鏈影響的是全球十多萬人。問題不是縮小了,是分散到不同地點、不同國籍、不同經濟條件的人身上。
第二,Anthropic 不揭露資料分布。Claude 4 System Card 只說了大類來源(公開爬取 + 第三方授權 + 付費標註 + opt-in 用戶 + 合成資料),但沒有揭露:各類的比例、付費標註的任務分布、領域專家的國籍分布、台灣或中文圈專家的參與程度。對金融業而言,這個資訊不對稱很具體 ── 你的銀行採用 Claude,但你不知道 Claude 對金融議題的判斷,是基於哪些金融專家的標註訓練出來的。
第三,「AI 訓練師」這個職業缺乏勞動保護。目前沒有明確的職業傷害認定(尤其是 Red Team 工作中接觸大量有害內容造成的心理影響)、沒有工會、沒有跨國勞動規範。Anthropic 雇用的高薪專家當然不在乎這些(時薪 1000 美元的 VC 合夥人不需要工會),但這層勞動鏈的下層 ── Scale AI、Surge AI 的低階標註者(在全球南方國家時薪 2-15 美元)── 工作條件並不總是透明的。
Anthropic 在這條鏈上的角色其實是「軍火組裝廠」:
- Anthropic 自己:用 Claude 取代自家工程師的工作(Anthropic 大部分內部程式碼由 Claude 協助產出)
- Anthropic 賣 Claude:給企業客戶 → 客戶用 Claude 取代客戶的員工 → Anthropic 收費
- Anthropic 教方法:Claude Code 開源、MCP 協定開源、Skills 系統公開,讓全世界更容易做出「取代員工的 AI」
- Anthropic 用 partner 知識變現:LSEG、S&P、FactSet 提供金融領域知識 → Anthropic 包裝為 Cowork plugin → 賣給銀行 → 銀行取代分析師
Anthropic 不把自家員工當訓練資料,但 Anthropic 用 10 億美元的全球付費標註勞動,加上 partner 領域知識,組裝成可賣給銀行、律師事務所、醫療機構的「取代員工工具」。這個結構性事實在「Meta vs Anthropic」的對照中,經常被忽略。
第三部分:兩者比較
3.1 程序面對照(誠實版)
| 維度 | Meta MCI | Anthropic Computer Use |
|---|---|---|
| 訓練資料來源 | 員工日常工作軌跡 | 公開爬取 + 付費標註 + opt-in 用戶 + 合成資料 |
| 採集方式 | 常駐軟體側錄 | 使用者主動觸發 |
| 採集範圍 | 鍵盤、滑鼠、螢幕、所有工作時段 | 任務範圍內的 input/output/screenshot |
| 同意實質性 | 無 opt-out(CTO 確認) | opt-in(但消費者方案 UI 設計有 dark pattern 爭議) |
| 歐洲處理 | 排除歐洲員工(因 GDPR) | 全球一致,但 GDPR 合規性受質疑 |
| 與裁員關係 | 同週裁員 8,000 人 | (Anthropic 仍在擴張,不適用) |
| 用途限制方式 | 政策聲明(Andy Stone 承諾) | 商用合約 + 消費者 toggle |
| 長期保留 | 未公開 | 商用 7 天 / 消費者 opt-in 5 年 |
從這張表可以看出,程序面 Anthropic 確實做得比 Meta MCI 好 ── 多元資料來源、明確同意機制(雖然消費者方案的同意實質性有疑慮)、商用合約保護、ZDR 選項。
但這個「比較好」不等於「沒有問題」,也不等於「可以照單全收」。
3.2 對「員工被取代」這個更大問題
如果跳出「員工資料保護」這個小框架,看「員工被 AI 取代」這個更大的問題,兩家公司的角色其實有結構性相似:
Meta:用員工資料,訓練可能取代員工的 agent。取代鏈的下游使用者。
Anthropic:不用員工資料,但賣工具給企業,讓企業取代員工。取代鏈的上游軍火商。
兩家公司都在「AI 取代員工」的浪潮上,只是位置不同。Meta 直接做、引發爭議;Anthropic 賣工具、教方法、收取每年數十億美元,但不在第一線承擔員工抗議的成本。
對金融業學員而言,這個視角的意義是:不要被「Anthropic 在保護員工」的敘事誤導。Anthropic 保護的是「員工資料不被當訓練素材」,但 Anthropic 提供的工具,正是讓你的銀行可以「用 AI 取代員工」的基礎建設。
3.3 一個核心區別
把以上整合,Meta 與 Anthropic 的真正差別可以濃縮為一句話:
Meta 直接把員工當作 AI 訓練的原料;Anthropic 不需要這樣做,因為它賣的是「讓其他公司可以用更精緻的方式取代員工」的工具。
兩者都對員工就業有衝擊,差別在執行手法的優雅程度。Meta 的手法粗糙、引發抗議、有法律風險。Anthropic 的手法精細、被視為產業領導者、有商業上的「合規護城河」。
但對台灣金融業的銀行行員、授信主管、客服人員、AML 調查員而言,最後被取代的可能性是相似的。
第四部分:金融業該怎麼設計 AI 治理
回到金融業實務。基於以上分析,銀行的 AI 治理設計應該考慮以下面向。本節不主張單一最佳解,但會點出幾個關鍵的設計選擇及其代價。
4.1 不要做的事:複製 Meta MCI 的錯誤
如果有外部廠商或內部 IT 提案「蒐集員工 AI 使用的全部紀錄,作為訓練未來行內 agent 的資料」── 這個提案在台灣不可行,理由如下:
- 個資法第 6 條與第 19 條:員工 prompt 中包含客戶資料時,其使用必須在「特定目的內利用」框架下,且需考慮特種個資的處理規範
- 勞動法理:台灣最高法院判例對員工監控採「目的正當、手段必要、程序透明」三原則,大規模採集員工工作軌跡作為訓練資料,「目的正當性」最容易被挑戰
- 金管會「金融業運用 AI 核心原則」(2024 年發布):第三條「保護隱私及客戶權益」要求金融機構於管理及運用客戶資料時必須充分尊重隱私
- EU AI Act(若銀行有歐洲業務):Annex III 將「員工管理 AI」列為高風險
更實質的問題是 ── 這條路即使技術上可行,也會引發 Meta 在 2026 年正在面對的所有員工反彈:傳單、組工會、Shadow AI 暴增、信任崩潰。
4.2 必須區分:三層資料的不同治理
金融業 AI 治理討論中常見的混淆,是把三件不同的事擠在「資料保護」這個框架下談。這三件事該分開:
第一層:客戶資料(舊問題,既有規範已涵蓋)
銀行員工本來就有權限看客戶資料 ── 授信查聯徵、客服查交易、AML 查可疑資金。員工用 AI 處理同一份客戶資料,本質上跟用傳統徵授信系統處理沒有差別。受個資法、銀行法、金管會核心原則規範,不需要為 AI 重新設計治理。
第二層:員工 Prompt 與 AI Output(AI 才有的新問題)
這層是 AI 引入的新資料類別。員工怎麼問 AI、AI 怎麼回應,傳統系統沒有這層資料。這層治理對應的不是個資法,而是 Model Risk 框架(SR 26-2、金管會 AI 核心原則):
- 可追溯性:每個 AI 輸出要可追溯到具體的 input、模型版本、時間戳
- 可解釋性:AI 給出的判斷與建議必須可被人類審查
- 責任歸屬:當 AI 給出錯誤建議導致客戶損失,責任屬於誰
第三層:資料是否離開銀行邊界(AI 引入的新風險)
如果使用外部 LLM(包括 Claude、GPT、Gemini),資料是否離開銀行?是否上雲?是否進入訓練?
這層需要區分:
- 公雲 API(直接打 Anthropic / OpenAI API):資料離開銀行,雖有合約保護
- 雲端託管(AWS Bedrock、Google Vertex AI):資料在雲端,但通常在指定 region 內
- 自建模型(微調開源模型如 Llama、Qwen、Taiwan FinLLM):資料完全在內網
4.3 模型策略:微調開源模型主導,外部 LLM 點綴
這是金融業 AI 治理最被誤解的環節。許多銀行的 IT 主管面對「Anthropic vs 開源模型」的選擇時,陷入兩個常見的錯誤:
錯誤一:認為開源模型「不夠聰明」,所以核心業務只能用 Claude/GPT
錯誤二:認為自建開源模型就要「複製 Claude」,所以投入巨資追前沿模型
這兩個都是錯的。讓我用一個具體例子說明 ── 企業金融授信審批。
拆解後才看得清楚:企金審批的真實 AI 需求
企金審批是金融業典型的「複雜判斷工作」,常被視為「LLM 不夠聰明做不來」的領域。但仔細拆解,會看到不同的圖像:
| Stage | 工作內容 | 佔審批時間 | AI 需求 | 開源模型夠用嗎? |
|---|---|---|---|---|
| 1. 資料蒐集整理 | 蒐集財報、徵信、銀行往來、從不同格式抽出關鍵數字 | ~30% | 文件理解 + 結構化抽取 | ✅ 完全夠用 |
| 2. 財務分析 | 比率計算、趨勢分析、同業比較、異常偵測 | ~25% | 規則套用 + 統計 | ✅ 完全夠用 |
| 3. 擔保品評估 | 不動產估價、應收帳款驗證、擔保比例 | ~15% | 規則套用 + 計算 | ✅ 完全夠用(且有專業系統) |
| 4. 合規對照 | 行內授信準則、大額暴險、關係人交易、Basel/IRB | ~15% | 規則套用 + 文件比對 | ✅ 完全夠用 |
| 5. 風險評估與建議 | 整合資訊形成風險評等與授信建議 | ~10% | 多步驟整合推理 | ⚠️ 草擬可,但最後判斷必須人類(SR 26-2 原則) |
| 6. 撰寫簽呈 | 把分析結論寫成正式簽呈文件 | ~5% | 文本生成 | ✅ 完全夠用 |
這張表的關鍵洞察:企金審批中,約 85-95% 的工作量,開源模型微調後完全可以處理。真正「需要 Claude 等級智能」的部分,實際上不應該由 AI 做最後判斷,人類審查者必須在「人機協作」上(這正是 SR 26-2 的核心要求)。
換句話說 ──「開源模型不夠聰明所以不能做企金審批」這個論述,前提就是錯的。前提是「AI 要從頭到尾自主完成審批」,而這個前提本身違反金融業治理原則。
為什麼開源模型「夠用」?關鍵在於三個設計原則
要讓微調的開源模型在企金審批場景真正可用,有三個設計原則:
原則一:工具化分工,而非全自動 agent
把企金審批拆成 10-20 個明確的子任務,每個子任務用最適合的工具:
- 文件抽取 → 微調過的開源模型
- 數字驗證 → 傳統規則引擎
- 比率計算 → Excel/SQL
- 異常偵測 → 統計模型或傳統 ML
- 文本摘要 → 微調過的開源模型
- 風險判斷 → 人類
只有「跨工具整合、複雜編排」這層元任務,才真正需要前沿模型。而這層通常不直接接觸客戶資料,可以放心用外部 LLM(透過 Bedrock/Vertex 在境內)。
原則二:對齊微調 + 行內 RAG > 期待模型本身懂
許多銀行的 AI 團隊有兩個對立的誤解:
第一個誤解是「把所有金融知識塞進模型權重」── 這是錯的,且代價極高,因為法規會變、SOP 會改、案例會累積,寫進權重一週就過時。
第二個誤解是「只要有 RAG 就夠了,不用微調」── 這也錯,因為 RAG 補的是「事實知識」,補不了「語感、判斷慣性、合規反射」。
正確的設計是把兩件事分層處理:
微調負責「行為模式」(模型的內化能力):
- 中文金融語感、台灣金融脈絡的判斷慣性
- 銀行業推理風格(產業 → 公司 → 財務 → 擔保)
- 合規意識的反射、拒絕越權問題的慣性
- 輸出格式的自動內化(簽呈體例、覆審意見格式)
RAG 負責「事實知識」(運行時動態資料):
- 法規條文(Basel III、IFRS 9、金管會解釋函令)
- 行內 SOP 與授信準則(每季可能更新)
- 歷史案例庫(持續累積)
- 即時資料(客戶財報、市場利率、新聞)
這個架構下,模型的「金融知識上限」不重要,重要的是「能不能從 RAG 撈到對的資料、做正確的整合」── 這個任務開源模型完全夠用,且行內知識庫的品質,比模型本身的能力更決定最終結果。
原則三:人機協作,不是橡皮圖章
SR 26-2 的「effective challenge」原則,在這裡是真正的安全網,不是合規裝飾:
- AI 草擬分析:可以,且應該由開源模型做(成本低、可控、資料不出行)
- 風險評等建議:可以,但必須附帶推理過程與 RAG 來源
- 最終核貸決策:必須由有授信權限的人類做,且要能挑戰 AI 的判斷
如果這層人類審查是真實的,那 AI 不夠聰明就不是致命問題 ── 錯誤會被攔截。反之,如果人類審查變成橡皮圖章,即使用當前最聰明的大語言模型也擋不住 model risk。
那 Anthropic 路線在哪裡有真正不可替代性?
也要誠實面對另一面 ── 開源模型「夠用」不代表 Anthropic 路線「沒價值」。Claude/GPT 的真正不可替代性,在金融業有三個場景:
- 高階推理(複雜衍生品、跨境結構性交易、Tax structuring):這類案件數量少、單筆金額大,本來就該人類主導 + 前沿 LLM 輔助
- 複雜多步驟代理(Computer Use 整合多系統):用於內部研發、流程原型驗證,但不該用於客戶面
- AI 開發加速:用 Claude Code 寫行內微調腳本、用 Claude 設計 prompt template,這層用前沿模型加速,然後成果用在開源模型上
這個分工的核心邏輯:前沿 LLM 用於「研發 / 設計」階段加速,開源模型用於「生產 / 業務」階段執行。前者跟客戶資料無關,後者完全在內網。
具體建議:三層混合策略
整合以上,台灣金融業的合理策略是:
Layer 1 ── 生產執行層(80% 業務工作量)
- 用微調的開源模型(Llama 4 / Gemma 4 / Taiwan FinLLM)
- 加上行內 RAG(法規、SOP、案例庫)
- 完全在內網運行,客戶資料不出行
- 場景:授信案件處理、AML 假警示濾除、客服 FAQ、文件分類
Layer 2 ── 高階推理層(10-15% 業務工作量)
- 用 Claude/GPT 透過 Bedrock/Vertex(資料在境內)
- 配合嚴格的 prompt 規範(客戶資料去識別化)
- 場景:複雜衍生品、跨境交易結構、新型監管詮釋
Layer 3 ── 研發加速層(內部使用,不接觸客戶資料)
- 用 Claude Code、Cursor、外部前沿 LLM
- 加速行內 AI 工具的開發、prompt 設計、skill 撰寫
- 場景:行內 AI 團隊的研發、原型、自動化腳本
這個分層的好處是:大部分業務工作用開源模型(資安最高、成本最低),只有真正需要前沿能力的少數場景才用 Claude/GPT,而最敏感的「客戶資料」永遠不會接觸到外部 LLM。
4.4 真正的競爭力:學「方法論」而非追「模型本身」
回到一個關鍵問題 ── 金融業可以學 Anthropic 嗎?
可以學「方法論」,但要清楚知道自己在學什麼、不在學什麼:
可以學的:
- 用付費的領域專家(行內金融專家)做明確契約的標註工作
- 把標註標準(rubric)結構化、版本化
- 用 RLHF 思維做模型對齊(讓開源模型在金融場景說話得體、有合規意識)
- 把「人類偏好」結構化為訓練訊號
- Skills 系統、MCP 協定、Subagent 設計模式
學不到也不該學的(規模、資源、基底模型都不對等):
- Anthropic 等級的對齊深度(他們有 5 萬名 Surge AI 標註者)
- 全球頂尖領域專家評估(銀行請不到時薪 $1,000 的 VC 合夥人)
- Constitutional AI 級的合成資料生成
- 從零訓練前沿大模型
台灣金融業的 AI 策略,不應該是「成為小型 Anthropic」,而應該是「在自己的場景內,做好 Anthropic 學不會的事」── 也就是業務知識深度、台灣法規敏感度、客戶關係脈絡。
這也回應前面提到的 Shadow AI 問題 ── 員工會偷用個人 ChatGPT/Claude 帳號,不是因為他們不在乎合規,而是因為內部工具不好用。當行內有夠用的微調開源模型 + 行內 RAG,員工自然會優先用內部工具。Shadow AI 的根本解,是把內部選項做得夠好。
4.5 Model Risk 框架的延伸
最後,把這些選擇放回 SR 26-2 與金管會 AI 核心原則的框架下,有幾個延伸思考:
Model Inventory 必須擴展為 AI Asset Inventory
傳統 model risk 的 inventory 是「模型清單」。LLM 時代,inventory 必須擴展為包括:
- 使用的 LLM 模型(版本、供應商、合約類型、訓練資料對齊樣本)
- 行內 RAG 知識庫(版本、責任部門、更新頻率)
- 行內 skill 與 MCP 介面(權限、資料流向)
- 對齊微調資料(評分標準、標註者、版本)
- Subagent 編排架構(各 agent 的用途、能力、限制)
對齊資料本身也是 model risk 資產
如果銀行開始累積內部對齊資料(讓 LLM 學會行內合規意識的標註資料),這份資料本身就是受 SR 26-2 管轄的關鍵資產:
- 標註資料不可用於評估標註者本人(架構鎖死,不是政策聲明)
- 業務段隔離(法金、個金、投資銀行的標註資料分開)
- 版本控制與保留期管理
- 稽核可見性
用途蔓延)Function Creep) 的長期防範
最後一個提醒:今天設計的 AI 治理框架,要能撐過未來 5-10 年的管理層變動、組織壓力、稽核要求變更。
最有效的 Function Creep 防範,不是寫進政策(政策可以改),而是寫進架構(架構難改):
- 員工 AI 互動的個人原文,結構上不留存(只留 token 用量、時間戳)
- 衍生資料的權限,結構上同步於原始資料
- 對齊訓練資料,結構上隔離於人事系統
當壞用途在架構上做不到時,Function Creep 自然跑不起來。
結語:選擇的本質
回頭看 Meta MCI 與 Anthropic Computer Use 這兩條路線,真正的差別不在「對員工好不好」這個道德問題,而在對「人類成為 AI 訓練資料」這件事採取了什麼立場:
- Meta 把自家員工當訓練資料源,引發爭議與抗議
- Anthropic 不用自家員工,但用 10 億美元購買全球十多萬名付費標註者的勞動,搭配 partner 的領域知識,組裝成可賣給銀行、律師事務所、醫療機構的「取代員工工具」
兩條路線各自有不同的勞動倫理結構、不同的法律風險、不同的長期可持續性。但對最終被 AI 取代工作的員工而言,結果是相似的。
對台灣金融業而言,真正該學的不是「Meta 還是 Anthropic」的二選一,而是建立自己的設計思維:
第一,把 AI 治理的對象拆清楚 ── 客戶資料的問題不是 AI 治理的新問題(既有規範已涵蓋),只有 Prompt 與 AI Output、以及資料是否離開銀行邊界,才是 AI 引入的新治理對象。
第二,在模型策略上,以微調的開源模型為主,前沿 LLM 為輔 ── 不是因為前沿 LLM 不好,而是因為金融業的核心業務(如企金審批)經過工具化分工後,85-95% 的工作量開源模型完全夠用,而真正需要前沿能力的部分,本來就不該由 AI 做最後判斷。
第三,用架構鎖用途,不要用承諾守用途 ── 今天的政策聲明,擋不住未來 5-10 年的管理層變動、稽核要求變更、業務壓力轉變。能撐過時間考驗的,只有在系統架構上讓「壞用途物理上做不到」的設計。
金融業的 AI 治理,不是技術問題,是組織選擇問題。Meta 與 Anthropic 各自走在自己選擇的道路上,各自承擔自己的代價。台灣金融業現在還在分岔路口,選擇本身就是答案。
。本文資料來源包括:Reuters、CNBC、TechCrunch、Platformer、Anthropic Privacy Center、Claude 4 System Card、Stanford CRFM Foundation Model Transparency Index、Sacra Research、Surge AI 公開資料、金管會「金融業運用 AI 核心原則」與 2026 年 4 月調查報告。



