深入解析 Anthropic Agent Skills:從技術架構到金融業合規考量

一、前言

2025 年,Anthropic 推出了 Agent Skills,這是一套讓 Claude 在執行任務時能夠參考最佳實踐指引的技能框架系統。隨著 AI Agent 概念的興起,各大廠商紛紛推出類似的解決方案,Agent Skills 究竟有何特別之處?

本文將從實務角度剖析 Agent Skills 的設計理念、與多Agent 架構及維護 Prompt Database (or Prompt Library)方案進行比較,以及金融業導入時必須考量的合規風險。

二、Agent Skills 的運作機制

2.1 核心概念

Agent Skill的核心是一個包含 SKILL.md 檔案的資料夾。該檔案包含元資料(至少包括 name 和 description )以及指示Agent如何執行特定任務的指令。技能還可以包含腳本、範本和參考資料。

my-skill/
├── SKILL.md          # Required: instructions + metadata
├── scripts/          # Optional: executable code
├── references/       # Optional: documentation
└── assets/           # Optional: templates, resources

為何需要Agent Skills

Agent的能力日益增強,但往往缺乏可靠完成實際工作所需的上下文資訊。Agent Skills透過賦予Agent存取程序性知識以及公司、團隊和使用者特定上下文資訊的權限來解決這個問題,這些知識和上下文資訊可以按需加載。擁有特定技能的智能體可以根據正在執行的任務擴展自身能力。

2.2 執行流程

Claude 會自主判斷需要哪些 Skills,使用 view 工具讀取 SKILL.md 內容,理解最佳實踐後,再使用 bash、python 等工具執行任務。

三、Skill 內容實例解析

3.1 xlsx Skill 的核心內容

以 Excel 處理技能為例,SKILL.md 包含以下關鍵指引:

區塊內容範例
品質標準零公式錯誤要求(不可有 #REF!、#DIV/0! 等)
顏色編碼藍色=輸入值、黑色=公式、綠色=跨表連結
格式規範年份為文字、負數用括號、百分比保留一位小數
工具選擇pandas 用於資料分析、openpyxl 用於公式與格式
驗證流程使用 recalc.py 重新計算公式並檢查錯誤

https://github.com/anthropics/skills/blob/main/skills/xlsx/SKILL.md

https://github.com/anthropics/skills/blob/main/skills/xlsx/recalc.py

3.2 pptx Skill 的核心內容

區塊內容範例
工作流程新建用 html2pptx、編輯用 OOXML、套用模板用 rearrange.py
視覺驗證轉 PDF → 轉圖片 → 逐張檢查文字截斷、重疊、對齊
模板處理建立 inventory、對應 slide index、替換文字保留格式
腳本工具thumbnail.py、inventory.py、replace.py、rearrange.py

https://github.com/anthropics/skills/tree/main/skills/pptx

3.3 關鍵觀察

Skill 是「領域知識」而非「程式邏輯」。這些內容告訴 Claude:

  • 「製作財務模型時,藍色文字代表輸入值」
  • 「公式不能有 #REF! 錯誤,要用 recalc.py 驗證」
  • 「簡報做完要轉圖片逐張檢查文字截斷」

這些是領域專家的經驗法則,Claude 讀取後,用它已有的 Python/bash 能力去實現。


四、為何用 Agent Skill 而非獨立 Agent?

4.1 實例對比:將 Excel 銷售數據製作成簡報

假設使用者需求是:「讀取 Q3_sales.xlsx,分析各區域業績,製作一份 5 頁簡報」

多 Agent 架構

特點

  • 多次 LLM 調用(每個 Agent 至少一次)
  • 需要序列化/反序列化資料傳遞
  • Agent 間協調增加複雜度

Agent Skill 架構

特點

  • 單一 LLM 實例,Context 連貫
  • 使用者意圖全程可見
  • 按需載入技能,無 handoff 開銷

4.2 設計取捨比較

面向多 Agent 架構Skill 架構
LLM 調用次數4+ 次1 次
Context 傳遞需序列化,可能損失資訊全程在同一 Context 內
使用者意圖保留每次 handoff 需重新描述原始需求始終可見
錯誤處理需跨 Agent 協調同一實例內直接修正
新增能力開發部署新 Agent新增 .md 文件

五、Skill 架構的潛在風險

5.1 缺乏獨立檢查機制

Skill 架構的最大風險在於:自己執行、自己驗證

有獨立的審核者,存在以下風險:

風險類型說明
自我驗證偏誤Claude 認為自己做對了,就不會質疑
錯誤傳播前一步的錯誤會被帶入下一步
幻覺風險誤解 Skill 指引,執行錯誤的流程
品質不一致沒有 second opinion,輸出品質波動

5.2 目前的「弱檢查」機制

Anthropic 在 Skill 中嘗試加入檢查機制,但都是「自己檢查自己」:

Skill檢查方式限制
xlsx使用 recalc.py 驗證公式只能抓語法錯誤,無法判斷邏輯正確性
pptx轉圖片後視覺檢查Claude 看自己的輸出,容易有盲點

5.3 可能的補強方案

方案說明適用場景
工具層強制驗證擴充自動化檢查腳本可程式化規則的驗證
輕量 Reviewer Agent在關鍵輸出點調用獨立審核 Agent高風險任務
Human-in-the-Loop強制人工審核點對外發布的內容

六、Agent Skills與企業自行維護 Prompt Database 的比較

6.1 結構對比

項目企業 Prompt DBAgent Skills
儲存內容Prompt 模板 + 腳本 + 工具SKILL.md + 腳本 + 工具
結構企業自行設計Anthropic 預設目錄結構

6.2 本質相同

兩者都是:

  • 將領域知識外部化為文字檔案
  • 可附帶輔助腳本與工具
  • 在需要時注入 LLM Context

6.3 包裝與定位的差異

面向企業 Prompt DBAgent Skills
擁有者企業自建自維護Anthropic 預建 + 用戶可擴充
品質保證企業自己負責Anthropic 聲稱經過大量試驗調校
整合方式企業自行設計Anthropic 預設好的目錄結構

控制權(外部指派或 LLM 自主判斷)是架構設計的選擇,兩者皆可實現,不構成本質差異。

6.4 小結

Agent Skills 沒有技術創新,本質就是 Prompt + 腳本的標準化封裝,是 Anthropic 降低使用門檻的產品策略。


七、Agent Skills 的完整價值拆解

7.1 單純 Prompt DB 無法「完成工作」

如果企業只管理 Prompt,不提供執行環境:

LLM 只產出中間產物,使用者還要介入複製、貼上、執行。

7.2 完整 Agent Skills能力的組成

組成要素功能單獨存在能完成工作嗎?
SKILL.md告訴 LLM「怎麼做才對」❌ 只有知識,無法執行
執行環境讓 LLM 能跑程式❌ 有手沒腦
工具介面讓 LLM 能操作環境❌ 有手沒知識
輔助腳本處理複雜任務的現成工具❌ 工具沒人用
四者結合LLM 自主完成端到端任務

7.3 企業自建Skills需具備的完整架構

層次需要自建/採用的項目
LLMClaude API 或開源模型(Llama、Qwen 等)
Agent 框架LangChain、AutoGen,或自建
執行環境容器、Sandbox
工具介面檔案讀寫、bash 執行、API 呼叫
輔助腳本參考 Anthropic 開源或自行開發
Prompt DB領域知識管理系統

八、Agent Skills 的開源生態

8.1 官方 GitHub Repository

網址https://github.com/anthropics/skills

8.2 授權狀態

類別授權內容
Example SkillsApache 2.0(開源)algorithmic-art、artifacts-builder、brand-guidelines、mcp-builder、skill-creator 等
Document SkillsSource-available(可看但有限制)docx、pdf、pptx、xlsx

注意:Document Skills 只是「可查看原始碼」,但不是開源授權,商業使用需注意。

8.3 開放標準

Anthropic 推出了獨立的開放標準:

項目網址說明
Agent Skills Spechttps://agentskills.io技能規格定義
規格 Repositoryhttps://github.com/agentskills/agentskills規格文件與 SDK

這讓其他平台(VS Code、Cursor、OpenAI Codex)也能支援相同格式,形成跨平台生態。

8.4 社群實作

專案說明
OpenSkills通用技能載入器,支援多種 AI Agent
SkillsMP技能市集,聚合 GitHub 上的社群技能


九、結語

Agent Skills 的定位

Agent Skills 是 Anthropic 將 Prompt Engineering 經驗產品化的封裝。從技術角度而言,它與企業自建的 Prompt Database 沒有本質差異,都是「領域知識外部化 + 輔助工具整合」的實踐。

真正的價值

價值點說明
開箱即用Anthropic 提供經過調校的最佳實踐
標準化結構統一的目錄結構與調用方式
開放生態Agent Skills Spec 成為跨平台標準
降低門檻不需自建 Orchestrator 即可使用

對金融業的啟示

對金融業而言,Agent Skills 的技術門檻不高,但真正的挑戰在於:

  1. 治理框架:如何將 AI Agent 納入現有的模型風險管理體系
  2. 合規要求:如何在資料安全、監理要求與效率提升間取得平衡
  3. 責任邊界:如何定義人機協作的責任歸屬

無論選擇使用 Claude API、私有部署開源模型,或完全自建 Agent 架構,都需要從資料安全、模型治理、自動化風險三個面向進行全面評估。

Agent Skills 提供了一個值得參考的框架設計,但企業最終仍需依據自身的合規要求與風險承受度,打造適合自己的 AI Agent 治理體系。


本文基於 Anthropic Agent Skills 的公開資訊撰寫,相關產品功能可能隨時間更新。