
本文探討知識圖譜與圖神經網路在企業金融商機挖掘的應用,涵蓋技術架構、國際案例、以及實務挑戰。
大綱
一、前言:法金業務的痛點與機會
傳統的法人金融業務開發,業務人員拿著一張紙一支筆,在茫茫資料海中尋找潛在客戶。拜訪一家企業前,往往需要花上半天到一天的時間準備資料,而這些準備工作大多仰賴個人經驗與直覺判斷。
然而,企業之間的關係遠比表面看到的複雜。當A廠商接獲大單、訂單變動時,這個訊號不只影響它的直接供應商,實務上可能一路傳遞到第三層、第四層,甚至第五層的供應商。這些深藏在供應鏈中的「漣漪效應」,正是銀行法金業務的潛在商機所在——某家看似不相關的中小企業,可能因為上游的上游接到大單,即將產生融資或避險需求。
問題是:這些隱性訊號,人眼看不到。
傳統的客戶關係經理(RM)查數據,像是拿著望遠鏡四處搜尋;但如果能讓AI偵測各種微小的訊號——徵才資訊、供應鏈變動、財報數字、新聞輿情——自動學習判斷,告訴RM「這裡值得注意」,那將是截然不同的競爭格局。
這正是知識圖譜(Knowledge Graph)與圖神經網路(Graph Neural Network, GNN)能夠發揮價值的場域。
二、解決方案的核心架構
為什麼傳統機器學習不夠?
當我們用傳統的機器學習方法(如XGBoost、隨機森林)來預測「哪家企業有融資需求」時,模型的輸入通常是一張表格:每一列是一家企業,每一欄是它的特徵(營收、員工數、產業別、負債比等)。
這種做法有個根本的限制:它把每家企業視為獨立的個體,忽略了企業之間的關係。
但現實世界中,企業的需求往往來自於它在網路中的位置。一家齒輪製造商是否需要融資,不只取決於它自己的財務狀況,更取決於它的客戶(汽車廠)是否接到大單、它的客戶的客戶(消費者市場)是否景氣回升。這種「關係中的訊號傳遞」,表格模型無法捕捉。
知識圖譜 + 圖神經網路的組合拳
要解決這個問題,需要兩項技術的結合:
知識圖譜負責「建立關係」。它將企業、人物、事件等實體表示為節點(Node),將供應關係、持股關係、授信關係等表示為邊(Edge),形成一張巨大的網路。這張網路不只記錄「誰是誰的供應商」,還能記錄關係的屬性(供應比重、開始年度、交易金額)。
圖神經網路負責「從關係中學習」。GNN的核心機制是「訊息傳遞」(Message Passing):每個節點會聚合其鄰居節點的資訊,經過多層傳遞後,一個節點的表示向量(embedding)就融合了它周圍多層網路的資訊。這正好對應了供應鏈中「漣漪效應」的傳遞方式。
整體架構概覽
一個完整的解決方案,從資料到商機推薦,大致包含以下層次:
三、國際標竿案例
知識圖譜與GNN在金融業的應用並非紙上談兵,國際領先的金融機構已經將其落地於核心業務。
3.1 JPMorgan Chase(摩根大通)
摩根大通是目前公開文獻中,將知識圖譜應用於企業金融業務最具代表性的案例。
根據其公開發表的技術論文,摩根大通建立了一個包含數百萬個實體(供應商、投資者、企業等)和數百萬條關係(供應鏈、投資、交易往來等)的大型知識圖譜,作為全公司的關鍵技術資源,支援風險分析、供應鏈分析、詐欺偵測、投資建議等多項任務。
實際業務場景:當某零售商因疫情申請破產時,這個訊息出現在財經新聞中。系統首先透過實體連結(Entity Linking)技術,將新聞中提到的公司名稱正確對應到知識圖譜中的實體(區分「同名但不同公司」的情況)。接著,系統沿著知識圖譜追蹤該零售商的供應鏈,識別出哪些供應商可能因此承受財務壓力,並計算這些供應商對銀行的風險曝險程度。一旦偵測到高風險客戶,系統自動向相關信貸人員發送警示。
這套系統的價值在於:將原本需要人工追蹤、可能延遲數週的風險識別,縮短到近乎即時。
3.2 DNB Bank(挪威最大銀行)
挪威最大的銀行DNB,採用圖神經網路進行反洗錢(Anti-Money Laundering, AML)偵測。
傳統的反洗錢系統多為規則式(rule-based),依賴領域專家預先定義的規則來標記可疑交易。但洗錢手法不斷演化,規則式系統難以跟上。DNB的做法是:將真實的銀行交易數據與商業角色資料整合,建構成一張大型的異質網路(heterogeneous network),其中包含不同類型的節點(個人帳戶、企業帳戶、中介機構)和不同類型的邊(轉帳、收款、擔保)。
在這張網路上,他們訓練圖神經網路來識別洗錢活動的特徵模式。GNN的優勢在於能夠捕捉「資金流動路徑」的結構特徵——洗錢者通常會透過多層帳戶轉移資金,形成特定的圖結構模式,這是傳統逐筆檢查的規則系統難以偵測的。
3.3 螞蟻集團(Ant Financial)
螞蟻集團雖非傳統銀行,但作為全球最大的金融科技公司之一,其在知識圖譜與圖計算的應用深度具有高度參考價值。
企業知識圖譜平台:螞蟻金服建立了企業知識圖譜平台,將非結構化的法律文本、新聞、公告等資料,轉換為結構化的知識圖譜。這個平台能夠呈現一家企業面臨的主要風險類型、風險指數、以及相關的風險等級,支援信貸審核與風險監控。
線上圖計算:螞蟻金服的線上圖計算技術支援超過100個業務場景,涵蓋風控、社交、營銷等領域,擁有超過2000台機器組成的集群全天候運行。
與傳統銀行的合作:螞蟻金服與常熟農商銀行合作開發「易言知識圖譜」專案,利用圖計算技術進行擔保關係的預判。在中小企業貸款中,擔保圈是重要的風險來源——一家企業違約可能連帶影響為其擔保的其他企業。透過知識圖譜,系統可以實現秒級的擔保圈風險預警,大幅提升信貸審批的效率與風控能力。
3.4 小結:國際趨勢觀察
從上述案例可以觀察到幾個趨勢:
- GNN + 傳統模型的混合架構成為主流:例如NVIDIA提出的金融詐欺偵測藍圖,採用GNN產生節點embedding,再接XGBoost進行最終預測,結合了GNN捕捉關係特徵的能力與XGBoost處理表格特徵的優勢。
- 從「流程輔助」走向「企業級AI平台」:領先機構不只是在單一流程中導入AI,而是建立統一的知識圖譜與AI平台,讓不同業務單位可以共享數據與模型。
- 即時性成為關鍵競爭力:無論是摩根大通的新聞警示、還是螞蟻金服的秒級風險預警,「比競爭對手早一步發現訊號」是知識圖譜與GNN帶來的核心價值。
四、知識圖譜的建構
要實現上述應用,第一步是建構知識圖譜。這涉及Schema設計、資料整合、以及一系列的自然語言處理技術。
4.1 定義Schema(本體論)
在整理資料之前,必須先定義知識圖譜的「骨架」——有哪些類型的節點、哪些類型的關係、各自有哪些屬性。
節點類型範例:
| 節點類型 | 說明 | 屬性範例 |
|---|---|---|
| Company | 企業 | 統編、名稱、產業別、資本額、設立日期 |
| Person | 人物 | 姓名、職稱 |
| Product | 產品/服務 | 名稱、類別 |
| Event | 事件 | 類型、日期、描述 |
關係類型範例:
| 關係類型 | 起點 | 終點 | 屬性範例 |
|---|---|---|---|
| SUPPLIES | Company | Company | 供應比重、開始年度 |
| OWNS | Company | Company | 持股比例 |
| WORKS_AT | Person | Company | 職稱、起迄日期 |
| BORROWS_FROM | Company | Company | 金額、利率、到期日 |
Schema的設計需要與業務單位密切合作,確保涵蓋業務關心的關係類型,同時避免過度複雜導致維護困難。
4.2 資料來源與整合
知識圖譜的價值來自於整合多元資料來源:
| 資料類型 | 來源範例 | 結構化程度 |
|---|---|---|
| 結構化 | 公司登記資料、財報數字、銀行內部交易紀錄 | 高 |
| 半結構化 | 年報PDF、政府開放資料API | 中 |
| 非結構化 | 新聞、研究報告、法說會逐字稿 | 低 |
銀行的獨特優勢在於擁有內部交易數據——哪些企業之間有資金往來、金額多少、頻率如何——這些資訊在公開資料中是看不到的,可以大幅補充供應鏈關係的完整性。
4.3 關鍵技術
從原始資料到知識圖譜,需要經過以下處理步驟:
實體抽取(Named Entity Recognition, NER):從非結構化文本中識別出實體。例如,從「台積電宣布將向艾司摩爾採購新一代EUV設備」這句話中,識別出「台積電」和「艾司摩爾」是公司、「EUV設備」是產品。中文環境常用的工具包括CKIP Transformers(中研院開發,繁體中文效果最佳)、HanLP等。
關係抽取(Relation Extraction, RE):識別實體之間的關係。從上述例句中,抽取出「(台積電, 採購, 艾司摩爾)」的供應關係。這可以透過規則式方法(適用於句式固定的情況)、監督式學習(需要標註資料)、或大型語言模型(few-shot learning)來實現。
實體對齊與消歧(Entity Resolution):同一家企業可能有不同的名稱——「台積電」、「台灣積體電路」、「TSMC」、「2330」都指向同一家公司。實體對齊的目的是將這些不同的指稱統一到同一個實體。最可靠的方法是利用唯一識別碼(如統編、股票代號),輔以字串相似度比對和embedding相似度計算。
4.4 儲存選擇
知識圖譜建好之後,要存在哪裡?這取決於使用情境:
| 情境 | 建議方案 |
|---|---|
| 原型驗證、節點數 < 10萬 | NetworkX(純Python,簡單快速) |
| 需要複雜查詢 | Neo4j(業界最成熟的圖資料庫) |
| 大規模、需要分散式 | JanusGraph、TigerGraph |
| 只做GNN訓練 | 直接用PyTorch Geometric,不需要圖資料庫 |
如果主要目的是支援業務查詢(例如「找出A公司的所有第三層供應商」),Neo4j是較好的選擇,其Cypher查詢語言直觀易學。如果主要目的是訓練GNN模型,則可以直接將圖結構轉換為PyTorch Geometric的格式,不需要額外部署圖資料庫。
五、圖神經網路的應用
有了知識圖譜之後,下一步是在圖上訓練模型,讓AI學會「從關係中發現需求」。
5.1 GNN如何捕捉多層傳遞效應
圖神經網路的核心是訊息傳遞機制:在每一層中,每個節點會聚合其鄰居節點的特徵,經過轉換後更新自己的表示向量。經過K層傳遞後,一個節點的表示向量就融合了它K跳範圍內所有鄰居的資訊。
這正好對應了供應鏈中的漣漪效應:如果我們想讓模型學會「上游的上游接到大單,對這家企業有什麼影響」,只需要讓GNN有足夠的層數(例如5層),它自然就能把5跳之外的訊號納入考量。
5.2 常見架構選擇
針對企業金融的應用場景,以下幾種GNN架構值得考慮:
| 架構 | 特點 | 適用情境 |
|---|---|---|
| GCN(Graph Convolutional Network) | 最基礎的GNN,聚合鄰居特徵取平均 | 關係類型單純、快速驗證 |
| GAT(Graph Attention Network) | 加入注意力機制,學習不同鄰居的重要性權重 | 不同供應商重要性不同時 |
| R-GCN(Relational GCN) | 針對不同關係類型使用不同的權重矩陣 | 知識圖譜中有多種關係類型 |
| GraphSAGE | 支援歸納學習,可處理訓練時未見過的新節點 | 新企業不斷加入系統時 |
在實務中,R-GCN或其變體通常是較好的起點,因為企業之間的關係本來就是多元的(供應、持股、授信、競爭……),不同關係類型的傳遞邏輯可能不同。
5.3 加入時間維度
供應鏈的影響不是即時的——上游接到大單,可能要3到6個月後才會反映到下游供應商的訂單上。這種時間延遲效應需要在模型中處理。
常見的做法包括:
Temporal GNN:將時間維度納入圖結構,例如EvolveGCN讓圖結構隨時間演化,T-GCN則結合GCN與GRU來處理時間序列。
GNN + 序列模型:先用GNN產生每個時間點的節點embedding,再用LSTM或Transformer建模embedding隨時間的變化。
5.4 訓練目標
根據業務需求,GNN可以訓練來解決不同類型的任務:
節點分類:預測某家企業在未來N個月內是否有融資需求。這是最直接的應用方式,將問題框架為二元分類。
連結預測:預測哪些企業之間可能建立新的業務關係。這可以用來發現潛在的商機——如果模型預測A公司與B公司之間「應該」有供應關係但目前沒有,或許是銀行可以媒合的機會。
異常偵測:識別供應鏈中的異常變動模式,可用於風險預警。
六、從模型到業務:推送機制的設計
GNN訓練好之後,還需要設計一套機制,將模型的預測轉化為RM可行動的建議。
6.1 如何排序「值得關注的客戶」
模型可能會輸出數百個「有潛在需求」的客戶,RM不可能全部拜訪。因此需要一個排序機制,將最值得關注的客戶排在前面。
排序可以考量多個維度:
- 模型預測的需求機率(信心度)
- 客戶對銀行的潛在價值(預估交易規模)
- 銀行與該客戶的既有關係(是否已有往來)
- 時效性(訊號是否即時、是否有競爭對手已介入)
這可以用Learning to Rank的方法,根據歷史成交資料來學習最佳的排序權重。
6.2 可解釋性:RM需要知道「為什麼推薦這家」
對RM來說,光是一個名單是不夠的。他們需要知道為什麼系統推薦這家客戶,才能在拜訪時有切入點。
GNN的解釋性是已知的挑戰,但可以透過以下方式提供說明:
- 關鍵訊號標註:告訴RM是什麼訊號觸發了推薦(例如「該客戶的主要客戶X公司近期營收成長20%」)
- 圖路徑視覺化:呈現從訊號源頭到該客戶的傳遞路徑
- 類似案例參考:列出過去類似情境下成功的案例
6.3 人機協作流程設計
AI不是要取代RM,而是擴大RM的視野。一個好的人機協作流程可能是:
- 系統每日推送:根據最新數據,推送值得關注的客戶清單給RM
- RM篩選與補充:RM根據自己對客戶的了解,篩選要跟進的對象,並補充系統可能遺漏的資訊
- 行動與回饋:RM拜訪後,將結果回饋給系統(成功/失敗/客戶實際需求)
- 模型持續學習:系統根據RM的回饋,調整推薦策略
這種閉環設計讓模型能夠不斷從實務中學習,也讓RM的專業判斷能夠補足模型的不足。
七、實務挑戰與建議
導入知識圖譜與GNN並非一蹴可幾,實務上會面臨多方面的挑戰。
7.1 資料面挑戰
供應鏈關係資料的取得:公開資料(如年報)通常只揭露主要供應商,完整的多層供應鏈關係需要靠銀行內部的交易數據來補充。但內部數據的品質參差不齊,可能需要大量的清洗與對帳。
資料時效性:供應鏈關係可能隨時變動,知識圖譜需要定期更新。如何設計高效的增量更新機制,是工程上的挑戰。
7.2 技術面挑戰
冷啟動問題:新成立的企業沒有歷史數據與關係,GNN難以產生好的embedding。可以考慮用產業別、地區等屬性來做初始化,或設計專門處理新節點的機制。
圖的稀疏性:大多數企業之間沒有直接關係,圖可能非常稀疏。這會影響GNN的訓練效果,可能需要引入隱性關係(如同產業、同園區)來增加連結。
模型更新頻率:金融環境變化快速,模型需要定期重訓。但GNN的訓練成本較高,需要在即時性與成本之間取得平衡。
7.3 組織面挑戰
打破數據孤島:知識圖譜的價值來自於整合多部門的數據,但不同部門之間往往有資料共享的障礙(權限、格式、意願)。這需要高層的支持與跨部門的協調機制。
人才缺口:同時懂金融業務、知識圖譜、GNN的人才稀缺。可以考慮採取「嵌入式合作」的模式——讓工程師進駐業務單位,實地了解業務痛點。
7.4 治理面挑戰
模型風險管理:金融業受到嚴格監管,AI模型的導入需要符合模型風險管理的要求(如SR 11-7框架)。這包括模型驗證、持續監控、文件紀錄等。
可解釋性要求:監理機關與內部稽核可能要求模型具備可解釋性。GNN的黑箱特性是一個挑戰,需要搭配解釋性工具(如GNN Explainer)來滿足合規要求。
八、結語:從被動跟隨到主動洞察
回顧本文的起點:傳統的法金業務開發,業務人員像是拿著望遠鏡在茫茫大海中搜尋。而知識圖譜與GNN提供的,是一套雷達系統——它能偵測到人眼看不見的訊號,在需求浮現之前就提前卡位。
從國際標竿案例可以看到,這不是遙遠的未來:摩根大通已經用知識圖譜追蹤供應鏈風險、螞蟻集團已經實現秒級的擔保圈預警。台灣的金融機構若能借鏡這些經驗,建立自己的企業知識圖譜,將有機會在法金業務上建立差異化的競爭優勢。
AI不是要取代RM,而是擴大RM的視野。當AI能夠處理數據的彙整與訊號的偵測,RM就能把時間花在更有價值的事情上——理解客戶的真實需求、建立信任關係、設計客製化的金融方案。
未來的進一步發展,可以考慮結合更多的先行指標:人力銀行的徵才資訊(企業擴張的領先訊號)、投審會的海外投資申請(跨境需求的來源)、專利申請數據(研發投資的指標)。這些訊號若能整合進知識圖譜,將能讓商機的預測更加精準、時效更加領先。
正如摩根大通的知識圖譜團隊所說:在金融業,將新聞中的公司名稱連結到正確的實體,看似是一個技術細節,但正確的連結能夠啟動整條供應鏈的風險追蹤,錯誤的連結則會產生大量的假警報、浪費人力。細節決定成敗,而這正是AI能夠發揮價值的地方。
參考文獻
國際銀行案例
- JPMorgan Chase – JEL: Applying End-to-End Neural Entity Linking in JPMorgan Chase
- 說明:摩根大通發表的知識圖譜與實體連結技術論文,描述其如何建立企業知識圖譜並應用於供應鏈風險分析
- 連結:https://arxiv.org/html/2411.02695v1
- DNB Bank – Finding Money Launderers Using Heterogeneous Graph Neural Networks
- 說明:挪威最大銀行DNB使用圖神經網路進行反洗錢偵測的研究
- 連結:https://www.sciencedirect.com/science/article/pii/S2405918825000273
螞蟻集團案例
- Ant Group Builds Globally Leading Risk Management Platform
- 說明:螞蟻集團運用知識圖譜建立跨境貿易支付風控平台
- 連結:https://regional.chinadaily.com.cn/wic/2024-12/10/c_1052120.htm
- Ant Financial Applies AI in Financial Sector
- 說明:螞蟻金服的企業知識圖譜平台與金融智能應用
- 連結:https://www.alibabacloud.com/blog/ant-financial-applies-ai-in-financial-sector_595687
- Ant Financial’s Innovations and Practices in Online Graph Computing
- 說明:螞蟻金服的線上圖計算技術,包含與常熟農商銀行合作的擔保圈預警專案
- 連結:https://www.alibabacloud.com/blog/ant-financials-innovations-and-practices-in-online-graph-computing_595846
GNN在金融領域的應用
- NVIDIA – Supercharging Fraud Detection in Financial Services with Graph Neural Networks
- 說明:NVIDIA提出的GNN金融詐欺偵測藍圖,說明GNN + XGBoost混合架構
- 連結:https://developer.nvidia.com/blog/supercharging-fraud-detection-in-financial-services-with-graph-neural-networks/
- Financial fraud detection using graph neural networks: A systematic review
- 說明:GNN在金融詐欺偵測的系統性文獻回顧
- 連結:https://www.sciencedirect.com/science/article/abs/pii/S0957417423026581
- Graph Learning-Empowered Financial Fraud Detection: Progress and Future Directions
- 說明:圖學習在金融詐欺偵測的進展與未來方向,包含螞蟻金服的應用案例
- 連結:https://spj.science.org/doi/10.34133/icomputing.0146
供應鏈知識圖譜
- Towards knowledge graph reasoning for supply chain risk management using graph neural networks
- 說明:運用知識圖譜與GNN進行供應鏈風險管理的研究
- 連結:https://www.tandfonline.com/doi/full/10.1080/00207543.2022.2100841
- Towards trustworthy AI for link prediction in supply chain knowledge graph
- 說明:供應鏈知識圖譜中的連結預測與可解釋AI
- 連結:https://www.tandfonline.com/doi/full/10.1080/00207543.2024.2399713
反洗錢應用
- Advances in Continual Graph Learning for Anti-Money Laundering Systems: A Comprehensive Review
- 說明:持續學習在反洗錢GNN系統的應用
- 連結:https://arxiv.org/html/2503.24259v1
- LineMVGNN: Anti-Money Laundering with Line-Graph-Assisted Multi-View Graph Neural Networks
- 說明:多視角圖神經網路在反洗錢的應用
- 連結:https://www.mdpi.com/2673-2688/6/4/69
開源資源
- GNN-finance: Curated list of Graph Neural Network Applications in Business, Finance and Banking
- 說明:GNN在金融領域應用的論文整理清單
- 連結:https://github.com/kyawlin/GNN-finance
- Graph Neural Networks for Finance – Ailleron
- 說明:GNN在銀行業個人化服務的應用說明
- 連結:https://ailleron.com/insights/graph-neural-networks-in-banking/
產業報告
- PwC – Graph LLMs: AI’s next frontier in banking and insurance
- 說明:PwC對Graph LLM在銀行與保險業應用的分析報告
- 連結:https://www.pwc.com/m1/en/publications/documents/2024/graph-llms-the-next-ai-frontier-in-banking-and-insurance-transformation.pdf



