從數據孤島到連接商機:以知識圖譜(Knowledge Graph)與GNN(圖神經網路)挖掘企業金融商機

本文探討知識圖譜(Knowledge Graph)與圖神經網路在企業金融商機挖掘的應用,涵蓋技術架構、國際案例、以及實務挑戰。

本文探討知識圖譜與圖神經網路在企業金融商機挖掘的應用,涵蓋技術架構、國際案例、以及實務挑戰。

一、前言:法金業務的痛點與機會

傳統的法人金融業務開發,業務人員拿著一張紙一支筆,在茫茫資料海中尋找潛在客戶。拜訪一家企業前,往往需要花上半天到一天的時間準備資料,而這些準備工作大多仰賴個人經驗與直覺判斷。

然而,企業之間的關係遠比表面看到的複雜。當A廠商接獲大單、訂單變動時,這個訊號不只影響它的直接供應商,實務上可能一路傳遞到第三層、第四層,甚至第五層的供應商。這些深藏在供應鏈中的「漣漪效應」,正是銀行法金業務的潛在商機所在——某家看似不相關的中小企業,可能因為上游的上游接到大單,即將產生融資或避險需求。

問題是:這些隱性訊號,人眼看不到。

傳統的客戶關係經理(RM)查數據,像是拿著望遠鏡四處搜尋;但如果能讓AI偵測各種微小的訊號——徵才資訊、供應鏈變動、財報數字、新聞輿情——自動學習判斷,告訴RM「這裡值得注意」,那將是截然不同的競爭格局。

這正是知識圖譜(Knowledge Graph)與圖神經網路(Graph Neural Network, GNN)能夠發揮價值的場域。


二、解決方案的核心架構

為什麼傳統機器學習不夠?

當我們用傳統的機器學習方法(如XGBoost、隨機森林)來預測「哪家企業有融資需求」時,模型的輸入通常是一張表格:每一列是一家企業,每一欄是它的特徵(營收、員工數、產業別、負債比等)。

這種做法有個根本的限制:它把每家企業視為獨立的個體,忽略了企業之間的關係。

但現實世界中,企業的需求往往來自於它在網路中的位置。一家齒輪製造商是否需要融資,不只取決於它自己的財務狀況,更取決於它的客戶(汽車廠)是否接到大單、它的客戶的客戶(消費者市場)是否景氣回升。這種「關係中的訊號傳遞」,表格模型無法捕捉。

知識圖譜 + 圖神經網路的組合拳

要解決這個問題,需要兩項技術的結合:

知識圖譜負責「建立關係」。它將企業、人物、事件等實體表示為節點(Node),將供應關係、持股關係、授信關係等表示為邊(Edge),形成一張巨大的網路。這張網路不只記錄「誰是誰的供應商」,還能記錄關係的屬性(供應比重、開始年度、交易金額)。

圖神經網路負責「從關係中學習」。GNN的核心機制是「訊息傳遞」(Message Passing):每個節點會聚合其鄰居節點的資訊,經過多層傳遞後,一個節點的表示向量(embedding)就融合了它周圍多層網路的資訊。這正好對應了供應鏈中「漣漪效應」的傳遞方式。

整體架構概覽

一個完整的解決方案,從資料到商機推薦,大致包含以下層次:

三、國際標竿案例

知識圖譜與GNN在金融業的應用並非紙上談兵,國際領先的金融機構已經將其落地於核心業務。

3.1 JPMorgan Chase(摩根大通)

摩根大通是目前公開文獻中,將知識圖譜應用於企業金融業務最具代表性的案例。

根據其公開發表的技術論文,摩根大通建立了一個包含數百萬個實體(供應商、投資者、企業等)和數百萬條關係(供應鏈、投資、交易往來等)的大型知識圖譜,作為全公司的關鍵技術資源,支援風險分析、供應鏈分析、詐欺偵測、投資建議等多項任務。

實際業務場景:當某零售商因疫情申請破產時,這個訊息出現在財經新聞中。系統首先透過實體連結(Entity Linking)技術,將新聞中提到的公司名稱正確對應到知識圖譜中的實體(區分「同名但不同公司」的情況)。接著,系統沿著知識圖譜追蹤該零售商的供應鏈,識別出哪些供應商可能因此承受財務壓力,並計算這些供應商對銀行的風險曝險程度。一旦偵測到高風險客戶,系統自動向相關信貸人員發送警示。

這套系統的價值在於:將原本需要人工追蹤、可能延遲數週的風險識別,縮短到近乎即時。

3.2 DNB Bank(挪威最大銀行)

挪威最大的銀行DNB,採用圖神經網路進行反洗錢(Anti-Money Laundering, AML)偵測。

傳統的反洗錢系統多為規則式(rule-based),依賴領域專家預先定義的規則來標記可疑交易。但洗錢手法不斷演化,規則式系統難以跟上。DNB的做法是:將真實的銀行交易數據與商業角色資料整合,建構成一張大型的異質網路(heterogeneous network),其中包含不同類型的節點(個人帳戶、企業帳戶、中介機構)和不同類型的邊(轉帳、收款、擔保)。

在這張網路上,他們訓練圖神經網路來識別洗錢活動的特徵模式。GNN的優勢在於能夠捕捉「資金流動路徑」的結構特徵——洗錢者通常會透過多層帳戶轉移資金,形成特定的圖結構模式,這是傳統逐筆檢查的規則系統難以偵測的。

3.3 螞蟻集團(Ant Financial)

螞蟻集團雖非傳統銀行,但作為全球最大的金融科技公司之一,其在知識圖譜與圖計算的應用深度具有高度參考價值。

企業知識圖譜平台:螞蟻金服建立了企業知識圖譜平台,將非結構化的法律文本、新聞、公告等資料,轉換為結構化的知識圖譜。這個平台能夠呈現一家企業面臨的主要風險類型、風險指數、以及相關的風險等級,支援信貸審核與風險監控。

線上圖計算:螞蟻金服的線上圖計算技術支援超過100個業務場景,涵蓋風控、社交、營銷等領域,擁有超過2000台機器組成的集群全天候運行。

與傳統銀行的合作:螞蟻金服與常熟農商銀行合作開發「易言知識圖譜」專案,利用圖計算技術進行擔保關係的預判。在中小企業貸款中,擔保圈是重要的風險來源——一家企業違約可能連帶影響為其擔保的其他企業。透過知識圖譜,系統可以實現秒級的擔保圈風險預警,大幅提升信貸審批的效率與風控能力。

3.4 小結:國際趨勢觀察

從上述案例可以觀察到幾個趨勢:

  1. GNN + 傳統模型的混合架構成為主流:例如NVIDIA提出的金融詐欺偵測藍圖,採用GNN產生節點embedding,再接XGBoost進行最終預測,結合了GNN捕捉關係特徵的能力與XGBoost處理表格特徵的優勢。
  2. 從「流程輔助」走向「企業級AI平台」:領先機構不只是在單一流程中導入AI,而是建立統一的知識圖譜與AI平台,讓不同業務單位可以共享數據與模型。
  3. 即時性成為關鍵競爭力:無論是摩根大通的新聞警示、還是螞蟻金服的秒級風險預警,「比競爭對手早一步發現訊號」是知識圖譜與GNN帶來的核心價值。

四、知識圖譜的建構

要實現上述應用,第一步是建構知識圖譜。這涉及Schema設計、資料整合、以及一系列的自然語言處理技術。

4.1 定義Schema(本體論)

在整理資料之前,必須先定義知識圖譜的「骨架」——有哪些類型的節點、哪些類型的關係、各自有哪些屬性。

節點類型範例

節點類型說明屬性範例
Company企業統編、名稱、產業別、資本額、設立日期
Person人物姓名、職稱
Product產品/服務名稱、類別
Event事件類型、日期、描述

關係類型範例

關係類型起點終點屬性範例
SUPPLIESCompanyCompany供應比重、開始年度
OWNSCompanyCompany持股比例
WORKS_ATPersonCompany職稱、起迄日期
BORROWS_FROMCompanyCompany金額、利率、到期日

Schema的設計需要與業務單位密切合作,確保涵蓋業務關心的關係類型,同時避免過度複雜導致維護困難。

4.2 資料來源與整合

知識圖譜的價值來自於整合多元資料來源:

資料類型來源範例結構化程度
結構化公司登記資料、財報數字、銀行內部交易紀錄
半結構化年報PDF、政府開放資料API
非結構化新聞、研究報告、法說會逐字稿

銀行的獨特優勢在於擁有內部交易數據——哪些企業之間有資金往來、金額多少、頻率如何——這些資訊在公開資料中是看不到的,可以大幅補充供應鏈關係的完整性。

4.3 關鍵技術

從原始資料到知識圖譜,需要經過以下處理步驟:

實體抽取(Named Entity Recognition, NER):從非結構化文本中識別出實體。例如,從「台積電宣布將向艾司摩爾採購新一代EUV設備」這句話中,識別出「台積電」和「艾司摩爾」是公司、「EUV設備」是產品。中文環境常用的工具包括CKIP Transformers(中研院開發,繁體中文效果最佳)、HanLP等。

關係抽取(Relation Extraction, RE):識別實體之間的關係。從上述例句中,抽取出「(台積電, 採購, 艾司摩爾)」的供應關係。這可以透過規則式方法(適用於句式固定的情況)、監督式學習(需要標註資料)、或大型語言模型(few-shot learning)來實現。

實體對齊與消歧(Entity Resolution):同一家企業可能有不同的名稱——「台積電」、「台灣積體電路」、「TSMC」、「2330」都指向同一家公司。實體對齊的目的是將這些不同的指稱統一到同一個實體。最可靠的方法是利用唯一識別碼(如統編、股票代號),輔以字串相似度比對和embedding相似度計算。

4.4 儲存選擇

知識圖譜建好之後,要存在哪裡?這取決於使用情境:

情境建議方案
原型驗證、節點數 < 10萬NetworkX(純Python,簡單快速)
需要複雜查詢Neo4j(業界最成熟的圖資料庫)
大規模、需要分散式JanusGraph、TigerGraph
只做GNN訓練直接用PyTorch Geometric,不需要圖資料庫

如果主要目的是支援業務查詢(例如「找出A公司的所有第三層供應商」),Neo4j是較好的選擇,其Cypher查詢語言直觀易學。如果主要目的是訓練GNN模型,則可以直接將圖結構轉換為PyTorch Geometric的格式,不需要額外部署圖資料庫。

五、圖神經網路的應用

有了知識圖譜之後,下一步是在圖上訓練模型,讓AI學會「從關係中發現需求」。

5.1 GNN如何捕捉多層傳遞效應

圖神經網路的核心是訊息傳遞機制:在每一層中,每個節點會聚合其鄰居節點的特徵,經過轉換後更新自己的表示向量。經過K層傳遞後,一個節點的表示向量就融合了它K跳範圍內所有鄰居的資訊。

這正好對應了供應鏈中的漣漪效應:如果我們想讓模型學會「上游的上游接到大單,對這家企業有什麼影響」,只需要讓GNN有足夠的層數(例如5層),它自然就能把5跳之外的訊號納入考量。

5.2 常見架構選擇

針對企業金融的應用場景,以下幾種GNN架構值得考慮:

架構特點適用情境
GCN(Graph Convolutional Network)最基礎的GNN,聚合鄰居特徵取平均關係類型單純、快速驗證
GAT(Graph Attention Network)加入注意力機制,學習不同鄰居的重要性權重不同供應商重要性不同時
R-GCN(Relational GCN)針對不同關係類型使用不同的權重矩陣知識圖譜中有多種關係類型
GraphSAGE支援歸納學習,可處理訓練時未見過的新節點新企業不斷加入系統時

在實務中,R-GCN或其變體通常是較好的起點,因為企業之間的關係本來就是多元的(供應、持股、授信、競爭……),不同關係類型的傳遞邏輯可能不同。

5.3 加入時間維度

供應鏈的影響不是即時的——上游接到大單,可能要3到6個月後才會反映到下游供應商的訂單上。這種時間延遲效應需要在模型中處理。

常見的做法包括:

Temporal GNN:將時間維度納入圖結構,例如EvolveGCN讓圖結構隨時間演化,T-GCN則結合GCN與GRU來處理時間序列。

GNN + 序列模型:先用GNN產生每個時間點的節點embedding,再用LSTM或Transformer建模embedding隨時間的變化。

5.4 訓練目標

根據業務需求,GNN可以訓練來解決不同類型的任務:

節點分類:預測某家企業在未來N個月內是否有融資需求。這是最直接的應用方式,將問題框架為二元分類。

連結預測:預測哪些企業之間可能建立新的業務關係。這可以用來發現潛在的商機——如果模型預測A公司與B公司之間「應該」有供應關係但目前沒有,或許是銀行可以媒合的機會。

異常偵測:識別供應鏈中的異常變動模式,可用於風險預警。

六、從模型到業務:推送機制的設計

GNN訓練好之後,還需要設計一套機制,將模型的預測轉化為RM可行動的建議。

6.1 如何排序「值得關注的客戶」

模型可能會輸出數百個「有潛在需求」的客戶,RM不可能全部拜訪。因此需要一個排序機制,將最值得關注的客戶排在前面。

排序可以考量多個維度:

  • 模型預測的需求機率(信心度)
  • 客戶對銀行的潛在價值(預估交易規模)
  • 銀行與該客戶的既有關係(是否已有往來)
  • 時效性(訊號是否即時、是否有競爭對手已介入)

這可以用Learning to Rank的方法,根據歷史成交資料來學習最佳的排序權重。

6.2 可解釋性:RM需要知道「為什麼推薦這家」

對RM來說,光是一個名單是不夠的。他們需要知道為什麼系統推薦這家客戶,才能在拜訪時有切入點。

GNN的解釋性是已知的挑戰,但可以透過以下方式提供說明:

  • 關鍵訊號標註:告訴RM是什麼訊號觸發了推薦(例如「該客戶的主要客戶X公司近期營收成長20%」)
  • 圖路徑視覺化:呈現從訊號源頭到該客戶的傳遞路徑
  • 類似案例參考:列出過去類似情境下成功的案例

6.3 人機協作流程設計

AI不是要取代RM,而是擴大RM的視野。一個好的人機協作流程可能是:

  1. 系統每日推送:根據最新數據,推送值得關注的客戶清單給RM
  2. RM篩選與補充:RM根據自己對客戶的了解,篩選要跟進的對象,並補充系統可能遺漏的資訊
  3. 行動與回饋:RM拜訪後,將結果回饋給系統(成功/失敗/客戶實際需求)
  4. 模型持續學習:系統根據RM的回饋,調整推薦策略

這種閉環設計讓模型能夠不斷從實務中學習,也讓RM的專業判斷能夠補足模型的不足。

七、實務挑戰與建議

導入知識圖譜與GNN並非一蹴可幾,實務上會面臨多方面的挑戰。

7.1 資料面挑戰

供應鏈關係資料的取得:公開資料(如年報)通常只揭露主要供應商,完整的多層供應鏈關係需要靠銀行內部的交易數據來補充。但內部數據的品質參差不齊,可能需要大量的清洗與對帳。

資料時效性:供應鏈關係可能隨時變動,知識圖譜需要定期更新。如何設計高效的增量更新機制,是工程上的挑戰。

7.2 技術面挑戰

冷啟動問題:新成立的企業沒有歷史數據與關係,GNN難以產生好的embedding。可以考慮用產業別、地區等屬性來做初始化,或設計專門處理新節點的機制。

圖的稀疏性:大多數企業之間沒有直接關係,圖可能非常稀疏。這會影響GNN的訓練效果,可能需要引入隱性關係(如同產業、同園區)來增加連結。

模型更新頻率:金融環境變化快速,模型需要定期重訓。但GNN的訓練成本較高,需要在即時性與成本之間取得平衡。

7.3 組織面挑戰

打破數據孤島:知識圖譜的價值來自於整合多部門的數據,但不同部門之間往往有資料共享的障礙(權限、格式、意願)。這需要高層的支持與跨部門的協調機制。

人才缺口:同時懂金融業務、知識圖譜、GNN的人才稀缺。可以考慮採取「嵌入式合作」的模式——讓工程師進駐業務單位,實地了解業務痛點。

7.4 治理面挑戰

模型風險管理:金融業受到嚴格監管,AI模型的導入需要符合模型風險管理的要求(如SR 11-7框架)。這包括模型驗證、持續監控、文件紀錄等。

可解釋性要求:監理機關與內部稽核可能要求模型具備可解釋性。GNN的黑箱特性是一個挑戰,需要搭配解釋性工具(如GNN Explainer)來滿足合規要求。

八、結語:從被動跟隨到主動洞察

回顧本文的起點:傳統的法金業務開發,業務人員像是拿著望遠鏡在茫茫大海中搜尋。而知識圖譜與GNN提供的,是一套雷達系統——它能偵測到人眼看不見的訊號,在需求浮現之前就提前卡位。

從國際標竿案例可以看到,這不是遙遠的未來:摩根大通已經用知識圖譜追蹤供應鏈風險、螞蟻集團已經實現秒級的擔保圈預警。台灣的金融機構若能借鏡這些經驗,建立自己的企業知識圖譜,將有機會在法金業務上建立差異化的競爭優勢。

AI不是要取代RM,而是擴大RM的視野。當AI能夠處理數據的彙整與訊號的偵測,RM就能把時間花在更有價值的事情上——理解客戶的真實需求、建立信任關係、設計客製化的金融方案。

未來的進一步發展,可以考慮結合更多的先行指標:人力銀行的徵才資訊(企業擴張的領先訊號)、投審會的海外投資申請(跨境需求的來源)、專利申請數據(研發投資的指標)。這些訊號若能整合進知識圖譜,將能讓商機的預測更加精準、時效更加領先。

正如摩根大通的知識圖譜團隊所說:在金融業,將新聞中的公司名稱連結到正確的實體,看似是一個技術細節,但正確的連結能夠啟動整條供應鏈的風險追蹤,錯誤的連結則會產生大量的假警報、浪費人力。細節決定成敗,而這正是AI能夠發揮價值的地方。

參考文獻

國際銀行案例

  1. JPMorgan Chase – JEL: Applying End-to-End Neural Entity Linking in JPMorgan Chase
    • 說明:摩根大通發表的知識圖譜與實體連結技術論文,描述其如何建立企業知識圖譜並應用於供應鏈風險分析
    • 連結:https://arxiv.org/html/2411.02695v1
  2. DNB Bank – Finding Money Launderers Using Heterogeneous Graph Neural Networks

螞蟻集團案例

  1. Ant Group Builds Globally Leading Risk Management Platform
  2. Ant Financial Applies AI in Financial Sector
  3. Ant Financial’s Innovations and Practices in Online Graph Computing

GNN在金融領域的應用

  1. NVIDIA – Supercharging Fraud Detection in Financial Services with Graph Neural Networks
  2. Financial fraud detection using graph neural networks: A systematic review
  3. Graph Learning-Empowered Financial Fraud Detection: Progress and Future Directions

供應鏈知識圖譜

  1. Towards knowledge graph reasoning for supply chain risk management using graph neural networks
  2. Towards trustworthy AI for link prediction in supply chain knowledge graph

反洗錢應用

  1. Advances in Continual Graph Learning for Anti-Money Laundering Systems: A Comprehensive Review
  2. LineMVGNN: Anti-Money Laundering with Line-Graph-Assisted Multi-View Graph Neural Networks

開源資源

  1. GNN-finance: Curated list of Graph Neural Network Applications in Business, Finance and Banking
  2. Graph Neural Networks for Finance – Ailleron

產業報告

  1. PwC – Graph LLMs: AI’s next frontier in banking and insurance

延伸閱讀