Graph + LLM 實踐指南|如何使用自然語言進行知識圖譜構建和查詢

隨著 ChatGPT 等 AI 智能應用在全球范圍內的風靡,大語言模型技術(Large Language Model,簡稱 LLM)受到各行業企業和個人用戶的廣泛關注。圖數據庫憑借圖形格式組織和連接信息的方式,能夠幫助大語言模型更好地理解實體間的關系,提升自己的表達和推理能力。那么,大語言模型與圖技術在具體應用領域又能碰撞出怎樣的火花呢?
經過悅數研發團隊的努力和與國際多家知名大語言模型 LLM 技術團隊的合作,目前悅數圖數據庫的產品已經可以實現基于 Graph + LLM 技術的 Text2Cypher,即自然語言生成圖查詢。用戶只需要在對話界面中通過自然語言就可以輕松實現知識圖譜的構建和查詢,更有開箱即用的企業級服務,歡迎大家在文末點擊試玩體驗新一代的悅數圖數據庫 x 知識圖譜應用吧!
作為圖技術領域最常見應用之一,知識圖譜以點-邊形式的圖結構組織和表示知識,不僅可以用于表示實體(如人、地點、事件、概念等)之間的關系,還包含這些信息之間的語義含義,以一種結構化的方式生動描述現實世界中的知識,使得計算機能夠理解和推理這些知識,被廣泛應用于風險控制、生產制造、藥物研發、科研探索等領域。
顧名思義,Text2Cypher 做的就是把自然語言的文本轉換成 Cypher 查詢語句。一直以來,阻礙圖數據庫、知識圖譜被更廣泛應用的因素之一就是查詢圖數據庫的技術門檻。那么,在沒有大語言模型的時候,我們是怎么做的呢?
傳統的 Text2Cypher
文本到查詢的這個領域在大語言模型之前就一直存在這樣的需求,一直是知識圖譜最常見的應用之一,比如 KBQA(基于知識庫的問答系統)的系統內部本質上就是 text2cypher。
當一個問題語句發送過來之后,它首先要做意圖識別(Intent)、實體識別(Entity),然后再利用 NLP 模型或者代碼把相應的意圖和實體構造成知識圖譜的查詢語句,最終查詢圖數據庫,并根據返回結構構造答案。
可以想象,讓程序能夠:
- 從自然語言中理解意圖:對應到哪一類支持回答的問題
- 找出實體:問題中涉及到的主要個體
- 從意圖和實體構造查詢語句
不可能是一個容易的開發工作,一個真正能夠落地的實現要訓練的模型或者實現的規則代碼所考慮的邊界條件可能非常多。
大語言模型實現的 Text2Cypher
而在”后大語言模型“時代,這種從前需要專門訓練或者寫規則的”智能“應用場景成了通用模型+提示工程(Prompt Engineering)就能完成的任務。
注:提示工程指通過自然語言描述,讓生成模型、語言模型完成”智能“任務的方法。
為此,悅數圖數據庫經歷了一系列研發驗證工作,最終實現了大語言模型與圖查詢語言表達的對接。用戶在提出任務的時候,只需要使用自然語言,就可以實現 Schema 獲取、Cypher 語句生成的 Prompt、各種大語言模型(LLM) 的調用、結果的處理,真正實現了無需代碼、開箱即用的知識圖譜構建和查詢方案。
通過悅數圖技術與大語言模型的結合,企業用戶可以輕松實現知識圖譜的構建和查詢。不僅可以以較低的費用成本完成高準確性的查找和直觀的可視化呈現,而且不再需要長時間的學習投入才能掌握從圖中獲取重要洞察的方法了。
和上一代知識圖譜相比,悅數圖數據庫和大模型的結合,能夠讓企業以更低成本更便捷地構建基于海量數據的知識圖譜。同時,用戶能直接使用自然語言進行交互式提問和查詢,降低企業使用門檻,用戶學習成本更低。












