AI > 
【第26回】ナレッジグラフの利用シーン
【第26回】ナレッジグラフの利用シーン
コラムイメージ

人と人、人とモノのつながりはいつも感心ごとです。新規プロジェクトを立ち上げたいけど誰と誰の相性がいいのか、誰が適切なスキルを持っているのか、誰々さんはこの前引っ越したそうだけどお祝いにどのようなモノをプレゼントしたらいいのか。そういった人やモノの関係を扱うのがナレッジグラフです。

ナレッジグラフの基本

ナレッジグラフはデータ表現方法の1つとなります。例えば人やモノ、モノとモノを出来事(例えばAさんがテレビを購入)といったもので線を結んで、人やモノ同士の関係を明確にする形で構成されます。可視に優れた人の理解しやすい表現となります。この表現の分かりやすさは特性要因図のような因果関係を図式化した思考共有ツールで使われていることからもうかがえます。
点と点が線で繋がると事実が浮かび上がるように、まさに「ナレッジ」を表すものとなります。
私もチャットボットの開発でナレッジグラフを使用しております。業務情報を格納しているのですが、構成や何を含めるかといった未確定も多いですが、少しずつ無理なく情報を増やしていけるナレッジグラフにより、お客様とのコミュニケーンも順調に行っています。
 
書籍に関するナレッジグラフ

ナレッジグラフの構造から得られるもの

ナレッジグラフはネットワーク構造を持ちます。モノはノード、関係はエッジになります。ネットワーク構造から得られる知見もいくつかあります。例えばエッジの接続数からどのノード同士が関連性が高いかを分析してコミュニティ検出ができます。これを利用してソーシャルネットワークから分析する場合、同じ嗜好性を持った特定コミュニティに対して販売促進をするといったことが可能になります。
また人や連絡先、カード番号といった関連性が問題解決のカギになるクレジットカードの詐欺検知といったことにも利用されております。

機械学習への適用

機械学習を用いて分類や予測といったものはポピュラーですが、ナレッジグラフでも機械学習が適用されています。
ナレッジグラフに機械学習を適用することでノードを分類したり、ノードとノード間のエッジを予測したり、クラスタリングしてサブグラフを構成したりすることが可能となります。
販売管理ナレッジグラフを考えた場合、ユーザと商品というノードが購入というエッジでリンクされます。まだユーザが未購入の商品に対してエッジが接続されるべきかどうかを予測し、エッジが接続できると予測された商品を、お薦め商品として紹介するといったことが可能になります。
多数の製品やコンテンツを抱える業者にとって、商品の特徴を示すワードとなるタグ付けは重要な作業となりますが、手作業では大変である。そこで、モノとタグをエッジで接続し、エッジの予測ができれば自動的に付与することができます。

検索システムとナレッジグラフ

ナレッジグラフに然るべきデータがあれば、ユーザが指定した検索ワードを元に、グラフ内をノードとエッジを経由して探索ながら、関連する単語情報を取得します。それを背景情報として、検索クエリに含めて、よりユーザの要望に応えた検索結果を得ることができます。googleでもナレッジグラフが活用されています。
検索結果でサイト情報とは別に、検索対象を端的に説明するナレッジパネルナレッジパネルでご覧なった方も多いかと思います。

LLMとナレッジグラフ

現在、LLMはChatGPTを筆頭に大きな話題となっております。各所での活躍は衆目の一致するところですが、LLMではハルシネーション(事実とは異なる回答)を生成したり、最近の情報であったり個別の情報については取得できないといった問題があります。
最新情報や個別情報の取得はRAGを使用することで解決できる例も多いですが、必ずしもよい結果が得られていない現状もございます。
特に組織固有の用語等を使用している場合は基本的には対応が困難となります。RAGにナレッジグラフを用いることで、事実関係を読み取ることができるため、ハルシネーションや組織固有の用語といった課題に対応することができます。

ナレッジグラフを始めてみる

ナレッジグラフはその表現方法の理解のしやすさから気軽に始められます。まずは紙とペンやホワイトボードを用意して、思いついたモノとモノをつないでいってください。
実際のシステムで利用するにあたって、手作業でのナレッジグラフの作成・維持管理作業はとても大変です。自動構築の手法は以前から検討されていてテキスト文書、現在だとLLMを用いた手法が積極的に展開されています。テキスト文書から固有表現、品詞、依存関係等を抽出して構築します。但しノイズも多くなり実装上の工夫も必要となります。それらの補う形でLLMによる自動構築も日々検討されています。
豊富なナレッジグラフに関する情報を持つモデルを用いて自動構築することができます。それでもまだまだ課題はありますが、よりナレッジが身近になり、活用が進んでいくことが予想されます。

執筆者

コラムニスト写真

NTTアドバンステクノロジ株式会社 
アプリケーション・ビジネス本部 AIストラテジビジネス部門
細谷 淳一(ほそや じゅんいち)


略歴
入社以来、自治体向けアプリケーションの開発、保守や業務システムの運用、保守業務に携わる。近年ではネットワーク系データ分析業務に取り組んでいる。

AIデータ分析コラム

このコラムは、NTT-ATのデータサイエンティストが、独自の視点で、AIデータ分析の技術、市場、時事解説等を記事にしたものです。
次回は2025年5月13日にお届けする予定です。生成AI活用術について掲載予定です。

 

※本コラムの著作権は執筆担当者名の表示の有無にかかわらず当社に帰属しております。

ai_column_parts02.jpg 前のコラム    コラム一覧に戻る 

 

AIデータ分析シリーズ

※DeAnoSは日本電信電話株式会社の登録商標です。
※当社とNTTコム オンライン・マーケティング・ソリューション(株)は、Spotfireの販売契約を締結しています。
※TIBCO、Spotfireは、Cloud Software Group, Inc.の商標または登録商標です。

Twitterでシェア Facebookでシェア
当サイトでは、お客さまに最適なユーザー体験をご提供するためにCookieを使用しています。当サイトをご利用いただくことにより、お客さまがCookieの使用に同意されたものとみなします。詳細は、「プライバシーポリシー」をご確認ください。