Express Finder(エクスプレスファインダー) / シソーラス辞書
検索システムの検索ヒット率向上、表記ゆれを解消した正確な集計を実現!
基本語から専門語まで幅広く収録した、日本最大級の同義・類義語電子辞書
こんなお困りごとはありませんか?
- せっかくの販売サイトなのに、ちょっとしたキーワードの違いで販売機会を逃してしまう
- 検索結果から少しずつサイトを修正するには相当な知識と忍耐強い作業が必要
Express Finder / シソーラス辞書とは
検索システムやFAQサイトの検索ヒット率向上や、表記ゆれを解消して正確な集計を実現Express Finder / シソーラス辞書の特徴
キーワードに対して
同義語を含めた検索が可能
⇒検索漏れを防ぐ
採用出典を厳選した
専門性の高い用語を収録
⇒様々な業界の多岐に渡る検索や
専門性の高い用語を収録
⇒様々な業界の多岐に渡る検索や
問い合わせに対応可能
辞書のメンテナンス作業時間が削減
⇒余った時間で他の作業へ注力
⇒余った時間で他の作業へ注力
活用イメージ
検索システムの検索結果の改良
課題- 検索システムを構築していて、表記ゆれや検索ノイズ対策を行いたい
- 単一の用語だけでなく関連する用語もヒットさせて検索結果を広げたい
- 送り仮名、旧新字、数字、カタカナでの表記のちがいも対応させたい
- シソーラス辞書を利用することで、表記ゆれに対応し検索ヒット率が向上
Express Finder / シソーラス辞書の詳細
幅広い分野に対応
基本語辞書に加え、分野別の専門用語シソーラス辞書を取り揃えております。
さまざまな専門用語に対応しておりますので、お気軽にご相談ください。
分野 | 辞書名 | 語数 | 収録内容 | 収録例 |
---|---|---|---|---|
基本語 | 基本語 | 217,738 |
一般用語を収録。(語義レベルの同義語辞書)
※一般・日常語 文化・芸術 健康・医療 年号 食生活 日用品関連
娯楽・スポーツ・趣味 情報・通信 ビジネス一般 科学・技術 環境 地理関連 |
コンピュータ ⇔ computer、電子計算機、電脳
オンライン授業 ⇔ on-line education、teleteaching、遠隔教育
チェルノブイリ ⇔ チョルノービリ、Chernobyl
計画運休 ⇔ 事前運休、予告運休
中央銀行デジタル通貨 ⇔ 中央銀行発行デジタル通貨、中銀デジタル通貨、CBDC、Central Bank Digital Currency
|
ことばの表記ちがい | 198,038 |
漢字ひらがなカタカナのゆれや送り仮名のゆれなどの表記ゆれを収録。 (表記レベルの同義語辞書) |
引換券 ⇔ 引き換え券、引替え券、ヒキカエケン、ひきかえけん 車両 ⇔ シャリョウ、車輛、車輌 セーシェル ⇔ Seychelles、せーしぇる、せいしぇる、セーシエル、セイシェル、セイシエル |
|
組織名称 | 企業名 | 886,602 |
国内の企業名称を収録。 (登記名変更や企業合併に伴う名称変更や略称などを対象) |
NTTアドバンステクノロジ ⇔ 日本通信技術株式会社、NTT-AT、エヌティティ技術移転 |
機関・団体・学校名 | 294,800 | 国内の行政機関、団体、学校等の名称を収録。 |
国立国会図書館 ⇔ NDL、帝国図書館
宇宙航空研究開発機構 ⇔ JAXA、Japan Aerospace Exprolation Agency
成田国際空港株式会社 ⇔NRT、成田国際空港、成空
|
|
専門用語 | 経済・法令・公共用語 | 187,515 | 経済・ビジネス用語や公文書・法律・行政用語などを収録。 |
全世界衛星測位システム ⇔ GPS、全世界衛星測位システム
Circular Economy ⇔ サーキュラーエコノミー、サーキュレーションエコノミー、循環型経済
cut-off error ⇔ カットオフ・エラー、期ズレ
|
時事・スポーツ・芸能・放送用語 | 76,500 | 時事(ニュース)、スポーツ一般、芸能に関する語を収録。 |
車いすラグビー ⇔ wheelchair rugby、ウィルチェアーラグビー、クアドラグビー P2P融資 ⇔ person2person lending、個人間融資 |
|
医学・薬学用語 | 625,152 |
医学薬学に関する用語を収録。 (病名、薬物名、人体の部分名などの語句を対象) |
既往症 ⇔ past medical history、PMH
ヘアターニケット症候群 ⇔ Hair tourniquet、髪の止血帯、ヘアターニケット
センサ入り錠剤 ⇔ デジタルメディスン、デジタル医薬品、デジタル薬、Digital medicine
|
|
非鉄・金属用語 | 20,036 | 非鉄金属、金属加工などの用語を収録。 |
応力ひずみ曲線 ⇔ S-S曲線、stress-strain curve、変形曲線 焼鈍軟化曲線 ⇔ softening curves、焼なまし軟化曲線 |
|
コンピュータ・情報・通信用語 | 130,722 | コンピュータ、情報通信、電子工学に関する用語を収録。 |
パリティビット ⇔ parity bit、奇偶検査ビット
ノーコード ⇔ ノーコード開発プラットフォーム、No-code development platform、NCDP、ノーコード開発
|
|
自動車用語 | 49,518 | 自動車を中心に電車・船などを含めた運輸交通に関する用語を収録。 |
つながる車 ⇔ コネクテッドカー、Connected Car
BEV ⇔ battery electric vehicle、バッテリ式電気自動車、電池電気自動車
|
|
機械用語 | 168,790 |
機械工学に関する用語を収録。 |
遠心ファン ⇔ centrifugal blower、輻流送風機、うず巻送風機、渦巻扇風機、遠心ブロワ
波形ばね座金 ⇔ curved spring washer、waved spring washer
|
|
土木建築用語 | 82,720 |
土木、建築に関する用語を収録。 (岩石、地形、工法、建造物に関連する語句を対象) |
自己治癒コンクリート ⇔ self-healing concrete
リバビリティー指標 ⇔ 住みやすさ指標、liveability indicator、リバビリティー・インディケーター
|
|
電力・エネルギー用語 | 38,439 | 環境、発電、原子力、物理学に関連する用語を収録。 |
地熱ヒートポンプ ⇔ geothermal heat pump、GSHP、地中熱ヒートポンプ 高輝度放電 ⇔ high-intensity discharge lamp、HIDランプ
微生物発電 ⇔ 田んぼ発電、microbiological electric generation
|
|
化学・石油工業用語 | 182,344 | 化学分野、主に石油化学工業に関連する語句を収録。 |
鋳込成形法 ⇔ スリップキャスト成形法、鋳込み成形法、slip casting
近赤外 ⇔ near infrared、NIR
|
|
合 計 | 3,158,914 |
適用例 / 導入事例
NTTコミュニケーションズ株式会社提供の「Communication Engine “COTOHA® API”」の企業名及び業界用語対応専門語辞書として提供。
- 2018年9月5日より提供開始された高精度な自然言語解析API「COTOHA® API」の企業名や業界用語に対応する専門用語辞書として利用されています。
顧客管理システムの名寄せ(大手総合メーカー様、国際的な信用調査会社様ほか)
- お客様の課題:旧名、略称、愛称、通称、前株・後株などさまざまな表記でデータベースに顧客名が登録されており、全社的に取引先を共有することが困難だった。そのため、顧客データベースでの顧客名表示を常に最新名にしたい。
- NTT-ATの回答:お客様の顧客データベースと、Express Finder / シソーラス辞書の「企業名編及び団体編」を連動させ、社内システムで正式名称に名称置き換えて表示する辞書としてご利用いただいている。
図書蔵書検索システム(各種図書館システム販売会社様)
- お客様課題:従来の検索システムでは、書誌項目を検索対象とすると表記ゆれ等により検索結果にバラツキがでた。また、個人の検索慣れ度合いが検索結果に影響することも懸念された。
- NTT-ATの回答:従来の検索システムとExpress Finder / シソーラス辞書(基本語)を連動させた。これにより個人の検索慣れ度合いに依存することなく、ほぼ同じような検索結果を得ることが出来るようなった。また、表記ゆれ対策も同時にできることにより、図書館システムを売り込む際の差別化要素として使用されるようになった。
その他、各種の実績があります。
インターネット検索、ホームページ検索、各種DB検索(新聞情報、学術論文、特許情報、図書館情報、会議録、法令判例等)、情報分類システム及びメール検索システムに組み込まれています。
- 社内管理システム:証券会社顧客管理、官公庁関連
- 製薬会社検索システム:学術論文検索システム/MRのための医薬情報検索システム
- 検索システム販売会社:利用先|総合研究所、就職紹介会社、書籍取扱い会社、総合電器メーカー特許検索など
- 図書館検索システム:国立大学図書館、企業図書館、自治体図書館、私立大学図書館
- 自治体向け検索システム:会議録検索、例規検索、公文書館検索、白書検索
- その他:検索エンジン販売会社、文書管理システム販売会社、SI案件取扱い会社など
その他の活用イメージ
シソーラス辞書を活用した顧客DBの名寄せ
課題- 会社合併や部内統合により複数の顧客管理情報の統合が必要だが、担当者がさまざまな表記をしているため、旧名、略称、愛称、通称、前株・後株など様々な表記ゆれがあった。
- 登録された顧客の企業名・所在地を正しい名称に変換し、顧客情報を整頓したい
解決
- シソーラス辞書を利用して名寄せを行いデータのばらつきを解消
大規模言語モデル(LLM)と検索エンジンを融合するRAGシステムの改善
背景と課題- 検索エンジンを用いて大規模言語モデル(LLM)に独自知識を追加するRAG(Retrieval-Augmented Generation)技術が注目されている。独自知識の検索には埋込ベクトル検索を用いる場合もあるが、手堅く全文検索エンジンを用いる場合も多い。
- 全文検索を用いてRAGシステムを構築する場合、表記ゆれによる検索漏れが課題となる。
- 適切な文書が検索されないとLLMも適切に回答できない。
解決
- シソーラス辞書の適用で検索漏れを防止し、LLMの回答を改善
詳しくは、お問い合わせください
「Express Finder / シソーラス辞書」が、さらによくわかる詳細資料をお送りいたします。資料ダウンロード
製品紹介資料 | ダウンロード | |
---|---|---|
サンプルリスト | ダウンロード |