NEC、目的の効率的な発見を可能にする情報検索システムを開発
目的情報に関する時間的な記憶をもとに
効率的な情報検索を行うシステムを開発
~情報検索に時間の概念を採り入れて過去に遡った検索を実現~
NECはこのたび、情報検索システムの過去の状態を再現することによって、検索対象を絞り込み、目的とする情報の効率的な発見を可能にするシステムを開発しました。
今回開発した情報検索システムは、(1)情報更新同期技術の開発、(2)時系列分割索引技術の開発、(3)過去索引圧縮技術の開発、(4)過去状態再現技術の開発、などにより実現したものです。
本システムにより、利用者は、探したい情報に関する時間的な記憶や記録を手がかりに、日々更新されている膨大な情報の中から、目的の情報を効率良く探し出すことが可能になります。
近年、企業のIT化が進み、企業ではWebサイトやオフィス文書など、膨大な情報が日々生成・更新されています。こうした膨大な情報の中から重要な情報を人手で探し出すことは困難となっており、企業内でも、インターネットの検索システムと同様の情報検索技術への需要が高まっています。しかし、これまでの情報検索技術は、主に情報に含まれるキーワード(特徴を表す用語)や、そのキーワードの出現頻度を手がかりに目的の情報を絞り込んでいるため、利用者が適切なキーワードを思いつかない場合や、手がかりにしたキーワードを含んだ情報が大量に存在する場合などに、目的の情報を探し出すことが困難であるという課題があります。
一般に、ビジネスに関わる情報を探す場合、その情報を的確に表す専門用語は思い出せなくても、その業務を行った年代や時期など、時間的な記憶は比較的残っている場合が多くあります。また、企業活動では、過去の一時期に販売した商品や商取引に関わる調査など、対象とする時間範囲を限定して情報検索を行う需要も増えています。NECでは、これらの事象に着目して情報検索に時間の概念を採り入れる技術の研究開発を進め、このたび、探したい情報に関する時間的な記憶や記録を手がかりに、過去に遡った検索を実現する情報検索システムを開発しました。
このたびの開発の特長は、以下の通りです。
(1) 情報が生成・更新される度に情報検索システムに記録する技術の開発により、情報の時間的な変化を記録できます。
(2) 情報の時間的な変化に対し、情報を検索する際に参照する索引を時系列に分割し、差分を管理する技術を開発しました。参照する索引の時間範囲を限定して検索を行うことで、過去の情報の検索が可能になります。
(3) 時系列に分割した複数の索引に対し、その差分を反映して結合する技術を開発しました。古い索引を結合することにより、ディスク容量を大幅に削減できるため、過去の情報を安価に記録できます。
(4) 情報の時間的な変化を記録する際、情報に含まれるキーワードの出現頻度や、その情報の閲覧許可者一覧など、情報の状態に関する情報も時系列に分割して管理します。過去の状態を再現した情報分析を効率的に行うことができるため、検索結果の優先順位や閲覧許可までも過去の状態を再現でき、あたかも過去にタイムトラベルしたかのような検索を行うことができます。なお、過去の閲覧許可と最新の閲覧許可を照合する機能も備えているため、過去の設定が不適切であった場合の閲覧を防止することもできます。
NECでは、今回の開発が、企業だけでなく、年々情報が増え続ける現代社会を生きる多くの人々に利便性をもたらすものであると考え、更なる技術向上に向けて研究開発を続けていく計画です。
なお、NECは今回の成果を、3月20日から23日まで、名城大学(愛知県名古屋市)で開催される「電子情報通信学会2007年総合大会」で発表します。
以上
<本件に関するお客様からのお問い合わせ先>
NEC 研究企画部 企画戦略グループ
http://www.nec.co.jp/contact/