データ変換研究所、テキスト抽出ソフト「DocCat(ドックキャット)」の最新版を発売
ソフトウェア・ベンチャーのデータ変換研究所
高精度・超高速のテキスト抽出ソフトウェア、MS-Office 2007対応の新版
“DocCat Ver.5”(ドックキャット5)を発売
データ変換に係わる技術研究開発販売のソフトウェア・ベンチャー、株式会社データ変換研究所(本社:京都府京都市中京区、代表取締役:畑中豊司、以下:デ変研)は、デ変研の重点基礎技術である「テキスト抽出技術」のパッケージソフトウェアとして定評のある、“DocCat(ドックキャット)”の最新バージョンを発売します。
今回、発売する“DocCat Ver.5(ドックキャット5)”は、前バージョン同様のテキスト抽出処理速度はそのままに、Microsoft Office 2007で作成されたファイルフォーマットに対応しました。
Microsoft Windows Vistaでは、従来のOSと比較してユニコード(UTF8/UTF16)においてJISの第三水準・第四水準に準拠する変更が加えられています。
このため、DocCatにおいてもJISの第三水準・第四水準(JIS X0213:2004)に準拠し、かつ、ユニコード(UTF8/UTF16)の変更に対応すると共に、“ユニコードのサロゲートペア”にも対応しました。これらによりテキストにおいては、JIS/EUC/SJIS/UTF8/UTF16の文字コード変換を実現しました。
DocCatは、2000年2月の発売以来「全文検索エンジンでの“検索率の向上”“インデックス生成速度の向上”」用途を主として好評を得ており、多くのユーザの方々にご利用いただいています。今回のVer.5は、6月11日以降受注分より出荷開始しており、前バージョンをご利用で年間保守に加入いただいている既存ユーザ様向けにも最新バージョン(Ver.5)キットを順次提供してまいります。
DocCat Ver.5は、“パッケージソフトウェアライセンス”として、販売代理パートナー経由での販売になります。本製品の詳細につきましては、http://www.dehenken.co.jp/をご参照ください。
<株式会社データ変換研究所について>
Windows文書ファイルからのテキスト情報を抽出するソフトウェア開発会社として、1999年9月に設立され、Linux/Unix上のミドルウェアパッケージソフトウェア「DocCat」、OEM組込み型ソフトウェアライブラリ「デ変研TFライブラリ」、メール全文検索ソフトウェア「Mail Cyclope」、個人情報を検出するためにPCやServerのDISK内のファイルを監査する「デ変研監査ライブラリ」の開発・販売を行う。
独自のテキスト処理技術に強みを持ち、大手ソフトウェア開発ベンダ40社以上にOEMにて技術供給を行っています。
以 上