テキストマイニングを使う技術/作る技術 基礎技術と適用事例から導く本質と活用法
価格:3,300円 (消費税:300円)
ISBN978-4-501-54220-7(4-501-54220-9) C3004
奥付の初版発行年月:2006年11月 / 発売日:2006年11月中旬
技術面での今後の発展可能性を示した
筆者らがIBMコーポレーションの基礎研究所のプロジェクトとして,機械翻訳や電子図書館のプロジェクトと通じて培った自然言語処理の技術をベースにテキストマイニングの研究開発に着手したのは,1997年後半のことである.近年では,数多くの企業からテキストマイニングの製品が発売されており,テキストマイニングという言葉自体,もはや目新しいものではなくなっている.ところが,期待されているほどにはテキストマイニングが使いこなされていないのが現状のようである.
そこで筆者は,「テキストマイニングは本当に使えないのだろうか?」という疑問から,大量の文書データを蓄積している社内外のユーザ部門において,ときにはコンサルタントの一員として,テキストマイニングの適用現場に参加させてもらうようになった.現場で実際に分析させてもらうと,有益な知見が面白いように抽出され,「やはりテキストマイニングは役に立つ技術である」という考えはますます強まっている.
しかし,それにも関わらず,「期待したような結果が出せなかった」「辞書作りが大変で手に負えない」「データの質が悪いのでテキストマイニングには適さない」といった声は絶えないようである.筆者の経験では,こういった声はすべてテキストマイニングに対する誤解から発生している.「試しに使ってみたが役に立たなかった」というユーザのデータでも,実際に分析してみると役に立つ結果が得られる.
そこで本書では,テキストマイニングを研究開発し,数多くの適用事例に関与した経験から,テキストマイニングの本質的な役割とその活用法を示すとともに,技術面での今後の発展可能性を示したい.
また,本書は,ユーザーとなる側の方々だけでなく,研究開発者の方々にも是非読んで頂きたいと願っている.
筆者がテキストマイニングを始めた動機の一つが,自然言語処理の研究者として,研究を推進するための新たなアプリケーションを確立したいということであった.自然言語処理の技術を活かせるとともに,研究のネタとなる大量の文書データを提供してくれるアプリケーションとしてのテキストマイニングの魅力を理解して頂き,研究の活性化に結び付けて頂ければ幸いである.
なお,本書に記す内容はすべて筆者個人の見解に基づいていることを,あらかじめご了承頂きたい.
2006年10月
著者しるす
目次
第1章 テキストマイニングとは何か
1.1 分析の技術としてのテキストマイニング
1.2 類似技術との比較—単なる検索や分類整理と何が違うか—
1.3 テキストマイニングの基本的な仕組み
1.4 テキストマイニングの自然言語処理
1.5 テキストマイニングにおけるマイニング処理
1.6 第1章のまとめ
第2章 テキストマイニングの適用例と効果
2.1 テキストマイニングの適用対象
2.2 コールセンターにおけるコンタクト履歴への適用例
2.3 インバウンドコールセンター(PCヘルプセンター)のコンタクト履歴のテキストマイニング
2.4 アウトバウンドセールスセンターのコンタクト履歴のテキストマイニング
2.5 第2章のまとめ
第3章 テキストマイニングの理想的な使い方
3.1 経営戦略としてのテキストマイニング
3.2 テキストマイニングの位置付け —誰が何のために行うのか—
3.3 情報の適切な共有
3.4 データを活かすことを意識したデータ収集
3.5 テキストマイニングの適用形態
3.6 第3章のまとめ
第4章 テキストマイニングに対する疑問への回答
4.1 どんなデータでも結果が必ず出るものか?
4.2 テキストマイニングの効果をどう判断すべきか?
4.3 テキストマイニングの結果はあてになるか?
4.4 辞書のメンテナンスが大変だからつかいこなせないというのは本当か?
4.5 テキストマイニングの分析に適正やコツがあるか?
4.6 テキストマイニングは文書の意味をどこまで把握できるのか?
第5章 テキストマイニングの今後
5.1 感情・評価・態度の分析技術
5.2 発話内容の分析技術(自動音声認識結果のテキストマイニング)
5.3 どうなるべきか—テキストマイニングの活用動向—
参考文献
索 引