フリーコメントをデータとして分析する「テキストマイニング」の効果を理解した

今回の内容

 

 

***

 

1: フリーコメントを分析するって?

コールセンターで話された内容を自由形式で書き留めたデータ、もしくはアンケートのフリーコメントなど、「ひとが読んで理解する」ための情報と思っていた文字データが、コンピュータを使った分析の対象になると初めてわたしが知ったのは、1999年~2005年の間のどこかだ。

当時、統計解析ソフトウェアを販売しているSAS社の年1回のイベント「SASユーザー会(=SUGIJ)」にほぼ100%参加していて、そのどれかのセッションで、「茶筅」というフリーソフトを使ったテキスト解析の発表があり、そこで知った。

その後2007年に、NRIが出している「TrueTeller」というテキストマイニングソフトを使ってアンケート情報のテキストマイニングを初めて体験した。

 

テキストマイニング」とは何か、今回はそんなエントリー。

 

2: テキストマイニング

テキストマイニングとは、テキスト(⁼フリーコメントなど)を以下の手順で分析する技術。

 

  1. テキストデータを単語単位に分解
  2. 同じセンテンスでどのような単語が入っているかグループ情報を持たす
  3. (例えば)単語と単語のつながりの濃淡を可視化

 

テキストマイニングの本質は、1つの単語が他の単語とどのような関係性を持つか、それを可視化することだ。

では単語を区切って情報化したとして、それをどのように使うのか?

 

 

3: テキストマイニングを仕事で活用する方法

テキストマイニングは単語と単語の関連性を可視化する。例えばアンケート調査の結果を使ってテキストマイニングを行う場合はどうなるだろう。

テキストマイニングの結果、ポジティブな単語と強く結びついているのはどのような単語か、逆にネガティブな単語と結びつきを強くしているのはどのような単語か、を知ることができる。

もし複数の商品を持っている場合、どの商品のどの部分を改善するか、という商品開発のヒントになる可能性がある。そして、仮にアンケートが数百件あったとしても、テキストマイニングでデータ処理が可能となれば、大きな生産性の改善になる。

 

しかし最もテキストマイニングが威力を発揮するのはグループ間の差異を見つけ、次のアクションに結び付けたい場合だ。コールセンターを例にしよう。

 

■状況

あるコールセンターで問い合わせのあったお客様に、商品を購入してもらうべく、テレセールス(⁼アウトバウンド⁼OB)を行っている。

■オペレータの状況

  • 100名のオペレータが勤務
  • オペレータあたり、100人のお客様をひと月に抱えている

※近年、コールセンターの会話データ(音声データ)を自動でテキスト化する技術が生まれている。

 

■事業の問題

問題は100名のオペレータの成約率に大きなばらつきがあること。

 

■事業の課題

課題はローパフォーマーをミドルパフォーマークラスに、ミドルパフォーマーをハイパフォーマークラスにそれぞれ引き上げる方法が、確立されていないこと。

 

このような状況になっている場合、テキストマイニングを以下の用に使うことで、現場の育成サポートができる可能性がある。

 

  1. 対話ログデータを「ハイパフォーマー」「ハイパフォーマー以外」に分類
  2. 1で作った2つの対話ログデータを、それぞれテキストマイニングで解析
  3. 分析手法は共起ネットワーク分析を使って可視化
  4. 可視化された結果を「ハイパフォーマー」「ハイパフォーマー以外」で比較
  5. 結果を解釈する(一番難しいところはココ!)
  6. 4で両グループ間の差異を発見することができたら、その示唆を実データで確認し、有益な結果となれば、それぞれのグループにフィードバックする

(参考)共起ネットワーク分析のイメージ

 

コールセンターの現場では、リーダークラスの管理者がオペレータの会話を絶えずモニタリングしており、オペレータそれぞれの特徴はつかんでいる。

その経験に加えて、共起ネットワーク分析などで可視化したデータがあれば、説得力が増す。現場を知っているひとこそがテキストマイニングの結果を有効活用できる人材だ。

 

ちなみに、わたしが共起ネットワーク分析で解析したときは、ハイパフォーマーの話題の作り方は、コンパクトにまとまっていて聞き手はわかりやすいだろうなという印象を受けた。一方ハイパフォーマー以外は、ひとつの会話に複数の話題が行ったり来たりしており、聞き手にはわかり辛いという印象だった。

これをコールセンター経験者に伝えたところ、如何にわたし自身のデータ解釈が表面的か、知らされた。(お恥ずかしい限りです)

 

このようなテキストマイニングを使った業務改善は、業務理解が深いひとが解析結果を手にするほどに、効果が期待できる。ただし効果に速攻性はない場合もあるため、その辺りは注意が必要だ。

 

 

4: テキストマイニングはビジネスでは利益を生まないと思っていた

テキストマイニングを初めて知ってから長い期間、わたしはテキストマイニングはビジネスでは使えないと思っていた。理由は利益につながらないと思っていたからだ。

しかしグループ間比較や個人の比較など、「可視化して比較」することで、浮き彫りになることがあること、そしてそれが行動を改善するアクションに結びつけることができることに気づいてから、わたしの考え方が変わった。

 

分析手法は、分析手法を知っているだけだと意味がない。

その分析手法をどのように使って利益を生むか、ということが一番重要だ。

 

テキストマイニングにご興味があれば、お勧めのフリーソフトは以下。

 

KH Coder