【ビジネス統計学入門】アンケートの自由記述(フリーコメント)を無料で集計する方法を分かりやすく解説



アンケートをビジネスに生かすには

ビジネスの現場において「アンケート」をとる、ということが割と頻繁に行われます。例えばセミナーなどを開催すれば、必ず最後に参加された方にアンケートを回答していただきます。セミナー以外にも展示会でブースに立ち寄ってくれたお客様にアンケートを書いていただいたり、もしくは「顧客満足度調査」と称して相当な分量のアンケートをお客様に回答して頂く、ということもあります。

問題はこういったアンケートの回答をどのようにビジネスに活用するのか?ということです。これまでの経験では、大抵の場合、次のような処理がなされます。

● 点数が付いている項目は平均点を出す。平均点が高い・低い、上がった・下がったと言う。

● 自由記述欄(フリーコメント)による回答については主催者からみて顕著な例がピックアップされる。次に向けての改善点などが話し合われる。

これだけではもったいない、不十分という感じがします。もちろん、これでもそれなりにPDCAは回るので、何もしないようりはましですが、もう一歩踏み込みたいところです。




「統計学的に」踏み込む

どう踏み込みたいかというと、「統計学的に」踏み込みたいということになります。上記のような対応では、主催者の主観に過ぎず、真実の一端しか掴めません。いったい何が起きているのか、真実の全体像は統計学的な分析によって、見えてくるようになります

点数が付いている項目の分析は「T検定」を使いましょう。T検定を使うと平均値の変化に意味があるのか、たまたまの変化なのか、が分かります。

見た目だけで主観的に平均点が高い・低い、上がった・下がったと言うのではなく、統計学的な意味付けを行うことにより、分析結果に説得力が増します。「T検定」のやり方は、次の記事に書きましたので、ご参照ください。

コメントによる回答は、いわゆる自然言語で書かれており、数値化されていないので、分析が難しくなります

このような自然言語の数値化は、従来はあらかじめキーワードを決めておき、その出現数を数える、という方法がありました。数え方は漢字の「正」の字を書いて数えたり、エクセル上の処理としてカウントしたりしていました。

いずれにしてもマニュアル作業で、時間もかかりますし、見落としも多く楽しい作業ではありません。





テキストマイニングが無料で使える

ところが最近「テキストマイニング」(英語ではVerbatim Analysis)という技術が発達してきまして、アンケートのコメント欄に記載された文書を分析し数値化できるようになってきました。これにより「正」の字を書いたりすることなく、瞬時に大量のデータが分析できるようになりました。

以前はテキストマイニングを実施するには自分でプログラムを作るか、高価なサービスやソフトウエアを購入する必要がありましたが、最近はテキストマイニングを無料で提供している下記サイトがあります

ユーザーローカル社 テキストマイニング無料ツール
https://textmining.userlocal.jp/

こちらのサイトでは、無料にもかかわらず、100,000文字までのデータを分析して下図のようにワードクラウドの作成や頻出後のカウントを行ってくれます。使い方も簡単で、アンケート結果がExcelなどで整理されているのであれば、テキスト形式に落としてツールにデータロードするだけです。

テキストマイニング

(出典:ユーザーローカル社)





テキストマイニングの結果の見方

ワードクラウドというのは、英語ではWord Cloudですが、見た通り頻出語をひとまとまりに書いたもので、頻度が大きな言葉ほど大きな文字になっています。上記無料ツールの場合、名詞は青字、動詞は赤字、形容詞は緑字になっており、ぱっと見で判別しやすようになっています。

こんなに優秀なツールが本当に無料で良いのか?と思うほど非常にありがたい限りで、私もいくつかのデータ解析においてお世話になっています。

また、このツールが優れいている点は、頻出語について「スコア」を計算してくれることです。スコアについては、ウェブサイト上に次の通り説明書きがあります。

単語ごとに表示されている「スコア」の大きさは、与えられた文書の中でその単語がどれだけ特徴的であるかを表しています。通常はその単語の出現回数が多いほどスコアが高くなりますが、「言う」や「思う」など、どのような種類の文書にも現れやすいような単語についてはスコアが低めになります。

つまり、このスコアに注目して分析することで、より意味のある解析が可能となります




時系列のアンケートならさらに良い

もしアンケートを「顧客満足度調査」のように、定期的に時系列でとっているのであれば、ワードクラウドの頻出語がどのように変化しているのかを比較検討することで、自社が行った施策が期待通りお客様に届いているかどうか、または意図しない変化が起きていないかどうか、分析することができます。

さらに、頻出語のカウントについて「検定」をかけることで、統計学的に意味のある(有意な)違いが生じているかどうか、調べることも可能となります。




パワフルなプレゼンが可能に

このように統計学に踏み込んだ分析を行うことで、同じアンケート結果からより多くの内容を読み解くことができ、また「統計学」という言葉を出すことにより、クライアントや上司に対して分析結果を説明する際によりパワフルなものとなります

以上、アンケート結果のコメントを分析する方法を分かりやすく解説、という話題でした。テキストマイニングは一見難しく見えてもやってみると意外に簡単です。ぜひお試しください。

★ ★ ★ 人気記事 ★ ★ ★