【ビジネスで使う統計学】業務分析可視化のためにアンケート調査をする場合のサンプルサイズの決め方

アンケート

最近ではコンピューティングのコストが下がって、ビッグデータ分析の技術が進んだために、何かを調べる場合に対象となるデータを全て使って調べることも可能となっています。昔はコンピューターを使うコストも高く、また計算に時間がかかったため、いわゆる全数調査というよりは、「サンプリング」による調査が行われました。今でもコンサルティングの現場では、サンプリングしたほうが良い(せざるを得ない)という場合がたくさんあります。



サンプリング調査とは

「サンプリング」調査とは対象となるデータの全体(母集団ともいいます)から、一定の標本を抽出して、標本を調べることで全体の特徴を推定しようというものです。正しいサンプリングを行えば、安いコストで調査をしつつも、それなりに正確な全体の特徴を結論づけることが可能です。

全数調査ではないので、完璧に正確ではありませんが、私たちの実務上不具合が無いレベルでの精度があれば事足りるという場合には便利な方法です。

従って、現在でもサンプリング調査を理解して使えるようになると、ビジネスにおいても大いに有用です。私の場合も様々なプロジェクトの業務分析の方法として使っています。全数調査が可能な場合でもあえてサンプリング調査を選択することもあります。


サンプリング調査を選択する理由

その理由は「コストが安く業務にかかる負担が少ないから」です。業務分析のための調査では、業務に携わる人に直接データ取得をお願いすることがあります。業務システムからデータが抽出できれば良いのですが、必ずしも必要なデータが取得できず、そのような場合はエクセルなどで記録用紙を準備してスタッフのみなさんにデータ記録をお願いします。このため、スタッフのみなさんにとっては余計な仕事が増えてしまうことになります。この負担を最小限におさえるためにサンプリング調査を選ぶのです。


サンプルサイズはどのように決まるか?

それでは、必要かつ十分なサンプルサイズはどのように決めたら良いでしょうか。実は統計学の理論上はサンプルサイズは全体(母集団)の数とは関係なく、調査で期待する正確さ(誤差・信頼度)と調査対象の性質(母比率)で決まる、ということになっています。

つまり、全体がどれほど多かろうが、これらの条件でサンプルサイズが決まるのです。この感覚が違和感になって業務の現場から理解が得られないことがありますが、理論上は正しいのです。


実際にサンプルサイズを計算してみよう

例として業務分析を考えます。作業者が毎日どんな仕事にどのくらい時間を費やしているのか、1時間おきの単位で分析する、と仮定します。この場合、どのくらいのサンプルサイズを取得したら良いか?ということが問題になります。もちろん作業者全員に全時間分の記録をとってもらう(全数調査)でも良いのですが、これでは肝心の作業が滞ってしまい、邪魔になります。したがって、必要最小限のサンプルで調べたいということになります。

サンプルサイズの算出に必要な数字は3つです。まず「母比率」。データ全体のうち一定の条件を満たすものの比率です。業務分析を行う場合は、業務担当者が全員全く同じ仕事をしていれば100%ですが、実際には少しずつ違っているはずです。現場を見てほぼ同じと判断できれば90%などとします。推定できない場合は、安全のため50%とします(母比率50%でサンプルサイズが最大になるからです)。

次に「誤差」です。誤差はどの程度のサンプリングのエラー(誤り)を許容できるか?ということです。通常は5%とします。業務分析のためのサンプリングであれば十分でしょう。

そして「信頼度」です。こちらはサンプリングが正しい割合(エラーが発生しない割合)ですので、通常は90%から95%など高く設定します。ここでは95%とします。

誤差・・・5%

信頼度・・・95%

母比率・・・90%

以上から、こちらの数字を下記のような計算ツールに入れると、必要なサンプルサイズが出てきます。

母比率の区間推定における必要なサンプルサイズの計算フォーム
https://bellcurve.jp/statistics/blog/14347.html


計算結果の読み方・導入方法

上記の例では「139」と出ます。これの意味は、139時間分のデータ記録を取得すれば、統計学的に業務全体の特徴を結論づけることが出来る、ということです。139時間というと1ヶ月の記録時間を80時間として、作業者1人では約1.7ヶ月分のデータですが、仮に作業者が2人いれば1か月程度のデータ記録で集められることになります。

例えば、同じ作業をしている人が10人のチームの業務分析を実施するのであれば、そのうち2人選抜して2日に1日くらい1ヶ月間データを記録してもらうと必要なデータが集まります。

さらに、人による偏りを避けるため、この2人は10人の中でランダムにローテーションさせたり、また、記録のタイミングは月の上旬、中旬、下旬にバランスよく振り分けて時期による偏りが出ないように工夫します。

このように139時間を超えるデータを取得して分析すれば、そのチームの業務の特徴や問題点をある程度結論づけることができるでしょう。


まとめ

上記の例でも必要なサンプルサイズは思っていたより小さいと感じるはずです。サンプリング理論に基づいて必要なサンプルサイズを決めることで過剰なデータを集めて、調査対象(作業者)に負担をかけるということが無くなりますし、データを集めて集計分析する作業も効率化することができます。

以上、業務分析可視化のためにアンケート調査をする場合のサンプルサイズの決め方、という話題でした。ちゃんと勉強してみたいという方は、こちらの本などお勧めです。




━━…━━…━━…━━…━━…━━
サンクプランズ・コンサルティング
━━…━━…━━…━━…━━…━━
個人・中小事業者のお客様を対象に会計サービス、コンサルティング、デジタルコンテンツ販売、セミナーなどを行っています。
詳しいプロフィールを見る
会計サービスについて
コンサルティングについて
デジタルコンテンツ販売について
セミナーについて
お問合わせはこちら