【ビジネスで使う統計学】誰でもできる将来予測のやり方

ビジネスのいろいろな局面で、過去の実績に基づいて将来を予測するという必要が度々あります。例えば、コールセンターの問い合わせ件数あるいは受注件数、そういったものです。



コールセンターの問い合わせ件数

コールセンターの問い合わせ件数の場合は、過去の件数に基づいて将来の件数を予測し、その予測に応じてコール処理スタッフのスケジュールを調整したり、または新規に採用して増員したりということを行うわけです。

従って、この予測が外れるとコール処理がさばききれず、お客様に迷惑をかけたり、逆に人を採用しすぎて損失を出すということが考えられます。問い合わせ件数の予測をなるべく正確に行うことで、適正なコストであったり顧客満足の実現にができるということになります。



受注件数

受注件数についても同様のことが言えます。予測を大きく見積もりすぎてしまうと、過剰在庫に問題が生じますし、逆に予測を小さく見積もりすぎてしまうと、欠品による機会損失の問題が生じます。

このように、将来予測はビジネス上非常に重要です。しかし、なかなかこれを科学的に行っているところは少ないようです。その代わりにいわゆる KKD(感と経験と度胸)によって将来を予測し、一か八かの勝負をしているところが多いのが現実です。

 

将来予測は難しくない

一般に考えられるより科学的な将来予測はそれほど難しいものではないです。特にExcelのようなソフトを使うことで、誰でも簡単にある程度の精度で将来予測をすることが可能となります。

 

散布図と近似を使う

本格的な将来予測をやろうとするとまず説明変数を見つけて、重回帰による分析を行って将来予測を行ったりします。ですが、これはかなり手間がかかりますし、誰でもできるという訳ではありません。そこで簡便的なやり方として、散布図とその近似を使った方法を紹介します。



散布図の書き方

これはExcelの通常のグラフの書き方となんら変わりありません。ただ単にデータを並べて「挿入」の中から散布図を選ぶだけです。具体的には次のような手順になります(Mac版Excel 2016による例ですが他のバージョンでもだいたい同じはずです)。

(1)表を作る。例えば過去10年分の1月度のコール件数として以下の例を使います。


(2)散布図を書く。「挿入」からグラフの散布図を選びます。こんな感じになります。この時点でおおよそのトレンドを理解します。この例でいうと、2012年ごろから成長していますが、2015年ぐらいから成長が鈍化しているイメージです。

近似線の作り方

次に出来上がった散布図に対して近似線を作成します。近似線には単なる直線から多項近似その他いろいろありますが、Excel を使えばメニューから選ぶだけでそれぞれの近似線を描くことができます。そしてその近似の度合いはR² と言う数値によって判定することができます。R²が1に近ければ近いほど近似式は精度が高い(誤差が少ない)ということになります。従って様々な近似線をExcelに書かせてR²の値が一番大きい(1に近い)ものを選べば良いということになります。

ただし、多項式においては項数が大きければ大きいほどR²が1に近くなってきますが、このことが必ずしも将来予測の精度を上げるとは限りません。ある程度の近似線を書いたら将来予測をしてみて、それがこれまでの実績と照らして妥当なものかどうかは、最終的に人間が判断する必要があります。

(1)散布図のプロットを選択して、右クリックから「近似曲線の追加」を選びます。

すると、どの近似をするのか選ぶ画面が出てきます。ここで、「数式を表示する」と「R-2上数値を表示する」のチェックボックスをオンにして、直線近似や多項式近似などいくつかパターンを試してみます。

例では直線近似はこうなりました。R²は0.7885となっています。


(2)次に多項式近似(項数=2)でみて見るとこうなります。R²は0.8596となっています。まずまずですが、直近の減速感がうまく出ていない感じもします。

(3)そこで項数を3に変更して見るとこんな感じになりました。R²は0.8841です。まあこのくらいでしょう。結果として近似式は

Y= -2.375X³ + 14351X² -3x(10の7乗)X +2x(10の2乗)

となります。

(4)X軸が年のままだと数字が大きすぎて厄介なので、1から10までの数値に置き換えてしまうと、次のように近似式がスッキリします。

これで、近似式は下記のようになりました。

Y= -2.3753X³ + 48.98X² – 205.98X +3324.7


将来を予測する

近似式が決まったら、その延長線上に将来の数値を予測します。例のように過去10年分の12ヶ月分のデータがあるとします。そうしますと1月分のデータとして過去10年分、つまり10個のデータがあることになります。その10個のデータから近似線を近似曲線を作成して、その式に当てはめることで、11個目すなわち今年もしくは来年などこれから起きる将来の数値を算出するのです。

例の場合では、Xに11を入れて計算するとY=3823.9757と算出されます。従って、11年目すなわち2019年1月のコール数は約3823件と予測されます。

しかしこれは近似式に基づいた計算結果に過ぎませんので、ビジネス運用上の実際の予測は直近の動向やデータ以外の情報(現場の観察など)も参照して、推定することになります。例の場合でも2015年くらいからの減速を考慮すれば、もう少し少なめの3800件弱くらいが良い線かもしれませんね。まあ誤差の範囲かもしれませんが。

いずれにしても計算技術上の一定の根拠を持ちつつも、最後は人間が判断することになるでしょう。

 

まとめ

この方法の良いところは、統計など詳しくない人でもExcelで手順さえ踏めば比較的簡単に予測が可能なことです。欠点は、それほど完全なものではない、ということですが、人命に関わることでもない限りそこまで厳密である必要もありませんし、最後は現場の関係者による判断ということになりますので、必要かつ十分な方法といえるでしょう。

以上、誰でもできる将来予測のやり方という話題でした。この方法を応用してビジネスの将来予測に役立てましょう。よろしければ下記の書籍もどうぞ(画像をクリックするとアマゾンのページに移ります)。

━━…━━…━━…━━…━━…━━
サンクプランズ・コンサルティング
━━…━━…━━…━━…━━…━━
個人・中小事業者のお客様を対象に会計サービス、コンサルティング、デジタルコンテンツ販売、セミナーなどを行っています。
詳しいプロフィールを見る
会計サービスについて
コンサルティングについて
デジタルコンテンツ販売について
セミナーについて
お問合わせはこちら

 

テストマーケティングの効果を統計的に分析する方法

テストマーケティング

同じ商品でもパッケージのデザインによって売れ行きが変わったり、Webサイトでいえばデザインによってクリック数が変わったりします。

このため、どのデザインにしたら良いか会議があり話し合うのですが、最後は多数決とかエイヤーで直感頼みで決めたり、偉い人の鶴の一声で決めたりする訳です。そこにはこれといった根拠や理由はありません。ただ単になんとなく、決まるのです。

しかし、それでは博打と同じで、特に大きな投資となる場合には、心もとないですし、選ばれなかったデザインを推していた人も釈然としません。

そこでテストマーケティングしてみよう、という話になります。例えば4パターンのデザイン全てのパッケージによる商品を店頭に並べてみたり、Webサイトのデザインを一定期間で変えたりして、どちらが選ばれるのか?というのを検証する訳です。

そうするとデータが取得できます。A/B/C/Dの4パターンのパッケージ商品がそれぞれいくつ売れたのか?とか、A/B/C/Dの4パターンのWebデザインのそれぞれで目的となるリンクやボタンのクリックが何回あったのか?というデータです。

例えば下記のような感じです。

A・・・20個売れた

B・・・30個売れた

C・・・40個売れた

D・・・10個売れた

これはもう圧倒的にCですよね、一番売れたし、となります。

ここで疑い深い人から「本当にそうか?」「たまたまでは?」という疑念が沸き起こります。

そんなときに使うのが、「カイ二乗(かいじじょう)検定」です。

 

カイ二乗検定とは

カイ二乗検定の「カイ」はギリシャ文字のΧです。英字のエックスに似てますが、ちょっと違います。Χの二乗だからカイ二乗です。

検定とは統計学界隈で使われている手法で、統計学的が裏付けのある意味のある違い(変化)が認められるかどうかを調べるやり方です。検定は、実際には難しい数式による計算を行う必要があるのですが、そういったことは専門家に任せておいて、私たちは要するにビジネスの現場でツールとして検定を使えれば良いのです。

計算自体はExcelに用意されている関数を使うだけです。この関数に数値をいれて、計算結果だけを使います。検定の計算結果はp値(ぴーち)と呼ばれていて、このp値の大きさが5%(0.05)より大きいか・小さいかで判定します。

5%(0.05)より大きければ、有意な(意味のある)違いが無い、と判定されて、上記の例ではパターンCがもっとも売れたのはたまたまで、統計学的な根拠無し、となります。

5%(0.05)より小さければ、有意な(意味のある)違いがある、と判定されて、上記の例ではパターンCがもっとも売れたのは確かで、統計学的な根拠有り、となります。

そして統計学的な根拠有りとなったら、そのことを上司なりクライアントなりにアピールしましょう。上司やクライアントはたいていの場合統計学に明るくないので、「そうなのかー」と納得してくれます。(たまに専門家の方がいて、冷や汗をかきますが)

 

Excelを使った分析のやり方

Excelでカイ二乗検定はCHITEST()という関数を使います。

まず下図のような表にデータを入れます。2行目はそれぞれのパターンの実測値を、3行目には期待値を入れます。期待値は本来どのパターンも同じになるはずですので、25ということになります。

それでどこかのセルに「=CHITEST(B2:E2,B3:E3)」と入れて計算させます。B2:E2というのが実測値の範囲、B3:E3というのが期待値の範囲の指定です。

上記の例では、計算結果は「0.00016974」と出ます。すなわちp値が5%(0.05)より小さいですので、有意であるということになり、従って統計学的にもパターンCがもっとも売れるパターンであると結論づけることができます。

今回サンプル数が全体で100でしたが、100程度はないと「たまたま」との違いを検知できないようですので、注意が必要ですね。

以上、テストマーケティングの効果を統計的に分析する方法について、でした。

統計学の基本が勉強したいときには、この本がお勧めですよ。私も愛読しています。

━━…━━…━━…━━…━━…━━

サンクプランズ・コンサルティング

━━…━━…━━…━━…━━…━━

個人・中小事業者のお客様を対象に会計サービス、コンサルティング、デジタルコンテンツ販売、セミナーなどを行っています。

会計サービスについて

コンサルティングについて

デジタルコンテンツ販売について

セミナーについて

詳しいプロフィールを見る