
先日@msngさんが主催する「俺聞け9」というイベントで「Webで使えるやさしい統計学」というプレゼンをしてきました。
「俺聞け」とはウェブに関連して
「いまこれが気になる!」という話題を発表したり
そういう話を聞いて「へー」などと言ったりするイベントです。
http://www.msng.info/archives/2014/07/orekike9.php
楽しい雰囲気の中、1日でウェブ界隈の様々な話が聞けるのオススメのイベントです。
大阪と東京で開催しているのでご興味のある方はぜひ参加してみてください。
さて、今回はとあるショッピングサイトのWebマーケターという立場になって、どのように統計学を活用していけばいいかという視点でストーリを練ってみました。
発表スライドはこちら。
それではスライド内のポイントをご紹介していきます。
平均値だけで大丈夫?
売上報告などでもよく使われていると思うのですが、データの中に極端に大きな値や小さな値が含まれていた場合、データの全体像を見誤ってしまう危険性があります。
そこでデータを見る指標として平均値の他に、「中央値」と「最頻値」も用います。
中央値はデータを小さい順に並べてちょうど真ん中の値、最頻値は最も出現頻度が高い値。
これらを見ていくことで、データの全体像をより詳しく把握することが可能になります。
平均値・中央値・最頻値を理解するためによく参考に挙げられる例として、世帯あたりの年間所得をご紹介しましょう。
平均値は537.2万円ですが、中央値はそれより100万以上も低く432万円、最頻値は200-300万円のゾーンです。
所得が2000万円以上あるような一部の方の影響で、中央値と平均値にこれだけの差が生まれているのです。
A/Bテストは効果あり?
A/Bテストを実施して、明らかにどちらかのパターンが良い結果であれば問題ないのですが、差が微妙だった場合本当に効果があったのか判別がつかない場合があります。
そういった場合に役立つのが統計学を使った検定です。
様々な検定の種類がありますが、A/Bテストでは「カイ二乗検定」が使われることが多いようです。
カイ二乗検定を使えば、AパターンとBパターンの差異が偶然起きた可能性が高いのか否かということが分かります。
上記の参考リンクではRを利用していますが、エクセルでも「CHITEST」関数を使って算出可能です。カイ二乗検定を正確に理解するのはちょっと難しいですが、ぜひ日々のデータ検証に取り入れてもらえればと思います。
年齢と売上は関係アリ?
「どうも年齢が高い人の方がよく買っているような気がする」
そういった場合に、2者の相関関係を統計学を使って数値化することができます。
気温とビールの売上の関係性などもよく例として挙げられますが、プレゼンではTwitter・Facebookのフォロー数・友達数とアクティブ率の関係について紹介しました。
Twitterは初日に5人以上フォローしたユーザーは継続してサービスを使い続ける
参考:グロースハックとは何か ?グロースハックをマスターするための究極のガイド?
Facebookは登録から10日以内に7人以上の友人と繋がると継続率が高くなる
参考:元Facebookのグロースハッカーが明かす!「ユーザー獲得」成功と失敗の変遷
ただし、相関関係があったとしても因果関係があるかどうかはまた別の話なので注意が必要です。
参考:相関と因果の話 つまり、掃除したからと言って儲かる訳じゃない
最後に今回のプレゼン資料作成に役立った本を3冊ご紹介します。
統計学ブームを作ったともいえるベストセラー本。
ちょっと難しい内容も含まれていますが、統計学の威力を知るにはうってつけの一冊。
ストーリー形式でサクサク読めます、初心者にもってこい。
分かりやすさと奥深さを両立した見事な本。
繰り返し読んでしっかり理解しておきたい。
統計学の知識はマーケターにとって大きな武器になるのではないでしょうか。
今後もしっかりと勉強し、ブログで活用法を発信していきたいと思います!
LEAVE A REPLY