ABテスト(4)_必要なデータ数
前回に引き続き、ABテストに触れます。 ABテストでクリック率の差を測りたい場合、どれだけのデータ数があれば良いのでしょうか?
「とりあえずやってみたけれど、データ数が十分でないため、統計的に有意な差はありませんでした」・・・
っていうのは困りますよね。
「何の成果も!!得られませんでした!!!!」とは言えませんし汗
分析前に必要データ数を把握する意味
比較したい目標クリック率によって、必要なデータ数が変わってきます。
ただ、データ数を増やしたくても、予算や時間など様々な問題で簡単には増やせないと思います。
国勢調査のようなものであれば、潤沢なリソースを基に大規模な調査ができるか思いますが、1企業では制約があります。
ですので、どこまでならデータ数を増やせるか、その制約下ではどこまでの精度で分析ができるかを、分析前に知っておく必要があります。
「何の成果も!!(以下略)」としないためです。
今は複雑な統計計算をしなくても、サイトで自動で計算してくれるサイトもありますので、それを活用すると良いでしょう。
必要データ数
例えば、通常のクリック率が1%だとします(リストA)。そして、比較対象のリストBでのクリック率目標が2%とします。 つまり、何らかの変更をリストBに施したことにより、クリック率が+1%増えることを目標とします。 その場合、統計的に有意といえるためにはどれくらいのデータ数が必要でしょうか?
専用サイトで計算してみました。 以下の場合、必要データ数は約1800でした。これくらいであれば、データを用意するのは難しくなさそうです。
ABのクリック率の差が1%
- リストA: クリック率1%(通常)
- リストB: クリック率2%(比較対象)
- 有意水準α: 5%
- ABの差が偶然生じる割合
→必要データ数:約1800
ABのクリック率の差が0.5%
上記のように明確なクリック率の差がなく、0.5%の場合は下記です。
- リストA: クリック率1%(通常)
- リストB: クリック率1.5%(比較対象)
- 有意水準α: 5%
- ABの差が偶然生じる割合
→必要データ数:約6200
これも、データ数は問題なさそうです。
次回はテスト結果の効果検証方法について触れます。
以上です。