ABテスト(2)_リストの分割

前回に引き続き、ABテストについて書きます。

リストの分割方法

前回、ABテストのリストをAとBで分割するときに、以下の２つでどちらが巧く分割できるか試すと書きました。

実際に２つの方法で、AとBで上記項目（属性）の比率が１：１にどれだけ近づけたか、検証してみました。

なお、以降は1の方法を単純ランダム化、２の方法を層化ランダム化と表現します。

この考え方は、統計学で母集団からの標本抽出をする際の「層化抽出法」に似ていますね。

どのように分割し、どういった結果が出たか載せれば分かりやすいのですが、一般公開ブログということもありますので、抜粋のみ載せようと思います。

各属性で細分化したブロックごとに、クロス集計で比率を確認しました。

注）属性：posの契約状況・posプラン・業種など

概ね、やってみる前からの想像通りの結果となりました。以下の条件が揃っていれば、単純ランダム化でも問題なさそうです。

ただし、今回はリストの分割方法による影響を極力除外したかったので、層化ランダム化を採用しています。

次回はどこまでの精度を求めるかについて触れます。

以上です。