メルカリshopsの売り上げが曜日や時間帯によって値段に差があるかエクセルのデータ分析を使ってみた。(ピボットテーブル、分散分析)
未分類
方法:ピボットテーブル + 分散分析(ANOVA)
目的:特定の曜日や時間帯に値段が高くなる傾向があるかを探る
一元配置分散分析
目的:曜日ごとの平均値に差があるか?」を調べる。
やっていること(ざっくり)
各曜日の平均値を計算する
「曜日ごとの平均値の違い」が、**群内のばらつき(個人差)に比べてどれくらい大きいか?**を見る
その比率から F値(検定統計量) を出し、p値 を計算
p値が小さければ「曜日によって平均が違う」と判断
p値 ≒ 0.23 は、通常使われる有意水準(0.05)より大きい
「曜日ごとに値段に有意な差は見られない」
ピボットテーブル
ピボットテーブルで以下のような結果を確認
深夜:3700 朝:8550 昼:12450 夜:12850
夜と昼で全体の約68%(25,300円)を占めています
月で見ると
3月:7940 4月:10360 5月:8450 6月:3600 7月:300 8月:3000 9月1600 10月:1400 11月500 12月400
4月の夜(18:00 ~ 23:59)が一番売れる。
日曜日だけで全体の約26%(9,760円)を占めています。
つまり、日曜日の夜が売れる
ナゼ?分散分析とピボットテーブルではの結論が違う??
件数を確認してみると、日:19件、月:9件、火:8件、水:9件、木:6件、金:6件、土:8件
ANOVA(一元配置分散分析)は、「平均値の差」つまり、各曜日の 1件あたりの金額(単価など)の平均 に差があるかを見る検定です。
日曜日がダントツ多いため、一元配置分散分析では有意な差が見られなかったことがわかります。
また、売れた件数をカウントしてみました。
カテゴリ時間帯件数
深夜0:00 ~ 5:597
朝6:00 ~ 11:5913
昼12:00 ~ 17:5924
夜18:00 ~ 23:5920
値段関係なく売れた件数では昼が一番多かったです。つまり「夜は1件当たりの単価が高い」と考えられます。
結論
分散分析は「平均の差」を見ています。各曜日の件数が極端に違うと信用した結果が得られにくいようです。
ピボットテーブルは曜日・時間帯別の「売上数」「価格」「件数」などの実際の傾向を可視化します。
日曜日の件数だけ桁違いなので、分散分析の結果ではなく、ピボットテーブルの結果を見た方が良さそうです。
従って、「日曜日の夜が売れる傾向がある」とみていいかもしれません。

コメント