当前位置:首页 > 教育 >

样本容量n的计算公式(样本总量和样本容量计算公式)

来源:原点资讯(www.yd166.com)时间:2024-06-13 21:10:59作者:YD166手机阅读>>

编辑导语:AB测试若运用得当,则可以对产品优化、企业决策等多个情景有所帮助。本篇文章里,作者就以费阅读为研究对象,具体探讨如何提高测试效率的问题。感兴趣的话就一起来看一下吧。

样本容量n的计算公式,样本总量和样本容量计算公式(1)

前半章是案例,想看干货的可直接转到后半章。

如今ABtest已被广泛应用,是否经常遇到测试成本高、观察周期长、结果不清晰的问题?

本文将通过探究测试需要的样本量来达到提升测试效率的目的。

一、思路

1)定性分析:确定样本量和变量的关系。

2)定量分析:已知总体比例,计算抽样样本容量。

二、背景

以付费阅读行业测试书籍为例,计算已知总体比例的抽样样本容量。

三、案例

1. 数据获得

付费阅读行业经常会根据书籍推广测试的后续回收增幅来对书籍质量进行评估,以确定书籍是否有推广价值。现需要对某测试书籍后续回收做有效判断,观察周期为5天。

样本容量n的计算公式,样本总量和样本容量计算公式(2)

现已有书籍平均回收经验:

  • 累计1天ROI=20%时,对应累计5天ROI=40%
  • 累计1天ROI=22%时,对应累计5天ROI=42%
  • 累计1天ROI=24%时,对应累计5天ROI=44%

2. 数据分析

1)问题

对于以上表格中的数据如何评价?

在探索出样本量的规律之前,我是这么做的:

样本容量n的计算公式,样本总量和样本容量计算公式(3)

初步结论:4/1、4/3、4/5后续达标;4/2、4/4后续不达标。

这就很难仅通过5天数据对这本书进行评价了。

这时我们注意到4/1、4/2的新增uv非常少,而涨幅的偏差却很大,那么是否因为样本量的原因干扰了我们的判断呢?

答案是:是的,样本量会影响后续回收涨幅。

如果样本量影响对书籍质量的评估,那么究竟需要多少样本量才能达到理想的反馈结果呢?

2)结果

本案例中,应排除4/1、4/2、4/4三天再做评价。

4/3、4/5的测试结果为正向,因此认为这本书可以用于推广。

根据4/3、4/5的第5天增长情况对4/6进行预估,4/6预计累计5天ROI=39%,结果仍为正向。

3)分析过程(正文 干货)

定性分析:分解指标,找出变量中受样本量影响的因素,以及该因素与变量的关系。

本案例中:

  • 累计ROI=累计充值金额/新增当日消耗;
  • 累计充值金额=∑第i天充值金额=∑第i天充值uv*第i天充值ARPPU;*ARPPU是对消费能力的反应,本案例中直接与用户阅读速度成正比,近似恒定;
  • 第i天充值uv=新增uv*第i天留存比例;*对于付费小说,免费用户在付费章节几乎全部流失,因此近似认为5天后留存下来的用户都是付费用户。

得到:累计充值金额=新增uv*∑第i天留存比例*第i天充值ARPPU。

问题简化为:为保证新增用户5天后有效留存,需要多少新增uv(又回到了熟悉的留存问题上了)。

现已知第5天平均留存比例为8%。

定量分析:大样本条件下,已知总体比例π,求置信度(1-α)下的样本容量n】

计算公式

本案例中:

  • 给定95%的置信度下z=1.96
  • π=8%(在总体比例未知的条件下可取π=0.5)
  • E取0.2π=1.6%(E为给定的置信水平下使用者可以接受的允许误差,由实际业务成本和接受程度决定)
  • n=1.96*1.96*8%*92%÷1.6%÷1.6%≈1100

计算置信区间:

计算公式

在本案例中,1.96*sqr(8%*92%÷1100)≈1.6%,置信区间为 (6.4%,9.6%)。

四、结论

众所周知,样本量越大、测试周期越长,成本就会越高。如何降低成本是数据分析师应做的,也是文章里想要表达的。

在本案例中,至少需要新增uv=1100。

因此认为4/1、4/2、4/4为无效测试,再结合实际业务对4/5进行取舍,本案例中认为4/5是有效测试。

最后很重要!

互联网很容易获取到大样本,但样本里掺杂的因素很多,在做测试和计算样本量的时候,一定需要先做定性分析!

本文由@树无???? 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议

,

栏目热文

初中数学样本容量和样本的区别(样本容量公式初中数学)

初中数学样本容量和样本的区别(样本容量公式初中数学)

1、数据的两个特征:集中趋势和离散中程度(波动大小),集中趋势指的是数据的“一般水平”或“平均水平”。离散程度指的是数据...

2024-06-13 21:00:17查看全文 >>

初一数学样本容量怎么算(七年级数学样本与样本容量)

初一数学样本容量怎么算(七年级数学样本与样本容量)

欢迎使用跨课,看下面这道题。某地有两千人参加自学考试,为了了解他们的成绩,从中抽取一个样本,若每个考生被抽到的可能性都是...

2024-06-13 21:00:53查看全文 >>

样本容量为什么不带单位(样本总量和样本容量需要带单位么)

样本容量为什么不带单位(样本总量和样本容量需要带单位么)

第十章 数据的收集、整理与描述第一节 统计调查【学习目标】1.了解全面调查和抽样调查的优缺点,能选择合适的调查方式,解决...

2024-06-13 21:30:57查看全文 >>

正版叶黄素价格(叶黄素有便宜的吗)

正版叶黄素价格(叶黄素有便宜的吗)

新京报讯(记者刘欢)8月15日,晨光生物披露投资者关系活动记录表显示,对于叶黄素价格波动大的原因,晨光生物回应称叶黄素的...

2024-06-13 21:31:52查看全文 >>

叶黄素是vb2吗(叶黄素又叫维生素b2吗)

叶黄素是vb2吗(叶黄素又叫维生素b2吗)

核黄素和叶黄素的区别核黄素和叶黄素是不同的,它们的区别也很容易认识,其中核黄素是能够促进人体毛发生长的元素,能够对改善身...

2024-06-13 21:25:46查看全文 >>

什么是样本容量通俗举例(怎么区分样本和样本容量举例)

什么是样本容量通俗举例(怎么区分样本和样本容量举例)

在问卷调研工作中,不少小伙伴可能会不太清楚如何确定样本量。本文就对这一问题做了阐述,一起来看看。在体验管理日常的问卷调研...

2024-06-13 21:28:04查看全文 >>

样本容量是不是样本总数(样本容量一般占整体的多少)

样本容量是不是样本总数(样本容量一般占整体的多少)

欢迎来到“统计学入门”系列!在这一系列的文章中,我们将一起探索统计学的奥秘——一个关键的学科,它在我们日常生活和各种科学...

2024-06-13 21:17:48查看全文 >>

样本容量的定义(样本容量的计算方法)

样本容量的定义(样本容量的计算方法)

样本容量又称“样本数”、“样本大小”,是指在一个样本中所包含的个案或单元数。 一般来说,样本容量主要由精确度、同质性、...

2024-06-13 21:20:26查看全文 >>

食堂四害是指(食堂四害消杀的温馨提示)

食堂四害是指(食堂四害消杀的温馨提示)

“四害”包括哪些?四害指的是老鼠、蚊子、蟑螂、苍蝇;四害不仅骚扰人们的休息,还传播疾病。四害的危害老鼠有哪些危害?老鼠不...

2024-06-13 21:27:08查看全文 >>

奇门四害表图(奇门四害最简单的化解法)

奇门四害表图(奇门四害最简单的化解法)

上次,我们谈到奇门遁甲断局一般分为三个步骤,即:取用神、看四害、看宫盘信息;并主要讨论了第一个步骤,即如何取用神的问题。...

2024-06-13 21:29:03查看全文 >>

文档排行