当前位置:首页 > 企业招商 >

均值和标准关系公式(条件均值计算公式)

来源:原点资讯(www.yd166.com)时间:2023-07-31 01:14:24作者:YD166手机阅读>>

本文介绍了多指标评价的几类方法:离差标准化、z-score标准化、非线性标准化。

均值和标准关系公式,条件均值计算公式(1)

多指标评价常用于需要对一些对象进行比较的场景,在保有明确目的的情况下,通过多个维度的表现数据,赋予不同权重进行综合评判,最终形成排序。

首先涉及到的就是这些数据的归一化(normalization),或者说标准化,本质上就是去量纲,把量纲理解成计量单位也OK。这一步的重要性在于,多维度的评判,收集到的多方面数据,横向来看没有强耦合性,性质不同,量纲&数量级则大概率不同,直接用原始数值分析,那你得在不同维度的最终权重赋予上下大功夫,而且也不是很好解释。

纵向来看,同一维度下不同对象的值极端情况下可能差异巨大,归一化可以减弱这类影响。总之,去量纲转化为纯数值后,会更方便得进行不同对象之间的差距评估。

以下是几类方法简介:

一、离差标准化

名字很多,也叫线性标准化,最值归一化,min-max法,都是一个意思,即 处理后X = (处理前X – 最小值)/(最大值 – 最小值),这里的最大最小值,指的是同一维度下不同对象的值的集合中的最值。这样的处理可以把这个集合中的所有数值根据大小差距,映射入[0,1]区间内,也有的处理是最小值默认0,那就是看集合中的值和最大值的比例关系。

举两个实际例子:

①现在想给a,b,c三个商家打分,0~10分,有两个维度的数据,各占比40%和60%,这就意味着在维度一上满分是4分。

均值和标准关系公式,条件均值计算公式(2)

每个维度下最大值得分最高,其余数值按照与最大值的比例得分,最终把两个维度的分数相加,即为总分,如下表。需要注意的是,并不是所有的维度下,最大值都是最高分,存在值越高分越低的情况,比如差评,针对这种情况在数值处理上要取其倒数。

均值和标准关系公式,条件均值计算公式(3)

②现在要给一个用户推荐一些餐馆,它们的Rank如果除了以往的评价,装潢等,我还要考虑餐馆和用户的距离,或者餐馆和用户搜索的POI的距离。此时,得分y = 1-(x-min)/(max-min),x = 用户或者POI与餐馆的距离,min = 用户或POI与该城市内餐馆的最小距离,max = 用户或POI与该城市内餐馆的最大距离。空搜或关键字搜索,不同场景。

二、z-score标准化

也叫z标准化,标准差标准化,均值方差归一化。适用于数量较多,没有明显边界的数据,而且最好满足高斯分布。公式是处理后X = (处理前X – 均值)/ 标准差。这里的均值和标准差都是指同一维度下不同对象的值的集合的均值和标准差。通过这样,就可以把一种分布的数据变换为标准正态分布,均值为0,标准差为1,处理后的数值,符号为正就是超出平均水平,符号为负就是低于平均水平,很清楚。

处理前:

均值和标准关系公式,条件均值计算公式(4)

处理后:

均值和标准关系公式,条件均值计算公式(5)

同样需要注意的是,如果有的值是越低越好,那么,最终正负号需要做一个相反处理。

三、非线性标准化

这个方法很适合处理极值,要用到这个,就需要看你有没有一个需求,比如,我还是要给用户推荐一批餐馆,排序要去考虑UGC,就是用户评价的数量,但是我研究了一下我所有的餐馆,发现大部分餐馆的评价数都在100~300之间,有一些是1000 ,就也不多,但是对于用户来说,评论数无非是一个评价可信的佐证,一个踩坑的概率剪枝,300多条勉强足够了,所以尽管有些餐馆的评论数特别多,它在这一项上的得分也不应该是正常水平的几倍,于是你就需要一个非线性的评价曲线,让评论数超过了一定阈值之后,增长相同的评论数,得分增长越来越低。这里一般会取用y=a*log10(x) b的形式,通过调整a与b来根据数据调整曲线。

均值和标准关系公式,条件均值计算公式(6)

标准化处理时也要考虑数据可能存在的问题,比如由于维度拆分过细,样本量较少,数据异常,可能会导致在单项上某个对象没有数值,针对此类情况,是否考虑在单次评价中将该项上的权重按比例转移?还是有一个兜底分数?等等。

不同的标准化方式其实适用于不同的业务要求(数据精准,颗粒度等),在多指标评价中你最终可能还会觉得权重的设置起了更重要的作用,但是说到底还是2部分:数据 算式(处理)。清楚你要评估的对象的哪些方面,清楚地定义口径,是评价体系的客观性的重要体现。

其实很明显,多指标的评价是一个描述不同对象的差距程度的,可以理解是描绘竞争关系的,是相对的,横向的,就比如在自媒体的后台中,平台给的分数的绝对值并不能完全代表你的水平浮动,但是努力提高创作水平,争取提高你的分数,一定是有用的,因为你改变了竞争关系~

本文由 @寒鸦jackdow 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

,

栏目热文

均值法公式(均值的运算公式)

均值法公式(均值的运算公式)

所谓平均值法,就是形如a b=2m常数2m (或者a-b=m),取2m的一半m.a b=2m a-m=m-b=t a=m...

2023-07-31 01:37:58查看全文 >>

求平均值的三种公式(求平均值的公式是什么)

求平均值的三种公式(求平均值的公式是什么)

1.求和:有两种方法1)第一种输入“=”,然后点击一个值,再输入“ ”,点击另一个值,最后点击Enter键,得出最后的结...

2023-07-31 01:39:33查看全文 >>

平均值计算器(平均值计算器怎么算)

平均值计算器(平均值计算器怎么算)

计算器平时大家用的应该比较少,为啥呢?因为平时只会用到一些基本的计算,复杂的用不了,满足不了我们的需求。那么,有没有多功...

2023-07-31 01:21:42查看全文 >>

调和均值计算公式(算术均值与调和均值)

调和均值计算公式(算术均值与调和均值)

今天我们来讨论一下平均数的大小关系。首先明确,在接下来的讨论中,所有涉及到的数都是正数。对于n个正数a1,a2,…,an...

2023-07-31 01:36:21查看全文 >>

多条件均值的计算公式(均值计算公式及答案)

多条件均值的计算公式(均值计算公式及答案)

小伙伴们好啊,今天老祝为大家准备了一组日常工作中常用的多条件判断、统计Excel函数公式,点滴积累,也能提升工作效率。1...

2023-07-31 01:18:14查看全文 >>

中间均值计算公式(均值是怎么计算出来的)

中间均值计算公式(均值是怎么计算出来的)

当我们有了想要分析的原始数据,首先需要对这些数据的基本情况有一个最初的了解和认识,然后在这个基础上进行下一步更全面,有针...

2023-07-31 01:34:09查看全文 >>

样本均值之差的公式(样本均值计算公式推导)

样本均值之差的公式(样本均值计算公式推导)

在实际工作和研究中,往往只能获得数据的一部分,通常指这个数据为样本,而通过样本对整体的估计被称为假设检验。样本是从整体中...

2023-07-31 01:20:36查看全文 >>

均值公式怎么套用(如何在公式中输入均值)

均值公式怎么套用(如何在公式中输入均值)

使用Excel统计数据时,除了加减乘除之外,计算平均值也是经常用到的操作。今天小编就给大家分享几个平均值计算技巧,帮你搞...

2023-07-31 01:27:59查看全文 >>

均值上限怎么计算(均值怎么算出来的)

均值上限怎么计算(均值怎么算出来的)

投资多少分为三个层面:这三个层面以优先级按如下排序,总资金投入多少、行业数量投入多少、单股投入资金多少。1.总资金投入多...

2023-07-31 01:32:17查看全文 >>

如何求均值标准(均值计算公式)

如何求均值标准(均值计算公式)

在管综数学的数据分析模块中,数据描述部分基本每年都会考查一道题目,考点主要有两个:平均值、方差。这两个知识点对应的题目思...

2023-07-31 01:28:30查看全文 >>

文档排行