当前位置:首页 > 上门服务 >

建立高置信度方法(可靠度置信度计算公式)

来源:原点资讯(www.yd166.com)时间:2024-01-29 10:53:42作者:YD166手机阅读>>

在接触机器学习、训练模型、数据挖据、OCR这些领域,都会碰到一个词“置信度”,究竟是什么意思呢?

我们只学习最简单好记的几个点:

1、这是一个统计学的词,英文confidence coefficient,相关的还有一个词叫置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。

2、置信度越高,说明对输出的结果越肯定。

3、置信度衡量的是规则准确率如何,即符合给定条件(即规则的“前提”语句所表示的前提条件)的所有规则里,跟当前规则结论一致的比例有多大。计算方法为首先统计当前规则的出现次数,再用它来除以条件(“前提”语句)相同的规则数量。

4、看了很多文章,我觉得以下这个例子最好懂:

你扔了14次的钢镚,有8次正面朝上,6次背面朝上,你有多大的把握说钢镚不均匀,正面朝上的概率更大,这个把握就是置信度。

如果14次有8次正面朝上,我们是否敢说这个“钢镚铸造有偏差”呢?

这里面有两种可能,其一是偏差确实存在。另一个原因是,它就是偶然造成的。那么这两种情况的可能性各是多大呢?从数学上可以算出,前者的可能性是57%,后者是43%。也就是说,钢镚铸造有偏差这件事有可能是真的,但是我们不太确定。我们把自己有多么确定这件事也量化地衡量一下,它就是置信度。

具体到这个问题,置信度是57%,当然相反的结论“这个钢镚没有铸造问题”的置信度是43%,在统计上,我们一般认为,置信度不到95%的结论不大能相信。

那么怎么才能够提高置信度呢?通常的办法就是要增加所统计的样本的数量。

如果一直保持8:6这个正反面的比例,我们扔得次数越多,最后就越有把握说,“钢镚两面不均匀”。根据T-测试原理的计算公式可以得知,大概扔140次就能说置信度达到95%了。当然如果扔到几千次, 我们的置信度就能达到99%。也就是说,扔了140次以后,我们有95%的把握说,这个钢镚两面不匀,它造成了80:60的偏差。而运气的因素,只占剩下的5%。(这个例子的作者:姜地主链接:https://www.jianshu.com/p/a15796489b5b
来源:简书)

5、在OCR的应用中,置信度可以来判断识别的准确性,当训练OCR这样的机器学习算法时,需要知道所使用的最佳参数和特征,以及如何修正项目中出现的分类、识别和检测错误。在笔云的AI应用实践中,类似集装箱门和电费单识别这样的数据标本已经达到10万级的数量,也就是置信区间足够大,可以提供一个非常准确的置信度判断。

,

栏目热文

置信水平是如何测试的(置信水平与置信区间)

置信水平是如何测试的(置信水平与置信区间)

本文为臭皮匠试验室(同微信号)观点。转载请请注明出处。在产品设计开发阶段,会通过一定样本数量的DV/PV测试验证,以评估...

2024-01-29 10:42:29查看全文 >>

常用的置信水平有哪三个(可靠程度和置信度的关系)

常用的置信水平有哪三个(可靠程度和置信度的关系)

介绍两种最为常用的相关系数:皮尔逊person相关系数和斯皮尔曼spearman等等级相关系数。他们可以用来衡量两个变量...

2024-01-29 10:50:40查看全文 >>

降低置信水平的步骤(置信水平降低置信区间)

降低置信水平的步骤(置信水平降低置信区间)

方法的检出限一般采用统计的方法确定。国内目前普遍使用的是根据空白实验测定MDL,在这里主要介绍目前国外水质检测实验室常用...

2024-01-29 11:01:04查看全文 >>

如懿传李玉最后一场戏(如懿传李玉最后为啥哭了)

如懿传李玉最后一场戏(如懿传李玉最后为啥哭了)

本文素材来自于网络,若与实际情况不相符或存在侵权行为,请联系删除。李玉,一个在如懿传中扮演重要角色的人物,他的命运也是一...

2024-01-29 10:56:43查看全文 >>

如懿传里李玉的最终结局(如懿传李玉最终结局)

如懿传里李玉的最终结局(如懿传李玉最终结局)

编辑丨陌小茶排版丨后妃秘史李玉后期有多惨?被如懿拖累到不能自保刚入宫不久如懿就被陷害,此刻的她意识到自己也要自保,于是她...

2024-01-29 10:59:01查看全文 >>

置信度与置信水平的关系(置信水平和置信度之间的关系)

置信度与置信水平的关系(置信水平和置信度之间的关系)

参数估计的基本概念一致性,对比总样本和小样本的时候用。点估计用样本统计量θ的某个取值直接作为总体参数θ的估计值。·比如用...

2024-01-29 10:25:00查看全文 >>

怎么降低置信区间(置信区间最低多少数值有可信度)

怎么降低置信区间(置信区间最低多少数值有可信度)

这里也没有狄拉克三角洲,所以与我的主观实验不同,它的可信区间是一维的。消除p=0然而,情况与我们的直觉相反。在生命中的每...

2024-01-29 10:17:30查看全文 >>

如何提高置信区间的精度(置信水平和区间精度关系)

如何提高置信区间的精度(置信水平和区间精度关系)

本部分包含基本PCR / qPCR / dPCR实验方案实例,可用作探索本指南理论章节所述某些概念的基础。除了提供更一般...

2024-01-29 10:20:14查看全文 >>

置信度100%的规则(置信度计算标准)

置信度100%的规则(置信度计算标准)

有必要学下“概率”,为什么?尽管提到这三个字会不自觉地把它往“赌博”上靠拢,可要知道,概率的知识能够帮助人们避开不确定的...

2024-01-29 10:57:42查看全文 >>

置信水平的原则(置信水平为什么通常选取95%)

置信水平的原则(置信水平为什么通常选取95%)

置信水平。在统计学中,置信水平是用来衡量我们对样本估计结果可靠性的度量。它告诉我们,如果进行类似的实验或调查很多次,那么...

2024-01-29 10:28:37查看全文 >>

文档排行