当前位置:首页 > 实用技巧 >

数据分析有哪三大类(数据分析的六种方法)

来源:原点资讯(www.yd166.com)时间:2023-05-08 00:09:57作者:YD166手机阅读>>

本文则针对性地讲讲数据分析整个流程最关键的阶段: 数据处理与分析阶段。该阶段我分成了三块:数据采集、数据处理、数据分析。

因为数据采集、处理、分析都围绕着“数据”进行,对海量或杂乱数据进行处理分析,从中找出痛点,洞察问题。

数据采集

该处的数据采集指的是获取分析所需要的数据,一般可以从内部数据、外部数据两个方向获取。

1. 内部数据

  • 直接获取

直接获取的前提是,公司进行了数据仓库的建设,已为决策分析提供了所有类型数据支持。该部分内容在之前的文章中也提到过,但是在这里更加细化的做了点补充。

直接获取就是指数据库中有现成的表可以直接获取到所需的数据,不需要分析师再在sql上做复杂的处理。

公司一般会将数据分为ods、dwd、dwb/dws层数据。

① ods层:明细数据。数仓不做任何数据处理,直接原封不动的将数据同步到该库上。为dw层的数据加工作准备。

②dwd层:明细数据。该层数据已在ods层上对数据做了清洗操作,比如去除空值、脏数据等。

③dwb/dws层:聚合数据。主要对ods/dwd层的数据做些轻度汇总,会涉及较多业务指标数据。如根据ods/dwd层的明细数据计算出七日复购率、周同期对比数据、毛利率等指标供分析师直接查询使用。

一般情况下,分析可以直接从dwb/dws层调取现成的指标数据进行分析,特殊情况下也可以从dwd层写复杂sql的方式计算成所需的数据。

  • 重新落表获取

前提是dwb/dws层没有现成的数据可以直接获取,哪怕自己写代码可以从dwd层获取,也需要写很复杂的代码。此时,请数仓协助落成聚合表再去调取数据。

重新落表一般会涉及人力资源的协调,需求的沟通。分析师担当业务方和数仓之间的桥梁,将业务方的需求理清楚之后,自身又作为数仓的需求方对数仓提需求。

2. 外部数据

当分析的内容内部数据无法满足时,或者不够全面时,此时需要借助于外部数据来辅助分析。

  • 行业报告数据

比如艾瑞网、极光大数据、阿里研究所、199IT互联网数据中心等都会时不时的发一些行业分析报告。整个行业的数据公司内部是无法获取的,所以可以从一些行业分析报告入手。

  • 问卷采集

比如我们需要获取用户的一些①主观想法:喜欢我们产品的原因是?我们产品最吸引您的点是?您觉得我们产品最应该改进的点是?②对竞品的行为:您在xx场景下更愿意使用A产品、B产品还是C产品③用户习惯的场景:您在什么场景下更愿意使用xx产品?等

通过问卷数据获取一些产品中无法获得的数据,辅助分析。

  • 宏观数据

有时候我们分析的某个指标有时候也会受到宏观政策的影响,比如宏观上某项指标上调了xx,对我们的业务会产生怎样的影响。

数据处理

对分析师而言,这步需要分析师将数据根据脑中的分析框架处理成所需要的数据。

1. 处理内容

会涉及数据异常值处理、缺失值处理、数据转换、数据聚合、数据分组归类以及数据准确性的校验,为下一步的数据分析奠定好基础。

井井有条的数据更有利于分析:

  • 剔除无效数据,比如异常值、缺失值、重复值等。
  • 考虑清楚数据聚合的维度,比如时间上、地域上、用户上、商品上等按照什么维度聚合。
  • 做好数据聚合的处理,比如需要借助开窗函数,是否需要去重计数,是否需要累积计数等;

2. 数据验证

数据采集到之后,还要做好数据验证,目的是确保数据准确性,切忌拿到数据立马动手分析。

从验证人员来看:

  • 自身多方验证。
  • 初始先自身验证一番,与现有报表中已有数据进行对比,观察是否一致。
  • 与需求方协同验证。
  • 数据调取之后先出一份数据表,提供给需求方共同验证。不过分析师接了需求,保证数据准确性是基本要素,一般情况下需求方并不会协同验证。前提是,无现有数据可供对比查验,可将数据先提供给需求方过一眼,确保数据准确无误。

从验证方式来看:

  • 定性验证
  • 通过经验或逻辑推理,主观判断该数据是否符合经验或正常逻辑,比如你取到的某个商品的gmv比整个品类的gmv还要大,就不符合正常逻辑,肯定有误。
  • 定量验证
  • 依据统计方式,计算出具体的指标,多方交叉验证。
数据分析

数据分析方法很多,网上有很多资料,这里就讲一下其中比较常用的几种分析方法。

1. 漏斗分析

漏斗分析是数据分析中比较常见的分析模型。采取漏斗的方式直观的表示业务从起点到终点的各个环节的转化情况,以便找出有问题的环节,针对性的优化。

如下图,展示了用户支付场景的转化率:用户从打开app到完成支付的过程。分为进入首页→进入商详页→加入购物车→提交订单→支付完成,直观分析每个重要环节的转化率。以最直观最简单的方式反映出每个关键环节的转化率,洞察主要问题所在。

数据分析有哪三大类,数据分析的六种方法(1)

2. RFM模型

RFM模型主要用来衡量用户价值,做用户分群,比如区分出低价值用户、高价值用户、忠诚用户等用户群体。

R:用户最近一次消费距今时间(Recency

F:用户在最近时间段内的消费频次(Frequency

M:用户在最近时间段内的消费金额(Monetary

这里用一个比较简单的例子讲下:

先对R、F、M三个值进行分层并赋予权重(以下数据纯属虚构,分层时根据实际情况)。

比如用户最近一次消费距今时间7天以下的打为5分,8-14天的打为4分......以此类推。分数高的表示价值性比较高,分数低的表示价值性比较低。

数据分析有哪三大类,数据分析的六种方法(2)

然后调取出每个用户R、F、M值,填入“按照均值处理前”列中。

比如下图中,用户“111113”最近一次消费距今时间在7天以下,则R为5,在最近时间段内的消费频次在6-10之间,则F为2,在最近时间段内的消费金额在1001-2000之间,则M为2。

再将每个用户的R、F、M值与均值对比,大于均值填充1,小于均值填充0,填充于”按照均值处理后“列中。

数据分析有哪三大类,数据分析的六种方法(3)

最后将“按照均值处理后”的数据参照下图模型表(下图不是计算出来的,是比较常用的标准),匹配出用户类型。

数据分析有哪三大类,数据分析的六种方法(4)

首页 123下一页

栏目热文

汽车几年清洗发动机积碳(怎么清洗发动机积碳最好)

汽车几年清洗发动机积碳(怎么清洗发动机积碳最好)

好多车主朋友去做保养的时候,不管车子多少公里,都被推荐过做积碳清理吧,而且还不便宜,一般都要四五百块清理一次。确实,汽车...

2023-05-07 23:45:14查看全文 >>

3万公里要清洗发动机积碳吗(清洗发动机积碳哪种效果最好)

3万公里要清洗发动机积碳吗(清洗发动机积碳哪种效果最好)

积碳是发动机在工作过程中,燃油中不饱和稀烃和胶质,在高温状态下产生的一种焦灼物质。它可以聚集在发动机的各个部位,比如:进...

2023-05-08 00:10:23查看全文 >>

汽车有必要清理发动机积碳吗(清洗发动机积碳多久清理一次)

汽车有必要清理发动机积碳吗(清洗发动机积碳多久清理一次)

很多车主在用车过程中,时常会听到这样一类声音,或许是维修师傅说:“你这车有积碳了,要深度清洗,去积碳油污。”或许是去加油...

2023-05-08 00:10:29查看全文 >>

师范专业在大学里是什么类(师范专业好不好)

师范专业在大学里是什么类(师范专业好不好)

怎么确定自己是不是师范类专业?这个问题确实会难倒一批人,尤其是面对各种教师招聘公告上明确指出的“要求师范生报考”时,不怕...

2023-05-08 00:14:59查看全文 >>

地理师范专业火了(师范最好十个专业)

地理师范专业火了(师范最好十个专业)

有一句话:板书才是课堂的灵魂。一名优秀的教师,往往具有很好的板书功底,他们擅长以高超的板书技巧来吸引学生的注意力,学生们...

2023-05-07 23:54:42查看全文 >>

数据分析需要分析哪些(数据分析从哪些方面写)

数据分析需要分析哪些(数据分析从哪些方面写)

很多人在入门数据分析的时候都无从下手,很多时候都是因为基础知识掌握不牢,连数据分析的目的都没搞清楚,怎么会成功呢?其实想...

2023-05-07 23:59:25查看全文 >>

数据分析方法都有啥(大数据分析方法有哪些)

数据分析方法都有啥(大数据分析方法有哪些)

数据分析更多地基于业务背景来解释数据,提取和汇总数据背后的隐藏信息以及查找有价值的内容。由于数据在此过程中是客观的,因此...

2023-05-08 00:01:28查看全文 >>

数据分析都分析些啥(常见的数据分析方法有哪几种)

数据分析都分析些啥(常见的数据分析方法有哪几种)

一直都有很多朋友想要学习数据分析,希望小编可以推荐一些靠谱的书。大家要么是看到了数据的重要性,想要转行做数据分析师,要么...

2023-05-08 00:19:29查看全文 >>

数据分析要分析什么(数据分析怎么分析出内容)

数据分析要分析什么(数据分析怎么分析出内容)

本文梳理了数据分析的重要性并总结了数据分析的具体方法,与大家分享。和传统的营销推广方式不同,网络营销是一种更为主动的营销...

2023-05-08 00:17:54查看全文 >>

如何理解数据分析(如何做数据分析一目了然)

如何理解数据分析(如何做数据分析一目了然)

“大数据”、“数据驱动”这些词汇,对沉浮在互联网的厂工们来说并不陌生,隔着屏幕,一边在源源不断地生产数据,一边在紧锣密鼓...

2023-05-08 00:07:10查看全文 >>

文档排行