当前位置:首页 > 科技 >

什么叫大数据通俗解释

来源:原点资讯(www.yd166.com)时间:2023-02-21 17:21:33作者:YD166手机阅读>>

大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

什么叫大数据通俗解释,(1)

大数据分析通俗的讲就是将海量混杂的数据,通过利用各类手段统一协调成一个有机整体,然后以不同的可视化分析工具直观呈现给用户,让其通俗易懂的发现数据中的一些关键因素点。以保障相关人员提升工作效率及分析数据核心指标,并且为企业带来收益价值点。

5V特点

大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

什么叫大数据通俗解释,(2)

来源网络

大量化Volume:非结构数据的超大规模和增长,总数据的80~90% ,比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍。IDC预计到2020年,全球将总共拥有35ZB的数据量。

很多人日常用到或者了解到的仅限于bit、Byte、KB、MB,其实在其之上还有更多维度的统计,例如:最小的基本单位是bit,按顺序给出所有单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。它们按照进率1024(2的十次方)来计算:

举一个例子:

一般情况下,大数据是以PB EB ZB为单位进行计量的:1PB相当于50%的全美学术研究图书馆藏书的信息内容;5EB相当于至今全世界人类所讲过的话语;1ZB如同全世界海滩沙子数量总和;1YB相当于7000位人类体内的微细胞总和。

  • 价值化Value :大量的不相关信息,对未来趋势与模式的可预测分析,深度复杂分析,快速提炼出海量数据资源中的那部分有价值的信息,为客户带来真正的受益点。(例如:机器学习、人工智能、数据汇聚等)
  • 多样化Variety :大数据的异构和多样化,很多不同的形式(结构化数据、非结构化数据、半结构化数据)呈现方式也不仅仅限于文本、图像、接口、文件、数据库类、标准格式等。
  • 快速化Velocity:实时分析而非批量式分析,数据的快速提取、清洗、汇聚、标签化、具体到人事物中,立竿见影而非事后见效。时刻都会处理万亿级以上的数据,因此具有时效性,高速处理、响应迅速。
  • 真实性Veracity:大数据中的内容是与真实世界中的发生息息相关的,研究大数据就是从庞大的网络数据中提取出能够解释和预测现实事件的过程。提高数据的准确、可依赖程度,保证数据质量。也可以作为未来某种趋势的预判及以数据来提取到真正的需求点。
价值体现

大数据可以实现的应用可以概括为两个方向:一个是精准化定制;第二个是预测。

精准化定制定制可根据不同业务需求进行设计开发,通过数据去解决一些行业应用难点,例如:智慧城市、可视化大屏、警务大数据、金融大数据等,更多居于toB领域。

而预测类:比如像通过搜索引擎搜索同样的内容,每个人的结果却是大不相同的。会利用大数据推荐算法等模型来进行推送。再比如精准营销、百度的推广、淘宝的喜欢推荐,或者你到了一个地方,自动给你推荐周边的消费设施等等。头条新闻信息推荐等等,更多趋向于toC领域。

什么叫大数据通俗解释,(3)

图片源于神策

人物画像分析,通过对人物的准确、全方位的刻画,深入挖掘其数据间的内在关系,将零散杂乱的信息组织成有机整体。快速分析出人物的各类属性指标:身份信息、行动轨迹、经济情况、活动偏好、等级划分等,有效地利用分析结果,发现关键数据指标。

数据汇聚、分析、保护

数据聚合针对内外部数据进行多维数据快速汇聚。可通过实时接口、文件自动导入、主动查询等方式接入。并可对各类格式的数据进行智能清洗入库。

汇聚时,需要对各类来源数据进行精准提取:例如利用一些智能终端采集设备,提取入库后,对海量数据进行快速的清洗处理,将其以结构化数据、非结构化数据、半结构化数据为主体划分,而后进行标签化划分,利用图数据库赋予其不同标签,再下发到具体分析的人事物中,以多样可视化分析图表的形态直观展示数据结果。

可视化分析可通过利用不同的分析工具,以关系图、时序图、位置轨迹、词云、时光轴、画像分析、可视化大屏等可视化方式进行分析。(针对不同的需求,可利用将多个工具结合进行全维度数据分析)

数据分级保护针对数据在应用时进行分级和脱敏过滤,保障数据安全。从数据提取、清洗、入库、分类、标签化并具体到人事物环境进行层层加密处理,保障全流程安全。

具体可分为:数据安全、应用安全、环境安全等方面。

工具的选用

1. 基础工具

传统分析/商业统计:

Excel、SPSS、SAS 这三者对于研究人员而言并不陌生。

  • Excel作为电子表格软件,适合简单统计汇总需求,由于其方便好用,功能也能满足很多场景需要,所以一直受用于广大用户基本统计分析。
  • SPSS(SPSS Statistics)和SAS作为商业统计软件,提供研究常用的经典统计分析(如回归、方差、因子、多变量分析等)处理。SPSS 轻量、易于使用,但功能相对较少,适合常规基本统计分析。
  • SAS 功能丰富而强大(包括绘图能力),且支持编程扩展其分析能力,适合复杂与高要求的统计性分析。

以上几种软件属于传统性的数据统计软件,此处不做过多的解说。要进行具体的数据汇聚并且可视化展示还需要利用一些可视化工具软件,如下:

2. 可视化工具

Echats:

  1. 千万级数据可视化渲染能力;
  2. SVG Canvas 双引擎动力更佳;
  3. 数据样式分离及扁平配置让开发更便捷;
  4. 首创无障碍访问支持;
  5. 微信小程序、PPT,哪里都能用;
  6. 数据自由刷选:自由选择数据,发掘数据背后的更多秘密;
  7. 多图表联动查看:对多个图表数据联动查看,进行多维有效分析。

什么叫大数据通俗解释,(4)

首页 123下一页

栏目热文

几分钟看懂什么是大数据(大数据通俗点怎么理解)

几分钟看懂什么是大数据(大数据通俗点怎么理解)

现代社会,大数据比你更了解你自己,分分秒秒把你分析的明明白白!,...

2023-02-21 17:28:04查看全文 >>

通俗易懂讲解什么是大数据(三分钟让你认识什么是大数据)

通俗易懂讲解什么是大数据(三分钟让你认识什么是大数据)

对于“大数据时代”很多人都觉得非常熟悉,而说到“大数据”是什么的时候,很多人都很模糊,似是而非地说出很多,又像是什么都没...

2023-02-21 17:17:07查看全文 >>

通俗解释大数据(怎么样通俗的理解大数据)

通俗解释大数据(怎么样通俗的理解大数据)

​「我的女儿还是高中生,你们却给她邮寄婴儿服和婴儿床的优惠券,这是在鼓励她怀孕吗?」一个男子冲进一家商店,要求经理出来见...

2023-02-21 17:13:54查看全文 >>

大数据通俗易懂的讲解(区块链通俗易懂的讲解)

大数据通俗易懂的讲解(区块链通俗易懂的讲解)

今天给大家分析一份《大数据入门指南》,一共767页,内容详实成体系,图文并茂通俗易懂,很适合零基础朋友入门大数据,相信看...

2023-02-21 16:48:42查看全文 >>

学大数据有前途吗(大数据的前途)

学大数据有前途吗(大数据的前途)

大数据培训学习后的前途怎么样?大数据开发技术的更新与发展已经是比较成熟了,同时也随着互联网和物联网的迅速发展,大数据开发...

2023-02-21 17:08:42查看全文 >>

云计算通俗解释(云计算通俗解释中国官方)

云计算通俗解释(云计算通俗解释中国官方)

概述云计算,大数据,人工智能,区块链热门词汇经常被媒体提起,是否大家都理解他们之间的联系和作用,下面我们用通俗点的说法介...

2023-02-21 16:49:53查看全文 >>

香楠树珍贵吗(奇楠香树前景如何)

香楠树珍贵吗(奇楠香树前景如何)

中国的土地广阔而肥沃,有一种特有的木材待成熟时售价昂贵,它的树干中通外直,下部有密密麻麻的绒毛覆盖,其木又自然而然散发着...

2023-02-21 16:51:41查看全文 >>

香楠树照片(什么树是香楠树)

香楠树照片(什么树是香楠树)

一、黄心楠黄心楠学名叫普文楠,樟科桢楠属。主产于云南南部地区,气干密度:0.58g/cm3,木材浅黄褐色带绿或油绿色,心...

2023-02-21 17:07:33查看全文 >>

香楠树长什么样子(香楠树图片)

香楠树长什么样子(香楠树图片)

香楠(学名:Aidia canthioides (Champ. ex Benth.) Masam.)又名:台北茜草树、水...

2023-02-21 17:37:58查看全文 >>

油楠树的特点

油楠树的特点

推荐词油楠是我国热带雨林的高大乔木,也称“柴油树”,为国家二级重点保护植物。油楠树干富含油状液体,经钻孔后可大量泌油,稍...

2023-02-21 17:12:42查看全文 >>

文档排行