当前位置:首页 > 实用技巧 >

csv文件过大怎么打开(csv文件太大不能全部显示)

来源:原点资讯(www.yd166.com)时间:2023-11-01 07:53:54作者:YD166手机阅读>>

处理大规模数据集时常是棘手的事情,尤其在内存无法完全加载数据的情况下。在资源受限的情况下,可以使用 Python pandas 提供的一些功能,降低加载数据集的内存占用。可用技术包括压缩、索引和数据分块。

开展数据科学项目中的一个重要步骤,就是从 API 下载数据并加载到本地内存,之后才能处理数据。

在上述过程中需要解决一些问题,其中之一就是数据量过大。如果数据量超出本机内存的容量,项目执行就会产生问题。

对此有哪些解决方案?

有多种解决数据量过大问题的方法。它们或是消耗时间,或是需要增加投资。

可能的解决方案
  1. 投资解决:新购有能力处理整个数据集,具有更强 CPU 和更大内存的计算机。或是去租用云服务或虚拟内存,创建处理工作负载的集群。
  2. 耗时解决:如果内存不足以处理整个数据集,而硬盘的容量要远大于内存,此时可考虑使用硬盘存储数据。但使用硬盘管理数据会大大降低处理性能,即便是 SSD 也要比内存慢很多。

只要资源允许,这两种解决方法均可行。如果项目资金充裕,或是不惜任何时间代价,那么上述两种方法是最简单也是最直接的解决方案。

但如果情况并非如此呢?也许你的资金有限,或是数据集过大,从磁盘加载将增加 5~6 倍甚至更多的处理时间。是否有无需额外资金投入或时间开销的大数据解决方案呢?

这个问题正中我的下怀。

有多种技术可用于大数据处理,它们无需额外付出投资,也不会耗费大量加载的时间。本文将介绍其中三种使用 Pandas 处理大规模数据集的技术。

压缩

第一种技术是数据压缩。压缩并非指将数据打包为 ZIP 文件,而是以压缩格式在内存中存储数据。

换句话说,数据压缩就是一种使用更少内存表示数据的方法。数据压缩有两种类型,即无损压缩和有损压缩。这两种类型只影响数据的加载,不会影响到处理代码。

无损压缩

无损压缩不会对数据造成任何损失,即原始数据和压缩后的数据在语义上保持不变。执行无损压缩有三种方式。在下文中,将使用美国按州统计的新冠病毒病例数据集依次介绍。

  • 加载特定的数据列

例子中所使用的数据集具有如下结构:

import pandas as pd data = pd.read_CSV("https://raw.githubusercontent.com/nytimes/covid-19-data/master/us-counties.csv") data.sample(10)

csv文件过大怎么打开,csv文件太大不能全部显示(1)

加载整个数据集需要占用 111MB 内存!

csv文件过大怎么打开,csv文件太大不能全部显示(2)

如果我们只需要数据集中的两列,即州名和病例数,那么为什么要加载整个数据集呢?加载所需的两列数据只需 36MB,可降低内存使用 32%。

csv文件过大怎么打开,csv文件太大不能全部显示(3)

使用 Pandas 加载所需数据列的代码如下:

csv文件过大怎么打开,csv文件太大不能全部显示(4)

首页 123下一页

栏目热文

csv文件太大了怎么办(csv文件用什么打开好)

csv文件太大了怎么办(csv文件用什么打开好)

全文共1713字,预计学习时长3分钟Pandas love eating data.Pandas已经成为最受欢迎的数据科...

2023-11-01 07:45:32查看全文 >>

csv文件在手机上如何打开(csv文件在手机什么位置)

csv文件在手机上如何打开(csv文件在手机什么位置)

经常会遇到将手机通讯录导出到电脑并转化为在电脑中可编辑的情况,在网上搜索了很久当前不外乎两种处理方式。1.使用电脑的o...

2023-11-01 07:26:46查看全文 >>

手机上csv文件怎么打开(手机怎么打开csv文件不乱码)

手机上csv文件怎么打开(手机怎么打开csv文件不乱码)

哟,各位老师,您瞧瞧这个,咱们今天要说的是怎么用Excel弄个分班查询系统。不过先允许咱说个更简单的方法,用易查分可以轻...

2023-11-01 07:32:52查看全文 >>

怎么打开超大csv文件(csv格式文件用什么软件打开)

怎么打开超大csv文件(csv格式文件用什么软件打开)

在实际应用中,外部数据导入SQL Server,是一项常规需要掌握的技术。一般外部文件大部分为excel和Csv文件,而...

2023-11-01 08:01:46查看全文 >>

csv用什么软件可以打开(手机csv用什么软件打开)

csv用什么软件可以打开(手机csv用什么软件打开)

小伙伴们好啊,今天咱们继续分享一个WPS表格的实用技巧,看看如何不露声色的打开CSV格式文件。sv文件是一种纯文本文件,...

2023-11-01 07:26:37查看全文 >>

csv文件打开方式(怎么完整打开csv文件)

csv文件打开方式(怎么完整打开csv文件)

Pandas中的read_csv()函数可以从CSV文件中读取数据并创建DataFrame对象。CSV(Comma-Se...

2023-11-01 07:47:51查看全文 >>

csv文件正确打开方式(csv文件如何在手机上打开)

csv文件正确打开方式(csv文件如何在手机上打开)

Hello,大家好,今天跟大家分享下我们如何快速的汇总多个csv文件,这个也是之前一个粉丝问道的问题,前几太忙没时间写,...

2023-11-01 07:59:17查看全文 >>

手动挡停车怎么调成中文版(手动挡怎么停车稳)

手动挡停车怎么调成中文版(手动挡怎么停车稳)

自动挡车起步停车顺口溜自动挡车,不再手动起步停车,真方便底下就来分享起步停车,不费劲起步时,刹车松开油门轻踩,速度上缓慢...

2023-11-01 07:42:07查看全文 >>

怎么判断物质可以大量共存(怎样辨别哪些物质能大量共存)

怎么判断物质可以大量共存(怎样辨别哪些物质能大量共存)

自然界有四种力,电磁力,引力,强核力,弱相互作用力。后两者是微距力,无法预测什么情况下会与宏观的暗物质作用,电磁力由光子...

2023-11-01 07:28:36查看全文 >>

物质怎么才能大量共存(怎么看物质是否可以共存)

物质怎么才能大量共存(怎么看物质是否可以共存)

离子共存历年各地的中考试题中经常会出现物质共存离子共存的题型,离子共存题是中考化普中重现率较高的题,题型新颖、灵活。但是...

2023-11-01 07:56:05查看全文 >>

文档排行