python教程—Python panda:如何只读取CSV文件的前n行?-Python实用宝典

python教程—Python panda:如何只读取CSV文件的前n行?

我有一个非常大的数据集,我无法读取整个数据集。所以,我想只阅读其中的一部分来训练,但我不知道怎么做。任何想法都将被感激。

我有一个非常大的数据集,我无法读取整个数据集。所以,我想只阅读其中的一部分来训练,但我不知道怎么做。任何想法都将被感激。

回答

如果您只想读取前999,999行(非标头):

    read_csv(..., nrows=999999)

如果只想读取第1,000,000行…1999999年

    read_csv(..., skiprows=1000000, nrows=999999)

<强>nrows:int,默认没有要读取的文件行数。有用的
读取大文件*

<强>skiprows:类列表或整数
要跳过的行数(0索引)或要跳过的行数(int)

对于大文件,您可能还想使用chunksize:

<强>chunksize:int,默认为None
返回用于迭代的TextFileReader对象

< a href = " http://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.io.parsers.read_csv.html " > < / > pandas.io.parsers.read_csv文档

​Python实用宝典 (pythondict.com)
不只是一个宝典
欢迎关注公众号:Python实用宝典

本文由 Python实用宝典 作者:Python实用宝典 发表,其版权均为 Python实用宝典 所有,文章内容系作者个人观点,不代表 Python实用宝典 对观点赞同或支持。如需转载,请注明文章来源。
0

发表评论