问题:如何将tsv文件加载到Pandas DataFrame中?
我是python和pandas的新手。我正在尝试将tsv
文件加载到熊猫中DataFrame
。
这是我正在尝试的错误:
>>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))
Traceback (most recent call last):
File "<pyshell#28>", line 1, in <module>
df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))
File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__
raise PandasError('DataFrame constructor not properly called!')
PandasError: DataFrame constructor not properly called!
回答 0
注:由于17.0 from_csv
气馁:使用pd.read_csv
替代
该文档列出了一个.from_csv函数,该函数似乎可以执行您想要的操作:
DataFrame.from_csv('c:/~/trainSetRel3.txt', sep='\t')
如果您有标题,则可以传递header=0
。
DataFrame.from_csv('c:/~/trainSetRel3.txt', sep='\t', header=0)
回答 1
从17.0开始from_csv
不建议使用。
使用pd.read_csv(fpath, sep='\t')
或pd.read_table(fpath)
。
回答 2
使用read_table(filepath)
。默认分隔符是制表符
回答 3
回答 4
打开文件,另存为.csv,然后应用
df = pd.read_csv('apps.csv', sep='\t')
对于任何其他格式,只需更改sep标记
回答 5
df = pd.read_csv('filename.csv', sep='\t', header=0)
您可以通过指定分隔符和标头将tsv文件直接加载到pandas数据框中。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。