问题:如何避免Python / Pandas在保存的csv中创建索引?
对文件进行一些编辑后,我试图将csv保存到文件夹。
每次我使用pd.to_csv('C:/Path of file.csv')
csv文件时,都有单独的索引列。我想避免将索引打印到csv。
我试过了:
pd.read_csv('C:/Path to file to edit.csv', index_col = False)
并保存文件…
pd.to_csv('C:/Path to save edited file.csv', index_col = False)
但是,我仍然得到不需要的索引列。保存文件时如何避免这种情况?
回答 0
使用index=False
。
df.to_csv('your.csv', index=False)
回答 1
有两种方法可以处理我们不希望将索引存储在csv文件中的情况。
正如其他人所述,将 数据框保存到csv文件时可以使用index = False
。df.to_csv('file_name.csv',index=False)
- 或者,您可以使用索引保存数据框,在读取时只需删除未命名的包含先前索引的0列即可!简单!
df.to_csv(' file_name.csv ')
df_new = pd.read_csv('file_name.csv').drop(['unnamed 0'],axis=1)
回答 2
如果不需要索引,请使用以下命令读取文件:
import pandas as pd
df = pd.read_csv('file.csv', index_col=0)
使用保存
df.to_csv('file.csv', index=False)
回答 3
正如其他人所说,如果您不想首先保存索引列,则可以使用 df.to_csv('processed.csv', index=False)
但是,由于您通常使用的数据本身具有某种索引,因此我们假设使用“时间戳”列,因此我将保留索引并使用该索引加载数据。
因此,要保存索引数据,请首先设置其索引,然后保存DataFrame:
df.set_index('timestamp')
df.to_csv('processed.csv')
之后,您可以读取带有索引的数据:
pd.read_csv('processed.csv', index_col='timestamp')
或读取数据,然后设置索引:
pd.read_csv('filename.csv')
pd.set_index('column_name')
回答 4
如果要将此列保留为索引,则可以采用另一种解决方案。
pd.read_csv('filename.csv', index_col='Unnamed: 0')
回答 5
如果您想要一个好的格式,那么下一条语句是最好的:
dataframe_prediction.to_csv('filename.csv', sep=',', encoding='utf-8', index=False)
在这种情况下,您将获得一个带有’,’的csv文件,该文件在各列和utf-8格式之间分开。另外,数字索引不会出现。