问题:将Pandas DataFrame的行转换为列标题,
我必须使用的数据有点混乱。它的数据中包含标头名称。如何从现有的pandas数据框中选择一行并使其(重命名为)列标题?
我想做类似的事情:
header = df[df['old_header_name1'] == 'new_header_name1']
df.columns = header
回答 0
In [21]: df = pd.DataFrame([(1,2,3), ('foo','bar','baz'), (4,5,6)])
In [22]: df
Out[22]: 
     0    1    2
0    1    2    3
1  foo  bar  baz
2    4    5    6
将列标签设置为等于第二行(索引位置1)中的值:
In [23]: df.columns = df.iloc[1]
如果索引具有唯一标签,则可以使用以下命令删除第二行:
In [24]: df.drop(df.index[1])
Out[24]: 
1 foo bar baz
0   1   2   3
2   4   5   6
如果索引不是唯一的,则可以使用:
In [133]: df.iloc[pd.RangeIndex(len(df)).drop(1)]
Out[133]: 
1 foo bar baz
0   1   2   3
2   4   5   6
使用df.drop(df.index[1])删除所有与第二行具有相同标签的行。因为非唯一索引可能会导致像这样的绊脚石(或潜在的错误),所以通常最好注意索引的唯一性(即使Pandas不需要它)。
回答 1
这有效(熊猫v’0.19.2’):
df.rename(columns=df.iloc[0])
回答 2
重新创建数据框会更容易。这也将从头开始解释列的类型。
headers = df.iloc[0]
new_df  = pd.DataFrame(df.values[1:], columns=headers)
回答 3
您可以通过代表的参数在read_csv或read_html构造函数中指定行索引。这样的优点是可以自动删除所有先前被认为是垃圾的行。headerRow number(s) to use as the column names, and the start of the data
import pandas as pd
from io import StringIO
In[1]
    csv = '''junk1, junk2, junk3, junk4, junk5
    junk1, junk2, junk3, junk4, junk5
    pears, apples, lemons, plums, other
    40, 50, 61, 72, 85
    '''
    df = pd.read_csv(StringIO(csv), header=2)
    print(df)
Out[1]
       pears   apples   lemons   plums   other
    0     40       50       61      72      85
	声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
