问题:如何从Pandas DataFrame获取值而不是索引和对象类型
说我有以下DataFrame
字母编号 A 1 B 2 C 3 4天
可以通过以下代码获得
import pandas as pd
letters=pd.Series(('A', 'B', 'C', 'D'))
numbers=pd.Series((1, 2, 3, 4))
keys=('Letters', 'Numbers')
df=pd.concat((letters, numbers), axis=1, keys=keys)
现在,我想从“字母”列中获取值C。
命令行
df[df.Letters=='C'].Letters
将返回
2℃ 名称:字母,dtype:对象
我怎样才能只获得C值而不是整个两行输出?
回答 0
df[df.Letters=='C'].Letters.item()
这将返回从该选择返回的索引/系列中的第一个元素。在这种情况下,该值始终是第一个元素。
编辑:
或者,您可以运行loc()并以这种方式访问第一个元素。这比较短,这是我过去实现它的方式。
回答 1
使用values
属性将值作为np数组返回,然后使用[0]
获取第一个值:
In [4]:
df.loc[df.Letters=='C','Letters'].values[0]
Out[4]:
'C'
编辑
我个人更喜欢使用下标运算符访问列:
df.loc[df['Letters'] == 'C', 'Letters'].values[0]
这样可以避免列名中可以包含空格或破折号的问题-
,这意味着使用进行访问.
。
回答 2
import pandas as pd
dataset = pd.read_csv("data.csv")
values = list(x for x in dataset["column name"])
>>> values[0]
'item_0'
编辑:
实际上,您可以像对任何旧数组一样索引数据集。
import pandas as pd
dataset = pd.read_csv("data.csv")
first_value = dataset["column name"][0]
>>> print(first_value)
'item_0'