像Qlik中那样在pandas数据框中的列中计算唯一值？

Question 1

如果我有这样的表：

df = pd.DataFrame({
         'hID': [101, 102, 103, 101, 102, 104, 105, 101],
         'dID': [10, 11, 12, 10, 11, 10, 12, 10],
         'uID': ['James', 'Henry', 'Abe', 'James', 'Henry', 'Brian', 'Claude', 'James'],
         'mID': ['A', 'B', 'A', 'B', 'A', 'A', 'A', 'C']
})

我可以count(distinct hID)在Qlik中提出5个唯一的hID。我该如何在Python中使用Pandas数据框？还是一个numpy数组？同样，如果这样做，count(hID)我将在Qlik中得到8。在大熊猫中做这件事的等效方法是什么？

Question 2

If I have a table like this:

df = pd.DataFrame({
         'hID': [101, 102, 103, 101, 102, 104, 105, 101],
         'dID': [10, 11, 12, 10, 11, 10, 12, 10],
         'uID': ['James', 'Henry', 'Abe', 'James', 'Henry', 'Brian', 'Claude', 'James'],
         'mID': ['A', 'B', 'A', 'B', 'A', 'A', 'A', 'C']
})

I can do count(distinct hID) in Qlik to come up with count of 5 for unique hID. How do I do that in python using a pandas dataframe? Or maybe a numpy array? Similarly, if were to do count(hID) I will get 8 in Qlik. What is the equivalent way to do it in pandas?

Question 3

计算不同的值，使用nunique：

df['hID'].nunique()
5

仅计算非空值，请使用count：

df['hID'].count()
8

计算包括空值在内的总值，请使用size属性：

df['hID'].size
8

编辑添加条件

使用布尔索引：

df.loc[df['mID']=='A','hID'].agg(['nunique','count','size'])

或使用query：

df.query('mID == "A"')['hID'].agg(['nunique','count','size'])

输出：

nunique    5
count      5
size       5
Name: hID, dtype: int64

Question 4

Count distinct values, use nunique:

df['hID'].nunique()
5

Count only non-null values, use count:

df['hID'].count()
8

Count total values including null values, use the size attribute:

df['hID'].size
8

Edit to add condition

Use boolean indexing:

df.loc[df['mID']=='A','hID'].agg(['nunique','count','size'])

OR using query:

df.query('mID == "A"')['hID'].agg(['nunique','count','size'])

Output:

nunique    5
count      5
size       5
Name: hID, dtype: int64

Question 5

如果我假设data是您数据框的名称，则可以执行以下操作：

data['race'].value_counts()

这将向您显示不同的元素及其发生的次数。

Question 6

If I assume data is the name of your dataframe, you can do :

data['race'].value_counts()

this will show you the distinct element and their number of occurence.

Question 7

或获取每一列的唯一值数量：

df.nunique()

dID    3
hID    5
mID    3
uID    5
dtype: int64

新进 pandas 0.20.0 pd.DataFrame.agg

df.agg(['count', 'size', 'nunique'])

         dID  hID  mID  uID
count      8    8    8    8
size       8    8    8    8
nunique    3    5    3    5

您始终能够agg在内完成groupby。stack最后使用了，因为我更喜欢演示文稿。

df.groupby('mID').agg(['count', 'size', 'nunique']).stack()


             dID  hID  uID
mID                       
A   count      5    5    5
    size       5    5    5
    nunique    3    5    5
B   count      2    2    2
    size       2    2    2
    nunique    2    2    2
C   count      1    1    1
    size       1    1    1
    nunique    1    1    1

Question 8

Or get the number of unique values for each column:

df.nunique()

dID    3
hID    5
mID    3
uID    5
dtype: int64

New in pandas 0.20.0 pd.DataFrame.agg

df.agg(['count', 'size', 'nunique'])

         dID  hID  mID  uID
count      8    8    8    8
size       8    8    8    8
nunique    3    5    3    5

You’ve always been able to do an agg within a groupby. I used stack at the end because I like the presentation better.

df.groupby('mID').agg(['count', 'size', 'nunique']).stack()


             dID  hID  uID
mID                       
A   count      5    5    5
    size       5    5    5
    nunique    3    5    5
B   count      2    2    2
    size       2    2    2
    nunique    2    2    2
C   count      1    1    1
    size       1    1    1
    nunique    1    1    1

Question 9

您可以nunique在大熊猫中使用：

df.hID.nunique()
# 5

Question 10

You can use nunique in pandas:

df.hID.nunique()
# 5

Question 11

要计算hIDdataframe列中的唯一值df，请使用：

len(df.hID.unique())

Question 12

To count unique values in column, say hID of dataframe df, use:

len(df.hID.unique())

Question 13

您可以通过使用len函数来使用唯一属性

len（df [‘hID’]。unique（））5

Question 14

you can use unique property by using len function

len(df[‘hID’].unique()) 5

像Qlik中那样在pandas数据框中的列中计算唯一值？

问题：像Qlik中那样在pandas数据框中的列中计算唯一值？

回答 0

编辑添加条件

Edit to add condition

回答 1

回答 2

回答 3

回答 4

回答 5

排行榜展示

Python 情人节超强技能导出微信聊天记录生成词云

你不得不知道的python超级文献批量搜索下载工具

7行代码 Python热力图可视化分析缺失数据处理

Python 流程图 — 一键转化代码为流程图

Python 优化—算出每条语句执行时间

你的10W块放哪里能赚最多钱？

文章展示

如何删除字符串中的前导和尾随零？Python

安装mysqldb python接口时找不到mysql_config

Django设置“ SECRET_KEY”的目的

如何装饰一堂课？

PyWhat-🐸识别任何东西。pyWhat让您轻松识别电子邮件、IP地址等

Tornado-Tornado是一个Python Web框架和异步网络库

像Qlik中那样在pandas数据框中的列中计算唯一值？

问题：像Qlik中那样在pandas数据框中的列中计算唯一值？

回答 0

编辑添加条件

Edit to add condition

回答 1

回答 2

回答 3

回答 4

回答 5

相关文章

排行榜展示

文章展示