当前位置: 代码迷 >> python >> 从两组交集中选择数据框的子集
  详细解决方案

从两组交集中选择数据框的子集

热度:63   发布时间:2023-06-19 09:09:37.0

我从DataFrame中获得了两组列标题。 一组是另一组的子集。

import pandas as pd
d = {'feature1':[1,2,3], 'feature2':[3,4,5], 'feature3':[6,7,8]}
df = pd.DataFrame(data=d)

现在我有两套:

set_1 = {'feature1','feature2','feature3'}
set_2 = {'feature1','feature3'}

如何在我的(新)数据框中实现这一点,只需选择子集中的列?

集不可散列,因此,例如,您需要将它们转换为列表。

然后您可以选择像这样的数据框

df[list(set_1)]

哪个返回

    feature1    feature3    feature2
0   1   6   3
1   2   7   4
2   3   8   5

要么

df[list(set_2)]

哪个返回

    feature1    feature3
0   1   6
1   2   7
2   3   8
  相关解决方案