问题描述
我从DataFrame中获得了两组列标题。 一组是另一组的子集。
import pandas as pd
d = {'feature1':[1,2,3], 'feature2':[3,4,5], 'feature3':[6,7,8]}
df = pd.DataFrame(data=d)
现在我有两套:
set_1 = {'feature1','feature2','feature3'}
set_2 = {'feature1','feature3'}
如何在我的(新)数据框中实现这一点,只需选择子集中的列?
1楼
集不可散列,因此,例如,您需要将它们转换为列表。
然后您可以选择像这样的数据框
df[list(set_1)]
哪个返回
feature1 feature3 feature2
0 1 6 3
1 2 7 4
2 3 8 5
要么
df[list(set_2)]
哪个返回
feature1 feature3
0 1 6
1 2 7
2 3 8