当前位置: 代码迷 >> python >> 如何在 3D-Pandas Dataframe 中查找包含特定子列/嵌套列的列
  详细解决方案

如何在 3D-Pandas Dataframe 中查找包含特定子列/嵌套列的列

热度:151   发布时间:2023-07-14 08:59:36.0

所以我有以下 3D Pandas Dataframe, new

  unique     cat     numerical    
       c   f   b   d         a   e
0      2   5   1   3         0   4
1      8  11   7   9         6  10
2     14  17  13  15        12  16

我想找到哪个“浅”列包含“更深”列“d”,即“猫”。 我对 Pandas 真的很new.columns ,但在盯着new.columns一会儿之后:

MultiIndex(levels=[['cat', 'numerical', 'unique'], ['a', 'b', 'c', 'd', 'e', 'f']],
           labels=[[2, 2, 0, 0, 1, 1], [2, 5, 1, 3, 0, 4]])

我终于发现这种看似冗长,极其嵌套,令人费解的做法确实让我感到'cat'

print(
    new.columns.levels[0][\
    new.columns.labels[0][\
    pd.Index(new.columns.labels[1]).get_loc(\
    pd.Index(new.columns.levels[1]).get_loc('d'))]]
)

我基本上是在级别下的第二个数组中获取 'd' 的位置(我们称之为 pos1),然后在标签下的第二个数组中找到该值(pos1)的位置(pos2),然后找到值( val1) 使用该位置 (pos2) 在 'labels' 下的第一个数组中,最后使用位置 val1 在 'levels' 下的第一个数组中找到列名。

所以我的问题是,有没有更好的、“正确的”方式来做这一切? 谢谢。

PS 在单独的说明中,所有这些实际上只是为了我可以在不知道它属于哪个“浅”列的情况下搜索“d”列:

row = (new.loc[new['cat']['d'] == 9])

这样我得到:

  unique     cat     numerical    
       c   f   b   d         a   e
1      8  11   7   9         6  10

所以如果有办法做到这一点,整个问题就可以避免。(我也是堆栈溢出的新手,我必须把它放在一个新问题或 smt 中)

swaplevel

但是不能保证你有一个唯一的列,所以我用iloc[:, 0]强制这个问题

new[new.swaplevel(0, 1, 1).d.iloc[:, 0].eq(9)]

  unique     cat    numerical    
       c   f   b  d         a   e
1      8  11   7  9         6  10

xs

关于不保证唯一性的相同警告

new[new.xs('d', 1, 1).iloc[:, 0].eq(9)]

  unique     cat    numerical    
       c   f   b  d         a   e
1      8  11   7  9         6  10

IndexSlice

new[new.loc[:, pd.IndexSlice[:, 'd']].iloc[:, 0].eq(9)]

  unique     cat    numerical    
       c   f   b  d         a   e
1      8  11   7  9         6  10

levelslabels

我的复杂方法版本

a0, a1 = new.columns.labels
b0, b1 = new.columns.levels

j = b1.get_loc('d')
i = a0[(a1 == j).argmax()]
t = (b0[i], b1[j])

new[new[t] == 9]

  unique     cat    numerical    
       c   f   b  d         a   e
1      8  11   7  9         6  10
  相关解决方案