问题描述
到目前为止,我真的很喜欢熊猫,但是我还是无法解决!
我在这里显示了一些航班数据的简化数据框。 承运人是像Am一样的承运人。 空气。 和Uni。 空气。
print (df)
Carrier | Num_Passengers
AA        40
AA        35
AA        64
UA        40
UA        25
UA        56
在我的数据框中,承运人是左侧垂直索引,旅客人数是该列顶部的我索引。
我已经通过以下方式确定了每个唯一索引:
carriers = df.index.unique()
这给了我
array(['AA','UA'], dtype=object)
然后,我想计算每个唯一索引(AA和UA)的平均Num_Passengers,而无需明确说明。 一些伪代码,因为我不确定该怎么做:
for "carrier" in carriers:
    make a new dataframe or array containing only the passengers 
    for "carrier" and calculate the average
我真的一直在为此苦苦挣扎,并在互联网上上下搜索。 也许我的措词是错误的,但是在某个地方肯定有答案!
1楼
您希望对索引进行分组,然后获得平均乘客人数。
df.groupby(level=0).mean()
             Num_Passengers
Carrier                
AA            46.333333
UA            40.333333