python pandas总结名义变量(计数)

python pandas总结名义变量(计数),第1张

概述我有以下数据框: KEY PROD PARAMETER Y/N1 AAA PARAM1 Y1 AAA PARAM2 N1 AAA PARAM3 N2 AAA PARAM1 N2 AAA PARAM2 Y2 AAA PARAM3 Y3 CCC PARAM1 Y3 CC 我有以下数据框:

KEY PROD ParaMETER Y/N1    AAA    ParaM1   Y1    AAA    ParaM2   N1    AAA    ParaM3   N2    AAA    ParaM1   N2    AAA    ParaM2   Y2    AAA    ParaM3   Y3    CCC    ParaM1   Y3    CCC    ParaM2   Y3    CCC    ParaM3   Y

我有兴趣通过PROD和ParaMETER列汇总Y / N列值并获得以下输出:

PROD  ParaM Y N AAA ParaM1 1 1 AAA ParaM2 1 1 AAA ParaM3 1 1 CCC ParaM1 1 0 CCC ParaM2 1 0 CCC ParaM3 1 0

而Y和N值是来自原始数据帧的Y / N列值的计数.

解决方法 您可以通过创建值为1的附加列来使用 pivot_table,因为它们无关紧要(您只计算它们)

df['Y/Ncount'] = 1df = df.pivot_table(index=['PROD','ParaMETER'],columns=['Y/N'],values=['Y/Ncount'],aggfunc=sum,fill_value=0)df.columns = [col for col in df.columns.get_level_values(1)]df.reset_index()

在这种情况下使用的最简单 *** 作是crosstab,它将产生Y / N列中存在的值的频率计数:

pd.crosstab([df['PROD'],df['ParaMETER']],df['Y/N'])

总结

以上是内存溢出为你收集整理的python pandas总结名义变量(计数)全部内容,希望文章能够帮你解决python pandas总结名义变量(计数)所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://www.outofmemory.cn/langs/1193748.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存