10 高级处理-交叉表与透视表

学习目标

  • 目标

    • 应用crosstab和pivot_table实现交叉表与透视表


1 交叉表与透视表什么作用

探究股票的涨跌与星期几有关?

以下图当中表示,week代表星期几,1,0代表这一天股票的涨跌幅是好还是坏,里面的数据代表比例

可以理解为所有时间为星期一等等的数据当中涨跌幅好坏的比例

  • 交叉表:交叉表用于计算一列数据对于另外一列数据的分组个数(用于统计分组频率的特殊透视表)

    • pd.crosstab(value1, value2)

  • 透视表:透视表是将原有的DataFrame的列分别作为行索引和列索引,然后对指定的列应用聚集函数

    • data.pivot_table()

    • DataFrame.pivot_table([], index=[])

2 案例分析

2.1 数据准备

  • 准备两列数据,星期数据以及涨跌幅是好是坏数据

  • 进行交叉表计算

但是我们看到count只是每个星期日子的好坏天数,并没有得到比例,该怎么去做?

  • 对于每个星期一等的总天数求和,运用除法运算求出比例

2.2 查看效果

使用plot画出这个比例,使用stacked的柱状图

2.3 使用pivot_table(透视表)实现

使用透视表,刚才的过程更加简单

Last updated