10 高级处理-交叉表与透视表
学习目标
目标
应用crosstab和pivot_table实现交叉表与透视表
1 交叉表与透视表什么作用
探究股票的涨跌与星期几有关?
以下图当中表示,week代表星期几,1,0代表这一天股票的涨跌幅是好还是坏,里面的数据代表比例
可以理解为所有时间为星期一等等的数据当中涨跌幅好坏的比例


交叉表:交叉表用于计算一列数据对于另外一列数据的分组个数(用于统计分组频率的特殊透视表)
pd.crosstab(value1, value2)
透视表:透视表是将原有的DataFrame的列分别作为行索引和列索引,然后对指定的列应用聚集函数
data.pivot_table()
DataFrame.pivot_table([], index=[])
2 案例分析
2.1 数据准备
准备两列数据,星期数据以及涨跌幅是好是坏数据
进行交叉表计算
但是我们看到count只是每个星期日子的好坏天数,并没有得到比例,该怎么去做?
对于每个星期一等的总天数求和,运用除法运算求出比例
2.2 查看效果
使用plot画出这个比例,使用stacked的柱状图
2.3 使用pivot_table(透视表)实现
使用透视表,刚才的过程更加简单
Last updated