Pandas的crosstab函数( 二 ) 介绍我很喜欢DataCamp上的“Seaborn中

尽管它有点高级，但是当你将crosstab()表传递到seaborn的热图中时，你将充分利用crosstab()表的优点。让我们在热图中看到上表：
cross = pd.crosstab(index=diamonds['cut'],columns=diamonds['color'],values=diamonds['price'],aggfunc=np.mean).round(0)sns.heatmap(cross, cmap='rocket_r', annot=True, fmt='g');
文章插图
seaborn可以自动将crosstab()表转换为热图。我将注释设置为True ，并用颜色条显示热图。 seaborn还为列和索引名添加了样式(fmt='g' 将数字显示为整数而不是科学计数) 。
热图更容易解释。你不想让你的最终用户看到一张满是数字的表格。因此，我将在需要时将每个crosstab()结果放入热图中。为了避免重复，我创建了一个有用的函数：
def plot_heatmap(cross_table, fmt='g'):fig, ax = plt.subplots(figsize=(8, 5))sns.heatmap(cross_table,annot=True,fmt=fmt,cmap='rocket_r',linewidths=.5,ax=ax)plt.show();Pandas crosstab()与pivot_table()和groupby()的比较在我们继续讨论更有趣的内容之前，我想我需要澄清计算分组摘要统计的三个函数之间的区别。
我在本文的第一部分介绍了pivot_table()和groupby()的区别。对于crosstab() ，这三者之间的区别在于语法和结果的形状。让我们使用这三种方法计算：
# 使用 groupby()>>> diamonds.groupby(['cut', 'color'])['price'].mean().round(0)cutcolorIdealD2629.0E2598.0F3375.0G3721.0H3889.0I4452.0J4918.0PremiumD3631.0E3539.0F4325.0G4501.0H5217.0I5946.0J6295.0Very GoodD3470.0E3215.0F3779.0G3873.0H4535.0I5256.0J5104.0GoodD3405.0E3424.0F3496.0G4123.0H4276.0I5079.0J4574.0FairD4291.0E3682.0F3827.0G4239.0H5136.0I4685.0J4976.0Name: price, dtype: float64# 使用 pivot_table()diamonds.pivot_table(values='price',index='cut',columns='color',aggfunc=np.mean).round(0)# 使用 crosstab()pd.crosstab(index=diamonds['cut'],columns=diamonds['color'],values=diamonds['price'],aggfunc=np.mean).round(0)
文章插图
以上是pivot_table的输出
文章插图
以上是crosstab的输出
我想你已经知道你最喜欢的了。 grouppy()返回一个序列，而另两个返回相同的数据帧。但是，可以将groupby系列转换为相同的数据帧，如下所示：
grouped = diamonds.groupby(['cut', 'color'])['price'].mean().round(0)grouped.unstack()
文章插图
如果你不了解pivot_table()和unstack()的语法，我强烈建议你阅读本文的第一部分。
说到速度， crosstab()比pivot_table()快，但都比groupby()慢得多：
%%timeitdiamonds.pivot_table(values='price',index='cut',columns='color',aggfunc=np.mean)11.5 ms ± 483 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)%%timeitpd.crosstab(index=diamonds['cut'],columns=diamonds['color'],values=diamonds['price'],aggfunc=np.mean)10.8 ms ± 344 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)%%timeitdiamonds.groupby(['cut', 'color'])['price'].mean().unstack()4.13 ms ± 39.8 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


上一页
1
2
3
4
下一页
		  	






























推荐阅读

           
                  
              
                  游戏追随者|毕业装没人要，被团长分解！，魔兽世界怀旧服狂暴战的“没落” 
                
                   
                
              
            

                  
              
                  军事装备啊外国包机自提防疫物资，“钢铁巨兽”“环球霸王III”“萨特的气球”抵穗 
                
                   
                
              
            

                  
              
                  法制日报|全国扫黑办举行挂牌督办案件第4次新闻发布会 
                
                   
                
              
            

                  
              
                  苏富比|翡翠越贵，挂绳越暗是什么道理？千万别踩到雷区！ 
                
                   
                
              
            

                  
              
                  眼睛非常痒 
                
                   
                
              
            

                  
              
                  南财音频财金晚高峰：A股公司2019年现金分红1.36万亿元创新高 
                
                   
                
              
            

                  
              
                  诗珞芙玉美肌燕窝胶原蛋白肽的价格多少 
                
                   
                
              
            

                  
              
                  【兼容机之家小牛】康康大公司有哪些惊喜彩蛋，谷歌今年的做法真有意义，愚人节来临 
                
                   
                
              
            

                  
              
                  中国经济网|丢掉幻想 坚定信心——TikTok交易谈判告诉了我们怎样的事实③ 
                
                   
                
              
            

                  
              
                  坦索罗辛(坦索罗辛胶囊) 
                
                   
                
              
            

                  
              
                  守株待兔文言文翻译 守株待兔文言文 
                
                   
                
              
            

                  
              
                  趣头条|与汉兰达同级，轴距2米9提供6/7座，超智能，国产又造出一款好车 
                
                   
                
              
            

                  
              
                   风味|荷叶碧绿，饭团松散，独特风味的广式荷包饭 
                
                   
                
              
            

                  
              
                  专业一般学校还可以怎样在一线城市立足 
                
                   
                
              
            

                  
              
                  IT互联网小助手收藏｜SQL查询优化技巧，提升网站访问速度！ 
                
                   
                
              
            

                  
              
                  素馅西葫芦饺子馅做法大全图解窍门,西葫芦素馅饺子的做法大全怎么做好吃- 
                
                   
                
              
            

                  
              
                  |五菱凯捷入围北京国际设计周大奖 有望跨界“夺桂” 
                
                   
                
              
            

                  
              
                   竞争力|设计实力派丨张健伟：让设计“会呼吸” 
                
                   
                
              
            

                  
              
                  第五人格|《第五人格》IVL联赛：LZX首次登场仍不敌TIANBA，CPG排名垫底 
                
                   
                
              
            

                  
              
                  江苏新闻|江苏各地亮灯表白祖国，太燃了！山河无恙，家国梦圆! 
                
                   
                
              
            

          

不常见的Pandas小窍门：我打赌一定有你不知道的 

countif函数的四种另类经典用法，我不说没人告诉你 

Pandas的SettingWithCopyWarning 

让人头痛的Generator 函数的异步应用真的有用吗？ 

PowerQuery 表达式计算函中调用其他函数的方法 

Python中文速查表-Pandas 基础 

Pandas教程 

函数逸闻之大小写 

Java函数式编码结构-好程序员 

Python数据处理，pandas 统计连续停车时长

Pandas的crosstab函数( 二 )

推荐阅读

游戏追随者|毕业装没人要，被团长分解！，魔兽世界怀旧服狂暴战的“没落”

军事装备啊外国包机自提防疫物资，“钢铁巨兽”“环球霸王III”“萨特的气球”抵穗

法制日报|全国扫黑办举行挂牌督办案件第4次新闻发布会

苏富比|翡翠越贵，挂绳越暗是什么道理？千万别踩到雷区！

眼睛非常痒

南财音频财金晚高峰：A股公司2019年现金分红1.36万亿元创新高

诗珞芙玉美肌燕窝胶原蛋白肽的价格多少

【兼容机之家小牛】康康大公司有哪些惊喜彩蛋，谷歌今年的做法真有意义，愚人节来临

中国经济网|丢掉幻想坚定信心——TikTok交易谈判告诉了我们怎样的事实③

坦索罗辛(坦索罗辛胶囊)

守株待兔文言文翻译守株待兔文言文

趣头条|与汉兰达同级，轴距2米9提供6/7座，超智能，国产又造出一款好车

风味|荷叶碧绿，饭团松散，独特风味的广式荷包饭

专业一般学校还可以怎样在一线城市立足

IT互联网小助手收藏｜SQL查询优化技巧，提升网站访问速度！

素馅西葫芦饺子馅做法大全图解窍门,西葫芦素馅饺子的做法大全怎么做好吃-

|五菱凯捷入围北京国际设计周大奖有望跨界“夺桂”

竞争力|设计实力派丨张健伟：让设计“会呼吸”

第五人格|《第五人格》IVL联赛：LZX首次登场仍不敌TIANBA，CPG排名垫底

江苏新闻|江苏各地亮灯表白祖国，太燃了！山河无恙，家国梦圆!