本文主要演示pandas中DataFrame对象corr()方法的用法,该方法用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数、Kendall Tau相关系数和spearman秩相关)。
>>> import numpy as np
>>> import pandas as pd
>>> df = pd.DataFrame({'A':np.random.randint(1, 100, 10),
'B':np.random.randint(1, 100, 10),
'C':np.random.randint(1, 100, 10)})
>>> df
A B C
0 5 91 3
1 90 15 66
2 93 27 3
3 70 44 66
4 27 14 10
5 35 46 20
6 33 14 69
7 12 41 15
8 28 62 47
9 15 92 77
>>> df.corr() # pearson相关系数
A B C
A 1.000000 -0.560009 0.162105
B -0.560009 1.000000 0.014687
C 0.162105 0.014687 1.000000
>>> df.corr('kendall') # Kendall Tau相关系数
A B C
A 1.000000 -0.314627 0.113666
B -0.314627 1.000000 0.045980
C 0.113666 0.045980 1.000000
>>> df.corr('spearman') # spearman秩相关
A B C
A 1.000000 -0.419455 0.128051
B -0.419455 1.000000 0.067279
C 0.128051 0.067279 1.000000
----------相关阅读----------
Python使用pandas扩展库DataFrame对象的pivot方法对数据进行透视转换
Python使用pandas读取Excel文件数据和预处理小案例
使用Python内置集合对象和内置函数filter()过滤无效书评
Python数据分析扩展库pandas的DataFrame排序方法小结
Python+pandas读取Excel文件并统计演员参演电影数量
Python使用wordcloud+pillow基于给定图像制作词云
KNN分类算法原理与Python+sklearn实现根据身高和体重对体型分类
使用线性回归拟合平面最佳直线及预测之Python+sklearn实现
Python+tensorflow计算整数阶乘的方法与局限性
Python使用tensorflow中梯度下降算法求解变量最优值
----------喜大普奔----------
1、继《Python程序设计基础》(2017年9月第5次印刷)、《Python程序设计(第2版)》(2017年9月第4次印刷)、《Python可以这样学》(2017年7月第3次印刷)系列图书之后,董付国老师新书《Python程序设计开发宝典》已于2017年8月1日在清华大学出版社出版,并于2017年9月进行了第2次印刷。为庆祝新书《Python程序设计开发宝典》全面上架,清华大学出版社联合“赣江图书专营”淘宝店推出特价优惠活动,《Python程序设计开发宝典》原价69元,新书上架期间超低价39.8元,可以复制下面的链接使用浏览器打开查看图书详情和购买:
https://detail.tmall.com/item.htm?spm=a1z10.3-b-s.w4011-14464369246.84.46f16db0roWfX4&id=557107249812&rn=339cbc9df2bac424664103917dedfbd2&abbucket=8&tbpm=3
2、董付国老师新作《中学生可以这样学Python》已正式出版,很快就会在各大书城全面上架。