19. Pandas的DataFrame的统计函数
DataFrame和Series都是pandas下的核心数据,series有统计函数,DataFrame也可以用统计里的各个函数,各个函数的意义和使用可以参考Series统计函数一章,本章就不再累述相应内容了。
import pandas as pd
import numpy as np
val = np.random.randn(5, 4)
idx = list("abcd")
df = pd.DataFrame(val, columns = idx)
print df
print df.describe()
程序执行结果:
a b c d
0 -0.385711 -1.294148 0.587965 0.679378
1 1.608339 -0.264607 -0.633850 -0.330153
2 0.536612 0.235176 -0.144298 1.436553
3 0.667061 -0.170487 0.411623 -1.887972
4 0.952012 0.083225 -0.235072 -0.978071
a b c d
count 5.000000 5.000000 5.000000 5.000000
mean 0.675663 -0.282168 -0.002726 -0.216053
std 0.723218 0.599592 0.498233 1.315476
min -0.385711 -1.294148 -0.633850 -1.887972
25% 0.536612 -0.264607 -0.235072 -0.978071
50% 0.667061 -0.170487 -0.144298 -0.330153
75% 0.952012 0.083225 0.411623 0.679378
max 1.608339 0.235176 0.587965 1.436553