1. 峰度与偏度
矩
对于随机变量X,X的K阶原点矩为 E(X^k)
X的K阶中心矩为 E([X-E(X)]^k)
期望是随机变量X的1阶原点矩,方差实际上是随机变量X的2阶中心矩,峰度为三阶中心矩,偏度为四阶中心矩
偏度Skewness
偏度数据分布形态的统计量,其描述的是某总体取值分布的对称性。这个统计量同样需要与正态分布相比较。正态分布的偏度为0,
两侧尾部长度对称。若以bs表示偏度。bs<0称分布具有负偏离,也称左偏态,此时数据位于均值左边的比位于右边的少,直观表现为左边的尾部相对于与右边的尾部要长,因为有少数变量值很小,使曲线左侧尾部拖得很长;bs>0称分布具有正偏离,也称右偏态,此时数据位于均值右边的比位于左边的少,直观表现为右边的尾部相对于与左边的尾部要长,因为有少数变量值很大,使曲线右侧尾部拖得很长;而bs接近0则可认为分布是对称的。右偏时一般算术平均数>中位数>众数,左偏时相反,即众数>中位数>平均数。正态分布三者相等。偏度的绝对值数值越大表示其分布形态的偏斜程度越大
偏度公式为S_K=μ3/σ^3,其中μ3为随机变量X的三阶中心矩,σ为标准差 0称分布具有负偏离,也称左偏态,此时数据位于均值左边的比位于右边的少,直观表现为左边的尾部相对于与右边的尾部要长,因为有少数变量值很小,使曲线左侧尾部拖得很长;bs>
峰度Kurtosis
峰度表征概率密度分布曲线在平均值处峰值高低的特征数,也就是描述总体中所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同,为常峰态;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖峰态;峰度小于0表示该总体数据分布与正态分布相比较为平坦,为低峰态。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。峰度高就意味着方差增大是由低频度的大于或小于平均值的极端差值引起的.
峰度公式为γ2=μ4/σ^4,其中μ4为随机变量X的四阶中心矩,σ为标准差