Parameters
总体统计量 Population
名称 | 描述 | 公式表达 |
---|
均值(Mean) | 总体数据的平均值 | μ=N∑i=1Nxi |
方差(Variance) | 总体数据的离散程度 | σ2=N∑i=1N(xi−μ)2 |
标准差(Standard Deviation) | 总体数据离散程度的平方根 | σ=σ2 |
比例(Proportion) | 总体中某个特征的比例 | P=Nnumber of successes |
偏度(Skewness) | 总体数据分布的不对称程度 | γ1=σ3E[(X−μ)3] |
峰度(Kurtosis) | 总体数据分布的尖峰程度 | γ2=σ4E[(X−μ)4]−3 |
Statistics
样本统计量 Sample
名称 | 描述 | 公式表达 |
---|
均值(Mean) | 样本数据的平均值 | xˉ=n∑i=1nxi |
方差(Variance) | 样本数据的离散程度 | s2=n−1∑i=1n(xi−xˉ)2 |
标准差(Standard Deviation) | 样本数据离散程度的平方根 | s=s2 |
比例(Proportion) | 样本中某个特征的比例 | p^=nnumber of successes |
偏度(Skewness) | 样本数据分布的不对称程度 | g1=(n−1)(n−2)n∑i=1n(sxi−xˉ)3 |
峰度(Kurtosis) | 样本数据分布的尖峰程度 | g2=(n−1)(n−2)(n−3)n(n+1)∑i=1n(sxi−xˉ)4−(n−2)(n−3)3(n−1)2 |
通用统计量
名称 | 描述 | 公式表达 |
---|
中位数(Median) | 数据集的中间值(对于排序后的数据集) | x~ |
四分位数(Quartiles) Q1 | 将数据集分成四部分的第一个值 | Q1=第25百分位数 |
四分位数(Quartiles) Q2 | 将数据集分成四部分的第二个值(即中位数) | Q2=第50百分位数 |
四分位数(Quartiles) Q3 | 将数据集分成四部分的第三个值 | Q3=第75百分位数 |
百分位数(Percentiles) | 将数据集按百分比分割的值 | Pk |
范围(Range) | 数据集中最大值与最小值之差 | R=max(x)−min(x) |