统计学术语

在讨论问题的时候,经常出现这种情况,大家都好像在热烈的交流,同一个统计量,你说A对,我说B对,两个人挣来争去,结果一翻书,原来大家说的不是一个东西,所以觉得很有必要在这里提一下统计学的专业术语,以免混淆,也方便在英文版的软件中查阅对应中文意思。
B
备择假设(alternative hypothesis) 与原假设逻辑相反的假设
比例(proportion)一个样本(或总体)中各个部分的数据占全部数据之比
必然事件(certain event)在同一组条件下,每次试验一定出现的事件
变量(variable)说明现象某种特征的概念
标准差(standard deviation)方差的平方根
标准分数(standard score)也称标准化值货分数,他是变量值与其平均数的利差除以标准差后的值。
标准化残差(standardized residual)残差除以他的标准差后得到的数值
不规则波动(irregular variation)称为随机波动,指序列中的偶然性波动
不可能事件(impossible event)在同一组条件下,每次试验一定不出现的事件
C
参数(parameter)用来描述总体特征的概括性数字度量,是研究这需要了解的总体的某种特征值
残差(residual)因变量的观测值与根据估计的回归方程求出的预测值之差
充分统计量(ample statistic)在样本加工统计量的过程中不损失任何信息的统计量
抽样分布(sampling distribution)样本统计量的分布
抽样框(sampling frame)用于抽选样本的总体单位信息,是概率抽样中不可缺少的
抽样误差(sampling error)有抽样的随机性一起的样本结果与总体真值之间的差异
处理(treatment)不同的因子水平
D
单因素方差分析(one-way analysis of variance)研究一个分类型自变量同数值型因变量之间关系的一种统计方法
点估计(point estimate)用样本估计量的曲子直接作为总体参数的估计值
独立性(independece)两个事件中不论哪一个事件发生与否并不影响另一个事件发生的概率,则称这两个事件具有相互独立性
独立样本(independent sample)一个样本中的元素与另一个样本中的元素相互独立
独立性检验(test of independence)对两个分类变量是否存在相依关系的检验
对照组(control group)随机抽选的实验对象的子集
多重比较方法(multiple comparison procedures)通过对总体均值之间的排队比较来检验哪些均值之间存在差异的方法
多重共线性(multicollinearity)回归模型中两个或两个以上的自变量彼此相关
多重判定系数(multiple coefficient of determination)回归平方和占总平方和的比例
F
方差(variance)各变量值与其平均数离差平方的平均数
方差分析(analysis of variance)通过检验多个总体均值是否相等来研究分类型自变量对数值型因变量影响的统计方法
方差分析表(analysis of variance table)汇总方差分析计算和结果的表
非抽样误差(non-sampling error)抽样误差以外的,由其他各种原因引起的样本结果与总体真值之间的差异
非概率抽样(non-probability sampling)根据方便原则或依主观判断选择样本单位
非平稳序列(non-stationary series)包含趋势性、季节性货周期性的序列
分类变量(categorical variable)说明事物类别的一个名称,其取值是分类数据
分类数据(categorical data)只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据则表现为类别
峰态(kurtosis)对数据分布平峰或尖峰程度的测度
G
概率(probability)随机事件出现可能性大小的数值
概率抽样(probability sampling)遵循随机原则进行的抽样,总体中每个单位都有机会被选入样本
估计标准误差(standard error of estimate)度量各实际观测点在直线周围的散布状况的一个统计量,是均方残差的平方根
估计量(estimator)用来估计总体参数的统计量的名称
估计值(estimated value)根据一个具体的样本计算出来的估计量的数值
观测数据(observational data)通过调查或观测收集到的数据
H
回归模型(regression model)描述因变量如何依赖于自变量和误差项的方程
回归方程(regression model)描述因变量如何依赖于自变量的方程
J
基本事件(elementary event)如果有个时间不能分解成两个或更多个事件,则这个事件称为基本事件
极差(range)也称全距,是一组数据的最大值与最小值之差
几何平均数(geometric mean)n个变量值乘积的n次方根
季节变动(seasonal fluctuation)也称季节性,指时间序列在一年内重复出现的周期性波动
假设检验(hypothesis testing)利用样本信息,对提出的命题进行检验的一套程序和方法
交互作用(interation)一个因素和另一个因素联合产生的对因素变量的附加效应
截面数据(cross-sectional data)在相同或近视相同的时间点上收集的数据
均方(mean square)平方和除以相应的自由度后的值
均值(mean)平均数,是全部数据的算术平均
L
拉式指数(Laspeyres index)1864年德国学者拉斯贝尔斯提出的一种指数计算方法,它是在计算一组商品的价格指数时,把作为权数的销售量固定在基期计算的指数
累计频数(cumulative frequencies)将各有序类别或组的频数逐级累加起来得到的频数
离散系数(coefficient of variation)也称变异系数,一组数据的标准差与其相应的平均数之比,是测度数据离散测度的相对值
离散型随机变量(discrete random variable)如果随机变量X的所有取值都可以逐个列举出来,则称X为离散型随机变量
连续型随机变量(continuous random variable)如果随机变量X的所有取值不可以逐个列举出来,则称X为连续型随机变量
列联表(contingency table)由两个以上的变量进行交叉分类的频数分布表
临界值(critical value)假设检验中非拒绝域和拒绝域的分界点
N
拟合优度检验(goodness of fit test)对多个总体比例是否等于其期望概率的检验。当期望概率相同时,表现为对多个总体比例是否相等的检验
P
P值(P-value)当原假设为真是,得到的样本数据或更极端数据的概率
帕氏指数(Paasche index)1874年德国学者帕舍所提出的一种指数计算方法,它是在计算一组商品价格指数是,把作为权数的销售量固定在报告期计算的指数
判定系数(coefficient of determination)回归平方和占总平方和的比例,它是对估计的回归方程拟合优度的度量
匹配样本(matched sample)一个样本中的数据与另一个样本中的数据相对应
偏态(skewness)对数据分布对称性的测度
频数(frequency)落在某一特定类别或组中的数据个数
频数分布(frequency distribution)各个类别及其相应的频数形成的分布
平均差(mean deviation)也称平均绝对离差,他是各变量值与其平均数离差绝对值的平均数
平均增长率(average rate of increase)时间序列中各逐期环比值的几何平均减1后的结果,用于描述现象在整个观察期内平均增长变化的程度
平稳序列(stationary series)基本上不存在趋势的序列,该序列中的各观察值基本上在某个固定的水平上波动
Q
期望值(expected value)随机变量的平均取值
区间估计(interval estimate)在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减抽样误差得到
趋势(trend)时间序列在长期内呈现出某种持续向上或持续下降的变动,趋势可以是线性的,也可以是非线性的
S
时间序列(time series)同一现象在不同时间上的相继观察值排列而成的序列
时间序列数据(time series data)在不同时间上收集到的数据,它所描述的是现象随时间而变化的情况
实验数据(experimental data)在实验中控制实验对象而搜集到的变量的数据
实验组(experimental group)随机抽选的实验对象的子集
数值型变量(metric variable)说明事物数值特征的一个名称,取值为数值型数据
数值型数据(metric data)按数字尺度测量的观测值
双因素方差分析(two-way analysis of variance)研究两个分类型自变量同数值型因变量之间关系的一种统计方法
顺序变量(rank variable)说明事物有序类别的一个名称,其取值是顺序数据
顺序数据(rank data)只能归于某一有序类别的非数字型数据
四分位数(quartile)一组数据排序后处于25%和75%位置上的值
随机化区组设计(randomized block design)先按一定规则将试验单元划分为若干同质组,然后再将各种处理随机地指派给各个区组的一种设计
随机事件(random event)在同一组条件下,每项试验可能出现也可能不出现的事件
T
统计量(statistic)描述样本特征的概括性数字度量
统计学(statistics)收集、处理、分析、解释数据并从数据中得出结论的科学
V
V相关系数(V correlation coefficient)另一种描述列联表数据相关程度的系数,可用于多种情况的列联表
W
无偏性(unbiasedness)估计量抽样分布的数学期望等于被估计的总体参数
X
显著性水平(significance level)在原假设正确的情况下,错误地拒绝原假设的概率
相关关系(correlation)变量之间存在的一种不确定的数量关系,一个变量的取值不能由另一个变量唯一确定
相关系数(correlationcoefficient)根据样本数据计算的度量两个变量之间线性关系强度的统计量
循环波动(cyclical fluctuation)也称周期性,指序列近乎规律性 地从低到高再从高到低的周而复始的变动
Y
样本(sample)从总体中抽取的一部分元素的集合,构成样本的元素的数目
一致性(consistency)随着样本量的增大,估计量的值越来越接近被估总体的参数
移动平均法(moving average)对时间序列逐期递移求得一系列平均数作为趋势值或预测值的一种方法
异众比率(variation ratio)非众数租的频数占总频数的比例
因变量(dependentvariable)被预测或被解释的变量
因子(factor)检验的对象,所研究的分类型变量的另一个名称
因子设计(factorial design)两个因素(可推广到多个因素)搭配的试验设计,该设计主要用于分析两个因素及其交互作用对试验结果的影响
有效性(efficiency)对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效
预测区间估计(prediction interval estimate)对于一个给定的自变量,因变量的一个个别值的区间估计
原假设(null hypothesis)提出一个(或两个)参数是否等于(或大于、小于)某个特殊值的命题
Z
增长率(growth rate)也称增长速度,是报告期观察值与基期观察值之比减1
指数(index number)广义,任何两个数值对比形成的相对数;狭义,用于测定多个项目在不同场合下综合变动的一种相对数
指数平滑法(exponential smoothing)对于过去的观察值加权平均进行预测的一种方法
置信区间(confidence interval)由样本统计量所构造的总体参数的估计区间
置信水平(confidence level)也称为置信度,它是将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例
中位数(median)一组数据排序后处于中间位置上的变量值
众数(mode)一组数据中出现次数最多的变量值
自变量(independent variable)用来预测因变量的一个或多个变量
自由度(degree of freedom)自由度可解释为独立变量的个数,还可以用二次型的秩来解释
总体(population)包含所研究的全部个体(元素)的集合
组距(class width)一个组的上限与下限之差
组中值(class midpoint)每一组中下限值与上限值中间的值

 

备择假设(alternative hypothesis) 与原假设逻辑相反的假设 比例(proportion)一个样本(或总体)中各个部分的数据占全部数据之比 必然事件(certain event)在同一组条件下,每次试验一定出现的事件 变量(variable)说明现象某种特征的概念 标准差(standard deviation)方差的平方根 标准分数(standard score)也称标准化值货分数,他是变量值与其平均数的利差除以标准差后的值。 标准化残差(standardized residual)残差除以他的标准差后得到的数值 不规则波动(irregular variation)称为随机波动,指序列中的偶然性波动 不可能事件(impossible event)在同一组条件下,每次试验一定不出现的事件 C 参数(parameter)用来描述总体特征的概括性数字度量,是研究这需要了解的总体的某种特征值 残差(residual)因变量的观测值与根据估计的回归方程求出的预测值之

 

拉式指数(Laspeyres index)1864年德国学者拉斯贝尔斯提出的一种指数计算方法,它是在计算一组商品的价格指数时,把作为权数的销售量固定在基期计算的指数
累计频数(cumulative frequencies)将各有序类别或组的频数逐级累加起来得到的频数
离散系数(coefficient of variation)也称变异系数,一组数据的标准差与其相应的平均数之比,是测度数据离散测度的相对值
离散型随机变量(discrete random variable)如果随机变量X的所有取值都可以逐个列举出来,则称X为离散型随机变量
连续型随机变量(continuous random variable)如果随机变量X的所有取值不可以逐个列举出来,则称X为连续型随机变量

发表评论