描述统计

统计学类型
Zeroclanzhang讨论 | 贡献2024年1月20日 (六) 00:55的版本


用来描述数据集的一些常见度量包括集中趋势度量和离散度量或可变性度量。集中趋势度量包括均值中位数众数,而可变性度量包括标准差(或方差)、变量的最小值和最大值、峰度偏度[1]

统计分析中的应用

描述性统计

学提供关于样本和已进行观察的简单总结。这些总结可能是定量的,即总结统计量,或是视觉上的,即易于理解的图表。这些总结可能构成更广泛统计分析中数据初始描述的基础,或者对于特定调查本身就足够。

例如,篮球中的投篮百分比是一种描述性统计量,概括了球员或球队的表现。这个数字是投中的投篮数除以射门次数。例如,投篮命中率为33%的球员大约每三次射门中一球。这个百分比总结或描述了多个离散事件。还可以考虑平均分数点。这个单一数字描述了学生在其课程经历范围内的整体表现。[2]

描述性和总结性统计学的使用有着悠久的历史,实际上,人口和经济数据的简单汇总是统计学主题首次出现的方式。最近,一系列总结技术在探索性数据分析的标题下被制定:这类技术的一个例子是箱形图

在商业领域,描述性统计学为许多类型的数据提供了有用的总结。例如,投资者和经纪人可能会通过对其投资进行实证和分析研究,使用历史回报行为,以便在未来做出更好的投资决策。

单变量分析

单变量分析涉及描述单个变量的分布,包括其集中趋势(包括均值中位数众数)和离散性(包括数据集的范围四分位数,以及像方差标准差这样的离散度量)。分布的形状也可以通过偏度峰度等指数来描述。变量分布的特征也可以通过图形或表格格式来描述,包括直方图茎叶图

双变量和多变量分析

当样本包含不止一个变量时,描述性统计学可以用来描述变量对之间的关系。在这种情况下,描述性统计学包括:

区分单变量和双变量分析的主要原因是,双变量分析不仅仅是简单的描述性分析,它还描述了两个不同变量之间的关系。<ref>{{cite book |first=Earl R. |last=Babbie |title=The Practice of Social Research |url=https://archive.org/details/isbn_9780495598428 |url-access=registration |edition=12th |publisher=Wadsworth |year=2009 |isbn=978-0-495-59841-1 |pages=[https://archive.org/details/isbn_9780495598428/page/436 436–440

引用

  1. Investopedia, 描述性统计学术语
  2. Trochim, William M. K. (2006). "Descriptive statistics". Research Methods Knowledge Base. Retrieved 14 March 2011.