频数表检验：修订间差异

决定类别的数量。类别太多或太少可能无法揭示数据集的基本形态，解释这样的频率分布也将变得困难。理想的类别数量可以通过公式确定或估计：[math]\text{类别数量} = C = 1 + 3.3 \log n[/math]（以10为底的对数），或者通过平方根选择公式 [math] C = \sqrt {n}[/math] 确定，其中n是数据中的观测总数。（后者对于大型数据集，如人口统计数据，将会过大。）然而，这些公式并非硬性规则，公式确定的类别数量可能并不总是与处理的数据完全适合。
计算数据范围 (范围 = 最大值 – 最小值)模板:Nowrap end，通过找出数据的最小值和最大值来实现。范围将用于确定类间隔或类宽。
决定类的宽度，用h表示，并由[math]h = \frac{\text{范围}}{\text{类的数量}}[/math]计算得出（假设所有类的类间隔相同）。

通常，所有类的类间隔或类宽是相同的。所有类的总和至少应覆盖数据中的最低值（最小值）到最高值（最大值）的距离。在频率分布中，相等的类间隔是首选，而不等的类间隔（例如对数间隔）在某些情况下可能是必要的，以在各个类之间产生良好的观察分布，并避免大量空的或几乎空的类。^[2]

决定各个类的极限并选择第一个类的合适起点，这个起点是任意的；它可能小于或等于最小值。通常，它是在最小值之前开始的，以便第一个类的中点（第一个类的下限和上限的平均值）被合适地, September 2019 {{citation}}: Cite has empty unknown parameters: |cat2=, |cat-date2=, |cat3=, |cat=, and |cat-date3= (help); Missing or empty |title= (help); Unknown parameter |cat-date= ignored (help)^{[clarification needed]}放置。
对一个观察对象进行标记，并为其所属的类标记一个垂直条(|)。直到最后一个观察对象，保持连续计数。
根据需要找出频数、相对频率、累积频率等。

以下是一些常用的频率描述方法：^[3]

直方图

直方图是表格频率的一种表示形式，显示为相邻的矩形或方形（在某些情况下），竖立在离散间隔（箱）上，其面积与间隔内观察值的频率成正比。矩形的高度也等于间隔的频率密度，即频率除以间隔的宽度。直方图的总面积等于数据的数量。直方图也可以是标准化的，显示相对频率。然后，它显示落入几个类别中的案例比例，总面积等于1。这些类别通常指定为连续的、不重叠的间隔。类别（间隔）必须是相邻的，并且通常选择大小相同。^[4] 直方图的矩形绘制时彼此接触，以表明原始变量是连续的。^[5]

条形图

条形图或条形图是一种图表，其矩形条的长度与它们所代表的值成比例。条形可以垂直或水平绘制。垂直条形图有时被称为柱状条形图。

频率分布表

一个频率分布表是一种安排一个或多个变量在样本中取值的方法。表中的每个条目都包含特定组或区间内值出现的频率或次数，从而总结了样本中值的分布。

这是一个单变量（=单个变量）频率表的例子。调查问题的每个回应的频率都被描述了。

排名	同意程度	数量
1	非常同意	22
2	稍微同意	30
3	不确定	20
4	稍微不同意	15
5	非常不同意	15

另一种制表方案将值聚合到箱子中，每个箱子包含一定范围的值。例如，一个班级中学生的身高可以组织成以下频率表。

身高范围	学生人数	累计数量
低于5.0英尺	25	25
5.0–5.5英尺	35	60
5.5–6.0英尺	20	80
6.0–6.5英尺	20	100

联合频率分布

双变量联合频率分布通常呈现为（双向）列联表：

*具有边际频率的双向列联表*
	舞蹈	运动	电视	总计
男性	2	10	8	20
女性	16	6	8	30
总计	18	16	16	50

总行和总列报告了边际频率或边际分布，而表格的主体报告了联合频率。^[6]

解读

在频率解释的概率下，假设随着一系列试验的长度无限增长，某个给定事件发生的实验比例将逼近一个固定值，称为极限相对频率。^[7]^[8]

这种解释经常与贝叶斯概率相对照。事实上，'frequentist'这个词最早是由M. G. Kendall在1949年使用的，用来与被他称为"非频率主义者"的贝叶斯主义者形成对比。^[9]^[10] 他观察到

3....我们可以大致区分两种主要态度。一种将概率视为“理性信念的程度”，或类似的想法......第二种则根据事件发生的频率，或者在'人口'或'集合'中的相对比例来定义概率；(p. 101)

...

12. 可能认为频率主义者和非频率主义者（如果我可以这么称呼他们）之间的差异主要是由于他们试图涵盖的领域的差异所造成的。 (p. 104)

...

我断言情况并非如此 ... 我认为，频率主义者和非频率主义者之间的本质区别在于，前者为了避免涉及任何意见色彩的事项，试图根据一个实际或假设的群体的客观属性来定义概率，而后者则不这样做。[原文强调]

应用

管理和操作频率制表数据比操作原始数据要简单得多。有简单的算法可以从这些表中计算出中位数、平均数、标准差等。

统计假设检验建立在评估频率分布之间的差异和相似性之上。这种评估涉及到中心趋势或平均值的度量，例如平均数和中位数，以及变异性或统计离散性的度量，如标准差或方差。

当一个频率分布的平均数和中位数有显著不同，或者更一般地说，当它是不对称的时候，就被称为偏斜。频率分布的峰度是一种衡量极端值（异常值）比例的度量，这些异常值出现在直方图的两端。如果分布比正态分布更容易出现异常值，则被称为尖峰态；如果较少出现异常值，则被称为平峰态。

字母频率分布也用于频率分析来破解密码，并用于比较不同语言中字母的相对频率，其他语言如希腊语、拉丁语等也常被使用。

引用

↑ ^1.0 ^1.1 Kenney, J. F.; Keeping, E. S. (1962). Mathematics of Statistics, Part 1 (3rd ed.). Princeton, NJ: Van Nostrand Reinhold.
↑ Manikandan, S (1 January 2011). "频率分布". 药理学与药物治疗学杂志. 2 (1): 54–55. doi:10.4103/0976-500X.77120. ISSN 0976-500X. PMC 3117575. PMID 21701652.
↑ Carlson, K. 和 Winquist, J. (2014) 统计学简介。SAGE Publications, Inc. 第1章：统计学和频率分布简介
↑ Howitt, D. 和 Cramer, D. (2008) 心理学统计。Prentice Hall
↑ Charles Stangor (2011) "行为科学研究方法"。Wadsworth, Cengage Learning. ISBN 9780840031976.
↑ Stat Trek, Statistics and Probability Glossary, s.v. 联合频率
↑ von Mises, Richard (1939) Probability, Statistics, and Truth (in German) (English translation, 1981: Dover Publications; 2 Revised edition. ISBN 0486242145) (p.14)
↑ The Frequency theory Chapter 5; discussed in Donald Gilles, Philosophical theories of probability (2000), Psychology Press. ISBN 9780415182751 , p. 88.
↑ [ Earliest Known Uses of Some of the Words of Probability & Statistics]
↑ Kendall, Maurice George (1949). "关于概率理论的和解". Biometrika. Biometrika Trust. 36 (1/2): 101–116. doi:10.1093/biomet/36.1-2.101. JSTOR 2332534.

[Kenney-1] 1.0 ^1.1 Kenney, J. F.; Keeping, E. S. (1962). Mathematics of Statistics, Part 1 (3rd ed.). Princeton, NJ: Van Nostrand Reinhold.

[2] Manikandan, S (1 January 2011). "频率分布". 药理学与药物治疗学杂志. 2 (1): 54–55. doi:10.4103/0976-500X.77120. ISSN 0976-500X. PMC 3117575. PMID 21701652.

[3] Carlson, K. 和 Winquist, J. (2014) 统计学简介。SAGE Publications, Inc. 第1章：统计学和频率分布简介

[4] Howitt, D. 和 Cramer, D. (2008) 心理学统计。Prentice Hall

[5] Charles Stangor (2011) "行为科学研究方法"。Wadsworth, Cengage Learning. ISBN 9780840031976.

[6] Stat Trek, Statistics and Probability Glossary, s.v. 联合频率

[Mises-7] von Mises, Richard (1939) Probability, Statistics, and Truth (in German) (English translation, 1981: Dover Publications; 2 Revised edition. ISBN 0486242145) (p.14)

[Gilles-8] The Frequency theory Chapter 5; discussed in Donald Gilles, Philosophical theories of probability (2000), Psychology Press. ISBN 9780415182751 , p. 88.

[9] [ Earliest Known Uses of Some of the Words of Probability & Statistics]

[10] Kendall, Maurice George (1949). "关于概率理论的和解". Biometrika. Biometrika Trust. 36 (1/2): 101–116. doi:10.1093/biomet/36.1-2.101. JSTOR 2332534.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

@@ 第1行： / 第1行： @@
 {{Short description|实验或研究中的发生次数}}
-{{other uses|Frequency (disambiguation)}}
 在[[statistics|统计学]]中，一个[[Event (probability theory)|事件]] [math]i[/math] 的'''频率'''或'''绝对频率'''是该事件在一个[[experiment|实验]]或研究中发生/记录的次数 [math]n_i[/math]。<ref name="Kenney">{{cite book | last1 = Kenney | first1 = J. F. | last2 = Keeping | first2 = E. S. | title = Mathematics of Statistics, Part 1 | edition = 3rd | url = https://books.google.com/books?id=UdlLAAAAMAAJ | location = Princeton, NJ | publisher = [[John Wiley & Sons|Van Nostrand Reinhold]] | year = 1962}}</ref>{{rp|12–19}} 这些频率通常以图形或表格形式展示。