一 单向频数表的概念(英语:One Way Frequency)
频数表是数理统计中由于所观测的数据较多,为简化计算,将这些数据按等间隔分组,然后按选举唱票法数出落在每个组内观测值的个数,称为(组)频数。这样得到的表称“频数表”或“频数分布表”。因为频数除以总频数即频率,所以频数表或频数分布表除以总频数即得频率表或频率分布表。分析频数分布的目的是要根据子样中各个变值的频率分布情况来推测母体中各个变值的频率分布情况。
1.1 频数分布的特征
由频数表可看出频数分布的两个重要特征:集中趋势(central tendency)和离散程度(dispersion)。身高有高有矮,但多数人身高集中在中间部分组段,以中等身高居多,此为集中趋势;由中等身高到较矮或较高的频数分布逐渐减少,反映了离散程度。对于数值变量资料,可从集中趋势和离散程度两个侧面去分析其规律性。
1.2 频数分布的类型
频数分布有对称分布和偏态分布之分。对称分布是指多数频数集中在中央位置,两端的频数分布大致对称。偏态分布是指频数分布不对称,集中位置偏向一侧,若集中位置偏向数值小的一侧,称为正偏态分布;集中位置偏向数值大的一侧,称为负偏态分布,如冠心病、大多数恶性肿瘤等慢性病患者的年龄分布为负偏态分布。临床上正偏态分布资料较多见。不同的分布类型应选用不同的统计分析方法。
1.3 卡方检验
卡方检验用于比较实际观测频数和理论频数是否相同。不同种类的比例相同或者不同
更多卡方检验原理和资料,请点此链接
二 在决策链Web版中的操作指南
2.1 网页端版本
1)点击数据分析板块
2) 分析方法中:
- 所属模块选择: 频数的比较与检验
- 直接选择或搜索选择:单向频数表
3)变量选择界面:
- 变量选择:X (分类型,离散型数字或字符串变量,选择多个变量可做多个单向频数表);
- 如与理论频数比较:1. 0.5 0.5 2. 0.33 0.33 0.34
- 多变量联合分布:点击不光生成各变量单独频数,且生成各变量交叉联合频数;
- 分解字符串计算频数:点击开始分解字符串进行计算频数;
- 分解字符串分隔符:1.逗号 2.分号 3. / 4.\
- 合并频数阈值: 针对字符串, 几个字符串的的频率小于某个阈值, 则全部计入一个字符串的频数
4)提交分析,生成结果压缩包或PDF。
2.2 PC版本
开发中
三 使用建议
建议前往决策链BBS论坛的专题页面获取更多的使用经验。 点此链接