广义线性模型

来自决策链云智库

一 广义线性模型的概念(英语:Generalized Linear Model,简称GLM)

模板:右侧信息框 是一种应用灵活的线性回归模型。该模型允许因变量的偏差分布有除了正态分布之外的其它分布。此模型假设实验者所量测的随机变数的分布函数与实验中系统性效应(即非随机的效应)可经由一链结函数(link function)建立可解释其相关性的函数。

1.1广义线性模型

假设因变量[math]Y_1,Y_2,...,Y_n[/math] 是 [math]n[/math]个独立观测,服从指数型分布,即其有密度函数:

[math]f(y_i\mid\theta_i,\phi)=\ \exp{(\frac{(y_i\ \theta_i-b(\theta_i))}{\phi}+c(y_i,\phi))}[/math]

其中 [math]\theta_i[/math] 和 [math]\phi[/math] 为参数, [math]b(.)[/math] 和 [math]c(.)[/math] 为函数。

假设 [math]x_1, x_2, ..., x_n[/math] 为对应于 [math]Y_1, Y_2, ..., Y_n[/math] 的 p 维自变量 X 的观测值。记 [math]\eta_i=x_i^T \beta[/math] , 其中 [math]\beta[/math] 为 [math]p \times 1[/math] 未知参数向量。假设 [math]E\left(Y_i\right)=\mu_i[/math] 并且 [math]\mu_i[/math] 与 [math]\eta_i[/math] 具有关系

[math]\eta_i=g\left(\mu_i\right), i=1,2, \ldots, n[/math]

称如此定义的模型为广义线性模型,[math]\theta_i[/math] 称为自然参数,[math]\phi[/math] 称为离散参数,称 [math]g(.)[/math] 为联系函数(连接函数).

二 在决策链Web版中的操作指南

2.1 网页端版本

1)点击数据分析板块

2) 分析方法中:

  • 所属模块选择: 正态性检验
  • 直接选择或搜索选择:方差分析

3)变量选择界面:

  • 变量选择:Y (连续型,选择多个变量可做多个方差分析);
  • 分组变量选择:A (连续型/离散型,选择一个做one-way);
  • 分层变量选择:B(连续型/离散型,选择一个做two-way; 留空则做one-way)

4)提交分析,生成结果压缩包或PDF。

2.2 PC版本

开发中

三 使用建议

建议前往决策链BBS论坛的专题页面获取更多的使用经验。 点此链接