对数几率 (Log-Odds)
几率 (Odds): 几率表示某个事件发生的概率与不发生的概率之比。 几率的取值范围是 。
对数几率 (Log-Odds 或 Logit): 对几率取自然对数 ( 或 )。 对数几率的取值范围是 。
在逻辑回归中的作用: 逻辑回归的核心思想是:将线性组合 直接建模为目标变量属于某个类别的对数几率**。 这个等式就是逻辑回归模型的基础。通过这个桥梁(对数几率),我们将一个具有无限取值范围的线性模型的输出,映射到了一个用于表示概率 () 的、介于 0 和 1 之间的量。Sigmoid 函数 正是这个等式的逆运算,即由 反推出 。
统计学上的合理性 (广义线性模型 GLM):
- GLM 的思想是将响应变量(我们的目标变量)的平均值(对于伯努利分布,均值就是概率 )通过一个链接函数 (Link Function) 与线性预测器 关联起来。
- 对于二元分类问题,假设响应变量服从伯努利分布(Bernoulli Distribution)。伯努利分布的规范链接函数 (Canonical Link Function) 恰好就是对数几率函数 ()。
- 使用规范链接函数有许多优良的统计性质,例如可以简化最大似然估计 (Maximum Likelihood Estimation, MLE) 的过程,并保证参数估计的统计效率。简单来说,它使得找到最佳模型参数 的优化问题更容易解决(通常是凸优化问题),能够找到全局最优解。
对数线性 (Log-Linear)
含义: “对数线性模型”是一个更广泛的概念,指的是模型中某个变量的对数与预测变量呈线性关系。
与逻辑回归的关系: 逻辑回归可以被视为一种对数线性模型,因为它建模的是目标变量的对数几率(即 )与特征的线性组合之间的关系。
其他对数线性模型的例子: 用于计数数据分析的泊松回归(Poisson Regression)也是一种对数线性模型,它建模的是目标变量的期望值的对数()与特征的线性组合之间的关系。
总结: 在你提到的上下文中,“对数线性”主要是指逻辑回归中,特征的线性组合与目标变量的对数几率之间存在的线性关系。它描述了模型在经过对数变换后的空间中的线性特性。