正态分布密度函数解析式

最大似然估计法的解析——在统计模型的框架下,旨在通过最大化数据的可能性来估算分布参数。
为了更好地理解这一概念,我们以连续数据为例,假设其服从正态分布。正态分布常以高斯钟形曲线形态呈现。我们对于曲线的“胖瘦”程度以及峰值在x轴上的位置并不确定。
参数估计或推断就派上了用场。如我们所知,高斯分布的特定形状和位置由σ(标准差)和μ(均值)决定。简言之,μ和σ是我们关心的关键参数。这两个参数定义了我们的曲线形态,正如我们在查看正态分布概率密度函数(PDF)时所观察到的那样。
以正态分布为例,我们的目标是确定数据的μ和σ,以便我们的数据能够与最可能的高斯钟形曲线相匹配。在技术性语言中表述,我们正在寻找一条能够最大化给定参数下数据概率的曲线。换句话说,我们既在最大化数据的概率,也在最大化曲线的可能性。
为了应用最大似然估计(MLE),我们需遵循两个通常被统称为iid(独立同分布)的假设。这些假设表明:
数据点之间必须独立分布。
所有的数据必须来自同一个分布族且具有相同的参数。
换句话说,iid假设意味着任何一个给定数据点的观察都不依赖于其他数据点的观察(每个收集的数据点都代表一个独立的实验),且每个数据点都来自同一个分布族。
通常,我们将参数μ和σ合并表示为一组参数θ。在处理连续概率分布时,虽然观察到任何一组连续变量的概率为零,但概念上这是有道理的。因为我们可以得出无限多的可能变量在连续域中,将任何给定的观察值除以无穷导致概率为零。
我们需要从概率密度的角度来思考而非概率本身。在不深入探讨两者之间技术差异的情况下,我们可以说在连续域中的概率密度与离散域中的概率具有相似性。在最大化问题的语境中,我们可以使用概率密度。
为了更好地定义我们的目标,我们希望最大化观察数据的概率密度函数关于θ的函数值。换句话说,我们希望找到使这个概率密度尽可能高的μ和σ的值。
从概率论的角度来看,多个独立事件同时发生的概率被称为联合概率。在此情境中,我们可以将每个数据点的观察视为一个事件。我们可以将观察到确切数据集视为一系列事件,并应用联合概率密度。
我们的目标是找到使得此概率密度项最大的θ值。为了在数学上表达这一点,我们可以说我们正在寻找该术语关于θ的“argmax”。
现在的问题是,这个导数并不容易计算或近似。幸运的是,我们可以利用一个简单的数学技巧来简化推导过程。这里我们使用的数学技巧是自然对数,它具有单调递增的性质。由于自然对数的这一特性,取原始概率密度项的自然对数不会影响我们关心的argmax指标。
为什么选择自然对数?因为它的单调递增性质意味着取自然对数不会改变全局最大值相对于θ的位置。在数学上,我们可以这样表述这个逻辑:
为了进一步阐释这一概念,以下是函数与其自然对数的图表(虚线表示),用以表明最大值沿x轴的位置对于函数和其自然对数是相同的。
黑色虚线标示出函数及其自然对数最大值的位置(argmax值)。如我们所言,这些值对于函数和其自然对数是相同的。这就是为什么我们能够在当前问题上应用自然对数技巧。
继续解决当前问题:以正态分布的PDF为例来计算μ和σ的解。通过设定相关项为零,我们推导出μ和σ的解。
当我们将MLE应用于贝叶斯模型和分布时,需要记住的关键在于不要将μ和σ视为数据集的均值和标准差,而是将其视为最有可能拟合数据集的高斯曲线的参数。
我们利用MLE技术不仅在统计建模中评估了分布参数,还在理解贝叶斯模型时提供了一个实用的框架。
