news 2026/2/28 21:00:02

学习笔记三十:极大似然估计

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
学习笔记三十:极大似然估计

1. 参数估计与极大似然

1.1 从类条件概率到参数估计

  • 任务背景:在分类问题中,我们需要估计类条件概率分布P(x∣c)P(x\mid c)P(xc)
  • 参数化假设:先假定P(x∣c)P(x\mid c)P(xc)具有某种确定的概率分布形式,其形状由一个参数向量θc\theta_cθc决定,记作P(x∣θc)P(x\mid\theta_c)P(xθc)
  • 训练目标:利用训练集DDD来估计未知的参数θc\theta_cθc,这个过程称为参数估计

1.2 频率派与贝叶斯派的视角

  • 频率主义:认为参数虽然未知,但客观存在,可以通过优化某个准则来"确定"它的取值;极大似然估计属于这一派的经典方法。
  • 贝叶斯派:把参数看成随机变量,对其假设一个先验分布,然后基于观测数据计算参数的后验分布

2. 极大似然估计方法

2.1 基本思想

DcD_cDc表示训练集DDD中属于第ccc类的样本集合,假设这些样本是独立同分布的。

似然函数:给定参数θc\theta_cθc,观测到数据集DcD_cDc的概率,等于所有样本概率的乘积。

极大似然估计的思想:在所有可能的θc\theta_cθc中,选择那个能使"已经观测到的这批数据DcD_cDc"出现的概率最大的参数。

2.2 对数似然

直接对大量小概率相乘容易造成数值下溢,因此通常对似然取对数,得到对数似然。由于对数函数是单调递增的,最大化对数似然与最大化似然等价。

参数的极大似然估计为:

θ^c=arg⁡max⁡θcLL(θc)\hat{\theta}_c = \arg\max_{\theta_c} LL(\theta_c)θ^c=argθcmaxLL(θc)

求解步骤

  1. 在给定的概率分布假设下写出对数似然函数;
  2. 对参数求偏导并令导数为 0,解出候选解;
  3. 检查该解是否对应对数似然的最大值点。

3. 正态分布下的极大似然估计

3.1 模型假设

在连续属性情形下,若假设类条件概率密度服从正态分布N(μc,σc2)\mathcal{N}(\mu_c,\sigma_c^2)N(μc,σc2),则需要估计的参数为均值μc\mu_cμc方差σc2\sigma_c^2σc2

3.2 MLE 结果

对属于第ccc类的样本集合DcD_cDc,极大似然估计得到:

  • 均值参数:就是该类样本的样本均值(所有样本的平均值)
  • 方差参数:就是样本关于均值的平方偏差的平均值(样本方差)

在离散属性情形下,采用类似思路:每个取值的概率的极大似然估计就是"该取值出现的频数 / 样本总数"。

4. 方法特点与注意事项

  • 优点:给定分布形式后,通过优化明确的目标函数即可得到参数,计算相对简单。
  • 局限:估计结果高度依赖于事先假定的概率分布形式;如果假设与真实数据分布相差较大,估计结果可能偏离真实值。
  • 实践启示:需要在建模之前充分利用对任务本身的经验知识来选择分布形式,而不是完全凭"猜测"。

5. 小结

  • 本质:频率主义框架下的参数估计方法,通过最大化观测数据的似然(或对数似然)来选取参数。
  • 操作:写出似然 → 取对数 → 对参数求导并令导数为 0 → 得到极大似然解。
  • 直观结果:在正态分布等常见模型中,极大似然给出样本均值、样本方差等统计量。
  • 关键前提:分布形式假设是否合理,往往比后续求解过程本身更重要。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/21 1:16:52

HunyuanVideo-Foley模型开源:大幅提升视频后期制作效率

HunyuanVideo-Foley模型开源:大幅提升视频后期制作效率 在短视频日均产量突破千万条的今天,内容创作者正面临一个隐性瓶颈——音效。画面可以快速剪辑、滤镜一键套用,但脚步声是否踩在雨后石板上、门轴转动是否有年久失修的吱呀声&#xff0c…

作者头像 李华
网站建设 2026/2/21 5:08:24

火山引擎AI大模型生态中Qwen3-VL-8B的应用定位

火山引擎AI大模型生态中Qwen3-VL-8B的应用定位 在电商客服对话框里上传一张商品图,系统立刻识别出“这是一款复古风高腰牛仔阔腿裤,搭配白色条纹衬衫适合通勤穿搭”;在内容审核后台,一张看似正常的风景照配上敏感文字,…

作者头像 李华
网站建设 2026/2/25 2:47:45

Linux动态壁纸终极指南:7个简单技巧打造惊艳桌面

Linux动态壁纸终极指南:7个简单技巧打造惊艳桌面 【免费下载链接】linux-wallpaperengine Wallpaper Engine backgrounds for Linux! 项目地址: https://gitcode.com/gh_mirrors/li/linux-wallpaperengine 厌倦了单调的静态壁纸?想在Linux系统上体…

作者头像 李华
网站建设 2026/2/28 13:52:58

深度解析Qwen3-VL-30B:300亿参数背后的视觉语言黑科技

深度解析Qwen3-VL-30B:300亿参数背后的视觉语言黑科技 在自动驾驶系统需要实时判断“前方施工围挡是否影响变道”、医生希望AI能直接从X光片中指出病灶区域并推测病因、电商平台用户上传一张北欧风装修图却期望推荐风格一致的沙发时——我们早已超越了对图像分类或文…

作者头像 李华
网站建设 2026/2/20 16:16:55

ComfyUI-Manager终极指南:一站式AI绘画插件管理平台

ComfyUI-Manager是专为ComfyUI设计的智能管理工具,彻底革新了传统手动安装插件的繁琐流程,让插件安装、更新和配置变得前所未有的简单高效。无论你是AI绘画爱好者还是专业创作者,这个工具都能显著提升你的工作效率,让技术门槛不再…

作者头像 李华
网站建设 2026/2/28 19:01:53

为什么Wan2.2-T2V-5B是社交媒体内容创作者的新利器?

Wan2.2-T2V-5B:如何让每个创作者都拥有“AI导演”? 在抖音、Instagram Reels 和 YouTube Shorts 每天吞吐数亿条短视频的今天,内容创作者面临的不再是“有没有创意”的问题,而是“能不能跟上节奏”。一条爆款视频可能带来百万流量…

作者头像 李华