news 2026/5/7 4:06:27

扩散模型相关的概率论基础

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
扩散模型相关的概率论基础

一、期望(Expectation)

期望是对随机变量在分布下的"加权平均"。

离散情形:

连续情形(积分):

在连续随机变量里:概率不是“点的值”,而是“密度函数”,所以期望会变成积分形式:

求平均 = 所有可能值 × 它出现的概率密度

积分和期望的关系:连续情形下,期望本质上就是一个积分。p(x)是权重(概率密度),f(x)是被加权的函数。

等价于

因为想要的p(z∣x)很难算,所以用q(z∣x)来近似它

二、VAE/Diffusion 中反复出现的核心公式

1. 边际化(Marginalization)

这是 VAE 最核心的困难之处——这个积分对所有 z 都是 intractable 的。

2. 贝叶斯公式

VAE 用一个神经网络来这个难以计算的后验 p(z∣x):

这里编码器网络接收输入 x,输出两个值:

  • :隐变量的均值
  • :隐变量的标准差

ϕ就是这个网络的所有可学习参数,通过最大化 ELBO 来训练。

3. KL 散度

衡量两个分布"距离"的函数:

(z∼q:z服从q分布)

KL(q||p) = “用 q 作为权重,衡量 q 和 p 的差异”意思就是“如果数据是按照 q 分布出现的,
那 p 有多不匹配?”所以必须用q来采样(用 q 加权),不能用Ep,否则变成在模型生成的数据下评估误差。

展开就是:,ELBO 其实就是这个结构的变形!

,当且仅当 q=p时等于 0。

4. 蒙特卡洛估计(MC Estimation)

当积分无法解析计算时,用采样近似:

VAE 的重建项就是这样估计的(通常 N=1,因为batch 和多次迭代已经在平均了)。

原来的期望是

这是一个连续积分(这个期望本质上是一个高维积分,而积分里的函数形式又非常复杂,要对所有可能的 z 值加权求和——有无穷多个点。而蒙特卡洛估计只用了 N 离散的采样点:

用有限个离散样本替代了无穷连续的积分。

5.先验概率和后验概率

🟦 先验(prior)

👉 “今天会下雨的概率是多少?”(没看到地面之前的判断)

🟩 后验(posterior)

👉 “既然地是湿的,那下雨的概率是多少?”(看到结果之后更新判断)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/7 4:02:29

如何阻止 HTML 页面在 JavaScript 执行完成前渲染

本文介绍两种可靠方法,通过延迟页面可见内容的呈现,确保重定向逻辑(如用户身份判断、a/b 测试分流等)在 dom 渲染前执行完毕,彻底消除“闪屏跳转”现象。 本文介绍两种可靠方法,通过延迟页面可见内容的…

作者头像 李华
网站建设 2026/5/7 3:59:27

马尔可夫链蒙特卡洛(MCMC)算法

马尔可夫链蒙特卡洛(马尔可夫链蒙特卡洛,简称MCMC)算法,是一类基于随机抽样的统计计算方法,核心作用是从复杂概率分布中高效抽取样本,进而通过样本推断分布的统计特性(如期望、方差、可信区间等…

作者头像 李华
网站建设 2026/5/7 3:59:00

C语言选择结构自用讲解

选择主要分为三种结构,分别为IF ,SWITCH和条件操作符。接下来,我将分别介绍这三种结构。 IF结构 首先,if结构是最基础的结构,也将是我们今后会经常使用的结构,这一部分是基础,一定要理解掌握。 一&#…

作者头像 李华
网站建设 2026/5/7 3:57:17

Chroma-Bubble-App:基于向量数据库与LLM的交互式知识可视化工具

1. 项目概述与核心价值最近在折腾一个挺有意思的开源项目,叫chroma-bubble-app。乍一看这个标题,可能会有点摸不着头脑——“Chroma”是色彩,“Bubble”是气泡,“App”是应用,这组合在一起到底是个啥?简单来…

作者头像 李华