扩散模型相关的概率论基础-平芜编程栈

一、期望（Expectation）

期望是对随机变量在分布下的"加权平均"。

离散情形：

连续情形（积分）：

在连续随机变量里：概率不是“点的值”，而是“密度函数”，所以期望会变成积分形式：

求平均 = 所有可能值 × 它出现的概率密度

积分和期望的关系：连续情形下，期望本质上就是一个积分。p(x)是权重（概率密度），f(x)是被加权的函数。

等价于

因为想要的p(z∣x)很难算，所以用q(z∣x)来近似它

二、VAE/Diffusion 中反复出现的核心公式

1. 边际化（Marginalization）

这是 VAE 最核心的困难之处——这个积分对所有 z 都是 intractable 的。

2. 贝叶斯公式

VAE 用一个神经网络来这个难以计算的后验 p(z∣x)：

这里编码器网络接收输入 x，输出两个值：

：隐变量的均值
：隐变量的标准差

ϕ就是这个网络的所有可学习参数，通过最大化 ELBO 来训练。

3. KL 散度

衡量两个分布"距离"的函数：

（z∼q：z服从q分布）

KL(q||p) = “用 q 作为权重，衡量 q 和 p 的差异”意思就是“如果数据是按照 q 分布出现的，
那 p 有多不匹配？”所以必须用q来采样（用 q 加权），不能用Ep，否则变成在模型生成的数据下评估误差。

展开就是：，ELBO 其实就是这个结构的变形！

，当且仅当 q=p时等于 0。

4. 蒙特卡洛估计（MC Estimation）

当积分无法解析计算时，用采样近似：

VAE 的重建项就是这样估计的（通常 N=1，因为batch 和多次迭代已经在平均了）。

原来的期望是

这是一个连续积分（这个期望本质上是一个高维积分，而积分里的函数形式又非常复杂），要对所有可能的 z 值加权求和——有无穷多个点。而蒙特卡洛估计只用了 N 离散的采样点：

用有限个离散样本替代了无穷连续的积分。

5.先验概率和后验概率

🟦 先验（prior）

👉 “今天会下雨的概率是多少？”（没看到地面之前的判断）

🟩 后验（posterior）

👉 “既然地是湿的，那下雨的概率是多少？”（看到结果之后更新判断）

STM32CubeIDE深度调优：从Tab设置到离线包管理，提升开发效率的5个实用技巧

STM32CubeIDE深度调优：从Tab设置到离线包管理，提升开发效率的5个实用技巧如果你已经用了一段时间STM32CubeIDE，可能已经习惯了它的基本功能——创建项目、配置外设、生成代码。但真正的高效开发，往往藏在那些容易被忽略的细节里…

李华

如何阻止 HTML 页面在 JavaScript 执行完成前渲染

本文介绍两种可靠方法，通过延迟页面可见内容的呈现，确保重定向逻辑（如用户身份判断、a/b 测试分流等）在 dom 渲染前执行完毕，彻底消除“闪屏跳转”现象。本文介绍两种可靠方法，通过延迟页面可见内容的…

李华

马尔可夫链蒙特卡洛（MCMC）算法

马尔可夫链蒙特卡洛（马尔可夫链蒙特卡洛，简称MCMC）算法，是一类基于随机抽样的统计计算方法，核心作用是从复杂概率分布中高效抽取样本，进而通过样本推断分布的统计特性（如期望、方差、可信区间等…

李华

C语言选择结构自用讲解

选择主要分为三种结构，分别为IF ,SWITCH和条件操作符。接下来，我将分别介绍这三种结构。 IF结构首先，if结构是最基础的结构，也将是我们今后会经常使用的结构，这一部分是基础，一定要理解掌握。一&#…

李华

Chroma-Bubble-App：基于向量数据库与LLM的交互式知识可视化工具

1. 项目概述与核心价值最近在折腾一个挺有意思的开源项目，叫chroma-bubble-app。乍一看这个标题，可能会有点摸不着头脑——“Chroma”是色彩，“Bubble”是气泡，“App”是应用，这组合在一起到底是个啥？简单来…

李华

机械操作耗尽精力？dothething：一款全自主本地 AI 代理，替你接管系统控制与网络任务

人跟机器打交道，最熬人的往往不是那些需要灵感的创造，而是机械重复的繁琐切换。你大概也经历过这样的日常：为了整理一份报告，要在浏览器里开上十几个标签页，把检索到的信息提取下来，转身去终端里敲几行命令…

李华