归一化流(Normalizing Flows)中的三角映射(Triangular Map)原理与可逆变换机制
字数 861 2025-12-03 18:50:01
归一化流(Normalizing Flows)中的三角映射(Triangular Map)原理与可逆变换机制
题目描述
归一化流(Normalizing Flows)是一种生成模型,其核心思想是通过一系列可逆变换将简单分布(如高斯分布)转换为复杂数据分布。三角映射是归一化流中一种重要的可逆变换结构,它通过保证雅可比矩阵的三角性,使概率密度计算和变换求逆变得高效。本题将详细讲解三角映射的数学原理、设计方法及其在归一化流中的应用。
解题过程
- 归一化流基本框架回顾
- 目标:将潜在变量 \(z\)(服从简单分布 \(p_z(z)\))通过可逆变换 \(f\) 映射为数据变量 \(x\),即 \(x = f(z)\)。
- 概率密度变换公式(变量变换定理):
\[ p_x(x) = p_z(z) \left| \det \frac{\partial f}{\partial z} \right|^{-1} \]
其中 $ \det \frac{\partial f}{\partial z} $ 是变换 $ f $ 的雅可比行列式。
- 关键要求:\(f\) 必须可逆,且雅可比行列式易计算。
- 三角映射的设计思想
- 核心动机:若变换 \(f\) 的雅可比矩阵是三角矩阵,则其行列式仅需计算对角元素的乘积,极大简化计算。
- 结构定义:将 \(z = (z_1, z_2, ..., z_D)\) 映射为 \(x = (x_1, x_2, ..., x_D)\),其中每个 \(x_i\) 仅依赖于 \(z_{\leq i}\)(或 \(z_{\geq i}\)),即:
\[ x_i = f_i(z_1, z_2, ..., z_i) \quad \text{(下三角结构)} \]
或
\[ x_i = f_i(z_i, z_{i+1}, ..., z_D) \quad \text{(上三角结构)} \]
- 雅可比矩阵特性:以