归一化流（Normalizing Flows）中的三角映射（Triangular Map）原理与可逆变换机制

字数 861 2025-12-03 18:50:01

归一化流（Normalizing Flows）中的三角映射（Triangular Map）原理与可逆变换机制

题目描述
归一化流（Normalizing Flows）是一种生成模型，其核心思想是通过一系列可逆变换将简单分布（如高斯分布）转换为复杂数据分布。三角映射是归一化流中一种重要的可逆变换结构，它通过保证雅可比矩阵的三角性，使概率密度计算和变换求逆变得高效。本题将详细讲解三角映射的数学原理、设计方法及其在归一化流中的应用。

解题过程

归一化流基本框架回顾
- 目标：将潜在变量 \(z\)（服从简单分布 \(p_z(z)\)）通过可逆变换 \(f\) 映射为数据变量 \(x\)，即 \(x = f(z)\)。
- 概率密度变换公式（变量变换定理）：

\[ p_x(x) = p_z(z) \left| \det \frac{\partial f}{\partial z} \right|^{-1} \]

 其中 $ \det \frac{\partial f}{\partial z} $ 是变换 $ f $ 的雅可比行列式。

关键要求：\(f\) 必须可逆，且雅可比行列式易计算。

三角映射的设计思想
- 核心动机：若变换 \(f\) 的雅可比矩阵是三角矩阵，则其行列式仅需计算对角元素的乘积，极大简化计算。
- 结构定义：将 \(z = (z_1, z_2, ..., z_D)\) 映射为 \(x = (x_1, x_2, ..., x_D)\)，其中每个 \(x_i\) 仅依赖于 \(z_{\leq i}\)（或 \(z_{\geq i}\)），即：

\[ x_i = f_i(z_1, z_2, ..., z_i) \quad \text{（下三角结构）} \]

或

\[ x_i = f_i(z_i, z_{i+1}, ..., z_D) \quad \text{（上三角结构）} \]

雅可比矩阵特性：以