扩散模型是AI图像生成的核心技术:

扩散过程

从随机噪声开始,逐步去噪生成清晰图像。

训练阶段

  1. 向图像添加噪声
  2. 训练模型预测噪声
  3. 学习从噪声中恢复原图

生成阶段

  1. 初始化随机噪声
  2. 迭代去噪过程
  3. 生成最终图像

关键技术

  • U-Net架构:核心网络结构
  • 注意力机制:处理长距离依赖
  • 调度器:控制去噪步长

代表模型

Stable Diffusion、DALL-E、Midjourney等。