U-Net

医用画像セグメンテーションのために開発されたエンコーダ・デコーダ型のニューラルネットワークアーキテクチャ。ダウンサンプリング→ボトルネック→アップサンプリングの「砂時計型」構造を持つ。

Stable Diffusion 1.5やSDXLなど初期の拡散モデルで採用されていた。2024年以降はTransformerベースのMMDiTアーキテクチャへの移行が進んでいる。