DiT
Diffusion Transformer の略。2023年にPeebles & Xieによって提案された、U-NetをTransformerで完全に置き換えた拡散モデルアーキテクチャ。
Vision Transformer(ViT)の成功を拡散モデルに応用した形で、MMDiTなどの後続アーキテクチャの基礎となった。より効率的なスケーリングと長距離依存の学習が可能。Transformerのスケール則が画像生成に適用できることを示した重要な研究でもある。
Select a result to preview
Diffusion Transformer の略。2023年にPeebles & Xieによって提案された、U-NetをTransformerで完全に置き換えた拡散モデルアーキテクチャ。
Vision Transformer(ViT)の成功を拡散モデルに応用した形で、MMDiTなどの後続アーキテクチャの基礎となった。より効率的なスケーリングと長距離依存の学習が可能。Transformerのスケール則が画像生成に適用できることを示した重要な研究でもある。