Jason 多模态学习近几年来受到不少关注重视,特别是文本-图像生成这个方向,一些模型因在创意图像生成、编辑方面的应用引起了公众的广泛关注,例如 OpenAI 的文本转图像模型 DALL·E 2、Nvidia 的生成对抗网络 GauGAN 以及 Google 提出的文本到图像的扩散模型 Imagen。