2014年,伊恩·古德费洛在一次酒吧讨论后灵光一现,提出了生成对抗网络(GAN)。GAN的天才设计是让两个神经网络互相竞争:生成器(Generator)不断尝试生成以假乱真的图像,判别器(Discriminator)则努力识破伪造——就像一对造假者和警察在相互博弈。这种对抗训练让AI第一次有能力创造逼真的新内容,而非只是分类已有内容。YannLeCun将GAN称为”过去20年机器学习最令人兴奋的想法”。
【为什么重要?】
GAN是生成式AI的奠基技术之一,从此AI不只能”看”和”分类”,还能”创造”——图像合成、数据增强、风格迁移、Deepfake等技术都源于此。
【逻辑闭环】
解决了什么:提供了第一个高质量图像生成框架,让AI具备了创造能力。局限是什么:GAN训练极不稳定(模式崩溃、训练不收敛),且生成的图像难以多样化控制——你能让它生成人脸,但很难精确指定”生成一个戴眼镜的微笑男性”。这些局限推动了扩散模型(Diffusion Models)和CLIP引导生成的研究——后来的DALL-E、Stable Diffusion正是在此基础上超越了GAN。
觉得有用?点个赞