DeepMind黑科技:AI生成图片竟能以假乱真

 

训练只需2天即可完成~...





Esther| 撰文

利用生成对抗网络(GAN)合成图像/视频已经不是新鲜事,比如前不久美国卡内基梅隆大学科研人员研发的一种有Deepfake(AI换脸应用)效果的视频合成技术,将视频的美国主持人John Oliver的变成了另一位主持人Stephen Colbert,效果非常逼真。

此外,NVIDIA也曾经利用GAN合成MRI成像,为AI提供模拟的训练数据,其还与MIT计算机科学与人工智能实验室利用GAN框架研发了将黑白草图合成为2K视频的技术。

近日,一组由谷歌旗下DeepMind和赫瑞瓦特大学组成的科研人员也发表了一篇关于GAN模型的论文,阐述了一款能够合成逼真的食物照片、风景肖像和动物照片的AI技术,他们发现其中一些效果图已经直逼相机拍摄的水平。



据青亭网了解,科研人员使用了优化的生成对抗网络(GAN,由生成模型和判别模型组成的两部分神经网络)来训练AI分辨合成图片与真实图片,此外他们的实验模型的不同之处在于,这款名为BigGAN的生成对抗网络架构有所调整,比如每批有2048张图片,参数(用于控制模型部分特性的算法控制器)也是其他模型的四倍(1.58亿)。

这组科研人员研究了GAN框架应对扩大化训练模型产生的不稳定性,发现垂直正则化后的生成模型可服从简单的“截断技巧”(这样生成模型便可以合成与训练图像相似度高的图像),这样就能通过截断隐空间来控制合成图像的保真度和多样性。

他们认为,BigGAN训练过的AI模型技术超越了目前类条件图像合成技术的最先进水平。



科研人员显示使用来自于斯坦福和普林斯顿数据库ImageNet的图像(分辨率128x128的图像)来训练AI模型,然后有使用包含3亿张真实图片的JFT-300M数据库来大批量验证模型。

据悉,训练BigGAN花了两天时间,科研人员使用了128个谷歌TPU。经测验,训练的结果得到了166.3的IS(初始分值)和9.6的FID指标,超越了其他模型最佳成绩(分别为52.52和18.65)。

与Deepfake效果相似的技术发展的越来越成熟了,同时也带来了一些隐患,比如会被用于犯罪活动。因此今年9月,美国国会成员就曾向国家情报局主任Dan Coats寻求情报机构关于Deepfake对民主与国家安全影响的报告。

不过随着这种技术发展,一些科研人员也在研发识别合成图像的AI,比如今年七月DARPA(美国国防部高级研究计划局)媒体法医项目就曾进行过识别Deepfake或图片/视频合成技术的研究,此外一家名为Truepic的创企在获得800万美元融资后,也努力研发识别合成图像的技术。

(END)


推荐阅读







每天五分钟,轻松了解前沿科技。
—— 青亭网



    关注 青亭网


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册