DeepMind黑科技：AI生成图片竟能以假乱真_【青亭网】

训练只需2天即可完成~...

Esther｜撰文

利用生成对抗网络（GAN）合成图像/视频已经不是新鲜事，比如前不久美国卡内基梅隆大学科研人员研发的一种有Deepfake（AI换脸应用）效果的视频合成技术，将视频的美国主持人John Oliver的变成了另一位主持人Stephen Colbert，效果非常逼真。

此外，NVIDIA也曾经利用GAN合成MRI成像，为AI提供模拟的训练数据，其还与MIT计算机科学与人工智能实验室利用GAN框架研发了将黑白草图合成为2K视频的技术。

近日，一组由谷歌旗下DeepMind和赫瑞瓦特大学组成的科研人员也发表了一篇关于GAN模型的论文，阐述了一款能够合成逼真的食物照片、风景肖像和动物照片的AI技术，他们发现其中一些效果图已经直逼相机拍摄的水平。

据青亭网了解，科研人员使用了优化的生成对抗网络（GAN，由生成模型和判别模型组成的两部分神经网络）来训练AI分辨合成图片与真实图片，此外他们的实验模型的不同之处在于，这款名为BigGAN的生成对抗网络架构有所调整，比如每批有2048张图片，参数（用于控制模型部分特性的算法控制器）也是其他模型的四倍（1.58亿）。

这组科研人员研究了GAN框架应对扩大化训练模型产生的不稳定性，发现垂直正则化后的生成模型可服从简单的“截断技巧”（这样生成模型便可以合成与训练图像相似度高的图像），这样就能通过截断隐空间来控制合成图像的保真度和多样性。

他们认为，BigGAN训练过的AI模型技术超越了目前类条件图像合成技术的最先进水平。

科研人员显示使用来自于斯坦福和普林斯顿数据库ImageNet的图像（分辨率128x128的图像）来训练AI模型，然后有使用包含3亿张真实图片的JFT-300M数据库来大批量验证模型。

据悉，训练BigGAN花了两天时间，科研人员使用了128个谷歌TPU。经测验，训练的结果得到了166.3的IS（初始分值）和9.6的FID指标，超越了其他模型最佳成绩（分别为52.52和18.65）。

与Deepfake效果相似的技术发展的越来越成熟了，同时也带来了一些隐患，比如会被用于犯罪活动。因此今年9月，美国国会成员就曾向国家情报局主任Dan Coats寻求情报机构关于Deepfake对民主与国家安全影响的报告。

不过随着这种技术发展，一些科研人员也在研发识别合成图像的AI，比如今年七月DARPA（美国国防部高级研究计划局）媒体法医项目就曾进行过识别Deepfake或图片/视频合成技术的研究，此外一家名为Truepic的创企在获得800万美元融资后，也努力研发识别合成图像的技术。

（END）

DeepMind黑科技：AI生成图片竟能以假乱真

0 个评论

发起人

DeepMind黑科技：AI生成图片竟能以假乱真

0 个评论

发起人

青亭网相关文章

相关问题