AI会为媒体领域带来什么？

导语从媒体制作到媒体传输，人工智能（AI）技术将对媒体领域产生全方位的影响。其中一部分现在已经进入我们的家庭...

导语

从媒体制作到媒体传输，人工智能（AI）技术将对媒体领域产生全方位的影响。其中一部分现在已经进入我们的家庭，例如Apple TV的语音控制，Prisma的创意照片滤镜等等。

未来，语音将成为内容发现和家庭物联网的入口，例如亚马逊Alexa那样的虚拟助手。语音生物识别和对上下文的理解将成为AI平台差异化竞争的关键。

今天推荐的文章来自Adrian Pennington，他介绍了AI技术在媒体领域的几种可能的应用。

自动唇语识读

当下，人们在网上大量消费并创造视觉内容，这给盲人和视力受损的人群带来了很大的困扰。

Facebook通过使用基于神经网络的物体识别技术，可以针对静态照片（目前还没做到视频）生成一段语音描述。

Facebook已在iOS平台上推出了这一功能。目前采用的语言是英语，未来将增加其他语言，并拓展到其他平台。

听力受损人群则可以受益于自动字幕。牛津大学计算机系的研究人员研发了AI系统LipNet。它可以从静音视频片段中识别讲话内容，正确率高达93.4%，而专业的唇语识读人员正确率仅为52.3%。

LipNet

MIT评论员James Condliffe表示，LipNet分析的是整个句子，而不是单个词语，这让它能对上下文有一个更好的理解。（口型的种类少于人类可以发出的声音种类）

据《新科学家》报道，另一个牛津大学的研究团队用一系列多语种的视频训练谷歌的Deepmind AI。这些视频不仅包含各种语言，还有各式各样的光照环境和头部位置。结果显示，该系统可以正确识别46.8%的单词，而人类的正确率仅能达到12.4%。

Condliffe指出，这类软件的应用前景可想而知。未来，Skype可以解决视频通话时通话者处于嘈杂环境的问题，而听力障碍的人也可以用手机“听到”对方在说什么了。

新型图像处理

机器学习技术带来了一个可以对图片和电影内容进行编辑的类似Photoshop的工具。不同的是，这一工具处理的对象不是单个像素，而是图像中的概念性元素。很快，我们可以直接编辑面部表情、面部特征等。Twitter机器人@smilevector就是一个这样的例子，但可能并不是最先进的技术。

@smilevector改变照片中人物表情

此外，我们还可以通过“图像修补”（in-painting）技术，使用简单的“点击式”界面，移除掉不想要的物体。目前，已经有这样的软件出现了，斯坦福也发布了关于这一议题的学术论文。

用户行为分析

了解用户行为对于留存用户、策划促销活动、谈判内容许可权等至关重要。

以防止用户流失为例，具备预测性的AI算法可以考虑到观影模式、购买频率、人口统计学数据、设备使用情况、地理位置等数百种特征，计算用户流失的可能性。

智能内容压缩

Twitter一直致力于成为视频直播的第一供应商，但它在内容分发上面临一个重要的问题：大量用户通过移动设备接入，而他们使用的往往是低带宽的移动连接（在欧美之外的市场这一情况更甚）。这让图像传输的质量大打折扣。

2016年6月，Twitter以1.5亿美元收购了Magic Pony Technologies，研发在低清晰度、压缩数据流基础上重建高清视频的技术。这样，Twitter就能以低分辨率进行内容传输（从而消耗更少带宽），使用标准的编码器和解码器。人工神经网络（ANNs）可以将压缩的图像转为更高的分辨率，且不会有像素化的滤镜效果。

Nagra公司数据科学家Pietro Berkes表述：“ANNs经过数小时的高清视频训练，学习了典型图像长什么样。从更技术的角度说，他们建立了一个自然图像统计的复杂模型。给ANNs一个损坏的、低分辨率图像，他们就可以去除所有的瑕疵，通过与统计模型相比较，让图像变得‘不典型’”。

和谷歌一样，Twitter还在研发更好的图像编码方法，希望能超越通用的JPEG标准。

Berkes表示：“AI与传统编码相比的一个重要优势在于，他们可以聚焦于具体的内容子集，例如自然风光纪录片等。AI可以训练出一个适用于某种具体内容的压缩模型，可以节省更多带宽。

后期植入广告

随着数字视频录制和点播视频的普及，广告商开始面临一些新的问题。用户可能会跳过他们投放的广告或者忽视传统的在线广告。植入广告会成为一个新的解决方案。但这同时也是一场赌博，万一相关场景被剪掉了呢？或者广告并没有以广告商喜欢的形式出现呢？

伦敦的MirriAd公司研发了一项通过后期制作将品牌实时置入视频的技术，并使用了人口统计数据来确定目标。该技术包含一个可以识别视频中具体区域光照特点的平面追踪器，并能根据光照环境将物体置入图像之中。例如，饮料可以出现在冰箱中。三星就在优酷一部55集的剧集中使用了这一技术，进行了家电的广告植入。

MirriAd的广告植入技术

但是，如果系统出错了……

去年，微软在Twitter上训练其聊天机器人Tay，但Tay发出了有关种族歧视和性别歧视的言论，造成了灾难性的后果。这说明，AI系统是否机灵和友善与你使用的训练数据有关，否则，它很可能成为客户关系的噩梦。

因此，今年年初，特斯拉CEO伊隆·马斯克、Facebook的人工智能研究主管YannLeCun等2000人共同签署了“阿西洛马人工智能23条准则”，最终目的是保护人类免受AI伤害。

这些准则涉及了一些AI伦理，包括避免“致命的自动化武器军备竞赛”等。

此外，还有一些比较日常化的准则，如第12条规定：“鉴于AI系统可以分析和使用人类产生的数据，人类应当拥有接入、管理并控制这些数据的权利。”

相关阅读：

《为什么说混合现实是沉浸式广播的未来？》

《Channel 4的个性化广告可以直接叫出你的名字》

《Sky在VR节目中加入3D全息主持人》