AI会为媒体领域带来什么?

 

导语从媒体制作到媒体传输,人工智能(AI)技术将对媒体领域产生全方位的影响。其中一部分现在已经进入我们的家庭...

导语
从媒体制作到媒体传输,人工智能(AI)技术将对媒体领域产生全方位的影响。其中一部分现在已经进入我们的家庭,例如Apple TV的语音控制,Prisma的创意照片滤镜等等。

未来,语音将成为内容发现和家庭物联网的入口,例如亚马逊Alexa那样的虚拟助手。语音生物识别和对上下文的理解将成为AI平台差异化竞争的关键。

今天推荐的文章来自Adrian Pennington,他介绍了AI技术在媒体领域的几种可能的应用。

自动唇语识读

当下,人们在网上大量消费并创造视觉内容,这给盲人和视力受损的人群带来了很大的困扰。

Facebook通过使用基于神经网络的物体识别技术,可以针对静态照片(目前还没做到视频)生成一段语音描述

Facebook已在iOS平台上推出了这一功能。目前采用的语言是英语,未来将增加其他语言,并拓展到其他平台。

听力受损人群则可以受益于自动字幕。牛津大学计算机系的研究人员研发了AI系统LipNet。它可以从静音视频片段中识别讲话内容,正确率高达93.4%,而专业的唇语识读人员正确率仅为52.3%。

LipNet
MIT评论员James Condliffe表示,LipNet分析的是整个句子,而不是单个词语,这让它能对上下文有一个更好的理解。(口型的种类少于人类可以发出的声音种类)

据《新科学家》报道,另一个牛津大学的研究团队用一系列多语种的视频训练谷歌的Deepmind AI。这些视频不仅包含各种语言,还有各式各样的光照环境和头部位置。结果显示,该系统可以正确识别46.8%的单词,而人类的正确率仅能达到12.4%。

Condliffe指出,这类软件的应用前景可想而知。未来,Skype可以解决视频通话时通话者处于嘈杂环境的问题,而听力障碍的人也可以用手机“听到”对方在说什么了。

新型图像处理

机器学习技术带来了一个可以对图片和电影内容进行编辑的类似Photoshop的工具。不同的是,这一工具处理的对象不是单个像素,而是图像中的概念性元素。很快,我们可以直接编辑面部表情、面部特征等。Twitter机器人@smilevector就是一个这样的例子,但可能并不是最先进的技术。

@smilevector改变照片中人物表情
此外,我们还可以通过“图像修补”(in-painting)技术,使用简单的“点击式”界面,移除掉不想要的物体。目前,已经有这样的软件出现了,斯坦福也发布了关于这一议题的学术论文。

用户行为分析

了解用户行为对于留存用户、策划促销活动、谈判内容许可权等至关重要。

以防止用户流失为例,具备预测性的AI算法可以考虑到观影模式、购买频率、人口统计学数据、设备使用情况、地理位置等数百种特征,计算用户流失的可能性。

智能内容压缩

Twitter一直致力于成为视频直播的第一供应商,但它在内容分发上面临一个重要的问题:大量用户通过移动设备接入,而他们使用的往往是低带宽的移动连接(在欧美之外的市场这一情况更甚)。这让图像传输的质量大打折扣。

2016年6月,Twitter以1.5亿美元收购了Magic Pony Technologies,研发在低清晰度、压缩数据流基础上重建高清视频的技术。这样,Twitter就能以低分辨率进行内容传输(从而消耗更少带宽),使用标准的编码器和解码器。人工神经网络(ANNs)可以将压缩的图像转为更高的分辨率,且不会有像素化的滤镜效果。

Nagra公司数据科学家Pietro Berkes表述:“ANNs经过数小时的高清视频训练,学习了典型图像长什么样。从更技术的角度说,他们建立了一个自然图像统计的复杂模型。给ANNs一个损坏的、低分辨率图像,他们就可以去除所有的瑕疵,通过与统计模型相比较,让图像变得‘不典型’”。

和谷歌一样,Twitter还在研发更好的图像编码方法,希望能超越通用的JPEG标准。

Berkes表示:“AI与传统编码相比的一个重要优势在于,他们可以聚焦于具体的内容子集,例如自然风光纪录片等。AI可以训练出一个适用于某种具体内容的压缩模型,可以节省更多带宽。

后期植入广告

随着数字视频录制和点播视频的普及,广告商开始面临一些新的问题。用户可能会跳过他们投放的广告或者忽视传统的在线广告。植入广告会成为一个新的解决方案。但这同时也是一场赌博,万一相关场景被剪掉了呢?或者广告并没有以广告商喜欢的形式出现呢?

伦敦的MirriAd公司研发了一项通过后期制作将品牌实时置入视频的技术,并使用了人口统计数据来确定目标。该技术包含一个可以识别视频中具体区域光照特点的平面追踪器,并能根据光照环境将物体置入图像之中。例如,饮料可以出现在冰箱中。三星就在优酷一部55集的剧集中使用了这一技术,进行了家电的广告植入。

MirriAd的广告植入技术
但是,如果系统出错了……

去年,微软在Twitter上训练其聊天机器人Tay,但Tay发出了有关种族歧视和性别歧视的言论,造成了灾难性的后果。这说明,AI系统是否机灵和友善与你使用的训练数据有关,否则,它很可能成为客户关系的噩梦。

因此,今年年初,特斯拉CEO伊隆·马斯克、Facebook的人工智能研究主管YannLeCun等2000人共同签署了“阿西洛马人工智能23条准则”,最终目的是保护人类免受AI伤害。

这些准则涉及了一些AI伦理,包括避免“致命的自动化武器军备竞赛”等。

此外,还有一些比较日常化的准则,如第12条规定:“鉴于AI系统可以分析和使用人类产生的数据,人类应当拥有接入、管理并控制这些数据的权利。”
相关阅读:

《为什么说混合现实是沉浸式广播的未来?》

《Channel 4的个性化广告可以直接叫出你的名字》

《Sky在VR节目中加入3D全息主持人》

关注我们,获取更多资讯
(长按识别图中二维码)


    关注 未来媒体网络


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册