视觉识别,比我们想象得要美

 

日前,由黄晓明、李冰冰、任泉、章子怡、黄渤联合创办的StarVC宣布,投资人工智能领域的领先企业Sense...



日前,由黄晓明、李冰冰、任泉、章子怡、黄渤联合创办的Star VC宣布,投资人工智能领域的领先企业SenseTime(商汤科技)除此之外两方还将在垂直领域对科技创新人员与科技创新企业的培养及扶持计划,携手打造科技产业孵化体系未来科技研究中心。

商汤科技这个拥有远古风名字的企业,深耕计算机视觉技术,这是人工智能中的一个分支,要搞清楚计算机视觉的意义与用途,还需要从人工智能本身说起。今年是人工智能概念面世60周年,虽然人工智能发展速度很快,普通人却难得一用,但这一概念背后所代表的科技进步力量及应用前景,值得人类再奋斗60年去将其实现。AlphGo与李世石的世纪大战,将人们想象的空间打开,以往只存在于科幻电影中的人工智能,从没有像今天一样离我们的实际生活如此之近。

人工智能是一个广泛交叉的前沿学科,除了要用机器模拟人的智能外,还要模拟人的语言,模拟人的视觉系统,模拟专家知识系统等。如果说AlphaGo模拟的是人的大脑,语音识别模拟的就是人的耳朵,计算机视觉模拟的是人的眼睛,而这所有的一切,都是与智力水平联系在一起的。

计算系统对万物的识别,在实现难度上并不亚于人工智能大脑,一幅图片和一个视觉影像中,有太多非结构化信息,人脑可以在信息位置散乱的状况下很轻易地识别出图像中的细节信息。例如,把梵高的星空和自画像放在一起,人眼获取信息后,并不难从夸张的线条中判断两者之间存在着某种关联,而在机器这里,目前的技术水平对此是无能为力的,机器只会判断这是两张毫无关联的图画而已,因为图画中的所有信息,都是非结构化的。

 
百度和谷歌除了研发各自的“大脑”外,也都致力于在计算机视觉技术的研发。两者的视觉识别技术,都已发展到了能够判断一张类似“春日的一个下午,阳光照进房间投在床上”这样的图画,也可以通过让机器进行深度学习而使其辨认出图画中的一条狗,不管是柯基还是拉布拉多。这虽然是很令人振奋的技术成就,但与之后仍要继续攻克的难关相比,这简直是微不足道的一点点进步而已。

近期虚拟现实VR的风头,已取代了前期大热的AlphaGo,成为科技界极为关注的一个领域。但事实上,VR的极致体验正是在于机器对于表情的捕捉和识别。终极的VR世界是不需要操纵装置的,仅凭语音、面部表情甚至一个眼神,就能将人从一个虚拟世界,运送到另一个虚拟世界。而这里面涉及到的主要技术,正是计算机视觉,也就是商汤科技所做的事情。

众明星云集的Star VC选择商汤科技作为投资目标,意味着人工智能的视觉识别技术在娱乐行业的前景受到认可,投资人愿意为这项技术的发展出资助力。同时也表明,商汤科技在技术上的实力与积累也是得到肯定的。



计算机视觉有极为广泛的应用范围,最简单的如人脸识别门禁,人脸识别付款,摄像自动捕捉面部对焦等。在未来的智慧城市中,该技术更是可以应用在智能交通、气象监测等对国计民生有极大帮助的领域。但这么广的应用范围,并不是可以一蹴而就的,技术上的障碍非常大,人工智能需要长时间的积累才能最终发挥作用,而这个积累的过程中,更是需要有人不断地创造和应用最新的技术。

可惜的是,目前国内不乏选择人工智能中的语音和自然语义方向进行研发的,也有少数实力强大的企业选择人工智能大脑作为突破方向,但缺乏计算机视觉研发公司。这是个技术壁垒非常高的技术方向,且需要忍受长时间无法开发商业价值的状况。根本上来说,只要在技术上能够不断进步,就已是很不错的了,根本没办法去多想商业化的事情。

AlphaGo的缔造者DeepMind公司,在被谷歌收购之前没有任何业务,甚至连产品也没有,只有一些研发力量。但全球在该领域称得上专家的不过50人,DeepMind却占了12个,谷歌收购的并不是公司,也非产品,而是该领域的高端人才。在这此收购之后,才有了具体的产品AlphaGo,但这款产品目前为止仍无法产生商业效益。

虽然计算机视觉只是人工智能的一个分支,但其涵盖的技术范围也是非常之广,需要一些更垂直的方向出现。国内目前已有一些同领域的公司出现,有专注于做图像识别的,还有专注于做人脸识别的,研发方向非常垂直。但人工智能这种广泛交叉的前沿科学,并不是一两家公司可以做成的,需要有无数个小公司不断进行创造和创新,以丰富和完整整个人工智能应用研究体系。

商汤科技的团队有较强的学术背景,200人的团队中有50多名博士任全职工作,不少人来自于斯坦福、MIT、香港大学和清华大学等国际名校,也有来自BAT和谷歌、微软等国际大公司的产业人才。该公司正在尽力延揽深度学习和计算机视觉领域的专家,而这是技术发展最关键的。

该公司在人脸识别、物体识别、图像搜索、图像处理、智能监控等多个领域有很强技术积累,专注于开发自己的人工智能引擎,而这些技术成果可以通过SDK和API的方式开放出去,让开发者和企业用户使用。其中有很多技术可以用来解决实际问题,在应用上拥有广泛的前景。不过,这本质上还是一家以研发为主的技术公司。

计算机视觉的商业价值是不需多言的,简单的门禁自不必说,支付和银行证券开户也少不了要用到这一技术,未来的网络征信中也会将其引入。主打社交金融的互联网金融公司借贷宝,在肖像认证识别方面,使用的就是商汤科技的原创技术。

计算机视觉这种商业上的巨大前景,使得投资者对其兴趣盎然的同时,市场活力也得到了激发。随着该领域的商业价值逐渐显现,参与其中的公司也会越来越多,这个领域将会出现更多创新和进步,而这对于人工智能的整体发展而言是加分的。一个产业,正是在一个个活跃分子的作用下,最终发展成熟的。


    关注 葛甲


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册