商汤科技徐冰:人工智能带来效率提升,未来会以指数级增长

[ 导读 ] 2014年我们迎来了又一次人工智能的升温,而到2016年底这样的时间,也是让整个人工智能行业回归本质的时间,回归商业的本质。到底人工智能现在是用多少成本创造了多少商业价值?能真正做到多少行业应用?

12月23日上午,由产业创新服务平台主办,嗖嗖身边协办的2016创新者年会暨第二届创新奖颁奖盛典在北京四季酒店盛大开幕,本次大会以“新科技赋予产业新动能”为主题,大会邀请了百余名新资本、新理念、新技术优秀企业代表及行业顶级投资机构创始人。

出席此次大会的嘉宾有:董事合伙人李双;峰瑞资本创始合伙人李丰;盈动资本创始合伙人项建标;昆仲资本创始合伙人姚海波;GGV合伙人、源星资本创始人及管理合伙人于立峰;火山石资本创始合伙人章苏阳;英诺天使基金创始合伙人林森;华创资本合伙人熊伟铭;明势资本合伙人曾颖哲等12位投资大佬和11位知名企业代表联袂出席。

本次大会到场观众累计超过1000人次,70%为互联网创业公司和传统中小企业高管,10%为各大资本的投资人士,到场媒体超过100家。

商汤科技联合创始人徐冰在本次大会上做了精彩分享,以下是演讲核心内容:

1、这一次的人工之智能风潮与之前不同,它真正带来了效率的提升,因此看得到未来人工智能呈指数的上升趋势。

2、现在的人工智能主要是基于深度学习算法,短期还不能解决大而全的事,更多应该从解决每个细分领域的实际问题入手。

3、要思考人工智能的商业模式,要先了解其成本,主要分为三方面:基础设施(深度学习框架、算法平台)的成本,GPU超算硬件的成本,数据的成本。

4、人工智能的商业价值来自于其对于效率的提升,人力成本的降低,以及消费升级和商业升级中带来的消费体验升级。

5、人工智能可以对很多行业进行颠覆,目前一些人工智能公司已经通过出售技术接口、解决方案、平台服务的形式进行商业探索,未来还会有更多的商业模式出现。

首先要感谢主办方的邀请,因为现在是个非常好的时间。在2014年人工智能开始火起来,而到2016年底这样的时间,也是我们让整个行业回归本质的时间,回归商业的本质。到底人工智能现在是用多少成本创造了多少商业价值?做到多少真正的行业应用?这是我今天想跟大家分享的主题。

刚刚主持人也介绍商汤做了新一轮融资,为什么商汤在这个时间上,在2016年年底比较适合做行业的总结?现在这个阶段一定程度上相当于对2012年、2013年讲深度学习人工智能对整个行业技术上的提升对行业前景的颠覆,单纯讲技术不行,大家都开始讲跟我们同样的逻辑。大数据计算能力的提升,同时深度学习算法的突破,带来人工智能大量工具性产品的成熟。这些产品一定程度上其实开始创造大量的商业价值。

在这个阶段我们毕竟有两年多真正在商业层面拓展的经验,其实我今天讲的主要的重点也是在商业这个点上,而不再在技术这个点上。

单纯看人工智能,从定义上来说,从1956年这个概念被提出,到现在没有变过。本质上是机器能够学习某一种技能,像人一样做事情,一定程度上解放劳动力、提高生产力。这样一个概念,我们想如果它真的被实现,它面临的市场前景是无穷的,它代表下一代的工业革命,我们看到当蒸汽机被发明时,无数行业被颠覆,不管运输、还是纺织,都真正创造了极大的生产价值。

有一句老话说“科学技术是第一生产力”,概念从一开始没变过,我们做的事情也是一样,那就是如何用人工智能这样一项技术,把它真正转换成生产力,最终这个生产力等效于某一种商业价值。因此如何把这个生产力转换成商业价值,就是商业模式的问题。

到现在人工智能是三起两落,在过程中从1956年被提出,有两波大家预期被拉高,实际上它还未成熟,技术并不好使。买了人工智能技术的商家,真正用起来时,发现这个技术不成熟,没有帮我提高效率,机器做这个事的能力比人差很远,第二年就不会买它了,跟周围的人不会推荐它,这是以前两落的核心原因。

当我们看到深度学习出现之后,在这两年为什么从2014年概念火起来,到现在没有降过温,很多人问会不会未来人工智能这个概念也会降温下去?我们的角度上作为技术的提供方、能力的赋能者,不好非常主观说这件事情。更多还是一样客户角度客观地评价这件事情。现在买成熟人工智能算法的客户,可以问他们,他们反馈说这些技术真的好用,一定程度节省了人力成本,提高了效率,在安全上、用户体验上带来不一样新的点,这些点是新的增长点,对业绩有新的提升,对利润有提升。

这样在客户端反馈的改变之下,我们看得到未来人工智能的上升趋势,是会呈指数上升。

本质上这项技术到底是怎么回事呢?一句话讲,深度学习在用数学模拟人脑的结构,让这样一个计算机程序能模拟人脑神经信号在这里面传输的过程,最终像人在特定技能上做一些判断,包括预测、识别这样实际的应用。

在2016年年初,阿尔法狗这样的一件事,也让很多人醒悟,在围棋这样一件非常复杂的事情上面,机器可以做得比人好,是不是在比围棋更简单的技能任务上机器也能超过人?这里想象空间非常巨大。

人工智能从传统人手设计的智能、专家系统方向的智能,现在变成数据驱动的智能,本质上极大降低开发一套人工智能系统的成本。深度学习平台之下,开发特定行业特定需求的AI系统,是要打通数据获取层面的壁垒或成本,这个成本或壁垒可以比较方便地通过跟行业里的领军企业合作获取。

这些传统的领军企业,不具备的能力,就是在算法上的能力,其实我们可以通过比较开放的合作态度,向他们换取数据。在这样一个成本解决的问题之下,传统来看做一套AI系统可能需要试错很多年,去踩坑,找到真正管用的规律才能把这套系统做好。

在传统的人工智能时代,很少出现很成功的公司,大部分技术都是不成熟的,因为还没有试错到非常好用的规律,人手设计很难让技术成熟超过人。而现在的人工智能,本质上是机器从数据里自动归纳规律,把这件事情真正做好。

深度学习已经带来大量算法上面的突破和成熟。其实围棋只是其中一项。这些方面是单个技能上的成熟,做人工智能很难说做大而全的东西,很难说做全能的AI解决各种各样问题,比如造一个机器人,从短期来看很难像家庭保姆一样去Care你的生活。人工智能短期来看一定不会是全能AI一下抢占市场,我们看得到深度学习带来各项技能的突破,现在发现是农村包围城市的局面。在这样一些特定行业的痛点需求,解决人力成本的痛点需求上,一旦做到一套系统比人做得好,这样一件事情面对的商业群体就非常巨大。在微小各个行业里的点上,带来的都是非常庞大的机会。

对于商汤来说,我们背景很简单,是一支学术团队,最早在2011年做深度学习研究。2014年谷歌花6.6亿美金收购DeepMind这样一支12人研究团队的新闻,也触动了IDG资本2014年对我们进行早期A轮投资。我们这支团队也是因为凭借早期深度学习的深刻积累,在2014年获取了在数项应用技术的突破,所以创立了商汤这家公司。后来在今年我们进行了鼎晖领投的B轮投资。

现在我们看得到深度学习是平台型的存在,我们用两年时间在基础设施建设上投入非常大的人力及财力成本。建设了专门用于做深度学习的GPU超算集群,获取了行业最大的数据量,同时聚集全亚洲最大的深度学习研究团队。超过100名教授、博士,有人说商汤是研究院都是博士教授做科研,这个说法不对,商汤是非常赚钱的研究院。

真正我们看到的,在短短的2015年、2016年商业拓展过程中,我们用30人的商业拓展团队获取了200家签约客户。其中不乏一些非常庞大的巨头,用它线下的资源,用它集团层全行业的资源,去跟商汤做一个非常深刻的合作。

AI这件事情的发生,很难由一个创业公司去带动整个行业发生的,我们实际上是专注在算法上的引擎。在各个行业里面,不做大而全的事情,而是以一个开放的态度去跟这些伙伴合作,跟各行业的巨头共同推动AI时代的到来。

我们讲回归商业的本质是两件事:一个是成本,另外一个是商业收益、商业落地,具体实现价值。在成本上,我们一直探讨深度学习,它带来人工智能技术的成熟。有没有人思考过,做深度学习到底要花多少成本?这里我就讲,根据过往的经验和实际技术上的探索,

深度学习主要分三方面的成本,算法研发、超算建设、和数据获取。

在面对崭新行业时,可以想想人工智能,像十年前互联网一样,十年内互联网建立非常多基础设施,面对崭新的人工智能行业,也有非常多基础设施建设的需求。

深度学习框架就是人工智能行业做算法创新的基础设施这样一项东西,在这个上,Major player都是非常强大的科技巨头及领先的算法团队,大部分的企业,包括很多这几年出现的创业公司,现在仅仅能依赖于大型的企业所开放出来的深度学习框架做初阶算法层面的应用。其实基于开源框架的初阶算法本身也是有价值,为什么这么说呢?因为深度学习这样一个框架之下的初阶算法,已经比传统算法好很多了。在这样一些层面之下,我们看到大家在各个点上都在去探索。

但基于开源框架的这些平台有各方面的问题。开源出来的往往是低配版本,这是显而易见的。另外还有长期技术受制问题,很多中国公司,都是依赖于国外的开源平台,一定程度上相当于当时Windows操作系统发明出来,国外操作系统专家是手写操作系统的人,国内的操作专家是教大家怎么用。这是本质区别,长期依赖于开源是技术受制于人的局面。此外,开源技术平台开源出来的技术模块,很多有知产的问题,License Agreement规定了技术不能用于商业用途。

深度学习这件事情带来AI极大成熟和突破,我们看得到它的算法在高速发展。作为一家深度学习为核心竞争力的公司,要保持在行业里面第一梯队,在技术无国界的前提下,一定在世界层面上是在跟顶尖的公司PK,和顶尖公司要走在同一个阵营上。

在大规模视觉识别竞赛,30多支国际上领先的科研团队比拼,算法成熟飞速进展,这是以往看不到的。在2011年之前很多算法很多一年只能提升一个点的精度,从2014年到2016年,单纯200类物体检测问题上提升20%的精度。目前大家是以原创和创新的态度在这上面持续做出突破。而商汤也凭借自主研发的框架平台一致保持全球层面的算法领先。

第二块就是超算,计算能力非常关键。超算在这块解决的是算法上大量研发需求的问题。这张是介绍北京商汤的超算集群,一共有三个集群在这里,大概有1000多块GPU卡相连,每个集群是上千万人民币的投入。这些是做深度学习需负担的基础成本。

第三块是数据。数据基本需要在数据的获取及数据结构化标注上投入极大的资源。

有了这三方面的成本概念之后,其实你会发现这个成本是可以共用的。当你成本一次性支出完之后,把你的AI技术应用到各个行业时,讲一个很好的比喻像抓中药一样,有这样深度学习的基础设施平台,在这个平台之上开发出来大量的能够逼近人能力细分的技能和应用,再深入到每一个行业真正做商业化落地时,就是把成熟的技术模块做组合。做组合之后再针对另外一个行业,就像抓另外一幅中药一样,针对它找到技术需求,找到解决方案,真正提高效率。

现在我们讲完成本,再看看它的商业价值。深度学习带来的在这样一个平台基础之上,去开发任何针对不同行业的AI系统时它的成本共用,它本质上是有平台性的作用。我们用这样一个平台真正做了哪些商业上的落地,以及商业上的成绩?它真正在哪些地方,真正提高了效率?效率最终转化出来就是一个商业价值。

像这样一款产品叫视频结构化分析平台,它所做的,把城市里面的摄像头拍摄到的数据进行全自动化的结构化。在视频结构化提取这样一些人、车、非机动车属性的基础需求上,它就像存储一样是一项监控里的基础需求。而存下来的东西过往都是死的,都是需要人去理解需要人去看的。

现在实时拍摄这些东西的过程中,机器自己可以做一些初步理解,然后把理解到的相应物体标签全部存取下来。这件事情在深度学习出现之前是完全不可做的,这里有两个非常核心的技术难点,第一项是多目标的检测和追踪,这件事在情深度学习出现之前精度低到没人愿意去用。另外针对人、车和非机动车这三项关键物体,在属性标签上的识别。

这两项技术上由深度学习带来的成熟,解决了两块问题。第一是存储问题,全中国有一半的硬盘都是用来存监控录像的,本身监控录像一般存7-14天,这消耗极大的存储空间。第二公安破案或发现异常情况时可以做视频内容检索,这里如果没有检索只用人来看,就会消耗大量的警力成本。这套产品在成本降低和效率提升上,带来的效率非常巨大。

另外一项也是解决大家切身的安全问题。就是人脸识别抓捕嫌犯,在一个场景之下,机器可以抓取这些人,并且跟黑名单做实时的比对和报警。这样一套系统在重庆一个区使用半年的时间,帮助公安抓捕120多个犯罪嫌疑人。公安反馈破案效率提高200多倍。效率提升带来的就是人力成本消耗上面的降低。

安防这个行业,AI创造了非常大的效率提升。而在互联网身份认证上也有用AI提高效率的点,这是银行和互联网金融上一个普遍的需求,它需要对这个用户进行身份的识别。因为你在真正借钱给一个人,或给他开户之前要知道他的身份。凭借人脸识别和文字识别两项AI识别技术,我们已经识别认证了3亿到4亿的用户,首先我们服务的借贷宝完成1亿人的身份认证,这家公司在一年之内用户量增长了1个亿。

另外一家公司中国移动,它今年完成3亿人的身份实名,完成3亿张未实名手机卡的认证。还有乐视手机中增添这样一项功能,用户通过刷脸直接登陆。

在第三点商业价值上,有一件事情叫商业升级或消费升级,它在做的一件事情一定程度上是说获取、捕获线下的消费信息,并且提取到线上来进行分析,最终能进一步优化线下的消费行为。如何获取线下的消费信息是关键的壁垒。这个上面一套识别系统可以通过对人群、人流以及人的分析,识别出来是什么样的人,什么年龄段的人,男人、女人,在什么区域停留多长时间,包括是否对你的产品感兴趣。然后在提高线下营销转化率上起到了非常大的作用。

AI这件事情一方面提高效率,一方面提高体验。在提高体验上真正做了哪些事?比如我们经常看到拍照的东西,手一抖,监控摄像头风一吹抖一下拍到都是糊的,糊的东西没办法做识别,这是深度学习的过程,学习出来模糊照片不模糊照片之间的关系;包括拍到照片非常暗,有一定算法可以恢复;在超分辨率上,过往十几年这项技术未解决、突破,很消耗计算能力,而现在可以在720P视频上进行实时超分辨率的处理。这些本质上是技术端带来的突破,进而在商业应用上带来新的商机。

包括现在看到一项非常火的未来手机的功能,也大量被手机公司采购,就是单反拍照效果。今年苹果iPhone7 Plus已经推出这项功能,中国很多手机厂商已经把这项功能加到自己手机里边,可以做到在强算法处理之下,做出普通手机拍到单反拍照的效果。

甚至现在深度学习可以学习画家的风格,画家是有创意的,画家创造完的东西,可以学习得到这样的风格,就像画家一样作出这些画作。

还有智能相册。深度学习让机器有一个理解能力,它现在开始理解用户的这些照片,理解你拍到的照片和视频里的内容,最终让内容进行自动分类。比如小米的相册、华为的相册及微博相册已经全部上线这个功能。

增强现实也是个非常热门的主题。今年大量直播公司,现在都能把这些主播的真实生活很快带到大家现实生活去,真实场景的识别进行虚拟特效的增强,变成主播和用户互动非常有趣的点。像商汤已经支持了基本全部这些直播平台,做到类似虚拟增强现实的一些特效。

深度学习带来非常多的行业颠覆。商汤也是行业中融资额最大的一家公司,同时也是商业化从实际的收入数字和订单量上最大的一家公司。本质上我们创造的技术解决了一些非常具有颠覆性行业影响的一些点,比如无人驾驶、比如基于人机交互的手势识别、关键点识别,机器人能够有一个机会理解你的姿态跟你交互。比如遥感领域的图像解析,能将整个行业遥感标注人员劳力全部解放出来,机器可以代替人做遥感城市数据、农村数据的理解。

人工智能本质上可以提高效率,在人口红利大幅下降的情况下,能够接下来保持生产力的持续增长。我们看得到,它的商业模式可能也是比较特殊的。一定程度上,现有比较成熟的商业模式,无非是提供SaaS,售卖SDK,售卖这些软件的License,做到芯片里面以芯片的License方式去收费。以及做到服务器端提供一套完整的解决方案,以一个标准化产品的方式来收费。这些是大家探索得比较成熟的商业模式,真正具有算法能力的公司,在这些商业模式上已经获得比较不错的回报。

我们看到人工智能产生的机会商机远远不止如此,我们看到有些客户在用AI技术之前、之后,它的毛利是有直接的改善和提升的。因为有一些实际的传统企业,是做大量的密集劳动力性质重复性的事情。在这样一些事情上,商汤有这样一套深度学习平台,可以用非常有限的成本,在短期之内开发出一套逼近人能力的AI系统,可以一定程度上把原来1000个人做的事情减低到可以100个人,剩下900个人简单的Case完全可以由人工智能来做。带来毛利的提升。

这样的提升是非常绝佳的投资机会。真正在用技术改变传统行业的成本结构之前,如果可以已经预知到,就已经可以用技术验证它在算法上的能力,能够带来效益上的提升及毛利的提升,可以以100%成功的概率投资这家企业,并且一定程度上获取它的股权。

甚至直接控股它,它提升1000万、1亿的利润直接可以反映在商业报表里。在投资这件事情来说,看得到投资或资本运作一定会未来成为人工智能行业商业模式中的一部分。这部分要远远比卖SDK卖SaaS服务带来商业收益大得多,因为这个里面一定上是成本定价、效益定价,整个的定价模式会直接反映在你最终的生意上。