深度学习是什么2019iyiou

2019-05-14 19:46:08 来源: 恩施信息港

【编者按】人工智能的技术算法不同的场景有不同的应用,所有的技术支撑,都是在为机器能够有“自我学习”的能力,而算法需要大量的数据来实现训练,提高准确度。今天,亿欧整合了多篇文章来介绍“深度学习”。

本文来源于盛盛GO,作者傅盛,由亿欧整理,供业内人士参考。

▌深度学习是什么?

人工智能,就好像第四次工业革命,正从学术界的私藏,转变为一种能够改变世界的力量。尤其,以深度学习取得的进步为显著标志。它让匍匐前进60年的人工智能一鸣惊人。

我们正降落到一片新大陆。深度学习带来的这场重大技术革命,有可能颠覆过去20年互联对技术的认知,实现技术体验的跨越式发展。

那么,深度学习到底是什么?怎么理解它的重要性?

我们先从概念和现象入手。

我总结了一句话,学术上看未必严谨,但从我的理解角度看——深度学习是基于多层神经络的,海量数据为输入的,规则自学习方法。

这里包含了几个关键词:个关键词叫多层神经络。

深度学习所基于的多层神经络并非新鲜事物,甚至在80年代被认为没前途。但近年来,科学家们对多层神经络的不断算法优化,使它出现了突破性的进展。

以往很多算法是线性的。而这世界上大多数事情的特征是复杂非线性的。比如猫的图像中,就包含了颜色、形态、五官、光线等各种信息。深度学习的关键就是通过多层非线性映射将这些因素成功分开。

那为什么要深呢?多层神经络比浅层的好处在哪儿呢?

简单说,就是可以减少参数。因为它重复利用中间层的计算单元。我们还是以认猫为例好了。它可以学习猫的分层特征:层从原始像素开始学习,刻画局部的边缘和纹;中层把各种边缘进行组合,描述不同类型的猫的器官;层描述的是整个猫的全局特征。

它需要超强的计算能力,同时还不断有海量数据的输入。特别是在信息表示和特征设计方面,过去大量依赖人工,严重影响有效性和通用性。深度学习则彻底颠覆了“人造特征”的范式,开启了数据驱动的“表示学习”范式——由数据自提取特征,计算机自己发现规则,进行自学习。

你可以理解为——过去,人们对经验的利用,靠人类自己完成。在深度学习呢?经验,以数据形式存在。因此,深度学习,就是关于在计算机上从数据中产生模型的算法,即深度学习算法。

问题来了,几年前讲大数据,以及各种算法,与深度学习有什么区别呢?

过去的算法模式,数学上叫线性,x和y的关系是对应的,它是一种函数体现的映射。但这种算法在海量数据面前遇到了瓶颈。国际上的ImagineNet图像分类大赛,用传统算法,识别错误率一直降不下去,上深度学习后,错误率大幅降低。在2010年,获胜的系统只能正确标记72%的图片;到2012年,多伦多大学的 Geoff Hiton利用深度学习的新技术,带领团队实现了85%的准确率。2015年的ImagineNet竞赛上,一个深度学习系统以96%的准确率次超过了人类(人类平均有95%的准确率)。

计算机认图的能力,已经超过了人。尤其图像和语音等复杂应用,深度学习技术取得了优越的性能。为什么呢?其实就是思路的革新。

举几个脑洞大开的例子。

1、先说计算机认猫。

我们通常能用很多属性描述一个事物。其中有些属性可能很关键,很有用,另一些属性可能没什么用。我们就将属性被称为特征。特征辨识,就是一个数据处理的过程。

传统算法认猫,也是标注各种特征去认。就是大眼睛,有胡子,有花纹。但这种特征写着写着,有的猫和老虎就分不出来,狗和猫也分不出来。这种方法叫——人制定规则,机器学习这种规则。

深度学习方法怎么办呢?直接给你百万张图片,说这里有猫,再给你上百万张图,说这里没猫。然后再训练一个深度络,通过深度学习自己去学猫的特征,计算机就知道了,谁是猫。

2、谷歌训练机械手抓取。

传统方法肯定是看到那里有个机械手,就写好函数,move到xyz标注的空间点,利用程序实现一次抓取。

而谷歌现在用机器人训练一个深度神经络,帮助机器人根据摄像头输入和电机命令,预测抓取的结果。简单说,就是训练机器人的手眼协调。机器人会观测自己的机械臂,实时纠正抓取运动。

所有行为都从学习中自然浮现,而不是依靠传统的系统程序。

为了加快学习进程,谷歌用了14个机械手同时工作,在将近3000小时的训练,相当于80万次抓取尝试后,开始看到智能反应行为的出现。据公开资料,没有训练的机械手,前30次抓取失败率为34%,而训练后,失败率降低到18%。

这就是一个自我学习的过程。

3、有人问了,深度学习,能学习写文章吗?

来看这个例子。斯坦福大学的计算机博士andrej kapathy曾用托尔斯泰的小说《战争与和平》来训练神经络。每训练100个回合,就叫它写文章。100个回合后,机器知道要空格,但仍然有乱码。500个回合后,能正确拼写一些短单词。1200个回合后,有标点符号和长单词。2000个回合后,已经可以正确拼写更复杂的语句。

整个演化过程是个什么情况呢?

以前我们写文章,只要告诉主谓宾。而以上过程,完全没人告诉机器语法规则。甚至,连标点和字母区别都不用告诉它。不告诉机器任何程序。只是不停将原始数据进行训练,一层一层训练,输出结果——就是一个个看得懂的语句。

一切看起来都很有趣。人工智能与深度学习的美妙之处,也正在于此。

4、我还去硅谷看过一家公司——完全颠覆以往的算法,利用深度学习实现图像深度信息的采集。

众所周知,市面上已经有无人机,可实现人的跟踪。它的方法是什么呢?一个人,在图像系统里,一堆色块的组合。通过人工的方式进行特征选择,比如颜色特征,梯度特征。拿简单的颜色特征举例:比如你穿着绿色衣服,突然走进草丛,就可能跟丢。或,他脱了件衣服,几个人很相近,也容易跟丢。

此时,若想在这个基础上继续优化,将颜色特征进行某些调整,是非常困难的。而且调整后,还会存在对过去某些状况不适用的问题。

总之,这样的算法需要不停迭代,迭代又会影响前面的效果。

而硅谷这个团队,利用深度学习,把所有人脑袋做出来,只区分好前景和背景。区分之后,背景全部用数学方式随意填充,再不断生产大量背景数据,进行自学习。只要把前景学习出来就行。

据我所知,很多传统方法,还在采用双目视觉。用计算机去做局部匹配,再根据双目测出的两个匹配的差距,去推算空间另一个点和它的三角位置,从而判断离你多远。可想而知,深度学习的出现,使得很多公司辛苦积累的软件算法直接作废了。

“算法为核心竞争力”,正在转变为,“数据为核心竞争力”。技术人员必须进入新的起跑线。

5、再举个例子

大家都做过胃镜。尤其胃痛,很痛苦。肠胃镜要分开做,而且小肠看不见。

有一家公司出了一种胶囊摄像头。吃进去后,在你的消化道,每5秒拍一幅图,连续摄像,此后再排出胶囊。所有关于肠道胃部的问题,全部完整记录。但医生光把那个图看完,就需要五个小时。原本的机器主动检测漏检率高,要医生复查。

后来,他们采用深度学习。采集8000多例图片数据灌进去,用机器不断学,不仅提高诊断精确率,减少了医生的漏诊,以及对稀缺好医生的经验依赖。只需要靠机器自己去学习规则。

深度学习算法,可以帮助医生作出决策。

思考:了解完深度学习,接着思考一个问题——20世纪70年代末80年代初,个人电脑突飞猛进时,人工智能的商业化却步履维艰。乔布斯曾这样定义个人计算机的价值——“它是我们思维的自行车”。那么,今天的人工智能呢?深度学习呢?它给我们真正带来的东西是什么?未来,对行业和社会有什么影响?中国公司的机会在哪?

▌深度学习是一种新的思维方式

落后怕的是思维方式的落后。

过去猎豹在安全和工具层面,抓住了上一个时代的大风口。如今这条赛道不再像以前那样野蛮生长。互联已经进入下半场,广度红利时代结束。原先粗放式的流量经营模式遭遇瓶颈,用户增长受限,且再难出现爆发性机会。下一个机会点在哪?

我讲过,人工智能会是下一个风口。

但,首先我们必须认识到——人工智能一定不是简单的一个神经络,也不是用一个新的函数替代一个旧的函数。人工智能是对整个产业的重构,是对我们整个思维方法的重新塑造。它将现实所有物理事件产生的东西归结于一个点——数据。然后,再把这个数据,用神经络的方式去认知和理解,达到过去所有算法无法企及的高度。

而深度学习,无疑成为当今人工智能大爆炸的核心驱动。它不只是一种算法的升级,而是一种全新的思维模式。

今天,我们完全可以利用深度学习,利用海量数据的快速运算,消除信息的不确定性,帮助我们认知世界。

这种认知的可能性,广为人知的就是AlphaGo打败李世石。我说过,现象即规律。这个现象给我的启示就是——把过去围棋的定式算法问题,转换成了黑白点的数据问题。它利用神经络超大规模的数据处理能力,去理解人类记录过的围棋数据,以及自己左右互搏产生的海量数据,在人类也不明白的情况下,一举碾压了人族。

它带来的颠覆性在于:将人类过去痴迷的算法问题,变成了数据和计算问题。

我认为,这是重构技术模式,产品形态,用户理解的新方式。深度学习的突飞猛进,也将使得猎豹这样的工具厂商,有机会与社交产品站在同一维度同台竞争。

需要思考的是:如何让用户成为一种生产力?

比如,你觉得特斯拉是汽车生产商吗?如果你重新换个角度,会发现特斯拉本质是一个数据采集器。它利用汽车载体实现了对人类驾驶行为的触达。

我买的特斯拉P90D,已经可以自主学习变道。它会多次来回试探,学习你开车的动作。你每一次开车,都是在给它贡献数据。它跟谷歌的无人驾驶有很大不同。他们走了完全不一样的路线,思维角度也不一样。

谷歌是传统的软件工程思维。用高精尖地图,把一段路的地图精确到厘米级,以便车子开的过程中就知道路况,通过激光来避开路面障碍。但问题在于,这套方案,只有知道地图和路况不发生改变时才能运行。

但特斯拉用的是NVIDIA+Mobileye的方案,跟人开车的状态一样。它认为,辅助驾驶到了一定程度就是实现无人驾驶。只要收集大量的驾驶数据做处理。不用管地图,用产品就能实现数据收集。实际上,就是把所有路况信息和人的操作动作数据化。

我认为,未来的公司本质都是数据公司。市场的竞争,一定会从技术竞争演变成数据竞争。

各公司的商业策略和产品策略,都会围绕着获取数据开展。后进的公司要想不坐以待毙,的办法就是快速获得数据。

深度学习绝不只是一场技术革命,或一种算法的改良。本质上,它是一种全新的理解用户和商业模式的思维方式。

▌变一切问题为数据问题

过去半个世纪,计算机也在进步,上一次震惊,发生在超级计算机深蓝打败人类的国际象棋。但,深蓝也只是依靠计算机强大的穷举能力,还不能像人那样思考。然而,当数据量足够大,运算速度的指数级提升,深度学习让机器有了人类的直觉,再一次震惊发生了:AlphaGo打败了世界围棋李世石。这标志着一个时代的终结和一个时代的开始。

它启示了我们:数据量的与日俱增,量变积累导致的质变,让机器变得更加智能。相应的,我们的思维方式和做事方式,都应该跟以往有很大不同。

今天,所有问题,我们只要换个思路就可以找到正确答案,其核心就是——变一切问题为数据问题。

1、从数据的维度看产品,就会变得不一样

按照我们以前的视角看,没有一千万用户的产品,都不值得做。但今天看,一百用户产品,如果用户在里面频繁交易,甚至比一千万用户产生的价值还要大。

怎么理解呢?就是说,从数据的角度看,小规模产品依然有价值。

当然,数据也分强数据。什么叫强数据?比如淘宝的数据就是强数据。它的用户上来就花一千块钱买一个东西,跟你在App右上角点击一下的数据,肯定不可同日而语。

换句话说,如果你有强数据的产品,即使用户量很小,它也可能产生很大的价值。比如,猎豹以前做了一个购保镖,一年差不多赔70多万,后来大家觉得太耗成本,就想关掉。如果换个角度,开购保镖的人,都是上花钱的人,这个数据价值是不是远高于70万?当你这样去想的时候,你再看一百万用户的小产品,是不是就变得有价值?

如此一来,我们通过深度运营小规模用户,重新挖掘出了数据价值。与此同时,我们还可以再做一些功能区分去引导用户。

只是,思路要变了。

我提出一句话叫——功能运营转向数据运营。不管你做交互也好,功能也好,做一个App亮点也好,在今天这个广度红利结束的时代,已经没有深入的机会。

任何一个产品经理来跟我交谈,我一定不要听他说,有什么不一样的点,或哪个功能点做得怎么样。为什么?,好的功能点,大家都想得差不多了。第二,即便你有好的功能点,对手跟进会非常之快。你很难做到。第三,如果你能把数据这件事想透,今天具备数据挖掘,具备深度学习能力的公司,尤其中小公司,还是非常少的。那么在这个点花功夫,是不是会事半功倍?且对手很难跟进,壁垒还足够高。

同理,不思考数据的产品经理必将被淘汰。

产品经理不理解数据,产品经理就只承载了交互。交互只是基础,就像汽车轮子。要想真正做到独步天下,还需要去思考数据。如果你不去思考你的产品数据,不去理解数据价值,不透过数据去理解用户,不去做用户画像细分,一定会被淘汰。

2、放弃野蛮增长的期待,信奉数据主义

近,我在听赫拉利的新书《未来简史》。他讲到,未来一切都是数据处理。如果你把每个人都想象成一个数据处理器,人和人之间的交流就是信息交流。那么,整个人类社会就是一个数据处理系统,整个人类历史就是给这个系统增加效力的历史。

到那时,新的宗教就会出现,称之为数据宗教,也叫数据主义。它的核心价值观就是主张信息要流动。哪怕是信息生产者,也不能控制和拥有这个信息。

这些思考还是很让我脑洞大开的。姑且不管数据是否终会成为一种宗教,但对于一家公司来说,核心就是要相信。相信数据主义已经到来。

有了这个思想,我们就可以把一切问题都当成算法问题。机器和它包含的各种算法,甚至有可能比任何一个人都了解一个人。

如果有一天,你所有的喜怒哀乐不贡献出数据,它们对于人类社会就是没有价值的,就是和你这个人是没有关系的。就跟你纳税一样。你想成为这个世界连接的一部分,你就要贡献数据。

而今天,对猎豹来说,数据就是我们的优势。

这个季度发财报时,分析师问,你们做News Republic有什么优势?这也是我反复讲的事情。我们有6亿月度活跃用户,这个用户本身就在产生数据。而我直接在这些数据之上升级内容,这些内容很快又会产生数据。我就比别人成长周期更短。

如果对手想做,得从零积累用户,还得一个个国家谈渠道,去推广,组建团队,经历磨合的痛苦等等。想半年或一年追上,基本就不可能。

我们还是站在一个高顶上。

包括现在说转型升级,工具内容化,核心的一点——其实就是我们把整体数据用好。否则,为什么Q3财报环比和同比都很低的情况,股价反而能涨呢?核心就是大家看到你在转型的过程中,还能实现增长。很多人有了信心。

本质上还是我们自己建立了信心——坚信有机会踏入下一个模式。所以,我觉得,未来的挑战就是整个团队,从上到下,能否思维革命,统一这样的认知——坚守数据主义的信仰,坚信这条路可达,去做不擅长但目标明确的事情。

如果过程中,哪一个点可能阻碍,那就:改造自己,干掉这个点,继续前进。

上海
2015年珠海A+轮企业
2006年泉州大健康F轮企业
本文标签: