人工智能从1956年**次提出来,人工智能已经发展了63年多,*初的**代人工智能是用计算机来解决问题,第二代是以AlphaGo为标志的深度学习,但是深度学习是基于真正的大数据,在目前似乎也遇到了瓶颈,于是,科学家们提出了第三代人工智能,但是目前来看,还没有人真正明确第三代人工智能是什么,但是其趋势是清晰的。
**代、第二代人工智能
下面是清华大学人工智能研究院院长、中国科培训院士张钹在《迈向第三代人工智能的新征程》中对三代人工智能的诠释。
**代人工智能提出符号模型,以知识经验为基础的推理模型,这是人工智能的**个重大突破。这个突破后来产生了一个结果,就是这个理论提出时有个非常乐观的估计,1956年由西蒙提出,基于这种模型,十年之后机器可以打败所有棋手,二十年以后机器取代人类所有的工作。实际并不是这样,六十年以后机器才打败棋手,机器究竟代替人类的所有工作是什么时间,可能还很遥远,这也是人工智能的另外一个特点,往往被高估。
人工智能的**代模型,有优点,但是也有很大局限性。这个优点是显然的,因为它是模仿人类的,它可解释,鲁棒性很强,但是它的局限性也非常大。因为*大的问题是人类的知识经验,很难准确表达,这就是产生的后来人工智能冬天的根本原因。当时的应用很有限,几乎没有推广,但是,有了大数据以后,这个问题得到了很大改善,特别是机器的能力提高以后,可以把大量的数据作为知识放在机器里,这就是*典型的沃森系统。
沃森系统可以做癌症的免疫治疗,这里面用多少知识呢?100万个医学杂志中抽取的2500个摘要,400万病人的数据,再加上1861年以前所有药物的**,它有医学知识,并联的数据再加上药物知识,就可以做癌症的免疫治疗。当然了,很多慢性病的治疗和管理,这个系统也做得很好,中国的国内也有大量这方面的工作在探索和研究。
第二代人工智能,一个*重要的成果就是深度学习。也就是说,**代人工智能提出来,如果能够很好地利用人类的知识,就可以建立很好的人工智能系统,如果我们有充分数据,也有可能建立起有用的人工智能的系统。
深度学习为什么这么受重视?一个很重要的原因,它有两个重大变化。当网络层次增加以后,有两个重大变化:**个变化,输入只要原始数据,不需要预处理。第二个是性能提高很多,这就造成了深度学习的重大突破。也就是说,它从一定意义上有通用工具,对领域的知识要求不高,同时能够处理大数据。
这就带来很大的变化,大家也看到了,语音识别,2001年时它的识别率停留在80%,也就是20%的误识别率;2016年误识率就降到了5.9%,达到专业速记员的水平,到了2017年,所有产品包括谷歌、微软,包括中国的讯飞、百度,用的全是深度学习。
变化更大的是图像识别。有一个标准的图像识别数据集 ImageNet,大家知道,2011年,它的误识率是50%,有一半认错了。但是四年以后,2015年就超过了人类水平,原因也是利用了深度学习。
*后一个,给大家印象*深就是AlphaGo,大家都知道了。因此就有很多估计,十年之内代替40%以上人类的工作,三五年里面,智能驾驶车就可以量产,等等,刚刚李院士说到了这个问题,他分析得很深刻。实际三五年里面不可能量产。
技术已经完全成熟,我们现在的研究已不成熟,主要是应用问题。为什么在人工智能上往往产生乐观估计?主要原因有两个:一个是对发展人工智能的困难性估计不足,对取得的成果估计过高。一个估计不足,一个估计过高,就产生了问题。另外一个很重要的原因,受历史事件的影响。过去我们发现,有了蒸汽机以后就产生了工业革命,有了电动机发动机以后就产生了电气革命,有了计算机以后产生了信息革命,大家很希望有一个东西出来以后引起人工智能的革命。
现在的问题是,有没有?至今为止,还没有发现人工智能里面的蒸汽机和计算机。曾经*开始寄希望于符号模型,结果发现符号模型也没有那么管用。第二次发现的是大数据+深度学习,以为大数据+深度学习就是人工智能的蒸汽机和计算机,为什么这样?
这不能不考虑到人工智能的特点,我们说深度学习根本不是AI的通用机。现在大家在寻找通用的人工智能,到底有没有,还有争论,不去管它,但至少深度学习不是人工智能。这个非常明显,**代人工智能也好,第二代人工智能也好,它的应用场景必须满足以下五个条件。
从正面来讲,所有的应用场景,如果满足以下五个条件,计算机**能够战胜人类,不管这个问题多么复杂:具有丰富的数据或知识,完全信息,确定性信息,静态,单领域和单任务。
*明显的例子是围棋,围棋多么复杂,但是围棋满足这五个条件,所以计算机战胜在围棋上战胜人类是早晚的事情。所以从正面来讲,如果你满足这五个条件,不管多复杂,计算机**战胜人类。长远来看,如果你的应用场景不完全满足这五个条件,其中有些条件不满足,你这个工作就变成困难。自动驾驶为什么如此困难?根本的原因在这里。为什么我们难以做出来廉价、可靠的自动驾驶呢?背后的原因就在这里,因为自动驾驶很多条件都不满足,它不是完全信息,它不是确定性信息,它不是静态的环境,或者是按照确定性规律演化的,它的很多东西是不可预测的,它也不是单领域的,里面有人驾驶的车、行人、其它车辆。所以刚刚李院士提出来专用道,就是把这些东西弄干净,变成单领域。所以我们一直说,如果有些条件是不符合这五条,你就需要下功夫。
本文摘自:网络 日期:2020-01-21