第798章 图灵测试(1 / 2)

我的1999 东人 2128 字 5个月前

第798章 图灵测试</p>

听到这里,原本神色平静的大BOSS们,脸上终于露出了郑重。</p>

能坐在这里的都是聪明人。</p>

他们都能从徐良的话里听出大数据应用的真实性。</p>

“不过,大数据和云计算只是基础,真正带来行业变革的是人工智能。</p>

我相信很多人都听过‘图灵测试’。</p>

让一台机器和一个人坐在幕后,让一个裁判同时与幕后的人和机器进行交流,如果这个裁判无法判断自己交流的对象是人还是机器。</p>

这就说明这台机器有了和人同等的智能。</p>

这便是大名鼎鼎的‘图灵测试’的全部内容。</p>

计算机科学家们认为,如果计算机实现了五件事,就可以认为它拥有图灵所说的那种智能。</p>

第一,语音识别。</p>

第二,机器翻译。</p>

第三,文本的自动摘要或者写作。</p>

第四,战胜人类的国际象棋冠军。</p>

第五,自动回答问题。</p>

对于怎么实现这五件事,学术界分为传统人工智能的方法和现代其它的方法。</p>

那么传统的人工智能方法是什么呢?</p>

简单讲,就是先了解人类是如何产生智能的,然后让计算机按照人的思路去做。</p>

这种方法又称为‘鸟飞派’。</p>

就像人类观察鸟的飞行,发明了飞机。</p>

观察鱼的游行发明了潜艇一样。</p>

通过模拟进而发明。</p>

但后来经过多年研究证明,这种方法非常不现实。</p>

因为机器始终是机器,永远不可能像人那样思考。</p>

科学家们不得不另辟蹊径。</p>

到了20世纪70年代,大家开始尝试机器智能的另一条发展路径。</p>

即,用数据驱动和超级计算的方法,来实现人工智能。</p>

这种方法又称为机器学习或者知识发现,也就是我们之前说的现代的人工智能发展方式。</p>

最早在这方面做出成果的是1972年美国康奈尔大学的教授——弗雷德·贾里尼克。</p>

他不是人工智能专家,他是一位卓越的通信专家。</p>

他认为人的大脑是一个信息源,从思考到找到合适的语句,再通过发音说出来,是一個编码的过程。</p>

经过媒介(声道、空气等)传播到听众的耳朵里,是经过了一个长长的信道的信息传播问题。</p>

最后听话人把它听懂,是一个解码的过程。</p>

也就是说,他认为人工智能的语音识别,是一个典型的通信问题。</p>

可以用解决通信问题的方法来解决。</p>

为此贾里尼克用了两个数学模型,即马尔科夫模型,分别描述信息源和信道。</p>

找到了数学模型后,下一步就是用统计的方法‘训练出’模型的参数,这在今天来讲就是机器学习。</p>

通过这种方法,人工智能的语音识别率从过去的70%左右,提高到了90%。</p>

同时语音识别的规模,从几百词上升到了两万多词,堪称革命性的发展。</p>

最重要的是贾里尼克的研究得出一个结论。</p>

即:</p>

随着数据量的不断提升,系统会变得越来越好。</p>

因此,国际上的人工智能研究分成了两派。</p>

一派是模仿人的鸟飞派,一派是数据驱动派。</p>

而后者之所以没有迅速发展起来,主要是因为数据获取非常困难。</p>

第一,当时没有机读资料。</p>

第二,很多文学明珠不同版本分散在不同国家,并且其翻译常常不是一一对应。</p>

当然还有很多其它原因就不一一细说了。</p>

但,这个困难在互联网时代被改变了。</p>

它的出现,让研究机构可以轻易获得全球的机读资料。</p>

而且数据量还在随着互联网的发展,每年呈几倍,甚至十几倍的增长。</p>

在庞大的数据支持下,从1994年到2004年的十年里,语音识别的错误率减少了一半。</p>

而机器翻译的准确性提高了一倍。</p>

其中20%的贡献来自方法的改进,80%来自数据量的提升。</p>

再就是今年2月份,在美国召开的全球机器翻译系统大赛。</p>

鸿蒙和Google通过数据驱动的方法,取得了50%以上的BLEU分数。</p>

比著名的南加州大学、IBM沃森实验室等研究机器翻译几十年的顶尖研究机构领先了5%。</p>

而提高这五个百分点在过去需要研究5~10年的时间。</p>

在中文到英文的翻译中,鸿蒙的得分比第三名领先了17%,同样采用数据驱动方法的Google比第二名领先了15%,这个差距已经超出了一代人的水平。</p>

而鸿蒙和Google都是成立不超过十年的新公司。</p>

在人工智能研发上的底蕴肯定没有南加州和沃森实验室深厚。</p>

但我们却超过了他们。</p>

原因是我们比他们更优秀吗?</p>

不是。</p>