1.2.3 智能技术的孕育:人工智能的技术触发期
在人工智能发展过程中,有许多学科为它贡献了思想、观点和技术。除了数学,信息论、控制论和计算机理论也为人工智能技术的产生奠定了坚实的科学基础。
1.香农信息论
20世纪中叶,人工智能研究出现了信息理论的新思潮,人们开始关注信息的采集、计算、处理和运用。信息是什么?信息量是怎么计算的?
图1-21 香农和他的“忒修斯”
克劳德·艾尔伍德·香农[23](见图1-21)是美国数学家、信息论的创始人,1936年获得密歇根大学学士学位,1940年在麻省理工学院获得硕士和博士学位,1941年进入贝尔实验室工作。香农提出了信息熵的概念,为信息论和数字通信奠定了基础。他提出:“信息是用来消除收信者认识上的不定性东西。”香农提出“信息是可以计算的”理论,这里的信息并非“广义信息”,是不包含信息的含义(语义)方面的内容是“狭义信息论”,这抓住了信息的传播形式,满足了通信工程的需要。他指出,通信系统的基本问题是在噪声背景下,在信息接收端接收发送端传来的信号波形,信号波形的语义与通信工程无关。
香农和维纳分别给出了计算信息量的数学公式,他们认为,通信系统传递的是信息,信息表征信源的不确定性(熵),信息量是通信过程中信源不确定性的消除或减少量。
香农在贝尔实验室工作期间,发表了一篇开创性论文《通信的数学理论》,他用数学理论解释了信息的计算问题,采用信息编码和概率论方法,研究了信号传输过程中的波形与干扰问题,发展了关于信息量的计算方法和统计理论,清晰地阐明了通信过程的本质。
香农引入了比特(binary digit的简称,中文意思“二进制数字”)的概念。比特是度量信息的基本单位,是信息时代的基石。他证明了用数字代码可以代表任何类型的信息,所以,所有信息都可以数字化;数字化的信息经压缩后再传输,可以极大地减少传输时间和传输成本;最具革命性的是,他展示了数字代码(二进制代码)可以让我们把数字化的信息毫无差错地从A地传到B地。即我们今天在互联网上看到的所有信息:文字、图片或音频、视频,都是由二进制码0/1编写并传输的。
香农还是人工智能和机器学习的先行者,他设计了一只可以走迷宫的机电老鼠“忒修斯”(见图1-22),编写了计算机下西洋象棋程序,发明了变戏法默读机等。
图1-22 机电老鼠“忒修斯”
香农的这只木老鼠是一个走迷宫的高手,它能通过不停地随机试错,穿过一座由金属墙组成的迷宫,直到在出口处找到一块金属的“奶酪”。“忒修斯”还能记住这条路线,在下一次试验中能漂亮地完成任务;甚至在下一次任务中,即使迷宫的墙壁有所移动,也难不倒它。香农告诉人们:“解决一个问题并记住解决方案,涉及一定程度的心智活动,这已经有点类似大脑了。”在人工智能AlphaGo已经能够击败世界上最优秀的围棋棋手,谷歌已经研究出自动驾驶汽车的今天,记住一块“奶酪”的位置似乎是一项微不足道的成就,但在当时,“忒修斯”是令人惊叹的。这简直就是一台能够思考的机器!它体现了香农对信息时代的基础性贡献。
2.现代控制论
自我调节和自动控制是生物智能行为的主要特征,自动的机器和自动运行的生产活动是人类一直追求的梦想。相传黄帝在战争中使用过指南车,祖冲之、张衡、姚兴等人都制造过指南车。英国著名科学史学家李约瑟说古代中国的指南车“是人类历史上迈向控制论机器的第一步”,是人类“第一架体内稳定机”(见图1-23)。
随着工业革命的发展,20世纪前50年,机械、力学、电学广泛应用于生产,产品逐渐走向标准化和自动化。微电子学、控制理论与计算机的应用,则极大地促进了生产过程控制理论的发展。
控制是通过信息传递的,控制论与信息论紧密相关,控制论是一门以数学为纽带,把研究自动调节、通信工程、计算机和计算技术以及生物科学中的神经生理学和病理学等学科共同关心的共性问题联系起来,而形成的边缘学科。诺伯特·维纳(Norbert Wiener)(见图1-24)1948年发表的《控制论》[24]将控制论与通信科学连接在一起。
图1-23 指南车
图1-24 诺伯特·维纳
1954年,我国著名学者钱学森(见图1-25)出版了《工程控制论》,把控制论推广到工程技术系统,创立了现代控制论。钱学森毕业于美国加利福尼亚理工学院,1955年在毛泽东主席和周恩来总理的争取下回到中国。他长期负责我国火箭导弹和航天器的研发工作。他发展了系统科学和开放式复杂巨系统的方法论[25],并创建了思维科学,构筑了抽象思维、形象思维、社会思维,以及特异思维系统。
20世纪60年代,美国数学家鲁道夫·卡尔曼[26](Rudolf Kalman)(见图1-26)把量子力学和稳定性理论中的“状态空间”概念引入工程控制论,发展了状态空间论和回归算法,得出了被称为“卡尔曼滤波器”的理论,形成了系统辨识、最优滤波、最优控制等现代控制理论。
图1-25 钱学森
图1-26 卡尔曼
卡尔曼滤波(Kalman filtering)是一种利用线性系统状态方程,通过系统输入输出观测数据,对系统状态进行最优估计的算法。由于观测数据中包括系统中的噪声和干扰的影响,所以最优估计也可看作是滤波过程。卡尔曼滤波是目前应用最为广泛的滤波方法,在通信、导航、制导与控制等多个领域都得到了较好的应用,对温度系统的估计是卡尔曼滤波应用中最常使用的案例(见图1-27)。卡尔曼滤波利用对状态观测系统的反馈实现温度估计,首先对当前状态和误差进行观测以获得下个时刻的先验估计;然后通过对先验估计和观测值的分析得到后验估计,经过反复的递归调用,就实现了卡尔曼滤波的工作过程。
图1-27 卡尔曼滤波
3.图灵测试
2016年HBO发行的科幻类连续剧《西部世界》,创意源自1973年同名电影,该剧讲述了由一座以西部世界为主题的巨型高科技成人乐园,提供给游客杀戮与性欲的满足,随着机器人接待员有了自主意识和思维,他们开始主动认识这个世界的本质,进而觉醒并反抗人类的故事。
机器拥有思维能力吗?机器真的能够学会思考吗?人工智能开拓者、自然哲学家图灵进行了更深入、更透彻的分析研究,他早在1950年发表了论文《计算机器与智能》(后改名为《机器能够思维吗?》)。这既是哲学论述,也是人工智能的科学思考,引起了广泛的关注。
图灵从完全不同的立场对机器思维进行了论述,不要问“机器能否思维”,而要问“机器能否通过智能行为测验”。由此提出了著名的“图灵测试”,即通过一种“模拟游戏”(测试方法)判断一台计算机是否具有智能。图灵测试要求测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。经过多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有了人类智能。
实际上,图灵测试并没有规定问题的范围和提问方式,怎样实现完全图灵测试呢?图灵预计,2000年的计算机可以通过此项测试。如果要实现完全图灵测试,通过各种实验的程序,就要在计算机中存储所有可能的问题及相关答案,并能快速、准确地检索到这些问题。被询问的计算机如何做到这些呢?怎样才可以顺利通过测试?首先,这些计算机要具有自然语言处理功能;其次具有将信息存储、表达和再现知识的功能;再次,还要具有用存储的信息去回答问题,并进行知识推理的功能,最后还要拥有适应、识别新环境的机器学习功能。
图灵测试既抓住了人工智能的本质,又巧妙地反驳了那些试图证明人工智能是不可行的哲学家。早期的数字计算机不含任何智能,它所依赖的二进制编码仅仅是一种解释机器内部状态的方法。图灵探讨了计算的本质,把形式推理与计算机理论结合,创造了一种简单、通用的非数字计算模型,证明了计算机可以用智能的方法工作,这也是计算机理论的基础。
图灵机[6](Turing machine,TM)是图灵在1936年提出的,它是一种精确的通用计算机模型(见图1-28),能模拟实际计算机的所有计算行为。这台机器可以读入一系列的0和1,这些数字代表了解决某一问题所需要的步骤,按照这个步骤走下去,就可以解决某一特定的问题,这种观念在当时是具有革命性意义的。图灵机就是一个抽象的机器,它有一条无限长的纸带,纸带分成了一个一个的小方格,每个方格有不同的颜色。有一个机器头在纸带上移来移去。机器头有一组内部状态,还有一些固定的程序。在每个时刻,机器头都要从当前纸带上读入一个方格信息,然后结合自己的内部状态查找程序表,根据程序输出信息到纸带方格上,并转换自己的内部状态,然后进行移动。
图1-28 图灵机模型
许多哲学家认为,即使某台机器通过了图灵测试,也不能认为它就是有思维、有理解力的,只能算是思维的模拟。图灵反问哲学家“为什么我们没有向人类索要内部精神状态的直接证据呢?为什么要对机器提出比人类更高的标准呢?”他提出了“礼貌惯例”理论,指出:我们并不清楚人的意识和精神,不必先解决有关“意识的谜团”,而是进行务实的行为模拟,创造具有智能行为的算法或机器。