如前所趋,某些种类的机器和若干生命体,特别是比较高级的生命体,都能在过去经验的基础上来改变自己的行为模式,从而达到反熵的特定目的。在这些比较高级形式的能够进行通讯的有机体中,作为个体过去经验的环境是能够把个体的行为模式改变得在某种意义上更加有效地来对付其未来环境的。换言之,有机体并不象莱布尼兹钟机式的单子那样,同宇宙作预定的和谐,而是和宇宙及其未来的种种偶然性依据实际情况而寻求着新的平衡。它的现在不同于它的过去,而它的未来又不同于它的现在。在生命体中,就象在宇宙自身之中那样,分毫不差的重复是绝对不可能的。就生命体和机器之间的类比而言,阿希贝博士的工作可能是我们目前对这个问题的最伟大的贡献。学习,和比较简单的反馈形式一样,也是一种从未来看过去和从过去看未来有所不同的过程。关于显然合目的的有机体这一整个概念(不论这概念是机械的、生物学的或是社会的),都是时间之流中具有特定方向的一根飞箭,而不是两端都有箭头的可以向着其中任一方向前进的线段。能学习的生物不是古代神话中的两头蛇,两端都有头,走哪儿去都无所谓。能学习的生物是从已知的过去走向未知的未来,而这未来是不能和过去互换的。
让我再举另外一个例子来弄清反馈在学习方面的作用。当巴拿马运河各水闸上的巨大控制室在工作着时,它们都是双向的通讯中心。控制定不仅要发出信号以控制牵引机车的运转、控制闸口的开和关、控制水门的开和关,而且,室里还摆满了仪表,它们除表示机车、闸口和水门已经收到它们的命令外,还要表示它们实际上已经有效地执行了这些命令。如果情况不是这样,水闸管理人就会很快地想到也许有一部牵引机车停顿了,或是一艘巨吨级的军舰冲进了水门,或是其他许多类似的不幸事件之一发生了。
控制原理不仅可以应用于巴拿马运河的水闸,而且可见应用于国家、军队和个人。在美国独立战争时期,由于英国不慎之故,已经下达的命令未能使一支由英国本土指挥的从加拿大开来的英国军队和另一支从纽约开出的英国军队在沙拉托加会师,以致英国柏戈因(burgoyne)部队遭到惨败,其实一个周密考虑好的双向通讯程序就能避免这种情况。由此可知,行政官吏,不论是政府的、大学的或公司的,都应该参与双向的通讯流,而不仅是从事自上到下的单向通讯。不然的话,上级官员就会发现他们的政策是建立在他们下属对种种事实的全盘误解上面了。再有,对于演说家讲来,最困难的任务莫过于向一个毫无表情的听众讲话了。戏院中热烈鼓掌的目的,就其本质而言,就是要在演员心中引起一些双向通讯的。
社会反馈这个问题对于社会学和人类学具有非常巨大的意义。人类社会的通讯模式极其多种多样。有些社会,例如爱司基摩人那样的社会,看来是没有领袖制度的,社会成员之间的从属关系也是很不显著的,所以,这个社会团体的基础只不过是在气候和食物供应的非常特别的条件下谋求生存的共同愿望而已。有些社会分成许多阶层,在印度就可只找到这样的社会,其中,二人之间的通讯手段受到自家门第和社会地位的严格限制。有些社会是由专制君主统治看,两个臣民之间的每一关系都要从属于君臣之间的关系。还有由领主和农奴构成的等级制度的封建社会,它们具有非常特殊的社会通讯技术。
我们大多数美国人都喜欢生活在相当轻松的社会团体中,在这样的社会里,个体之间和阶级之间的通讯障碍不是太大的。我的意思并不是说,美国在通讯方面已经达到了这种理想。在白人至上还是全国大部分地区的信条的情况下,这个理想总是达不到的。但是,这种限制多端、形式不定的民主,对于许多以效率作为最高理想的人们说来,甚至还是认为太无政府主义了。这些崇拜效率的人们喜欢让每一个人从孩提时代起就在指定给他的社会轨道上活动,执行着束缚他就象奴隶之被束缚在泥土上面一样的社会职能。在美国的社会图景中,存在着这些倾向,存在着这种对未知未来所蕴含的种种机会之否定,这是可耻的。由于这个缘故,许多人虽然一心一意依恋着这种永远派定人们社会职能的秩序井然的国家,但若迫使他们公开承认这一点,那他们就会感到狼狈不堪了。他们只能以其行动来表示自己明显的偏爱。可是这些行动也是够明确突出的了。商人用一批唯命是从的人围绕在自己周围,从而使自己和他的雇员们隔离开来;或者,一个大研究所的领导人给每一属员指定一个研究专题,但不给他独立思考的权利,以免他超出这个专题的范围并窥见研究工作的全部要领。这些都表明了他们所尊重的民主并非真正是他们愿意生活于其中的秩序。他们所向往的预先指定各人社会职能的秩序井然的国家,令人想起了莱布尼兹的自动机,它在通向偶然性的未来时,不会提供不可逆转的活动,而这种活动却是人的生活的真正条件。
在蚂蚁社会中,每个成员都执行着各自特定的职能。其中也许还存在着专职的士兵阶级。某些高度特殊化的个体执行着皇帝或皇后的职能。如果采用这种社会作为人类社会的模式,那我们就会生活在法西斯的国家中,其中每一个体生来就命中注定了有着自己特定的职业:统治者永远是统治者,士兵永远是士兵,农民不外乎是农民,而工人则注定了是工人。
本章的主题之一就是指出:法西斯主义者之所以渴望用蚂蚁社会作为模型来建立国家,乃是对蚂蚁和人二者的本性都有严重的误解所致。我愿意指出,昆虫的生理发展自身决定了它在本质上是一个愚蠢的、不会学习的个体,注定了不能有任何较大程度的改变。我还愿意表明,这些生理条件如何使昆虫成为一种廉价的、可以大量生产的东西,不比一只纸做的、用过一次就要扔掉的馅饼盘子具有更多的个体价值。在另一方面,我愿意表明,人之所以能够进行大量学习和研究工作(这差不多会占去他的半生时间),乃是生理地装备了这种能力的,而蚂蚁则缺乏这种能力。多样性和可能性乃是人的感官所固有的特性,而且它们确实是理解人的壮丽飞跃的关键所在,因为多样性和可能性都是人的结构本身所特有的东西。
我们即使可以把人的远远超过蚂蚁的优越性弃置不顾,用人做材料来组织一个蚂蚁式的法西斯国家,但我确信这种做法乃是人的本性的贬值,从经济上说,也是人所具有的巨大价值的浪费。我想,我是相信人类社会远比蚂蚁社会有用得多的;要是把人判定并限制在永远重复执行同一职能的话,我担心,他甚至不是一只好蚂蚁,更不用说是个好人了。那些想把我们按照恒定不变的个体职能和恒定不变的个体局限性这一方式组织起来的人,就是宣判了人类只该拿出远低于一半的动力前进。他们把人的可能性差不多全部抛弃掉了,由于限制了我们可以适应未来偶然事件的种种方式,他们也就毁掉了我们在这个地球上可以相当长期地生存下去的机会。
现在让我们回头来讨论一下蚂蚁的个体结构中那些使蚂蚁社会之所以成为非常特殊事物的局限性。这些局限性在蚂蚁个体的解剖学和生理学上都有其深刻的根源。昆虫和人二者都是呼吸空气的生物形式,都是从水生动物的方便的生活条件经过漫长的时间而后过渡到受陆地限制的、要求极为严格的产物的代表。从水界到陆界的这种过渡,不论在什么地方发生,都要引起呼吸系统、循环系统、有机体的机械支架以及成觉器官等等方面的根本改造。
陆生动物的躯体之在机械方面的增强是沿着几条互不相关的道路前进的。大多数软体动物的情况就跟某些其他生物群(它们虽然和软体动物无关,但在基本特点上都具有类似于软体动物的形式)的情况一样,都是从外皮的某个部分分泌出一种无生命的、含钙的组织体,叫做甲壳。这个东西从动物的早期阶段起到它的生命结束止都在不断地添加着。那些依螺旋形式发展的生物群只要用这个添加过程就足以说明它们。
如果甲壳对动物起到保护作用,而动物在其以后的阶段中又长得相当大的话,那么甲壳一定是一种非常可观的负担,仅能适用于蜗牛式的移动缓慢而生活安静的陆生动物了。在其他带壳的动物中,壳愈轻,负担愈少,但与此同时,防卫的力量也就愈差。壳的构造具有沉重的力学负荷,它在陆生动物中只是一个不大的成就。
人自身代表着另外一个发展方向,这在所有脊椎动物中都可见看出;在无脊椎动物中,至少象鲎和章鱼那样高度发展的无脊椎动物也是标志着这个方向的。在这一切的生物形式中,结缔组织内部的某些部分凝聚起来了,不再是纤维状的了,它们变成一种密集而坚硬的胶状物。躯体的这些部分叫做软骨,旨在附着那些有力的为动物活跃生命所需的肌肉。在高等脊椎动物中,这种原始软骨质的骨骼起着临时支架的作用,继而代之的是更加坚硬的材料,叫做骨,它就更加合乎附着有力的肌肉的要求了。这些由骨或软骨构成的骨骼,在任何严格意义上都不是大量活组织构成的,但是,在这一整块的胞间组织之内,却充满了细胞、细胞膜和营养血管等活的结构。
脊椎动物不仅发展了内骨骼,而且发展了其他特性以适应它们活跃生命之所需。它们的呼吸系统,不论其形式是腮,是肺,都能很好地适应外部媒介物与血液之间进行积极的氧交换,而其效率要比一般无脊椎动物的血液大得多,因为脊椎动物的血液含有集中在血球里的输送氧气用的呼吸色素。这种血液是在效率较高的心脏抽送之下在一个封闭的血管系统中流通着,而不是处在一个由不规则的心窦(sinuses)所构成的开放系统中。
昆虫和甲壳类以及一切节足动物是以完全不同的生长方式建成的。节足动物的躯体外部包围着一层甲壳质,这是由表皮细胞分泌出来的。甲壳质是一种和赛璐珞很接近的致密物质。在动物躯体的接合部位,甲壳质层很薄,而且比较柔软,但在其余部位,则是坚硬的外骨骼,这我们在大虾和蟑螂身上都可以看到。内骨骼,例如人的,能够随同一切组织的生长而生长。外骨骼就不能这样了,除非象蜗牛那样通过添加来生长。外骨胳是死组织,没有内在的生长能力。它的作用是给躯体以坚强的防护,也供肌肉的附着之用,但它等于一件紧身衣。
在节足动物中,内部生长可以变换为外部生长,这只要脱去旧的紧身衣并在旧衣下面长出一件新衣来就行了,新衣开头是柔软的、可弯曲的并且能够采取稍微新颖和宽大的样式,但它很快就会变成旧衣的样子,硬化起来了。换言之,它们的生长阶段是以一定的脱皮周期为标志,甲壳类脱皮比较经常,昆虫脱皮则少得多。幼虫期可只有好几个脱皮阶段。蛹期就是其过渡形态,这时,本来在幼虫期不起作用的翅内在地向着官能状态发展。这个发展过程在接近蛹期的最后阶段才达到完成,而这一次脱皮便使它完全成年。成年之后就永远不再脱皮了。这就是昆虫的性阶段,在大多数的情况下,虽然它这时还有食用食物的能力,但有些昆虫的口腔和消化管道停止发育,所以,这种昆虫称为成虫(imago)。成虫只能配偶,产卵,而后死去。
在脱掉旧衣并长出新衣的过程中,神经系统是参与作用的。虽然我们有一定数量的证据来说明从幼虫过渡到成虫时有某种记忆保持着,但是,这种记忆的范围不能很广。记忆的生理条件以至于学习的生理条件看来就是组织性的某种连续,即把来自外界的由感官印象所产生的变化变作结构或机能方面的比较经久的变化。昆虫的变形太彻底了,以至于无法把这些变化的经久纪录较多地保留下来。我们的确很难设想,经过了这样严重的内部改造过程之后,还能够继续保持着一种具有任何精确程度的记忆。
昆虫还受到另外一种限制,这和它的呼吸方法与循环方法有关。昆虫的心脏是一个非常弱小的管状结构,它不是和那些具有确定外形的血管相通,而是和外形不确定的、把血液输送到各种组织中去的腔或窦相通。这种血液是没有红血球的,但在溶液中含有血色素。这种输氧方式看来肯定要比通过血球的输氧方式低级得多。
此外,昆虫组织的充氧方法至多是局部地利用了血液。这种动物的躯体中有一个枝状的气管系统,它直接地从外部把空气吸入需氧的组织中去。这些气管都由螺旋状的甲壳质纤维保护着,以免受损,所以它们是被动地开放着的,我们无论在哪儿也找不到证据来说明昆虫有一个主动的、有效的气泵系统。昆虫的呼吸只是通过扩散的方式来进行的。
值得注意的是,通过扩散把新鲜空气带进来又把用过的含有二氧化碳的脏空气带出体外的乃是同一个气管系统。在扩散的机制中,扩散时间不是随气管长度而变化,而是随着管长平方而变化。因此,一般讲来,系统的效率随着动物躯体的增大而极其迅速地降低下来,对于相当大的动物而言,系统的效率就会降低到生存点以下。因此,从昆虫的结构看来,它不仅不可能有最好的记忆,而且不可能生长得更大一些。
为了说明昆虫的尺寸受到上述限制的意义,让我们比较一下两种人工结构——小屋和摩天大楼。小屋的通风条件完全可以通过窗框附近的空气流通而得到适当的保证,无需考虑管道通风问题。另一方面,在分成许多单元的摩天大楼中,把强力通风系统关上,就会在几分钟之内使工作场所的空气变得不可忍受的污浊。对于这样的结构,扩散乃至对流的通风办法都是不够用的。
昆虫全部尺寸的最大值要比脊椎动物小,但是,构成昆虫的那些基本元件并不总是小于人的甚至鲸鱼的基本元件。昆虫的神经系统依其躯体大小也成为小尺寸的,然而,它所含有的神经元不比人脑的小多少,虽则它们在数量上少得多了,而其结构也远不如人的复杂。就智力问题而言,我们应该想到,起作用的不仅是神经系统的相对尺寸,而且,在很大程度上,是它的绝对尺寸。在昆虫的小而又小的结构中,肯定没有地方来安置非常复杂的神经系统,没有地方来存赃大量的记忆的。
从不可能存贮大量的记忆这个观点看来,昆虫就没有机会学习到很多的东西了,这也可以从下述事实看出:在生长的过程中,由于发生过生理变形这样重大的灾难,一只象蚂蚁这样的昆虫,其幼年期是采取了与成年期毫不相关的生活形式渡过的。此外,昆虫在成年期的行为必须在本质上一开始就是完整的,这就清楚地说明了,昆虫的神经系统所收到的种种指令一定基本上是其构成方式的结果,而非任何亲身经验的产物。因此,昆虫很象那种预先把全部指令都陈述在“纸带”上的计算机,几乎没有什么反馈机制来帮助它在不确定的未来中采取行动。蚂蚁的行为主要是本能问题,而非智力问题。昆虫在其中长大起来的生理方面的紧身衣直接决定了调节其行为模式的心理方面的紧身衣。
读者在这里也许要说:“好了!我们早已知道蚂蚁之作为个体不是很聪明的,那又何必庸人自扰地讲了一大堆它不能聪明的道理呢?”答案在于,控制论采取了这样的观点:机器或有机体的结构就是据之可以看出其演绩的索引。昆虫的机械定型就是这样地限制了它的智力的,而人的机械可变性则为其智力发展提供了几乎毫无限制的前景。这个事实与本书的观点密切相关。从理论上说,如果我们能够造出一部机器,其机械结构就是人的生理结构的复制,那我们就可以有一部机器,其智能就是人的智能的复制。
在行为定型问题上,与蚂蚁差别最大的无过于一般哺乳类,特别是人。我们经常看到,人是幼态(neoteinic form)的,这就是说,如果我们把人和他的近亲——类人猿比较一下,那就会发现,成年人在头发、头形、体形、身体比例、骨骼结构和肌肉等等方面都和刚刚生下来的类人猿更加相似,而不那么象成年的类人猿。在动物之中,人就是永远长不大的彼得·潘。
解剖学结构上的这种不成熟性是和人的童年期很长这一点相对应的。从生理学看,人在过完他的正常寿命的五分之一以前都还没有达到他的青春期。让我们用这一点和老鼠的相应比率作个比较。老鼠可只活三年,但是,三个月过后,它就开始生殖。这是十二与一之比。在绝大多数的哺乳动物中,老鼠的这个比率与人相较是近乎标准的。
大多数哺乳动物的青春期,或是标志着保护期的结束,或是标志着其青春期的到来远在保护期的结束之后。在我们的社会中,人不到二十一岁不算成年,而现代高等职业所需的受教育时间大约要延续到三十岁左右,实际上已经过了体力最强壮的时期。因此,人在做学生方面所花费的时间可以达到他的正常寿命的百分之四十,其道理又是和他的生理结构有关。人类社会之建立在学习的基础上面乃是一桩十分自然的事情,这就象蚂蚁社会之建立在遗传模式的基础上面一样。
和其他的有机体一样,人也是生活在偶然性的宇宙之中,但是,人比其他生物优越之处就在于他具有生理上的因而也具有智力上的装备,使得他能够适应环境中的重大变化。人种之所以是强有力的,只是因为它利用了天赋的适应环境的学习能力,而这种可能性则是它的生理结构所提供的。
我们已经指出,一个有效的行为必须通过某种反馈过程来取得信息,从而了解其目的是否已经达到。最简单的反馈就是处理演绩成败的总情况的反馈,例如我们是否真的抓住了我们想要抓起来的东西,又如一支先头部队是否在指定时间到达了指定地点。但是,还存在着许多别的形式的、具有比较复杂性质的反馈。
我们常常有必要知道行为的总策略,例如战略,是否已经证实为成功的。当我们教导动物通过迷宫去寻找食物或避免电击时它必须能够把通过迷宫的总计划之成功与否全面地作出记录,还得有能力修改这个计划以便有效地通过迷宫。这种形式的学习肯定是一种反馈,但它是较高级的反馈,亦即它是策略性的反馈,而不是简单动作的反馈。就b.罗素所讲的“逻辑类型”而言,这种反馈是不同于那些比较基本的反馈的。
这种行为模式也可以在机器中找到。晚近在电话接线技术方面的革新对于人的适应能力提供了一个有趣的机械方面的类比。在整个电话工业中,自动交换机很快地就胜过了手工操作的交换机,人们似乎还这样地认为,现在的自动接线装置就是一个近乎完善的东西了。然而,稍微想一想,人们就可以明白,现在的接线过程是非常浪费设备的。我真正想用电话联系的人们是有限的,今天和我通话的大部分人就是昨天和我通话的那些人,日复一日,周复一周,都是如此。我就是使用电话设备来和这批人建立通讯联系的。现在,由于普遍采用了目前的接线技术,以致接通每天同我们打四次、五次电话的人的接线过程和接通那些也许过去从未和我们通话的人的接线过程无法区别开来。从电话线负荷应当均等的角度看,我们可见利用的电话设备,不是对经常的传呼户太少,就是对不经常的传呼户太多,这种情况使我想起了霍尔墨期的《单马车》这首诗篇来。你们大概都还记得,这辆古老的马车,在使用了一百年之后,表明了它自身的设计是如此之精致,以致无论是车轮、车顶、车杠或座位,都没有显示出任何不经济的、其磨损程度超过了其他部分的地方。实在说,“单马车”乃是尖端技术的代表,它不单是一个幽默的幻想。要是车箍比辐条或是挡泥板出车杠耐久些,那这些耐久的部件就会使若干经济价值浪费掉了。这些经济价值或者可以节省下来而不损害整个车辆的耐久性,或者可以平均分配给全车使它更加耐久些。的确,任何不具“单马车”这种性质的结构都是浪费地设计出来的.
这也就是说,就最经济地服务而言,把我跟某甲的联系过程(此人我一天跟他打三次电话)和我跟某乙的联系过程(此人在我的电话本上是不受注意的一户)等量齐观,不是理想。假如稍微多分配一些我跟某甲直接联系的手段,那我即使花费加倍的等候时间来和某乙接通也是完全可以补偿过来的。如果这样,那我们就可以不费多少钱而设计出一部仪器来记录我过去的谈话,按照我过去使用线路的额数重新分配给我一个服务度,那它就会为我服务较好,或花钱较少,或二者兼而有之。荷兰菲力普电灯公司已经成功地做到这一点。借助罗素所讲的“高级逻辑类型”的反馈,它的服务质量已经得到了改善。这种设备具有较多的变化,较大的适应性,工作起来比常见的设备更为有效,因为常见的设备都具有熵趋势,几率大的压倒了几率小的。
重讲一下:反馈就是一种把系统的过去演绩再插进它里面去以控制这个系统的方法。如果这些结果仅仅用作鉴定和调节该系统的数据,那就是控制工程师所用的简单的反馈。但是,如果说明演绩情况的信息在送回之后能够用来改变操作的一般方法和演绩的模式时,那我们就有一个完全可以称之为学习的过程了。
另外一个关于学习过程的例子见于预测机的设计工作中。在第二次世界大战初期,防空火力的效率较差,以致有必要去发明一种仪器,要求它能够跟踪飞机的位置,计算出飞机的距离,确定炮弹在击中它之前在空中所经历的时间,还要算出在该时间终了时飞机将要达到的位置。如果飞机能够采取完全随意的逃避动作,拥我们的任何技巧都无法掌握我们所不知道的飞机在高射炮开始射击和炮弹到达目标附近这段时间内的运动。但是,在许多情况下,驾驶员不是或者不能采取随意逃避动作的。他受到这一事实的限制:如果他快速转弯,离心力会使他失去知觉;他还受制于另一事实:飞机的控制机构和飞行员所受的驾驶训练实际上迫使他遵守某些有规律的控制习惯,甚至在其逃避动作中也不例外。这些规律性不是绝对的,而是多次实践所表现出来的统计优势。对于不同的飞行员讲来也许是不同的,对于不同的飞机讲来则肯定是不同的。让我们记住:在追踪快得象飞机这样的目标时,计算者是没有时间拿出仪器来计算飞机飞向何处的。全部计算程序都必须编进高射炮本身的控制系统中。这个计算程序必须包括我们对一定类型的飞机在不同飞行条件下的过去统计经验的数据在内。现在所用的高射炮都附有一个校准仪器,仪器或者使用这类固定数据,或者对这些有限个的固定数据作选择使用。它们的正确选择可依炮手的需要而随意更变,按一下电钮就行了。
但是,还有另一级的控制问题,它也是可用机械方法来解决的。通过对飞机飞行的实际观测求得其统计材料,再把这些统计材料变换成控制高射炮的规则,这个问题本身就是特定的数学问题。和通过实际观测来追踪飞机的办法相比,按照给定规则来追踪飞机的办法是相对缓慢的,因为它得对飞机过去飞行的情况作大量的观测。但虽然如此,要使这个长时间的活动就象短时间的活动那样地机械化起来,不是不可能的。因此,我们有可能去建造一种防空武器,它自身能对飞行目标的运动情况作统计的观测,然后对这些材料进行加工,把它们编成一个控制系统,最后以该系统作为快速调整的方法,使武器的位置对准所观测的飞机位置及其运动。
就我所知,这一点目前还没有做到,但它已经纳入我们的研究范围,而且有希望应用于其他预测问题中。防空武器之能够根据飞机的特定运动来进行瞄准和射击,这样一个总计划的构成,就其本质讲来,是一种学习行为。这是防空武器计算机构中的程序带的变化,它和数字数据的解释过程并无太大的不同。事实上,它是一种非常一般的反馈,能对仪器操作的整个方法作出改变。
我们这里所讨论的高级学习过程仍然受到所在系统的机械条件的限制,它显然不与人的正常学习过程相当。但是,从读过程出发,我们可以推导出一些完全不同的方法使复杂类型的学习过程得以机械化起来。这些方法的指导思想是由洛克的联想学说和巴甫洛夫的条件反射理论分别给出的。但是,在我讨论它们之前,我要先做一些普通的解释,来答复对我下面将要提出的见解的某些批评。
让我再讲一下关于学习理论可能建立的根据。神经生理学家的绝大部分工作都是研究神经纤维或神经元的冲动传导,而这个过程是以“不全则无”的现象给出的。这就是说,如果一刺激沿神经纤维到达其上的某点或某端,它就沿着该处的某一神经纤维传播下去,只要它在相对短的距离内不消失掉,那么,该刺激在神经纤维的较远点上所产生的效应与共初始强度本质上无关。
这些神经冲动沿着一根纤维传播到另一根纤维是要经过其间的连接点即所谓突触这个地方的,在这个地方,一根输入纤维可见和多根输出纤维相接,而一根输出纤维也可以和多根输入纤维相接。在这些突触中,单根输入神经纤维所提供的冲动往往不足以产生一个有效的输出冲动。一般地说,从输入突触到达一给定输出纤维的各个冲动如果太少,则输出纤维不作应答。我这里所说的太少,并非必然地意味着所有的输入纤维的作用相同,甚至也不是必然地意味着有了一批从事输入活动的突触作为连接点,则输出纤维的应答与否这个问题就可以一劳永逸地得到解决。我也不想忽视这样的事实:有些输入纤维不仅不在它们所连接的输出纤维中产生刺激,反而有阻止这些输出纤维接受新刺激的趋势。
无论如何,冲动沿神经纤维传导的问题,即使可用颇为简单的办法来描述,例如,用全或无的现象来描述,但是,一冲动通过突触层的传递问题仍然要取决于复杂的应答模式,其中输入纤维的某些组合能在某一限定时间内激发,使消息作进一步的传递,而其他组合就不是这样。这些组合不是一成不变的,甚至也不仅仅取决于该突触层过去接收消息的情况。大家知道,它们是随温度而变化的,很可能还随着许多其他因素而变化。
关于神经理论的上述见解和那些由一系列开关装置组成的机器的理论相符。在这种机器中,后面开关的接通取决于前面一批相关开关的同时接通这样一种精确配合的行动。这种“全或无”的机器叫做数字计算机。它在解决各种各样通讯和控制的问题上有着很大的便利。特别是,由于它仅仅是在“是”和“否”之间作出决定,这就使得它的积累信息的方式很便于我们在非常庞大的数字中把极为细小的差别区分出来。
除了这些按照是和否的原则来工作的机器外,还有其他计算机和控制机,它们是用来测量的,不是用来计数的。这类机器叫做模拟计算机,因为它们的操作是以待测的量和代表它们的数值量之间的类比关系为根据。模拟计算机的例子之一就是计算尺,它和进行数字运算的台式计算机完全不同。凡用过计算尺的人都懂得,印有刻度的标尺和我们眼睛的准确度都给我们在尺土所能读到的精密度带来了明显的限制。这些限制,并非如人们所想的那样,只要把尺子造得大一些,就可以方便地得到解决。十英尺长的计算尺只比一英尺长的计算尺增加十分之一的精密度,为了取得这个精密度,我们不仅要把大计算尺的每一英尺造得和小计算尺的精密度相同,而且这一英尺和那一英尺接续起来的排列方向又必须和小计算尺所预期的精密度相一致。除此以外,保持大尺的刚性这个问题要比保持小尺的刚性麻烦得多,这就使得我们依靠增大尺寸来增加精密度的办法受到了限制。换言之,从实用目的看来,用作测量的机器不同于用作计数的机器,因为它的精密度受到了极大的限制。把这一点加到生理学家对全或无活动的偏爱上面,那我们就不难理解为什么对人脑的机械模拟所做过的大部分工作都要在不同的程度上以计数作为基础。
但是,假若我们过分坚持人脑是一部值得推崇的数字计算机,那我们就要受到某种非常公正的批评了。批评可以部分来自生理学家,部分来自心理学家,后者是跟那些不喜欢用机器作对比的心理学家们多少持着相反意见的。我讲过,数字计算机中有程序带,它决定所要完成的操作程序,而程序带在过去经验基础上的变化就和学习的过程相当。在人脑中,最最显见的类似于程序带的地方就是突触阈的确定性,即激发一个与之相连的输出神经元的那些输入神经元要在彼此之间作出精确组合的确定性。我们已经知道,这些阈值随着温度而变化;我们没有理由认为,它们不随血液的化学成分以及许多自身根本没有全或无性质的现象而变化。因此,在考虑学习问题时,采用神经系统的全或无理论,我们就必需特别当心,如果我们对这个概念还没有做过理论上的批判,而又没有特定的实验证据来支持这个假设的话。
常常有人说,任何一个适用于机器的学习理论都是不存在的。也有人说,就我们目前的认识水平而言,我所能提出的任何一种学习理论都不免为时过早,它和神经系统的实际情况大概不对头。我希望从这两种批判意见的夹缝中穿过去。一方面,我希望提出一种制造学习机器的方法,要求这个方法不仅能够使我造出一些特定的学习机器,而且能够给我提供一种制造多种多样学习机器的一般工程技术。只有在我达到这种一般性的程度时,我才能够免除下述的批评:我所主张的类似于学习的那种机械过程事实上是某种与学习的本质完全无关的东西。
另一方面,我希望使用与描述神经系统以及人和动物的行为的实际过程不太不同的语言来描述这种机器。我充分了解到,我在表述人的实际机制时不可能期望在每个细节上都是正确的,我甚至可能在原则上发生错误。但虽然如此,只要我提出一种能够用那些属于人心和人脑方面的概念对之进行文字描述,那我就是给出一个免于受到批评的起点,也是给出一个用以和其他理论所能得到的成果进行比较的准绳。
在十七世纪末叶,洛克认为人心的内容就是他称之为观念的那种东西构成的。对他说来,人心完全是被动的,是一块干干净净的黑板,是tabula rasa(一张白纸),个人经验就是他在这张白纸上面所写下的印象。如果这些印象经常地出现,或是同时地出现,或是在某一序列中出现,或是在我们往往归之于因果联系的那些情况中出现,那么,按照洛克的意见,这些印象或观念便具有某种能动的趋势把各个组成部分粘合在一起而形成复合观念。观念粘合的机制就在于观念自身之中,但是,洛克在其所有的著作中,有一个令人感到奇怪的反对描述这种机制的意图。他的理论与现实的关系只能是火车的照片与行进中的实际火车的关系。它是一张任何部分都是静止不动的图表。如果我们考虑到洛克学说产生的时代,这一点就不值得惊奇了。动力学的观点,动态地描述事物的观点,首先是在天文学中而非首先在工程学或心理学中获得其重要性的,这项工作要归功于牛顿,但牛顿不是洛克的先驱者,而是他的同时代人。
在许多世纪中,科学在亚里士多德冲动的驱使之下,着重于分类工作而把现代的研究冲动即研究现象发生作用的方式扔在一边。的确,当植物和动物还有待于调查研究的时候,要是不经过一个不断搜集材料以描述自然史的过程,我们就很难理解生物学如何能够进入真正的动力学时代。伟大的植物学家林耐(linnaeus)就是一个例子。对于林耐讲来,种和类都是固定不变的亚里士多德式的形式,而不是进化过程的路标;但是,我们只有根据林耐的全面描述,才有可能找到令人信服的进化实例。早期的自然史家都是知识领域中的实干的拓荒者,他们围攻和占领新领域的欲望太强烈了,以致对于他们所观察到的新形式不能十分细致地作出解释。拓荒者之后来了讲究操作的农场主,自然主义者之后来了现代的科学家。
在上做纪最后四分之一和本世纪最初四分之一的年代里,另一位伟大学者,巴甫洛夫,以其独特方法从本质上研究了以前洛克研究过的同一个领域。但是,他的条件反射的研究是实验地进行的,而不是象洛克那样理论地进行的。除此以外,他认为条件反射是在下等动物中出现的东西,而不是在人体中出现的东西。下等动物不会讲人的语言,但是,它们能讲行为语。在它们的比较显眼的行为中,就其动机而言,大多数都是情绪方面的行为,而它们的情绪又大部和食物相关。巴甫洛夫正是从食物和唾液的生理征候而开始其研究的。我们可以很容易地把一根小管插入狗的唾腺中,并观测唾液在食物刺激出现时的分泌情况。
通常,许多东西都和食物没有什么联系,例如,视的对象、听的声音等等,它们对唾液不会产生任何的影响。但是,巴甫洛夫观察到,如果狗在进食时系统地出现某种对象或某种声音,那么,这个对象或声音单独出现时也足以激起唾液。这就是说,唾液的反射受到过去联想的制约。
这里,在动物反射的水平上,存在着某种类似于洛克的观念联想的东西,即反射应答所产生的联想,其情绪内容显然是很强烈的。我们现在考察一下那些性质相当复杂的为产生巴甫洛夫型的条件反射所必需的前提。首先,它们一般是动物生活中居于重要地位的东西,在上述情况下,就是食物,虽则在反射的最后形式中食物因素可以全部消除掉。我们还可只用畜牧场周围的电网为例,说明原始刺激在巴甫洛夫的条件反射中的重要性。
在畜牧场上,要建造一个足够牢固的线网来圈住牲口,不是一桩容易做到的事情。因此,比较经济的办法就是用一两根较细的、通有高压电流的导线来代替这种笨重类型的线网,一当动物身体触及电网从而使电流短路时,动物就受到了一个十分可观的电击。这种电网要能在开头一两次承受住了牲畜的压力,但继此以后,电网的作用,不在于它能够承受机械压力,而在于牲畜已经养成力图避免与电网接触的条件反射。在这里,反射的原始扳机乃是痛苦,而避免痛苦对于任何动物的生命延续讲来则是一枚极为重要的事情。形成该反射的扳机是牲口对于电网的视觉。除饥饿和痛苦外,还存在着其他的产生条件反射的板机。对于生物的这些情绪状态,我们可以用拟人的语言来讲述它们,但我们用不着这样一种的拟人主义,即把这些东西说成具有动物经验中所不具有的重要意义。动物的这些经验,无论我们可否称之为情绪的,都能够产生强烈的反射。在形成一般的条件反射时,反射应答使转移到这些扳机状态之一。这个扳机状态经常伴随原始扳机而出现。对于引起给定的应答,刺激物可变,这在神经方面一定是互为相关的:导致应答的突触通路是开着的,不然的话,就应当关着,或者说,不导致应答的突触通路是关着的,不然的话,就应当开着;这样就构戍了控制论所讲的程序带中的变化。
程序带中的这种变化是在旧的、强有力的、引起特定反应的自然刺激和新的、伴随而来的刺激之间经过多次反复的联系而后产生的。看来旧刺激在其活动的同时似乎具有一种能力,即改变其消息通路的渗透性。有趣的是,新的、起作用的刺激除了重复伴随原始刺激这一事实外,几乎没有其他的要求。所以,原始刺激在其出现之时似乎对于所有输送消息的通路都产生了一个长期的效应,至少对其中的大多数通路是这样的。刺激的代替物之具有任意性表明了原始刺激的变形效应极为丰富多样,它不是被限制在少数特定的通路上面的。因此,我们可以认为,原始刺激能够释放出某种一般性的消息,但它仅在原始刺激起作用之时才在那些消息通路中起到作用。这种作用的效应也许不是经久的,但它至少是相当长期地存在着。看来发生这种第二级活动的最合理的场所就在突触之中,因为这个地方最便于改变它们的阈值。
非直达消息这个概念,大家并不生疏。这种消息在找到接收者之前不停地传播出去,然后,它使接收者受到它的刺激。这类消息经常被用作警报。火警就是通知全城居民的信号,特别是通知消防人员的,不论他们呆在何处。在矿井中,当我们发现沼气而要求远处通道上的所有人员离开时,我们便在通风口处把一瓶乙基硫醇打破。我们没有理由认为神经系统中不会有这类消息。如果我去建造一架普通类型的学习机,那我就非常乐意采用这样的方法:把一般地传播“敬告所有与此事有关者”式的语息和特定通路的消息两者结合起来。设计种种电方法来执行此项任务,应该不难。当然,这完全不等于说,动物的学习实际就是采取传播性的和通道性的两种语息相结合的方式。坦白地说,我认为动物的学习完全可能就是这样,但是,我们的证据不足,所见它还只是一种猜想。
至于说到这些“敬告所有与此事有关者”式的消息的性质时,那我还是站在玄想较多的基础上面而假定它们的存在的。它们也许的确是神经性质的,但我宁愿倾向于把它们看作非数字的、类似于产生反射与思想的机制。把突触的活动归因于化学现象,这是自明之理。实际上,在一根神经的活动中,我们不可能把化学势和电势分开来;说某一特定活动是化学的,这几乎是毫无意义的话。但虽然如此,假定突触变化的原因或伴随物中,至少有一个原因或伴随物,不论其来源为何,可以局部地表现为化学变化,这跟流行观点不相抵触。这种变化的出现完全可以局部地取决于神经所传送出来的信号的。我们至少可以同样地设想:这类变化可以部分地起因于化学变化,而化学变化一般是通过血液而非通过神经来传送的。我们又可以设想:“敬告所有与此事有关者”式的消息是由神经来传送的,这些消息自身局部地表现为化学活动的形式,伴随着突触的变化而出现。作为一个工程师,我认为,比较经济地传送“敬告所有与此事有关者”式的消息的办法似乎是通过血液,而不是通过神经。但是,我没有证据。
让我们记住:“敬告所有与此事有关者”式的消息所起的作用,在一定程度上,是和那种把全部新的统计资料都送进仪器的防空控制装置中的变化相似,而不是和那些只把特定的数字资料直接送进仪器的防空控制装置中的变化相似。在上述两种相似的情况中,都有一种也许是长期积累起来的活动,由于长期持续之故,这种活动将有种种效果产生出来。
条件反射对其刺激作出迅速的应答,并不必然地标志着条件反射的建立过程也是比较迅速的。因此,我认为,下述看法是适宜的:使得这种条件化得以产生的消息乃是通过血液流的缓慢而又普遍的传播作用带来的。
设定饥饿、痛苦或任何其他刺激的固定影响可以通过血液引起条件反射,这就已经把我所需的观点作了相当的限制了。要是我企图去确定这种未知的由血液带来的影响的性质,要是这种影响存在的话,那我的观点就要受到更大的限制了。血液自身带有种种物质,可以直接地或间接地改变神经的活动,这在我看来是一桩非常可能的事情;某些荷尔蒙或内分泌的活动至少暗示了这个事实。但是,这并不等于说,决定学习阈值的那种作用就是特定荷尔蒙的产物。此外,它虽然引导我们在饥饿和电网所引起的痛苦之间找出某种可以称之为情绪的共同物,但如果认为情绪就是决定反射的全部条件,而对反射条件的特殊性不作任何进一步的讨论,那就肯定跑得太远了。
但虽然如此,了解下述一点是有意义的:那种被我们主观地称之为情绪的现象,也许并不单纯是神经活动中的一种没有用处的附带现象,它很可能控制着学习过程中的以及其他类似过程中的某一重要阶段。我并不是说,它一定是这样的,但是,我要说,那些在人与其他生命体的情绪和现代类型的自动机的应答之间截然划上一条不可逾越的鸿沟的心理学家们,在他们作出否定的结论时,应当象我作出肯定的结论时那样地小心谨慎。