《心理学的故事》

墨顿·亨特著 

 

第十四章 知觉心理学家

 

 

有趣的问题

  米诺鱼几乎没有什么大脑可言,可它能够看见东西(多少是这样);一只蚂蚁也是这样,虽然它整个的神经系统只不过是由几百个神经元构成的;其它许多与思维沾不上边的物种也是这样的。由此看来,视知觉是一种生理功能,虽然它影响到许多的心理过程,但却不是任何生理过程本身。(鉴于大多数心理学研究都只涉及到视觉,我们将把其它的知觉先放在一边不谈。)

  然而,几个世纪以来,大多数哲学家和心理学家都曾认为,至少在人类中,知觉基本上是一种心理功能;它是思维与外部现实之间的连系,我们对它的了解当然也只限于我们的感官所告诉我们的。知识从知觉当中偏移出来,因此也引出了一大堆有趣的问题(不是一般意义上的“吸引人”的意思,而是指科学上的“重要性”或者“有可能带来新思想”的含义)。然而,尽管哲学家们在2500多年里都曾考虑过知觉的问题,而且生理学家和心理学家曾经在将近400年的时间里研究过它,可是,有些最为有趣的问题仍然还是问题,而其它的许多问题已经以各种不同的方式解决了,不过,解决问题的方式本身又提出了无数同样麻烦的新问题。

  请考虑这样一个事实,古希腊哲学家是第一个提出这么一个问题的:外部世界的图象是如何进入内部智性的?

  柏拉图有个想法,认为人的眼睛在活跃地发出可以接触物体的探寻——可以说是从视觉上接触物体。德谟克利特不同意他的说法,认为感知的作用正好相反:每个物体不断地将其同等性印证在空气的原子中,而这些复制品在传达至接受者的时候可以与眼睛的原子相互作用,然后重新在眼睛里面重新构造这个同等性,因而就在这个时候传达到了思维。这个想法比柏拉图的稍强一点,可在所有的细节上都是错误的。

  德国天文学家乔安尼·开普勒在1604年在对视力的理解上又产生了一个巨大的飞跃。开普勒时代刚刚出现的光学和光学仪器上的发展使他有能力看出,眼前的清晰物体是一个透镜,它可以弯曲来自物体的光线,再在眼睛里面像筛子一样的视网膜上形成有关一个物体的图象,从这里得到的神经脉冲再传递到大脑里面去。

  从那以后,眼睛是一种相机这种看法就流传开来,这个比喻适合近视、远视和散光的现象,并且符合用眼睛能够对它们给以矫正这一点。可是,虽然从某些方面来说它是符合事实的,可从另外许多方面来说,它又与事实完全不合。拉尔夫·N·哈伯长期以来就是一位在感知研究方面出名的人物,他说,人眼像相机这种比喻“虽然是最有希望但同时也是心理学史上受到误导的一个比喻”,因而也造成了无数的“危害”。

  哪一种危害?一方面,在相机里面,由透镜形成的图象是倒过来的,而在1625年,天文学家克里斯朵夫·申纳又证明,这对眼睛来说是正确的。他小心地剥开了牛眼后部的包层,并通过半透明的视网膜看见了一个倒置的东西。可是,如果我们看见视网膜上形成的图象,为什么我们不会看到一个倒置过来的世界?这个问题将会困扰心理学家,达300年之久。

  随着摄影术的出现,把眼睛看作相机的比喻而引起的麻烦就更明显了。相机要生成一个清晰的图象,必须在曝光的时候抓牢它,如果是拍活动电影,则其快门在一秒钟内必须快速地开关许多次。可是,人眼却是不停地前后闪动的,就算是在紧盯住某东西看时也是如此,但人眼却不会看到模糊的影像。尽管我们没有意识到,而且一般也不会体验到这些移动,但是,我们却可以通过非常简单的办法来看到物体。我们可以盯着下图中心的黑点看约20秒钟,然后再快速地把眼睛移过去盯着白点看。你会看到由黑线条构成的一个错觉图案在前后晃动着。这些黑色的线条是一种余象,其成因是,白色线条落在视网膜接受器上约20秒钟,造成暂时的疲劳所致。晃动的原因就是本章所论的永不停息的移动。

  这个演示的意义是,眼球可能会是某种相机,可是,察看事物却与摄像完全不同。

  另一个有趣的问题:我们所看到的事物真的就在那里吗?进而推论一个问题:这个东西是我们所看到的那个样子吗?民间的说法是,我们看到什么,什么东西就存在在那里,而且我们看到的东西是真实存在的忠实反映。我们看到眼前有扇门,伸手摸门把手,门把就在我们认为它所在的地方,也作出我们期望它作出的反应。我们在椅子上低下身子来,椅子就真实而结实地存在着,就像它看上去的样子。我们叉一块食物到嘴里,它就是食物的丰美、肉感和汁液感,就跟我们预料的一样。常识和哲学都认为,知觉就是与现实的接触。只有极少数稀有的超凡出众者,如贝克莱大主教,才提出过一些怀疑,认为在我们的体外有一个世界,它只对应于我们的知觉。

  然而,尽管几乎所有人都合理地假设知觉是真实的,但是,我们却经常会体会到一些我们明知是误导性的和有错误的东西。远在地平线上的月亮看上去硕大无比,我们都知道当月亮处于头顶的时候,它并不会改变其大小,可是,我们却无法让自己使它看上去比处在地平线上时一样大。我们紧盯着一根明亮的线条,扭开头时会看到一个余象——这是个知觉,它却不是存在于我们之外的任何东西。我们在梦中看到一些人,一些地方,还看到一些并不存在于我们面前的行动,这些东西看上去好像就在身边,可也许根本就不存在。

  再说,在过去和目前这个世纪里,还有许多被心理学家们研究过的错觉。在下图中:

  两个圆中间的灰度区看上去彼此有很大的不同,可是,它们的灰度实际上是一样的,可以在一张纸上剪下一个小孔,把小孔先对着其中一个的灰区,然后再对着另一个灰区,这样就可以确定其灰度是否有差别了。思维,或者至少大脑的皮质层是以对比来判断其亮度的,而不是依靠其绝对密度来判断。我们所看到的东西并不一定就是真实存在的。

  还有好几个经典的例子,每一个都以其发明人的名字来命名的:  (1)泽耳纳氏图形;(2)坡根多夫氏图形;(3)杰士托罗氏图形;(4)赫林氏图形:

  第一幅图中的直线是彼此平行的,这与眼睛看到的情形不一样(可以用尺子量),第二幅图中的斜线是彼此对齐的,而不是彼此偏移的,第三幅图中的两个弯块也是同样大小的,而第四幅图中的粗黑线也是笔直的。

  另一组错觉是由模糊的图形构成的,我们可以把它们看作两个不同事物之间的任何一种。这里两个例子:

  在图(1)中,你可以让自己看到熟悉的纳卡尔氏箱,就好像你是在俯瞰它,X角离你最近;也可以让自己抬头看它,这时,Y角离你最近。在图(2)中,你可以看到提手紧贴在篮子里面的两面白壁上,也可以把它看作紧贴在黑壁上。

  最后,在下图中,好像有一个比周围的地方白得多的三角形。

  可是,正是你本人创造了这个三角形及其亮度的。并不存在这样一个三角形,这张纸比周围其它地方也不是更白些。

  再往下,我们会得到对这些错觉的解释。眼下,我们关心的是,人的知觉不是一个简单的生理过程,只把外部的刺激转移到中枢神经里面去。它常常还包括更高的精神过程,这些过程使通过光学神经传递的脉冲产生(或者使其毫无)意义。至少,许多知觉研究者现在都相信是这样的,尽管其他人也都坚持认为知觉并没有利用更高级的精神过程。

  第三个有趣的问题——艾温·波林在他里程碑式的作品《实验心理学史》中称这个问题为“第一视觉疑团”——我们有两只眼睛,可是,人类看到每一种事物却都不会是双重的。加伦在很久以前正确地假设,这是因为两只眼睛里的神经细胞都到达同一个脑区。可是,这只不过是答案的一部分。除开较远处的物体外,两个视网膜接受到的所有物体的图象都稍有不同,两只眼睛轮流开闭看一个近处的物体就可以轻易地证明这一点。(每只眼睛看到的物体一侧比另一只眼睛多,而且,物体与周围背景中事物的相互关系也不一样。)可是,如果这些稍有不同的图象在大脑里面重合,其结果为什么又不会模糊呢?

  知觉研究者回答说,不同图象的“重合”发生在视皮层中。得出一个三维的图象。他们甚至还精确地指出了皮层中被双眼差异激发的特别细胞。可是,这些细胞,或者其它一些由它们输送信息到里面去的细胞是如何将不同的图象重合起来,形成一个三维图景的,目前这还是个谜。

  另一个有趣的,也是最令人困惑的问题之一是,视网膜上的图象是如何映照在大脑里面的?大脑里面并没有一个可供投射影象用的屏幕,那么,进入大脑里面来的数据流是如何被看见的呢?而且,如果图象是以某种方式投射到这个屏幕上,或者投射到大脑里面别的什么地方的,是谁,或者是什么东西看到这个图象的呢?这个问题又使人想起一个古老的说法,即,有一个侏儒或者小矮人——即思维的“我”——他在感知到达大脑皮层里面的信息。可是,如果是侏儒在察看图象,那么,它是在用什么东西看呢?也是某种眼睛一样的东西吗?那么,是谁或者是什么东西在察看到达侏儒视觉中心的东西呢?等等,等等。

  与这个谜团紧密联系在一起的还有另一个视觉记忆的问题。每一位成人都在他的或者她的大脑里面储存着大量的图象:熟悉的面孔、房子、树木、草叶、云朵、曾经睡过的床。这些东西稍加观察后即以某种方式记录下来。我们虽然不能把所有这些一下子都调入大脑,可是,通过这些记忆,我们却可以辨认出第二次看到的东西。1973年,一位极有耐心的加拿大心理学家莱昂内尔·斯坦丁,让志愿者们观看了10000多张不同题材的快照,他显示照片的速度为每天2000张,一连进行5天。后来,当他把这些照片混在其它一些新照片里面让受试者看时,他们能把三分之二看过的照片认出来。他们是在什么地方存储所有这些仅仅掠过一眼的图象,又是以什么形式来存储的呢?当他们第二次看见图片时,他们是如何在记忆里面找到这个图象并将它与进来的这个图象进行比较的呢?肯定不是通过把存储下来的那一个投射在大脑屏幕里面来进行的,因为根本就不存在这样一个屏幕。而且,不管它们以什么方式显示出来,在里面的东西既会看存储下来的,也会看新来的图象——啊!又是这个令人头疼的小矮人。

  这些只不过是有关视知觉神秘之中的少数几个例子,也许,在心理学中,没有哪个领域曾弄出这么多的数据而又只有少数一些确定的答案。不久以前,一位有争议但极受注意的知觉理论家詹姆斯·J·吉布森很平淡地说过,知觉研究者们在过去几百年时间里所学到的只是“对实践性的知觉业不相关和偶然的一些东西”。知觉心理学家斯蒂芬·M·科斯林和詹姆斯·R·波梅兰茨说得更轻巧些,他们说,尽管收集到了大量的数据,可是,人们对知觉的了解还是相当肤浅的。另外,他们还说:“我们的确了解一些情况。”的确,许多事情——许多足以开始了解它的问题,足以回答至少其中一些有趣的问题,去掉其它一些问题,从而让位给更有说服力的一些事情。

关于看的一些看法

  几百年以来,哲学家们一直在进行辩论,焦点在于我们是天生就有使看到的事物产生意义的精神能力(康德学派或者先天论者的观点),还是必须通过经验来学习,从而解释看到的事物(洛克或者实验论者的观点)。当心理学进入实验阶段时,知觉研究的发现不仅没有回答这个问题,反而给两者的答案增加了更多的证据。尽管今天,这些词已经被重新定义,一些假设也变得更为复杂,因此,这场争辩依然在进行之中。

  如我们知道的一样,洛克和贝克莱以及其他一些哲学家和心理学家有时候会提出一些幻想的测试个案,以期最终一次解决这个问题:一个天生的盲人经过手术或者其它一些干预后突然复明。在不触摸正看着的物体时,他会不会知道这个物体是个立方体而不是球体,是一条狗而不是一只老鼠呢?或者,除非他学过物体的真实含义,否则,他的知觉是不是毫无意义的呢?这样一个人的经验把持着事情的关键。

  最近几个世纪以来,事实上的确出现了这样一批个例。报道得最为详尽的就是一位英国人的例子。他天生患有白底角膜,60年代他52岁时终于得见天日。英国心理学家和知觉专家里查德·L·格雷戈里称他为SB先生,并对他进行了仔细的研究。SB是位活跃而且极聪明的人,他很好地适应了盲目消失之后的生活:他读布里叶盲文读得极好,会使用工具制造物件,经常喜欢丢弃常见的白色导盲杆而散步,哪怕有时候撞在别的东西上也无所谓。他还让朋友扶着他的肩膀帮他骑自行车。

  到SB的中年时代,角膜移植已经成为可能,他去做了手术。按格雷戈里的报告,当绑带从眼睛上取下时,他听到外科医生说话的声音,并朝他转身,心想一定能看见一张脸。他只看见一片模糊。

  然而,经验很快就使他的知觉清晰起来:在几天时间内,他就能够看清很多脸,不用扶着墙就可以顺着医院的走道走路了,他还知道窗外移动而过的东西是小汽车和大卡车。然而,空间知觉对他来说却困难得多。有一阵子,如果他双手抓住窗台,他以为从窗前到地面的距离是他可以用脚趾够到的,而实际上,那个距离有10倍之高。

  SB很快就能够一眼辨认出他通过触摸了解的物体了,比如玩具,可是,对于从没有摸过的物体,除非有人告诉他那是什么东西,或者发现那是什么东西,否则,这些东西对他来说就是一些神秘的东西。格雷戈里和同事带他去伦敦,他在那里辨认出了动物园里的大部分动物,因为他曾养过猫和狗,还知道其它一些动物与这些猫狗有何不同。可在一家科学博物馆里,SB看到一架车床——他一直想要使用的工具——可是,除非他闭上眼睛用手四处摸它,否则,他无法用车床车出任何东西来。接着,睁开眼看着这东西后,他说:“现在我摸过它了,因此我就可以看见它了。”

  有趣的是,当格雷戈里让SB看一些错觉时,他却没有受这些错觉的误导。比如,他没有把赫林氏图形错觉中的直线看成曲线,也没有把泽耳纳平行线看成偏斜线。这些错觉明显取决于一个人已经学到的提示,因为这些提示具有视角的含义,而通过错觉中的其它线条给定的提示对SB却没有任何意义。

  从这个例子中,人们可以得出的结论是相当令人失望和混淆的;有些证据偏向于先天论,有些又偏向于经验论。另外,这个证据是混杂的:SB有一辈子的感觉经验和学习过程,通过这些东西,他能够解释他的第一次视知觉,而他的故事并没有显示出,思维在经验之前准备好理解视知觉的程度有多大。实验研究也没有通过婴儿回答出这个问题,因为婴儿知觉能力在任何时期的发育在多大程度上是因为成熟而造成的,或者在多大程度上是因为经验造成的,这一点目前尚不清楚。只有取消婴儿的知觉和其它感官经验这种不可能进行的实验才能分开彼此,并测量出其相对的影响。

  还有一个问题会把这件事弄得更麻烦,即,知觉主要是一种生理功能,还是一种心理功能。

  19世纪和本世纪早些年的科学心理学的奠基者们曾试图避开这个问题,他们说,思维是不可观察的,也许是一种幻觉,他们只好让自己局限于对生理现实的研究。那些对知觉有兴趣的人们调查了感觉系统的生理学,特别是视知觉,在一个多世纪的时间里,在欧洲和美洲的一些人收集了大量有关这个系统的工作机理的数据。到20世纪早些年,他们已经确定,每只眼的视网膜,即一种专司其职的薄薄的神经组织,里面包含有约一亿三千二百万个两种类型的视觉接受器细胞、柱体和锥体,这些东西都能将光转变成神经脉冲;柱体更常见于视网膜的外周,它更敏感,而且只对较暗的亮度有反应,而锥体却更常见于视网膜中心地带,它对较高级别的亮度产生反应。共有三种不同的锥体,一种里面主要包含有一种吸收短波长光的化学物质(因而对蓝色和绿色有反应),另一种里面主要包含一种吸收中等波长(绿色)的化学物质,还有第三种,里面主要包含能吸收较长的波长(黄、桔黄和红色)的化学物质。

  他们还理清了大部分复杂的连接线路图,柱体和锥体就是通过这些线路图将脉冲传送入大脑的。一丛丛视神经纤维从视网膜一路行进至视觉皮层,这是大脑后部较低地方的一个区域。这些携带有来自每只眼睛的视觉区左右半区信息的纤维一路上被分类和分发。来自每只眼睛的右半边视觉区的信息在左视觉皮层中结束,左半边视觉区的信息在右侧视觉皮层中停止。(进化为什么要按这种交叉的方式进行安排,到今天为止,还没有人能说出一点皮毛。)

  许多心理学家长期以来都不太愿意接受视觉功能定位在视皮层中这样一个证据;这样一种定位几近颅相学。可是,在19世纪晚期,大脑定位法又获得了一定的声誉——不是颅相学那种定位,而只是指部分功能——这是在维尼克和布洛克发现言语功能是在大脑左半球的两个小区域内进行的之后。这激发起研究者们寻找一个可以接收和理解信息的大脑区域,而且,他们通过对大脑受过损伤的人类进行的尸检和对猴子进行的手术发现了这个区域,按一般的话来说,就是人的后脑。

  视皮层更为精确的定位,是1904-1905年俄日战争军备的副产品。在那次冲突中,俄国引进了一种新型来福枪,即毛瑟91型步枪,这种枪射出的子弹比以前小些,可射出的速度快些。子弹常常可以容进头颅而不会把头打开花,在有些情况下,这种子弹能部分或者全部摧毁受害者的视力但却不会使其致死。一位整治受伤士兵的年轻日本军医绘制出每位伤员每只眼睛的视觉区域受损害的程度,因而根据子弹的进口和出口确定了大脑受损害的部位,把这些数据综合在一起之后,他就辨认出了视皮层的准确部位。

  他还发现,接受视网膜信息的视皮层区域与接受视网膜图象信息的区域的尺寸极不相称。有极大的一个部分接受来自视觉中心,即视网膜上视力最为清晰的那个部分的中心小区域,而只有极小的一个部分接受来自较大的周边区域的信息。(后来的研究发现,比例不协调的程度为35:1。)这就解决了一个大问题:到达大脑的东西在版面上并不是对应于视网膜上的图象的那个图象。

  这位日本军医和其他人的发现的含义,不可避免地在接下来的几十年中慢慢为人所接受。其含义在于,视网膜细胞是“转换器”,它们可以将光信号转变成一种不同的能量——一阵阵的神经冲动——而且,这些“编了码的”脉冲或者信号在被大脑接受到的时候,不会退回到视皮层中的图象,尽管被“看见”在那里,或者在大脑别的什么地方。它们是怎样被看见的,这一点仍然是个谜,可是,知觉心理学家们逃开了这个问题。他们考查观看的方式只处理神经脉冲的流动,并在思维的边缘上突然打住。

  另一种所谓的知觉研究的风格——它只是与知觉沾一点边——是冯特式的传统方法。它的实践者研究了感觉(对声音、光线和碰触的直接简单反应),他们认为这些感觉是反射型的、基本的和可以进行科学调查的。他们还研究了这些简单感觉的感知。可是,他们忽略了知觉所有复杂的解释性的方面,对此,他们正确地认为,这时思维对感觉进行处理的结果,他们还不正确地以为,是超出客观细察的范围的。这个方法在20世纪早期比较风行,它得出了有关感觉的大量资料,可是,它对知觉心理学的理解并没有增加任何新东西。

  再有一种知觉研究风格。那就是心理物理学,它也只是研究心理过程而已。费希纳及其追随者如我们所见的,测量了感觉临界值(最微弱的声音、光线、或者一位受试者可以感觉到的其它刺激)和在两种刺激之间“仅仅能注意到的差别”。当这样一些研究接触到有意识的心理过程时,心理物理学家们并没有针对受试者如何注意到一个刺激,或者如何判断差别说点什么,他们只是紧贴着客观数据——刺激的强度和受试者在感觉或者没有感觉到一种刺激,或者两种刺激之间的某个差别时所说的话。因此,心理物理学在行为主义处于鼎盛时期时还可以接受,当时,感觉还为人们所忽视,因为它假设,对世界的重新存在于思维之中,这是行为主义者们所排斥的。

  可是,心理物理学被一种长期的问题所困扰:受试者在他们的回答中前后不一。如果在好几次给定同样的临界值刺激,他们有时候会看见或者听到,有时候又看不到或者听不到。如果低于受试者临界值的某种强度的光线慢慢地增高强度,他可能开始在某个既定的水平上看到它,可是,如果是在这个临界值之上发出这种光线,然后减低光线强度,他可能在某个不同的水平上看不到这种光线。

  为了解决这个问题,心理学家J·A·斯威茨于1961年提出,应把信号检测和信息论这些工程概念引入心理物理学,心理学家们在二战期间开始接触这些概念了。斯威茨及其同事甚至给他们的方法取了一个名称,它反应了工程学的非人格性和客观性——信号检测论。它首先认为,由任何信号激发的神经元的数量一定总是有一些随机的变化的,进入神经系统的“噪音”(无关和偶然的激发)数量也是有随机变化的,这种理论可能通过统计理论来纠正这些变量。第二,它认为,受试者在任何尝试中所作出的反应有一部分是由他的预期和尽量增大回报,尽量减少代价这种企图所决定的,这些变量可以通过决策理论加以解释。

  尽管“决策”听上去像是心理活动,可是,“信号检测论”却是在思维之外的,它按照纯数学参数预测正确及不正确反应的或然性。信号检测论是心理物理学的重大进步,也是今天的实验方法中标准库中的一部分,可是,它只关心知觉的某些客观结果,对知觉如何形成没有投下理解之光。

  然而,这期间,一小批心理学家却早已开始探索知觉的内部或者认知方面了。他们是唯心论者,但不是形而上意义上的唯心论者。反过来,他们遵循詹姆斯、弗洛伊德和比奈的传统,相信较高级的心理过程是心理学的中心所在,而且可以通过实验的方法进行了解的。

  在1897年,就在桑代克及其他人开始转向动物实验学和后来成为行为主义心理学的东西时,一位叫做乔治·斯特拉顿的美国心理学家进行了一项人性化和明显是认知性质的知觉试验。在一个星期的时间里,他一刻不停地戴着一种可以使整个世界倒过来的眼镜。一开始,他四处走动和拿东西时非常困难,致使他经常闭起眼睛,依靠触摸和记忆力帮助他。可是,到第5天的时候,他已经开始自如地进行活动了,到这个星期末尾的时候,他感觉到事物就在他看见的地方,有时候,他觉得这些东西“就是正放着的,而不是倒过来的样子”。最终,当他取下眼镜时,一切都令人迷惑。有好几个小时,他发现自己取东西时是在朝错误的方向伸手;然后,他又重新掌握了这些东西实际上在正常看起来的时候是在什么地方的。实验很明显地显示,空间知觉,至少在人类中,有些部分是通过学习得来的,因此可以重新学习。

  这些发现虽然令人惊讶,可是,本世纪初期的几十年中,大部分心理学家的世界观都是反唯心主义的,没有任何人去欣赏斯特拉顿的工作,几乎也不存在认知型的知觉研究,直到半个世纪以后。可是,到40年代,好几种不相关的、认知方向上的心理学分支——弗洛伊德心理学、格式塔心理学、性格研究和尚未成熟的社会心理学——也在不断地获取力量,一些认为这些理论很对自己心思的心理学家也对知觉采取了与心理生理学和心理物理学不同方法的研究。

  在美国和其它一些地方,有些人重新发现了斯特拉顿的工作,并进行了新的视觉-扭曲实验。1951年,奥地利心理学家依沃·科勒尔说服志愿者花50天的时间透过棱镜眼罩看世界,这种眼罩可使他们的视野向右偏转10度左右,并使垂直线稍有弯曲。他的受试者在几天的时间里感觉到,世界很不稳定,走路和做一些简单的事情也有困难,可是,一星期至十天之后,大部分东西在他们看来都恢复正常了,几星期之后,一位志愿者甚至可以溜冰了。跟斯特拉顿一样,他们在取下眼罩后感觉到方向不明,可后来迅速恢复了正常现力。

  其它一些心理学家把长期以来一直受到冷落的错觉研究又恢复起来了,到50年代,错觉研究又成了炙手可热的研究项目。图21中最为显眼的主观三角形是1950年由意大利心理学家吉坦罗·堪尼萨发明的。它只是用来调查视觉心理过程的许多新错觉图象中的一个。还使用了一种特别的错觉来探索心理对模糊人物的解释。下面这个经典的图案是1930年由波林发明的,人们可以按自己的意愿随便看这幅图,它可以是一个老巫婆朝观察者这里稍为侧了一点身,也可以是脸稍稍转开了的一位少妇。

  人们能够在两种意义模糊的、不同的图象,或者在一些像鲁宾花瓶之类的人物——背景可反向模型中看到两种意义模糊的不同图象的能力,不能被已知的任何生理机械理论所解释,英国心理学家斯图尔特·安斯迪斯说,不过,它是较高级的知觉过程的结果。[有些知觉研究者把这种反向效果归结为神经饱和(视网膜对一种图象感到疲劳,因而另一种图象就替代了原来的图象)。可是,这无法解释为什么我们可以自由地在两种图象之间随意转换。」思维能够接受40和50年代由一些知觉心理学家发明的“不可能的事物”,或者会因此而感到惊讶也是同一个原因。我们在下面举几个这样的例子。是思维,而不是视网膜、视觉神经,也不是神经皮层的一些特殊细胞在解释这样一个提示,它认为这是一个物体的图片,同时又觉得在现实世界里不可能存在这样一个东西。

  另一个对知觉的认知研究方法是由几位美国心理学家们想出来的,他们从40年代开始想办法发现需要、动机和心理设定对知觉产生影响的方式。在这方面比较出色的两位领头人,哈佛大学的杰罗姆·布鲁纳和里奥·波士特曼让小孩子们看一些玩具和简单的积木,这些积木的高度都是3英寸。然后,他们请孩子们判断这些东西的大小,孩子们认为玩具要高些。在这些实验的后面,他们对孩子们说,他们可以把玩具留下来,可过一会儿后又说不行。当这些玩具眼看着到不了手时,孩子们看这些玩具甚至比原来还大些。其他一些研究者请饥饿和不饿的受试者估计食品大小时,饥饿的人看到的食品比不饿的人看到的食品大些。这些实验以及类似实验表明,需要、欲望和挫折会影响知觉。

  按照同一时代的其它一些研究,性格方面的有些特点也是如此。在维也纳接受过教育然后来到美国的心理学家艾尔丝·弗兰克尔-布兰斯维克给一组孩子评定了种族偏见的级别,她认为这种特点与生硬的“权力主义人格类型”有紧密联系。然后,她给孩子们看一幅画着狗的图片,然后是一系列过渡性的图片,狗的图象慢慢变成了一只猫。在偏见上评得高分的孩子倾向于在更长时间内认为这些图片是一只狗,不像那些偏见得分低的孩子更有弹性。当她请孩子们辨认一系列颜色发生了从一种深度到另一种深度的变化的图片时,情形也是这样。

  40年代和50年代对知觉进行的另外一些认知研究还探索了“知觉型防御”——对看见某些令人倒胃的东西产生的心理抵抗。研究者利用速转实体镜在屏幕上很快地闪动一些单词(百分之一秒左右),然后发现,受试者能够辨认出来的中性词多于禁忌词。当实验者为男性,受试者为女性时,效果最为明显。有一个小组用速转实体镜显示出一些与成就相关的词汇,如“竞争”和“掌握”,还有一些中性词,如“窗户”和“文章”;通过亨利·默里TAT法测试为极想成功的受试者认出与成就相关的词汇的速度,比认出一般中性词汇的速度快些。

  心理设定,或者叫人们对可能看到的物体的预期,是这种研究的另一个课题。布鲁纳和波斯特曼利用速转实体镜让受试者们快速地看一些扑克牌,大部分牌都是标准的,可其中一些不是标准的,比如红色方块四。习惯和预期使28位受试者中的27位认为不正常的那些牌也是正常的,可是,一旦受试者了解情况后,他们的心理设定就发生了改变,辨认扑克牌时出错的机会也减少了。

  到1949年,这类的研究非常之多,心理学家们从当时的流行女装中借来了一个词,他们谈到了知觉研究中的“新面孔”。在约10年的时间里,新面孔红极一时,收集了大量资料,涉及需要、动机和心理设定对知觉产生影响的范围。然后,因为缺少详细的理论,以解释这些东西发生的过程,这场运动最后也偃旗息鼓了。

  可是,一种更新、更有威力的理论,即信息处理,也已经开始转变认知心理学了。这种理论认为,有一系列有序的过程,感觉是通过这些过程传递到思想,思想也是这样传递到行动中的。这种理论假定(并提出了实验证据)有一系列步骤的感觉输入变形,包括在感觉器官中暂时的记忆存储,编码变成神经冲动,在思维中短期存储,再用熟悉的物质进行检索或者连接,长期记忆力存储,检索等等。这个理论使心理学家能够具体地处理思维如何处理进入的感觉材料,而且,它还恢复了对知觉采取认知方法的兴趣。到70年代,这在认知领域里的研究已经结出了丰硕的成果。

  可是,这时候,对于知觉的生理学已经有许多有意义的发现。从那以后,观察看这个动作的两种风格,即生理学和认知法,就并存一起了,它们表面看上去彼此对立,实际上都集中于同一些现象的不同方面,从现在起,我们会看到这些情况。

看的形式

  我们是怎样看见物体的外形的?这个问题好像根荒谬——我们怎么能不看见事物?可是,对外形的知觉既不是自动的,也不是完全不出错的。我们在晚上看见黑暗中一个阴影般的东西,不知道它是一片草丛还是潜伏在那里的一个人;我们看着一个签得十分潦草的签名,不知道这个签名到底是以C,G还是以O开头的。我们坐了很长时间的飞机后疲惫地回家,看见空荡荡的机场停车场里停着我们的车,然后拖着疲惫的身体朝它走出去,可到跟前时才发现,这只是跟自己的车看上去差不多的另一个牌号的车。我们很喜欢玩拼图游戏,就是因为我们觉得这游戏很难做,当我们把最后一片东西装到自己刚刚空下来的一个边子上的时候,我们会感到愉快。

  对外形知觉进行的研究是想辨认出一些机械原理,既是神经学上的,也是认知理论上的。它会帮助我们辨认各种外形——而这一点却时常使我们感到为难。在过去的半个世纪里,这方面进行的很多研究都采取了认知的方法。格式塔学者们及其追随者探索了思维的倾向,如将有关联的元素集中在一起,变成一个连贯的整体;在我们看到的间隔之间填入衔接材料,从背景中辨别物体等。他们,还有其它一些人都还说,是人天生的高级心理过程在解释“恒定现象”——我们看事物的时候倾向于不变,哪怕视网膜的图象已经发生了扭曲,正如我们看见一本书从某种角度斜躺在我们面前,就好像它还有一些方方正正的角,哪怕在视网膜或者照相机里,这书看上去一定是一个偏菱形的东西,有两个锐角和一个钝角。

  可是,这些知觉是结果,而不是过程。思维是通过什么样的一些步骤看到这些东西的呢?我们说,我们会把我们看到的一些很熟悉但不完整的形状之间的间隔填满,这是一回事,但是,要确定我们是通过哪些具体的办法来做到这一点的,这却又是另外一回事。以很详细的细节探索视觉信息的认知过程的最新研究已经找到了一些过程。下面就是这些发现的例子:

  ——对主观轮廓现象的研究(如上述图21中的错觉三角形)表明,我们一方面是通过联想(这三个角使我们想起以前见到过的某些三角形)来分析出这个想象的周边的,还有一部分是通过提示,即经验告诉我们要加以插补的的地方(一个物体挡住我们看见另一个物体的视线)。如知觉研究者斯坦利·科伦在1972年进行的一项研究中指出的,圆圈和图21已经存在的三角形中的间隔表明,某些别的东西——即错觉的三角形——挡在视线里,挡住了它们。由于明显的插入,思维“看见了”想象的三角形。

  ——有些实验探索了我们如何辨认一个我们正在寻找的东西的外形,特别是当这个东西丢失在其它有外形的东西里面时。有一个重要的过程是“特征检测”——有意识地寻找某个特定的外形已知和可辨认的一些元素,以从类似的物体中区分这个东西。在下面这两栏字母中,各有一个Z在里面。如果你用秒表计时,看在哪一栏里找对象词快些,你会发现,在第二栏里找到这个词比在第一栏里快多了。

  XEIMWV   ODRUQC

  XIEWMV   QCURDO

  VXIEWM   OQCURD

  MVXIEW   DOQCUR

  WMVXIE   RDOQCU

  EQMVXI   URDOQC

  IEQMVX   CURDOQ

  XIEMWV   QUCRDO

  WVZXIE   DOZQUC

  MVXIEW   DOQUCR

  WMVXIE   RDOQUC

  按照科伦及其同事(这两个栏目就是从他们的书中找出来的)的说法,将Z这个从记忆里面找出来的模式与我们正在寻找的东西相比较这个任务,当藏起来的Z这个字母是在圆形字母中时,找起来比它藏在由像Z本身一样的直线和角构成的字母中时容易得多,也快得多,因为在后者的情况下,我们得注意一些细小的差别。或者,如另一种解释所言,我们在寻找视觉图象时,经常会以“预注意”过程来进行,即与总体的图象相关的自动过程,可是,如果这个不行,我们就转移到“集中的注意力”上来,并有意识地寻找要找的这个东西细小的区别性特征。

  ——1954年,俄勒岗大学的弗雷德·阿特尼夫请一些受试者用10个点来表示一些图形,他们倾向于把这些点放在一些使轮廓的方向转变最明显的地方。阿特尼夫的结论是,我们辨认模式的一个方法是通过对其“变化点”的分析进行的。他还画了一些图,这些图与现实中的实物相比已经做了极大的简化,是从一个变化点向另一个变化点来画直线的。尽管这使曲线变成直线,可是,图形还是立即能够辨认出来,如在下列中:

  ——懂技巧的阅读者把词汇当作一个整体看,而不去一个字母一个字母地辨认,而刚开始读书的人却是一个字母一个字母地看的。可是,哪怕是在快速的阅读中,还是有很多高速特征检测活动在进行着,如由艾林娜·J·吉布森(上述提及的詹姆斯·吉布森的妻子)和同事60年代在康奈尔大学进行的一些实验所显示的一样。他们生造了一大批根本不存在的单音节,其中一些符合英语拼音规则,因此是有可能发音的(“glurck,”“clerft”),然后把辅音组调来调去以生造另外一些音节,虽然字母是同一些,可违反了发育规则,因此无法发音(“rckugl,”“ftercl”)。当有技巧的阅读者在快速实体镜中看到这些词时,他们辨别合法组合比非法组合容易得多,尽管这些字母组都是不认识的词。一种可能的解释是,他们自己给这个词发音,因而更有可能将可发音的一些音节放入短时记忆中,而不可发音的音节就不行。可是,吉布森在加罗戴学院的聋哑儿童中进行试验,因为他们从来没有听到过人念单词,她得到的结果还是一样的。这只能意味着,在感知一个假词时,阅读者区分了这些字母,并且立即辨认出,哪些组遵守了合法的英语拼写模式规则,哪些没有。

  ——在50年代晚期和60年代早期,欧文·罗克,一位后来成了知觉研究领袖人物的心理学家给受试者看一个倾斜了45度的方框,然后问他们说看上去像什么;他们说像钻石。然后,他让这些受试者也倾斜45度,使图象在他们的视网膜上呈方框图形。可是,他们是在一间屋子里,在屋子的参照下,知道哪一个被倾斜了。有了这两个信息来源,经过大脑的处理以后,使他们还是把方框看成一块钻石。这个简单的实验极大地影响了罗克对于知觉的认识,并使他得出结论说,除非知觉现象在一个心理视点上经过了分析,否则,在一个神经生理学的水平上来做这个工作是不成熟的。

  可是,从40年代起至以后,神经生理学家们已经得出了有关视知觉的大量发现,这些发现对认知学家们也同样有着重大的意义。早在30年代,他们就已经能够记录小组神经细胞的电活动了,到40年代,实验室研究者们已经完善了装有电极的玻璃探针,其程度如此之精细——其顶端细如发丝,其直径兴许只有千分之一厘米——它们可以插入视网膜的单个细胞、膝状关节或者经局面部麻醉后插入猫或者猴子的视皮层里面去。有了这种仪器,研究者们就可以观察单个细胞在给动物照光或者进行其它显示时的电子释放情况。

  这种技术给外形知觉带来了历史性的发现。50年代晚期,哈佛医学院的两位极聪明的神经生理学家大卫·胡贝尔和托恩斯顿·威塞尔测试了猫的视皮层细胞反应。他们把微电极埋在猫的视皮层中的细胞里,尽管他们不能选择某个特定的细胞,可是,他们可以把电极以大约正确的方式插在它们大约正确的地方,因此可以了解它们到达了什么地方。威塞尔有一次把这个过程比作用牙签在碗里刺樱桃。你可能不知道要刺中哪一只,可你知道一定会刺中一个。研究者在屏幕上打出一阵光或者一些光栅或者其它图形时,猫会用带子束好。把猫的头用东西固定好,研究者们就可以知道视网膜上的哪一个部分是图象落在上面的地方,并把这个与被刺进的皮层区域进行连接。通过放大器和扬声器,他们可以听到细胞启动的声音。安静的时候,细胞每秒可能会发出几声“卟卟’声,可是,当它受到刺激时,它会以每秒50或100个卟卟声不停地响。

  由于视网膜和皮层都有比较复杂的结构,发现哪些细胞,在什么地方和在皮层的哪一层对来自视网膜的不同区域的信息产生反应,是一件极费耐心的事情。1958年的一天,这项令人极为痛苦的精细工作终于得出了令人惊讶和半是偶然的结果。胡贝尔和威塞尔已经把一根电极插在一个细胞里面了,可是,在几个小时的时间里,它并不能引发快速的启动。如胡贝尔几年以前回忆的:

  为了让细胞启动起来,除了用脚踩我们自己的头以外,我们尝试过了无数的办法。(不时会有一阵间歇性的响动,因为大部分皮层细胞都会这样,可是,我们花了很多时间来证明,是我们施加的刺激引发这些活动的。)为了刺激细胞,我们使用的大部分都是白色和黑色的圆点。可是,在5个小时的斗争之后,我们突然产生了一个印象,上面带有「黑」点的玻璃偶尔会产生一种反应,可是,这种反应好像与这个点没有什么关系。最终,我们想到这一点了:在我们把幻灯片插入槽中时,是玻璃[幻灯]片边子上很尖锐但又很模糊的阴影在作怪。我们很快使自己相信,这条边只有在其阴影扫过视网膜上一个较小的部分时才起作用,扫描时应该让边子对着某个特定的方向才行。

  简而言之,细胞对一个横向的线或者边有强烈反应,但对一个点、一条斜线或者一条竖线只有非常微弱的反应,或者根本就没有反应。

  胡贝尔和威塞尔(及其他研究人员)继续表明,有些其它的细胞对某些处在一个角度上的线条、或者对垂直线条或者对直角或者对明显的边际都有特别的反应(在这里,一个物体与其周围的东西有一种对比)。很明显,视皮层的细胞是非常专业化的,它们只对视网膜上的图象的某些特定的细节有反应。胡贝尔和威塞尔为这项研究,以及其它相关的大脑研究而获得了1981年的诺贝尔奖。

  有可能通过一个简单的试验来体验一个人自己的线条检测器神经元。支起这本书来,看着下面三个图案,然后慢慢朝后退。约在6英尺远的地方,你仍然能看见竖线和横线,可是,中间圆里的横线会成为一块模糊的灰色。知觉研究者把这叫做“斜线效应”。

  有趣的是,尽管这是生理学上的,可有一部分也是后天学习得来的。在1970年进行的一项实验中,把一窝猫放在一个竖直的笼子里面养着,里面贴满竖条,从不让它们看见横条。5个月后,当对它们进行视力测试时,它们看不见横条或者横向的物体。神经学解释是,对横向线条作出反应的皮层细胞在小猫早年生活的阶段停止了发育。同样地,在城市长大的人在童年早期看见坚线和横线的机会多些,而看见其它方向线条的机会相对就少些,因而,他们对前者的反应就灵敏一些。一个研究小组对一组在城市长大的大学生,和一组在传统的帐逢和房屋里长大,很少看见横向和竖向线条的克里印第安人进行测试。在城市长大的大学生表现出了斜线效应,而克里人却没有。

  固定不变地看着下面这个图案的中心,也可以体验你的视网膜上竖直、横向和斜向检测器细胞的专业性:

  你看到的旋转和抖动,也许是因为,当你看着中心时,不同角度的光线都靠得很近,眼睛不断的移动使视网膜上的图象从一种角度的线条跳到另一根线条上,从而发出一大堆信号,使专业化的、有方向性的敏度皮层接受器产生了混乱。

  微电极法使神经生理学家们能够解释视皮层的建筑——神经元是竖向排列着的,一栏里面约有100个,而且分层排列,一层层地穿过各栏——并能测量视皮层里面每一个部分的神经元对广泛刺激的反应。结果,人们得出了视皮层各个不同部分的不同细胞详细的图景,它们如何区分各种外形,亮度、色彩、运动和深度提示的对比。极为复杂的神经元对神经元,神经栏对神经栏的突触连接,把所有这些细胞的反应连接起来,给大脑提供视网膜上的图象这样一个复杂的编码信息。

  这个集中起来的信息是在什么地方和怎样被思维“看见”的,这一点尚不太清楚,不过,从认知型知觉研究中可以明显地看出,视觉皮层专业化的反应不是最终的产品,至少在人类中不是如此。在简单动物中,神经反应也许足以产生合适的行动(要么逃跑,要么攻击)。在人类当中,神经信息经常是毫无意义的,除非这些信息得到认知过程的解释。在错觉三角形的例子中,观察者的思维,而不是皮层细胞,可以提供这个图象缺少的部分。其它许多不完整或者降级的图象也是这样的,观察者有意识地唤起较高级的心理过程,填入缺损的部分,然后看到一个根本就不在那里的东西。这里有一个例子:

  一开始,大部分人会把这个图案看作一个毫无意义的黑块排列。反向的白色部分和里面藏着的那个字是怎样看出来的,这一点尚不清楚,可是,一旦看出来以后,思维几乎就再也不能认为这个图形是一些无意义的黑块了。

察看运动

  把眼睛当作照相机这个比喻的意思是,我们是以快门的方式来观察事物的,可是,我们的视觉经验是一种不间断运动的体验。的确,通过环境和环境中移动的物体来感知我们的运动,这是观察当中最为重要的一个方面。没有运动知觉的视力几乎是无价值的,也许比没有视力还要糟。这可以从1983年《大脑》期刊报道的一例罕见的个案中看出来。

  病人是位妇女,因为严重的头疼、晕眩、恶心,最严重的是失去了运动感,这使她处处不便,因而住院。做脑电图和其它体检显示,她主要的视觉接受区域外的大脑皮层的一个部分有损伤,这个区域已知是对运动感觉至关重要的。报告摘抄如下:

  (她)失去了所有三个层面的运动视觉。比如,倒茶和咖啡时都有问题,因为这些液体看上去都像结了冰,就像一层冰块。另外,她也掌握不了倒水的时间,因为水快要倒满时,她不能够感知杯子(或壶)里面的运动……在有别人走动的屋子里,她感觉很不安全,很不舒服,而且很快就离开房间,因为“人们很快地走到这里或者那里,可是,我看不见他们的移动”……她不敢走过街道,因为她无法判断车辆的速度,可是,她可以很轻松地看到汽车本身。“当我首先看到车辆的时候,它好像在很远的地方。然后,当我准备穿过街道时,汽车突然就在很近的地方。”

  哪怕没有这些证据,我们都可以判断出,运动视觉是极为重要的。我们对自身移动的感觉指导我们在环境中走动;对向我们移动而来的物体的感觉,使我们能够避开危险;我们对手的移动的感觉,给我们提供对何时伸向物体或者做一些精细手工活至关重要的数据;站着的时候,对我们身体精细运动的感觉使我们知道挥舞双手或者不要失去平衡。(如果你双脚并在一起站着,然后闭上眼睛,你会发现很难站得极稳。)

  在过去的半个世纪里,很多对动知觉的研究都是处理外部的变量的:移动物体的大小、速度、位置和其它特点是如何影响它们在我们看上去的样子的。这样一些研究与心理物理学是差不多的:它获取一些客观数据,但对于经验的内部过程却只字不提。尽管如此,它提供了这些过程的重要提示,一方面是天生的神经过程,另一方面是获取的认知过程。

  一项有关天生的低水平过程典型的发现:研究者在婴儿面前把一个阴影或者盒子样的图象打在屏幕上,然后让阴影或者图象快速地扩张。当图象扩大时,婴儿朝后靠一靠,就好像要避免被撞上一样。这个反应不是经验的作用,一个从没有被快速接近的物体撞上过的新生儿会以这种方式作出反应,就跟许多没有经验和新生的动物一样。这种对“快速放大”的物体作出的避开姿势,很明显就是一种保护性的反射,它是通过进化传达给我们的;一个快速接近我们的物体的视觉图象会触发回避的行为,它不涉及到任何更高的精神过程。

  有关获取的高级过程的典型发现是:1974年,心理学家戴维·李和埃里克·阿伦森做了一个没有地板的小房间,它可以通过一块不能移动的地板从这里或者那边溜过去。当他们把一位13一16个月大的、刚刚学会走路的婴儿放在里面,然后偷偷把这个房间朝着婴儿面对的方向溜过去时,也就是说,从孩子面前溜走——这个孩子会向前扑过去,或者跌倒;如果他们把房间朝另外一个方向溜过去,孩子会朝后跌倒。这个解释是,当墙壁移走时,孩子感觉到,好象他或者她在朝后倒,因此自动地通过向前倾倒而加以补偿,反过来亦是一样。这好像是一种获取的行为。孩子在开始走路时,会学会使用“光学流动”信息。(光学流动是我们移动时反映在我们视野范围内的任何东西的移动。比如,当我们走向某个点时,其周围的任何东西会向外扩大,直到视野的尽头。)

  这些,以及其它一些有成果的移动知觉研究,把长期以来认为眼睛是照相机的这个观点里更多的缺陷暴露了出来。其中一种缺陷是,尽管眼睛没有快门,可是,移动的物体并不会引起模糊,如我们在照相时,照相机在曝光时的移动并不会使我们看到一个模糊的东西。相应地,很多对移动感觉的研究已经在寻找发现为什么没有模糊的原因。一种不断得到同意的假设是以乌尔里克·赖塞尔和其它一些人的研究为基础的,即,当我们看到一个图象通过速转实体镜在屏幕上闪动哪怕多少分之一秒时,我们事后可以在思想里面粗略地看到它。1967年,赖塞使用“图标”这个词来形容这个非常短暂的视觉记忆,他测量它的持续约为半秒钟(后来的研究报告说只有四分之一秒)到2秒,并发现,如果新的模式在它完全消失以前出现的话,它就会被擦掉。其它一些视觉研究者们因此而认为,由于眼睛扫过视野或者以一系列叫做“飞速扫视”的跳跃方式跟踪物体,它在物体移动时什么也看不到,可是,在每一次短暂停留时,它会发出一个图标式的快照给大脑。这些快照都汇集在一起,变成了一种运动知觉,有点像看电影。

  这种假设在70年代和80年代早期被广为接受。可是,一些处于先进行列的调查者开始怀疑,图标只是在不自然的实验室条件下观察到的,它不一定存在于正常的知觉之中。果真如此,有关移动知觉的飞速扫视——图标假设就会崩溃。拉尔夫·哈伯是这样看的:

  在自然状态下是没有这样一些表现的,除非你想在闪电中阅读。没有自然的一种情形是视网膜可以在约四分之一秒的时间里受到静态刺激的,因为它的前后都是一片黑除……从来没有一个固定的、像快照一样的视网膜图象固定在时空中,而只有持续变化着的图象……图标是在实验室里诞生的,且只存在于实验室,而不可能存在于别的任何地方。

  眼睛的屏幕不是一种感光剂,它上面移动的图象并不是以静止物的形式被捕获而不模糊的。反过来,视网膜是一种由成百万接收器构成的组织,当受到刺激的时候,每一个接收器每一秒钟启动的次数有好多次。当一个图象在视网膜上通过时,从一连串接收器上产生的连续脉冲流会向前进入视觉皮层。没有模糊不清的地方,因为这个系统生成的不是一连串静止的东西,而是一种不间断的、不断变化的信息之流。

  的确,仅只在30年前才有的一项有关移动知觉问题的戏剧性发现是,视网膜和视觉皮层里的有些神经元会对移动作出反应,可是,其它的许多神经元却不会有反应。移动的检测在单细胞水平上开始。这个古老的进化性发展有助于一些猎物避免被吃掉,也有助于一些捕食者发现和抓住猎物。一只青蛙会有效地捕捉住任何小的移动物体,不过,如果只给它喂死苍蝇或者死虫子,它就会饿死,因为它不会认为这些死东西是食物。其它许多简单动物显示了相类似的行为。青蛙的视网膜和大脑明显具有一些可以对移动(和大小)作出反应的神经元,这种能力具有比视觉方面意义更大的生存价值。

  在60年代和70年代,胡贝尔和威塞尔及其它人都显示了移动知觉器的存在。他们显示,当他们利用电极法记录老鼠和猴子的单细胞的活动时,视网膜和视觉皮层中的某些细胞,而且只有这些细胞,会对移动作出强烈反应。事实上,有些只对一种方向上的移动作出反应,有些对另一方向上的移动作出反应。

  其他一些调查者通过完全不同的方法确证了这一点。1963年,罗伯特·塞库拉及一位同事将一只向上移动的栅栏投影,他们确立了人类受试者可以看见物体移动的临界值(最低速度),然后让每位受试者稳定地看着移动的物体。几分钟以后,受试者在栅栏以原来的临界速度慢慢走动时再也不能看见它移动了,不过,如果速度提高一倍,他们仍然能够看见它移动,而且还能够在更慢的速度上看见它向下移动。结果表明,有向上移动的检测器,它已经疲倦了,还有向下移动的检测器,而这些检测器却没有疲倦。比较结果以相反的方式得到,受试者这时候观察一个向下移动的栅栏有好几分钟。

  我们大多数人都经历过移动检测器疲倦而不知道它的神经元基础。如果我们盯着一道瀑布长时间地看(或者其它长时间连续移动的物体,如生产流水线),然后扭过头去,我们会看见向相反方向的移动错觉。以高速对一个方向上的移动作出反应的细胞会暂时疲倦,而且不再产生反应,这时,对向另一个方向的移动产生反应的细胞却会不断地以其正常的低水平这样做,并以它们喜欢的方向临时产生一个移动感觉。

  然而,这些都没有解释清楚其它两种移动知觉的未解之谜。如果我们移动眼睛或者头脑去追随一只飞鸟,或者其它移动的物体,我们会感觉到移动,哪怕这个图象在视网膜的中心保持不动。反过来,如果我们移动眼睛,图象会扫过视网膜,可是,我们会看到一个静止的世界。

  那么,一定就是一些其它的信息来源来确认或者纠正来自视网膜的信息。自上个世纪以来,已经提出了两种可能性:要么大脑向眼睛和头脑发出了移动命令,以便使一个移动物体的图象保持在视网膜中心位置,要么眼睛和头的移动本身延缓进入视觉皮层,并在那里被解释为这个物体的移动。同样,当我们扫瞄一个静止的背景时,要么是大脑的命令,要么是眼睛的移动在向视觉皮层发出信号,以使它把移动视网膜图象当作一个末移动场景的图象。

  这个问题尚没有得到解决,用动物进行的实验室实验为每种理论提供了一些证据。通过一种或者另一种方法,眼睛和头移动会提供一部分对于移动知觉至关重要的信息。对余象的研究证明了这一点。如果受试者盯住一个明亮的光线看~会儿,当扭开头去看一个相对黑暗的地区时,他们会看到光线的余象。如果他们移动眼睛,余象会在同一个方向上移动,尽管余象的来源,视网膜上已经疲倦的区域并不会移动。这意思是,视觉皮层尽管接受到眼睛在动而图象并没有在视网膜上移动的信息,可是,它还是会解释它们,并把它们当作眼睛在跟踪一个移动图象来解释。

  另一项实验也证明了这一点,是在50年代由一位名叫冯赫尔斯特的德国人进行的。他暂时使一位志愿者的眼肌瘫痪,这样,眼睛就不能向左移动,然后告诉这位志愿者,让他朝这个方向移动。眼睛并没有移动,可是,观察者却看见物体在朝这个方向移动。接下来,他机械地使眼睛向左移动,果如所料,观察者看见视野向右移动。最后,他告诉观察者将瘫痪的眼睛向左移动,同时机械地将它移向右边,志愿者完全看不到移动,因为两种影响互相抵消了。

观察深度

  在自然中,不像在实验室里,所有的外形或者移动都不可能脱离三维性质而存在。为了理解日常生活中的外形及移动知觉,理解深度知觉是至关重要的。心理学家一向认为这是有关知觉的中心问题。他们有关深度知觉的所有文献来源将塞满一本书的空间。

  基本的问题一向是既明显又简单:当我们的信息来源,即视网膜上的图象基本上是两维的时候,我们是如何看到三维世界的?我们看到的为什么不是一个平面的世界,比如在一张彩照里,每个物体的距离和三维特质只能通过其大小、视点、阴影和其它提示来暗示呢?

  事实上,这些提示就是一组理论所提供的答案。这些理论的形式各种各样,可是,它们都认为深度知觉不是自动和天生的。有些理论说,它是一些经验带来的结果,它使我们将深度与提示联系起来;另外一些理论认为,这是学习得来的心理过程,我们可以通过这个过程从提示当中推出深度来。

  说深度知觉是我们将提示与深度经验联系起来的产物,这种观点在洛克和贝克莱的时候就开始了。从他们那个时代到目前,联想-行为主义传统中的心理学家们一直都认为,我们都在有意无意地把视网膜二维图象的提示与物体离开我们有多远的经验联系起来,这样就产生了一些提示。

  另有一种观点是,我们能够感知深度是一种对所看到的事物进行逻辑推理的结果。它首先是由J·S·密尔于1843年提出来的,他提到知觉的时候说,我们观察到的东西有十分之一是观察,十分之九是推理。在这个世纪的后期,亥姆霍兹更详细地提出,我们是根据视网膜上的二维图象无意识地推测出三维的现实。从那时起到现在,一系列认知方向上的心理学家都认为,知觉,包括深度知觉,部分地,或者在很大程度上是高级心理功能的产品——“有点像思想的过程”欧文·罗克这样说——在这些过程当中,从提示中进行推理只是其中一个。

  不管人们喜欢哪一种说法,对深度的提示在日常生活中是极为熟悉的,而它们在知觉中的作用已经通过好几百种实验所显示。这里是一些主要的线索和一些具有代表性的实验:

  ——明显的大小:一个物体越远,它看上去就越小,可是,如果我们已经知道它有多大——比如一个人——我们会从它显示的大小上推断距离,哪怕它是在一个毫无特点的平面上,我们得不到任何提示也是如此。在1951年进行的一项实验中,一位研究者制作了一些扑克牌,从正常牌大小的一半到一倍不等,然后在实验室条件下请受试者看这些牌,因此没有任何有关距离的提示。受试者认为一倍大的扑克牌在离他们近些的地方,而只有一半大小的牌离他们远些。所有的牌实际上是在同样一个距离内。

  ——介入:当一个物体被另一物体部分地挡住时,我们会意识到,被挡住的物体会比挡住东西的物体远些。我们远看城市风景时,会很容易地感觉到一个遥远的高层建筑的距离,因为较低层的一些建筑挡住了高层建筑下面的楼层;另一方面,在海上,一个浮动物体的距离是很难判断的。

  ——视点:从观看者这面向外走的平行线,比如铁轨或者墙壁边角、地板和走道,是会与距离聚合起来的。我们受到这样一些提示的影响有多大,可以从下面这个图案中看出来。

  视点坡度就是不可能把这些圆柱看作一样大,尽管它们实际是一样大的。

    ——物体表面的质地——有草的一片地方,一条水泥人行道-是不变的,可是,质地越来越细的纹路在远处看来就是一条重要的线索,可以看出任何东西在表面上的距离。

  ——远处的建筑物或者山岗看上去很平淡,比近处的物体要模糊一些,这是因为中间隔着大量的气层。

  ——视差:在我们移动时物体与彼此之间不断变化的关系——它是一个重要的深度信息,特别是对近处的物体相对于远处的物体观察时。

  ——聚合与适应:当我们看一些离我们很近的物体时,眼睛会向内产生一个角度,每个晶状体旁边的肌肉都未能使它集中注意力。当我们看远处的物体时,眼睛是平行的,晶状体会处于放松的状态。共生的内脏感觉是一些重要的线索,可以告诉我们10英尺及以内的物体的距离。

  ——双眼差异:当我们看一个相对很近的物体时,它的图象会落在每只眼睛的视觉中心——视网膜的中心上面,而同样远的一些物体的图象会落在两个视网膜相对应的地方。不管物体的远近,其图象却会落在视网膜不同的地方,如下图所示:

  两个视网膜图象之间的差异通过大脑进行解释,以指明哪个物体离我们远些。双眼差异在从800-1900英尺之间的特写中效果最明显。有些知觉理论认为这是对深度最为重要的提示。

  前述所有深度提示都可以用内在机制或者学习到的行为加以解释。可是,深度知觉的天生要素,却是由另外一些更有说服力的证据来证明的。

  一系列有历史意义的实验指明,深度知觉是本能性的,这些实验是50年代和60年代早期在康奈尔大学由艾林娜·吉布森进行的,其对可发音和不可发音词汇的高度阅读进行的工作,是我们前面提到过的,她是与同事里查德·沃尔克一起做这些实验的。吉布森终身害怕崖壁,而沃尔克在二战期间曾让受过训练的军队从高台上往下跳,他们合作起来创立了一种“视觉悬崖”,以确立老鼠是学习得来的深度知觉还是天生就有这着本领的。视觉悬崖是一大块玻璃,其下面的一半贴着瓦楞形的墙纸,另一半也贴着墙纸,但在几英尺以下的地方。问题在于,没有深度经验的动物——即从没有在任何形式的高度上往下跳过的东西-会自动地避开看上去像是要往下跳的东西。

  研究者们在黑暗中养鸡、鼠和其它一些动物,不让它们产生任何深度经验,然后放在一块板上,这块板在玻璃上从有阴影的一边跨过,到另一个看上去更深的地方。结果极富戏剧性。动物尽管从没有经历过深度,但总会避开较深的一边,并在板上退后,退到有阴影的一边。然后,吉布森和沃尔克对人类婴儿加以实验。如吉布森不久前回忆的:

  我们不能在黑暗中哺育婴儿,只好等他们能够自己移动时,才把他们对边缘的躲避当作我们的深度区别指标。可是,只会爬行的婴儿的确会避开“很深的”一边。他们可能在学会爬行之前就已经学习到了某些东西,可是,不管那是什么东西,他不会从外部得到很大的强化,因为父母从没有报告说婴儿曾经从一个什么样的高度上摔下来过。

  每个婴儿的母亲会站在这个装置的左边或者右边,并向孩子召呼。在几乎所有的情形中,婴儿在阴影里面时会一步步地向母亲爬,可是,在27个婴儿中,只有3个敢向很深的那一边爬。

  (最近由其他一些人做的实验却倾向于削弱吉布森与沃克结论,这些实验表明,人类婴儿对高度的害怕是后天得来的——不是通过摔下来的体验,而是通过总体意义上的移动经验得来的。)

  认为深度知觉是内置入神经系统的极有说服力的证据,是1960年从一个不太可能的来源,美国电话电报公司的贝尔实验室和一位同样不太可能的研究员,一位当电视信号发射专家的年轻电气工程师。贝拉·朱莱茨出生在匈牙利,并在那里接受教育,1956年的革命失败后来到美国,并被新译西默雷山的贝尔实验室录用,主要解决压缩电视线号使用的频道宽度问题。可是,朱莱茨被一些更有趣的问题吸引住了,从1959年开始,在贝尔实验室的默许下,决定专攻人类视觉问题。虽然他从来没有得过心理学学位,可是,他很快就成了一位获得许多殊荣的知觉心理学家,是贝尔实验室视觉知觉研究处和麦克阿瑟基金会的主任,1989年还当了鲁杰斯大学视觉研究实验室的负责人。

  朱莱茨因为想到了一个主意而使他在心理学界立即出名,这时候,他才刚刚开始视觉研究。他在阅读有关实体深度知觉的书籍时惊讶地发现,实体视觉的整体接受是大脑将一些提示与每只眼睛的图象里的外形和深度进行比较的结果。这被认为形成了图象和深度知觉的重合。朱莱茨以前在匈牙利曾当过雷达工程师,他感觉到,这明显是错误的:

   毕竟,为了揭开空中侦察的掩饰,人们会通过一种实体镜来观察空中图象(从两个稍有不同的位置),而被掩饰起来的目标会以极鲜明的深度跳出来。当然,在现实生活中,并不存在理想的掩饰物,在经过实体镜的观察以后,人们可以用一只眼检测到有可能从其背景中将一个目标区分出来的微弱的提示。因此,我利用当时刚刚运到贝尔实验室来的最大计算机,即IBM704,来模拟理想的掩饰实体图象。

  这是由随机利用黑白点制造的图象构成的,如下面这两个图案:

  如果单独看其中一个图案,这两个图案中没有深度提示。可是,尽管它们大部分是相同的,可是,中心部分有一个小区已经通过计算机稍稍向一边偏了一点,因此,当人们用一只眼睛看每个图象而这些图案重合在一起时,这个小区会产生一种双眼视差,并看上去会从背景中浮起来。(要看看这个惊人的效果,可以用一块4×4英寸的纸板或者一张纸竖直放在面前,并与本页垂直,这样的话,每只眼睛就只看其中一幅图案。看着图案的一个角,过一会儿后,两个图案会向彼此移动并重合在一起。这时候,中心方块会显得从纸页上腾起约一英寸的样子。)

  这种随机点构成的立视图远远不止是逗人好玩的把戏。它证明,实体视觉并不依靠每个视网膜上的提示形成三维特质的体验,而且,反过来,大脑会把无意义的图象重合起来,从而显示出三维特质隐藏起来的提示。这不是认知过程,不是学习如何解释深度提示的问题,而是天生的神经生理过程,它发生在视觉皮层某个特别的层面里。组织严密的一些相互作用细胞就在这里发生图案中点的相关作用,得出重合后的三维效果知觉。(实体效果并不是我们获取深度知觉的惟一途径。朱莱茨的工作并不排除其它一些办法,包括那些涉及学习的方法。)

  朱莱茨很自豪地看到,他的发现导致胡贝尔和威塞尔及其他人把注意力从外形知觉转向了对双眼视差的调查上了,但他很谦虚地说:

  我从来没有把自己将随机点立视图引入心理学的作用看成重大的智力成就,尽管它的许多成果对大脑研究确有裨益。这只是一种幸运的巧合,两种文化之间的碰撞,在一个会说两种语言的人的头脑中两种语言之间的联想(心理学家和工程师的语言)。

  有关深度知觉,还有另一种现代理论,既不是专门性的神经方面的,也不是专门性的认知性的。并不是说其提议者机智地将两者合并起来了,反过来,他实际上把神经理论和认知理论当作不需要的东西弃而不用,并且认为它们是以错误的假设为基础的。

  只有一个胆识过人的怪杰,才有可能把一个世纪以来对深度知觉的研究全盘抛弃,并宣布自己已经找到一种全新的正确办法。只有一个真正的不服从传统的人,才有可能确切地说,我们感知深度既不是通过神经检测器,也不是利用提示进行推理,而是“直接”和自动地产生知觉的。只有一个性急的人才会提出一种激进的认识论,他认为光的物理特性就是,来到眼睛里面的东西就是深度的准确和实际的体验,我们不需要解释看到的东西,因为我们看到的就是实际的东西。

  这样一个人就是已经过世的詹姆斯·J·吉布森(1904-1980),他的崇拜者认为他是“20世纪视知觉方面最为重要的学者”和“知觉心理学世界里最有创见的理论家”,可是,他的理论被大部分知觉专家看作是“极为难以置信的”(一位评论者甚至认为他的理论太过“愚蠢”,根本就不值得讨论),也没有行家倡导他的理论。

  吉布森在1950年和1980之间形成他激进的知觉概念时,对他的事业并没有多大的帮助,他对总体的主流心理学中现存的知觉理论更是嗤之以鼻。他典型的评论是:“心理学,或者至少是美国心理学,是一种次等的学科……主要的原因是,它对自己的主题并没有敬畏感”,“心理学[是]要寻找错误问题的答案;选择来研究的问题都是对于研究很方便的,而不是相关的问题”。可是,尽管他的观点听上去怒气冲冲,而且还有严重的听力问题,他一向总还是很平和的,很迷人,非常友善,跟他接触过的几乎所有人都喜欢他,一位热情的编年史学者认为他“非常迷人、有活力,很可爱”。

  吉布森出生在俄亥俄省的一座河边小城里,并在中西部的各处长大,其父是一位铁路寻视员。这使他有很多机会搭乘火车,并在铁路上体验到很多后来成为他的视知觉理论核心元素的东西。如他在一份简短的自传中所言:“8岁的时候,我从铁路上知道了世界看上去是一个什么样子,站在列车后部看世界时,它看上去是向内流动的,而从火车头看去,它又是向外扩大的。”

  吉布森去了普林斯顿大学,可是他觉得这里的一些人不如人意,而情愿去接近他叫做“神经病”的一些人。有一阵子,他在哲学和社交活动(他一头卷发,方脸,长相极帅,很可做一个领袖人物)之间来回不定,可到了高年级以后,他选了一门心理学,立即就喜欢这门学科了。他在普林斯顿读心理学研究生时,受到了行为主义心理学的影响。然而,1928年,他接受了去斯密斯学院当教师的委任,在那里遇到科特·科夫卡,接着,虽然他没有成为格式塔学者,却受到了格式塔心理学中有关组织和结构概念极大的影响。

  一些年来,吉布森对社会心理学和相对传统一些的知觉研究都有兴趣。接着,在二战期间,他被“陆军航空人员航空心理学计划”请去开发深度知觉测试,以确定谁具有飞行,特别是成功起飞和降落必备的视觉敏感度。

  也许因为吉布森早期在火车上的一些经历,他认为传统的深度知觉提示,包括阴影和视点,都没有什么价值。在他看来,这些都是以油画和客厅里的立体照相机,而不是现实中的三维特质,以静态的图象而不是以移动为基础的。对他显得更有用得多,更现实得多的,是两种提示:纹理阶度,就像飞行员在接近地面时迈出最后一脚时看到的跑道上不规则变动的粗糙;还有活动视点,或者是当一个人在环境中移动时物体之间不断变化的关系的流动,包括飞行员在起飞和降落时看到的所有东西。这些提示很快就被接受了,到今天仍然是深度知觉当中以提示为基础的理论中的一部分。

  吉布森的航空人员工作里面包含有他日后观点的精华部分。深度知觉中最为关键的机制(按照吉布森的说法,在所有的知觉中)不是视网膜图象,尽管它有许多提示,而在于物体之间相对关系不断变化的流动,及其处于感知者移动的环境之中的表面。

  这一概念后来慢慢主宰了吉布森在50年代和60年代的思想,当时,他在康奈尔大学做了相当数量的研究,并对其纹理阶度信念进行了测试。在有些测试中,他把一些发散性的奶瓶放在观察者和有纹路的表面;在其它一些实验中,他使观察者的眼睛发生肿胀,以避开对纹理过份集中。在还有一些实验中,他把乒乓球剖成两半,做成护目镜,因此,他的受试者看到的东西就像青蛙一样,没有表面,也没有体积。从类似的这些实验中,再加上他对航空人员的研究加以仔细考虑后,吉布森慢慢慢抛弃了纹理阶度,把观察者通过环境的移动强调为深度知觉的关键。不管移动有多大或者多小,它都会给视觉排列带来变化——从环境来到眼睛里面的光线有结构的模式——比如在下幅图中:

  视觉排列富含从任何一个角度看到的信息,它会随着观察者的移动而变得无限丰富。哪怕是头部最小的变化都会改变这种排列,它会使看见的物体的样子发生变化,得出这种或者那种光学流动。吉布森慢慢相信,有足够的,远远超出足够的信息在视觉排列里面,还有流动,可以直接传递深度和距离,根本不需要心理计算或者根据提示推算。

  下面就是吉布森在他总括性的“直接知觉”、“生态学”理论中解释的深度知觉。可惜的是,吉布森这个局外人和怪杰,这个按他的一位心理学家同事的说法是“极端固执和毫不让步的”人决意非得把洗澡水和婴儿一同泼出去。因为,有可能承认神经和认知深度知觉观正确地解释了一个现象不同的方面的问题,而吉本森的观点是对这两者的补充。可是,对吉布森·J·詹姆斯来说,这就是不可能。

对视觉的三种不同看法

  “视知觉,”贝拉·朱莱茨最近说,“所处的状态与物理学在伽俐略之前,或者生物化学在沃森和克里克发现DNA双螺旋之前一样。”他可能对自己有些苛刻,不过,两种主要的方法——如果我们把吉布森的理论与其它的理论并列在一起的话,那就有三种——都只能解释这些现象的某些方面,还没有一种综合性的视知觉理论。这可能意味着,某种大型的组织性概念尚没有发现出来,或者说,视知觉是如此复杂,没有一种理论可以解释它所有的方面,不同的方法解释各个不同的复杂问题。

  我们已经看到过一些不同的方法。在这里,我们做一个收尾的工作,把他们对视知觉的解释在总体上做一个全面的勾勒。

  神经元理论:这种方法回答的问题,是19世纪的生理学家们一直很着迷的:感觉神经虽然在结构上都是一样的,它是怎样把不同的感觉传递到大脑里面去的呢?

  这个以详尽的细节作出的答案是,神经脉冲本身并没有什么差别;反过来,对某些刺激有反应的接受器把它们的信号分开发送到纹状体,即视皮层的主要区域。胡贝尔和他目前的同事玛格丽特·利文斯通(威塞尔与胡贝尔合作20年后另分一支了,他现在是洛克菲勒大学的校长)最近显示,由外形、移动、深度和色彩生成的脉冲经由不同的平行通道到达皮层,并稍后在那里形成一个整体。(色彩是一个研究得很多的课题,它只是本书焦点外围的部分,因此加以忽略。)

  主视觉皮层只覆盖约15平方厘米的面积,但其内部的建筑却是极为复杂的。好几十年来的神经生理学家们一直在探索这个结构及其内部的线路原理。他们得知,进入里面来的信息首先进入“简单”细胞,在这里被谐调起来,以对具体的刺激作出反应。这些细胞把他们的脉冲通过极复杂的线路原理送入“复杂”细胞,这些复杂的线路原理在很大程度上是基因决定的。复杂细胞开始整合单个的脉冲,并把来自两眼的信息混合起来。结果是,视网膜图象被以“地图”形式作为复杂神经元的集体激发而送入视皮层,可是,这些激发的模式并不像视网膜上的图象,也不像眼睛之外的场景。按胡贝尔和威塞尔的话说:

  视觉场景在投射到视皮层里面去的时候,实际上什么样子呢?假设一个动物盯着某个点,而视野中惟一的物体就是在这条直线稍上和偏左的地方,动物的目光就盯着这个点。如果每一活跃的细胞都会被点燃,再如果一个人可以站在皮层之上然后朝下看,这个图案会是什么样的呢?为了使这个问题更有趣,假设这个图案只由一只眼看着……这个图案却原来不是一条直线,而只是一组有规则地分布开的串。

  换句话说,它不是一个图象,而是一个编了码的图象表达,这有点像录音带上磁场的图案并不是声音,而是一种编了码的声音表达。然而,这种表达的确还不是知觉;如胡贝尔和威塞尔所言:“主视觉皮层绝对不是神经传导的终结。它只是一个阶段,比较起它所处理的信息的抽象程度来说,它兴许只是一个早期的阶段。”

  部分集合和整合起来的信息从纹状区域发送到视皮层的另一个区域,再到达超出它之外的更高的大脑皮层区域。在这里,信息最终被思维看见,并被认出来属于某种熟悉或者以前没有看见过的东西。这是如何发生的,到目前为止还没有弄清楚,大部分神经生理学家都这么看。可是,有少数人却大胆地猜想,在大脑较高级的水平上,有一些包含以前看见过的、以突触连接或者分子沉积形式表现出来的物体的“痕迹”,而这些细胞只有在一个输入的信息符合痕迹时才会有所反应。这种对能配合的一方作出的反应是一种意识(“我见过这张脸”);非配合不会引起反应,它也是一种意识(“我没有见过这张脸”。)研究者们半开玩笑,半是严肃地把这些假设性的视觉系统神经元称作“祖母”细胞,因为其中的一些只在看见自己祖母编了码的本身时才会有所反应,而对其它的任何信号皆置之不理。

  除开这些想象的东西不说,神经理论告诉了我们很多有关视知觉在微观水平上的工作机制,但没有宏观的理论;说了很多有关视觉机制的话,但没有谈到其拥有者和操作者,谈了很多有关神经元反应的东西,但没有说到知觉经验。如一位认知理论家所说的:“只研究神经元来理解知觉,这就像只靠研究羽毛来理解鸟的飞行一样。”

  认知理论:这种方法主要处理在像外形一致、特征辨认、外形辨认、从提示中得来的深度知觉和当许多信息丢失后辨认人物等的知觉现象中运作着的心理过程。

  得出这些结果的心理过程,是由几十亿的神经现象构成的,可是,认知理论家们认为,需要宏观理论,而不是微观理论来解释这些过程。一位研究一个波浪如何改变形状并在接近海滩时粉碎的物理学家,不会从数不胜数的水分子的相互作用中得出波动机械学的法则,就算利用巨型计算机也得不出一个结果来。这些法则表达的是集体效应,它们存在于一个完全不同的组织里。一个人与我们谈话时发出的声音是由大气中的分子的震动构成的,可是,这些话的意义绝不可能以这些分子形式表达出来。

  视知觉的心理过程亦是如此。它们是神经现象集体的组织效应,是由心理法则,而不是神经生理学的法则表达出来的。我们已经看到过这方面的证据,但是,有一个特别有趣的例子是很值得讨论的。当我们从记忆中调出一个图象并在思维的眼中看它时,会发生什么样的事情,并在什么样的水平上发生呢?由认知理论家们进行的一些实验显示,这只能在高级认知理论上进行解释。最为流畅和表现力最强的的实验,是由斯坦福大学的罗杰·谢泼德进行的“心理旋转”实验。谢泼德请受试者说出下列三组中的物体是否是一样的:

  大多数人在研究过这些图案后会认出,A里面的物体与B里面的物体是一样的。C里面的物体不是。当问及他们如何得出结论时,他们说,这些东西在他们的头脑里面转动,就好像在现实世界里转动真实的东西一样。谢泼德通过另一项实验显示出这个过程是如何反应了真实的转动的。在这项实验中,看东西的人从一个有角差的角度看见一个既定的形状。比如,下面这套实验显示出一系列位置上的单个形状:

  给受试者看这些图案时,他们辨认出这些东西彼此一样所需的时间与这些图案位置的角差成正比。也就是说,一个图案与另一个进行比较时需要转动的角度越大,辨认所需要的时间就越长。

  这只是许多知觉现象中的一个例子,它们涉及更高的心理过程,必须以外部世界的内化符号进行操作。最近几年,一系列知觉研究者在尝试形成一个综合性的认知理论,以说明这些过程是什么样的,它们是怎样产生这些知觉的。

  他们的理论有两种方法。一种是利用从计算机科学的分支——人工智能中得来的概念及过程。人工智能基本的假定是,人类心理活动可以通过一步一步的计算机程序加以摹仿,也按这同一种步骤一步一步地发生。人工智能专家们一方面是想让计算机辨认出他们正在寻找的东西,一方面是想获取对人类知觉更好的理解,它们编写了好多外形辨认的程序。为了获取基本的外形辨认元素——比如辨认三角形、方形和其它规则的多边形——一种程序也许会按一系列的假如——那么步骤来进行。如果有一条直线,那么,它会跟着直线下去,并测量它,直到末端;如果另有一条线从这里继续下去,那么它会把这个点叫做一个角,并测量这个角,经由这个角而改变方向;如果这另一条线是一条直线,那它就会跟踪它,直到……等等,直到边和角的数字已经被数过,并与一个多边形和其特征的对比而配对。

  赞同人工智能方法对视知觉有用的主要说法是,大脑里面没有投射器或者屏幕,也没有想象的小侏儒在里面看事物;因此,思维一定不是在处理图象,而是在处理编了码的数据,它一步一步地处理,而计算机程序正是这样工作的。

  反对人工智能方法的主要观点是,与人类的程序比较起来,还没有任何机器视觉程序可以与之相匹敌的,还没有辨认平面形状,还不说三维图象的能力,也没有哪一种程序可以感知周围世界里的三维分布,也不能理解它是不是在环境里面,也不能辨认出岩石、椅子、沙发、水、面包或者任何它所看见的东西可能的物理特性。如乌尔里克·赖塞尔所总结的:

  在机器视觉设计里面碰到的许多困难,都可以归结到一个简单的来源中:设计者们进行的工作缺乏有效的理论。他们大都以为视知觉是辨认特别刺激模式的问题。如果果真全都如此,我们应该早就能够生产出有视力的计算机了。没有形成以这些理论为基础的模型,失败的原因都可以作为一个证据,证明这些理论本身不行,因此也可以证明需要另一种方法。

  关于认知知觉过程如何工作的另一个思想流派,依赖于对人类思想而不是对机器进行的思想摹仿进行的实验室研究。这个观点的起源可以远到亥姆霍兹时代,当时的传统看法是,知觉是从不完整的信息,包括另一类有意识的思想过程进行无意识推理的结果。其最显著的倡导者是我们前面提到过的、加利福尼亚大学的欧文·罗克。他1983年的《知觉逻辑》一书在1991年的“心理学年报”中被描述为“是对在观察者一方好像需要智力活动才能得到的知觉效果最为全面和实验上最可行的解释”。

  尽管罗克是一位杰出的感觉心理学家,可是,他在其早年的学生生涯中远非如此。事实上,在一个知识分子家庭里,他是一头黑羊。可是,在二战期间,他那支部队受到敌机轰炸,他感觉到自己会被炸死,“我对自己发誓说,如果能够活下来,我会在有生之年做比以前更多的事情”。战后,他成了顶尖大学生。他在物理学方面开始其研究生学院的生活,可当他意识到,在心理学这门年轻的研究领域里对知识作出更大贡献的机会要大得多以后,他就转向了心理学。

  在社会研究新学院里,罗克受到了格式塔学派很大的影响,他自己也成了其中一个热情的研究者。格式塔心理学中的一些基本的组织和关系思维法则仍然是他的理论中的一个部分。可是,这些法则描述基本的自动过程,而罗克慢慢相信,许多知觉现象只有通过像一种思想一样的心理过程才能得到解释。

  他在1957年进行的一项实验中开始产生这个想法,如上所述,他把一个方框倾斜一下,让它看上去像钻石形,然后再证观察者倾斜过来。由于观察者仍然认为这个方框是钻石形的,罗克推出,观察者一定是在利用视觉和内脏提示来解释看到的东西。罗克花了许多年的时间设计和进行其它的实验以检测一个假设,即,知觉经常需要比视皮层更高水平的一些过程。这些研究最终引导他得出目前的论题,即“知觉是智力的活动,因为它基于类似构成思想的那些操作”。

  而罗克说,的确,知觉也许就是思想之所以诞生的原因;也许就是原初有机体低水平的感觉过程与更复杂的生命形式高水平的认知过程之间的进化连接。他认为,如果眼睛看到的东西是一种意义模糊和对现实易于变形的表达,有些机制就得发生进化,以得出对现实可靠和忠实的了解。按他的话说,“智力操作也许就是为了服务于知觉而进化出来的”。

  这并不是说,所有的知觉都是类似于思想的。罗克特别引用了瀑布错觉,作为在低水平的神经形式上可以解释的例子。可是,有关运动知觉和其它形式的知觉的大部分事实对他都好像需要高水平的过程。无意识的推论,比如我们利用纹理阶度提示来感觉距离,只是其中的一种。对这种解释的结果的描述是另外一种。在由波林绘制的含义模糊的老巫婆与少妇图案中,人们看到的不仅仅是简单辨认一个图像的结果,而是对自己解释一个特别的曲线是什么样子的结果:像一只鼻子,或像脸。许多物体被知觉出来的形式并非立即可以辨认出来的;辨认事物究竟是什么东西是通过这样一个过程得来的。

  知觉还经常需要这种或那种问题求解。人们很少认为知觉是问题求解,可罗克已经掌握了大量的证据——很多是从别人早期的研究中得来的,有些是从他自己的原创实验中得来的——可以显示,在很多情况下,我们寻找一个假说来解释我们看到的东西,把这种假设与别的可能性进行比较,然后选择好像能够解决使我们看到的东西产生意义这个问题的那一个。所有这些通常都发生在几分之一秒的时间内。

  一个例子:在一个自亥姆霍兹时代以来就知道的一项实验室现象中,如果一条像波浪的曲线横向通过一个细孔,如下图所示;

  大多数观察者首先看到小的元素在上下移动,可是,过一会儿后,其中一些人会突然看到这条曲线以直角在孔的前后移动。是什么东西产生了这些发生了变化的正确的知觉的呢?罗克发现,他们使用的一条提示是线条在通过小孔时不断变化的曲率;另一个是曲线的末尾,如果它能够为人们所看到的话。这些提示给思维提示了另一种假设——一条曲线平行通过小孔,而不是一个小元素在上下移动。这个假设好得多,思维很快就接受了,并认为这条线真的就是这个样子的。

  罗克是这样总结他的理论的:

  在理论水平上,至少按照提供在这里的一套理论来说,知觉和思想包含着推理。在有些情况下,总括或者规则是通过归纳在知觉中形成的。这些规则接着就被演绎加以利用,作为推出结论的前提。某些情形下的知觉可以概括为创造性的问题求解的结果,因为它也是在寻找一个基础(或者内部的解)从而得出一个具体的解释。知觉包含着决定,正如思想一样。最后形成知觉经验的操作与概括思维的东西是同一类型。

  直接或生态知觉理论:吉布森及其追随者的直接或生态知觉理论不仅仅试图解释深度知觉,如我们前面已经说过的一样,而且要解决总体的视知觉问题。吉布森的理论,即观察者通过环境的移动会产生一个连续变化的视觉排列,不仅仅是他的深度知觉解释的中心,而且也是他对形式、大小、距离和运动知觉的中心。

  吉布森于1979年在《视知觉的生态学方法》一书中阐述了他的理论,他的阐述深奥难解、穷根究底,很难读下去,部分原因是因为他创制了许多新词。可是,这本书在知觉心理学家中极其有限的接受程度,也许更多的是由于它否定了由其他人到目前为止在知觉研究中取得的几乎一切成果。吉布森典型的话如下所示(摘自他去世后发表的一篇文章):  

  一个世纪以来从对知觉的研究中得出的结论是微不足道的。从一个世纪以来对感觉的研究中获取的知识是不连贯的。我们没有足够的知觉理论,我们在寻找感觉当中所发现的东西是一串混杂的错觉、生理怪事和身体的感觉。这些含义是令人沮丧的。在解决知觉的问题上,必须有一个全新的开始。

  吉布森之所以决定要另起炉灶的理由听上去是足够充分的:他用这个问题(跟科夫卡一样)开始“为什么事物就是它们看上去的样子”,然后说:

  我们如何看出自己处于环境之中的什么地方?我们如何知道自己是不是在移动?如果是在移动,我们是在向哪里移动?我们如何知道事物的长处在哪里?我们如何知道怎样处理事情?

  为了正儿八经地重起炉灶,吉布森排除掉了大多数基本的假设,这都是哲学家和心理学家们在视知觉方面一向采用的假想。其中有:感觉是知觉的基础;来自外界的刺激会引起有机体的反应;有机体能产生反应;大脑可以处理、整合并解释信息;对视觉的合适研究从视网膜和大脑开始;光学的运动是视觉系统必须加以补偿的东西;环境只是由视网膜上的信息部分再现出来;知觉在很大程度上取决于推论等等。吉布森可谓是一把新扫帚。

  对前述假设加以全盘扫荡之后,吉布森提出了自己的新理论,这种理论多一些哲学意味,少一些实证基础,更多的是概念上的,而不是以资料以基础的,而且很难掌握。尽管如此,他还是通过实验达到他自己的结论的,首先是运动知觉,然后是形式和其它现实世界特点的形式。如我们在前面已经说过的,第一线曙光是从他参加航空人员研究中得出的,如他所言:

  我们了解了更多有关物体知觉的东西,我认为这比通过外形知觉进行的实验室标准实验多得多。一方面,我有一个挥之不去的感觉,即从来没有人真正在生活中看到过一个二维的东西,也就是说,一个事物的图片。人们看到的是一连串视点的转换,无穷多的外形,它们可以确定物体变化了的外形。

  从这里开始,他后来不仅排斥所有以图片和错觉为基础的研究,而且排斥就知觉作为思维对视网膜上的二维图片不完全的信息进行的解释的所有理论:

  最终,我慢慢理解了,图片形式的知觉与自然的知觉方式是何等的不同。前者是二手的知觉;后者是一手的知觉。从图片中来到眼睛里的有框架的视觉排列,与来自世界而到达眼睛里的自然的视觉排列完全不同……眼睛之所以进化;是因为它们要看这个世界,而不是看一个图片。自从我意识到这些以后,不管是什么意义上的用途,我一概回避使用 “视网膜图象”这个词了。

  吉布森的结论我们已经在前面看到,就是说,光学排列包含了我们需要的所有有关现实世界的信息。他承认,我们的对这个世界的知识由于神经系统的特性而有限,可是,他坚持认为,这些特性取决于对这个世界的进化适应,我们知道必须了解的所有环境特点。进化会在每种动物中产生一个知觉系统,会使它直接辨认对其有用的环境的特点——按吉布森的说法是“可利用性”,即任何东西的特征的利用都会使这个物种受益。因此,事物相对于观察者的大小和生理装备来说,看上去是可食用的、可饮用的、可以在上面行走的、可以在里面游泳的等等。

  简短地说,知觉不是对一种降格视网膜图象的解释过程,而是通过光学排列和光学流动直接和真实的现实体验。这对吉布森而言,就是知觉的核心机制——而不是由胡贝尔和威塞尔(他们进行的工作他认为是无关的)记录下来的神经现象,也不是认知过程,他认为认知过程是以错误和人工的假设为基础的。

  直接知觉也是吉布森对贝克莱的回答。我们知道,世界就在那里,在我们之外独立地存在着,因为当我们在环境中移动时,我们以连续变化的形式看见事物,而我们会体验到事物的连续性、真实感,且不依赖我们作为观察者而存在。其它的所有动物亦是如此。只有哲学家们才会去怀疑世界不是我们看上去的样子。吉布森的视知觉理论因而就大胆突破了对视觉的研究,从而进入认识论的领域。

  这还不算完。到他生命快要终结的时候,吉布森慢慢相信,知觉是全部心理学的支柱,而他的知觉理论可以给这门科学的许多领域带来巨大的变化。像思维、意识、学习和驱动力这样一些概念,都可以被生态心理学所代替,而生态心理学是以动物对地点、事件和物体有用的、危险的特征的意识为基础的,也是以他们对自己的动作进行组织和控制,以达到他们在现实世界里所欲求的结果为基础的。

  吉布森经由何种过程以期达到这种至高无尚的目标的,我们不得而知。《生态心理学》出版两年后他就去世了,尽管他有关视知觉,特别是光学流动的一些思想已成为被接受的知识的一部分,可是,这些知识和他更为雄心勃勃的一些概念却并没有给知觉带来一场革命,更不用说总体意义上的心理学。

  很可惜,吉布森会变得这样不能宽容,这样自负,他的光学流动概念当然是很有价值的,尽管它并不会使他认为的许多东西毫无必要,可是,他爱走极端的性格使他对心理学作出的贡献不能像它应该的那样广为接受。

  所有这些会把我们引向哪里?

  《心理学年报》1991年对知觉问题的回顾提出了全部三种方法——神经生理学的、认知学的以及吉布森式的方法——并认为这三种共同存在的理论和知识体系彼此并非互相排斥。以刺激为基础的神经学方法、以人类思维进行的认知方法和光学流动直接法都描述了全部现实的不同部分。他们并非彼此冲突和矛盾的,而是互补的。

  从这个立场出发,知觉好像就是心理学知识当中相对发达的一个领域,尽管有许多谜尚未解开。对这些有趣的问题,还有太多而不是太少的答案,但是,现代心理学其它的研究领域也是这般情景。未来是否会产生一个包罗万象的综合理论,这还需要时日来证明。同时,我们知道,我们已经了解了比以前多得多的知觉方面的情况,而且知道,还有更多的知觉知识尚需了解。

前一页
回目录
后一页
秋早文学