汉译世界学术名著

《心理学的故事》

墨顿·亨特著

第八章测量者

“能数尽量数”：弗兰西斯·高尔顿

　　1884年伦敦国际健康展上，在展厅里一个只有 36×6英尺的小小展台上，堂而皇之地标着“人体测量研究室”。展台里面有3位服务人员，长桌上摆着一些简单的仪器，其中有一个摆锤和一个反应键，一个手柄和转盘，一台光度计，用它可以比较小块的色彩，还有一个长管子，在助手往里充气时，它可以发出一阵哨音，音调可以通过调节管子终端上一杆有刻度的螺丝来调高，直到访问者再也听不到为止。参观者只需花3便士的费用，就可以测试和测量13项特征：反应时间、视力和听力的灵敏度、色彩分辨能力、判断长度的能力、拉力和拧力，吹气的力量、身高、体重、臂长、呼吸力量和肺活量。

　　人们为什么愿意花3个便士去获取这些数据，这是很难说的一件事，不过，在展览期间，共有9337位参观者真的付了钱。也许，这项活动本身就是值得奖励的；在那个时代，准确测量正成为科学的品质证明，它有很高的威望，哪怕人们在心里根本就没有什么具体的目的。

　　如果说，到“人体测量实验室”参观的人思想里面根本就没有什么具体的目的，其经营者倒是有的。他就是弗兰西斯·高尔顿，一位小个子的秃顶男子，他有白色的鬓脚，极具穿透力的蓝眼睛，突出的鼻梁和狭长的嘴，这些都给他一种大个子男人可能会嫉妒的权威风度。高尔顿是位业余的心理学家，他相信，人与人之间智力上的差别很大程度上是遗传所致，因此，应该奖励智力最好的一些人多多繁殖，这样的话，社会就可以使人类的进化得以进步。可是，怎样认出这些人呢？他相信，若干遗传的生理特征或者能力，特别是感官和反应时间的敏度，都与智力相关联，因而是辨识这些人的标准。（他之所以这样想的原因，是他自己的两项观察结果：首先，智力迟钝者的感官分辨度较差；第二，因工作要求而产生的感觉敏度，比如钢琴调音师、品酒师或者羊毛分捡者通常都是由男人进行的，他相信，这些人比女人聪明多了。）

　　高尔顿的遗传也许先天就决定了他的智力观。一方面，他是著名的医生和植物学家伊拉斯谟·达尔文的曾孙（另一个曾孙查尔斯·达尔文是高尔顿的堂兄弟）；另一方面，他还是极成功的银行家的孙子和儿子。可是，他还有另外的长处。早先，他曾收集了大量杰出男人的家谱，并证明，显耀——他认为这跟智力没有什么分别——是以家庭为单位传播的。

　　高尔顿自己花钱租用展台展示“人体测量实验室”，正是为了进行测试，以测量与智力相连的生理特征，并收集成果。这样一来，他就开启了一条心理学研究新形式的先河，与冯特当时正在莱比锡大学进行的实验研究完全不同，与通过内省法在哈佛实践的詹姆斯也不同，与“谈话治疗”的弗洛伊德正在维也纳与布罗伊尔商讨，并于不久后在自己的办公室里使用的方法亦有差异。

　　不管大家对高尔顿的观点作何感想，他本人倒不是一位花花公子，不是维多利亚时代闲极无聊的沙文主义者，而是一位有超凡智力天赋的科学家，他有热情，有好奇心，也有对工作的专注。他是一位真正的博学者，一位成功的发明家，一位赢得过大奖的地理学家，权威的游记作家，气象学家，他开发了第一套鉴别指纹的实用方法，第一个使用对成研究法来挑开遗传和环境的影响，他还发明了关联分析法，这是心理学和其它科学当中最有价值的研究工具。

　　最为重要的是，高尔顿是第一位使用智力测验的人，因此，他也就宣布了一种心理学研究的新形式，也宣布了一个新的研究领域：个体差异。其他的心理学家，特别是冯特派的心理学家，都在寻找万用的心理学原则，比如，对一种声音产生反射反应和有意识的反应各需要多长时间。高尔顿在寻找个体特征之间的差异（比如反应时间）以及这些差异与他们其它的特征和能力之间的关系。

　　高尔顿对个体间差异的兴趣反映了他那个时代心理学在英国的地位。与德国大学不一样，英国大学不支持心理学，没有建立心理学实验室，也不设心理学系。对这个领域感兴趣的人不是把它当作生理学或者心理疗法下面的一个专业，而是按照他们自己的兴趣，并当成一个个人爱好。在德国大学，高尔顿也许很可能就被导人生理心理学；而在英国，他可以自由地要求使他成了一位极有天赋的人物的东西，而且宣扬社会如何可以增多象他这样的人的人数。

　　高尔顿1822年出生于伯明翰，远远早于冯特、詹姆斯和弗洛伊德，不过，他对心理学的贡献都是在中年和晚年作出的，因而与前面几位几乎就是同时代人。高尔顿少年老成，在一个中产阶级知识分子家庭里，他是7个孩子中最小的一个，两岁半就开始读书，5岁前就可以读任何英语文体了，懂很多拉丁文，懂一些法文，还能解决最基本的算术问题。6岁时，他上当地一所学校，瞧不起其他的孩子，因为他们从没有听说《麻米翁），也不知道《伊利亚特》，7岁时，他就把阅读莎士比亚和普薄的作品当作消磨时间的办法了。

　　这颗极有希望的新星在寄宿学校显得十分暗淡，这里强调死记硬背，而自然的好奇心和独立精神被鞭打、布道和惩罚性的课外作业所压抑。他转到剑桥去连声招呼都没打：他感觉自己处在出人头地的压力下，整天被考试和学习成绩不如人所困扰。到三年级的时候，他还是没有能够在班上名列前茅，而且也看不到可以成为顶尖生（数学成绩特别好的荣誉生）的希望，他慢慢患上了心悸、头晕和走神的毛病。“头脑里面好像有台榨机在转，”他还说，“无法排谴这些念头，有时候我连书都看不进去，光是看到有字的纸都烦。”在精神崩溃的剧痛中，他离开学校回家了。只有在后来决定不去竞争荣誉生而只当普通生毕业后，他才回到学校完成了学业。他对考试和学习成绩的名次耿耿于怀，一直留在心里，一辈子都难以忘怀。

　　剑桥毕业后，高尔顿完成了医学培训（这他早就开始了），可当他父亲于1844年去世时，他已经很富裕了，因此放弃了行医的打算，过了好几年的绅士生活，骑马、射击、赴宴和旅行。可是，富闲的生活对他无法宁静的大脑来说远远不足以使他满足，因而，在二十七八岁的时候，他在咨询了皇家地理学会后，决定花自己的钱到西南非腹地进行两年的探险生活。他带回了大量制图信息，使原来地图上的一片空白有了内容，而在31岁的时候，他被授予这个学会的金奖，并被表彰为杰出的探险人。

　　1853年同年，他结了婚，而且让自己的旅行生活稍加收敛了一些，通过写游记来保持自己对冒险的兴趣，并帮助别人安排一些大型探险活动。可是，这些活动不能长期使他满足，因而，他转向了发明，生产出了一系列有用的装置，其中包括印刷发报器（电传的前身），一种改进的油泵，一种橇锁销的装置，一种旋转蒸汽机和一种潜望镜，这种潜望镜可以使他在拥挤的地方越过高个子看一些地方。

　　到他40岁的时候，因为需要一种新挑战，他捡起了气象学。他曾想到，他可以通过最近研制出来的一种发报器同时收集不同地方的天气数据，把这些数据弄在一张图上，看看重要的模式是否能够变得明显起来。当他这样做，并把具有同样气压的点用线条连接起来的时候，他就发现，它们可以描述几近环形的低压区和高压区（气旋和非气旋），其在地表的运动就是预测天气的基础。

　　约在同时，高尔顿终于来到他一辈子最感兴趣的领域，即智力的遗传。1859年，查尔斯·达尔文发表了他划时代的《物种起源》，这部著作极大地影响了高尔顿，给他留下深刻印象。达尔文最基本的假设之一是，在任何物种的成员之中，都有少量遗传的变化或者差异，进化是通过物竞天择、适者生存的原则发生的。尽管《物种起源》主要是针对动物而言的，但高尔顿把它的结论运用到了人类中。他推想，人类物种的进化也可能是通过有最好的大脑的有及其向子孙传递的天生的心理优越性而发生的。

　　这与高尔顿在剑桥时期的印象是一致的，即许多人之所以能够赢得荣誉和高分，是因为他们的父亲和父亲的父亲都是能赢的人。高尔顿现在设想并进行了一个有价值，如果不说是繁重的研究项目：他检查和统计一些家庭，一些在过去40年时间内赢得了剑桥的古典知识和数学高分的人。如他所料，高分一直是被一些特别家庭的子弟所获取的，这个比例极不匀称。他于1865年发表了自己的结果，从那以后，他的生活与工作就一直围绕着人类心理能力的遗传本质和通过选择繁殖而改进人类。高尔顿一定感到这是个令人百思不得其解的恶作剧，因为他和妻子从没有能够生出孩子来。一位弗洛伊德主义的心理学家可能会说，他对这个课题的固结是对他不能生育的补偿。

　　尽管高尔顿在剑桥一直不能拿到数学荣誉，但他的研究方法却是有数学特征的；跟古希腊雄辩家狄摩西尼一样，虽然有语音障碍，可偏要成为演说家一样，高尔顿使自己的弱点变成了最大的长处。他研究智力，或者说是研究任何使他感兴趣的问题的办法，就要找到某种能够计量的东西，这样他就可以计算比例，比较平均值，然后得出结论。在非洲，他测量了当地妇女的一些数字（在一个明智的距离之外），在与英国妇女的相应比较时，他发现这些数字相当不同。回到家后，在他到过的城市里，他记录了遇到的女人是漂亮、一般还是很丑的数据，他发现，漂亮女人的发生率在伦敦最高，在阿伯丁最低。在科学会议上，他数过每分钟发生烦燥不安的次数，在一个由50名听众组成的样品会议上，他发现，当讲演使听众感兴趣时，烦燥不安的情形会减少一半。

　　高尔顿1869年出版了《遗传天赋》，这是他第一部，也是他论心理能力遗传的4本书中最有影响的一部著作。他在该书中的方案是要选择一系列非同寻常的人，看看在这些人的家庭中，才智的普及率与一般家庭比较起来有多高。他的超常心理能力的标准，在这个时候，是在公众中的名声：

　　我认为社会及职业生涯是一个连续的检查。一切都是为了赢得别人的好感，也为了在自己的职业里获取成功，他们取得的成功与对他们总体的优越之处的普遍估计成比例。

　　为了确立这样的声望（因而是心理能力）有多么频繁，他计算了1868年和更早些年《伦敦时报》上的讣文，结果发现，在超过中年的100万人口当中，只有250人登了讣文，也就是只有四千分之一。

　　然后，他又着手将一些杰出人士家庭中的显著人物的比例与之相比较：如自宗教改革以来的英国法官、过去几百年以来的首相和著名军事首领、文学人物、科学家、诗人、画家、音乐家和新教神职人员的抽样结果。他计算出，这些人出现的比例与四千分之一的比例少得多；他估计，他们的频率为百万分之一。如果天才是遗传的，他应该在他们的亲戚中发现一个比百万分之一甚至四千分之一的比例大得多的杰出人物出现率。

　　高尔顿是根据“平均值的偏差率”来作为其对天才人物稀少率的估计的。这个定律是在那个世纪的初期由一些数学家推算出来的，他们要表示天文观测和靠运气赢牌的游戏中的数字或牌型的误差分布率。可是，它也适用于人类特征的可变性。1835年比利时天文学家阿道夫·奎特勒利用有关法国兵员的信息报告说，一些人很高，一些人很矮，其它的人都处在中间，最大数量的人是平均值或者接近平均值。这个数据，如果在图形上表示出来就会得出一个钟形曲线，大部分人都处在中间位置。从中间于始，越向两边走人越少。人类特征的“正常分布曲线”概念在今天是如此熟悉，但这个问题在奎特勒的时代竟然会成为一个新发现。

　　高尔顿推想，有关身高的实际情况，在人体的其它一些特征中也应该是一样的，如脑重、神经纤维的数量、感官灵敏度－因而也就是心理能力。果真如此，一个人的心理能力就应该遵守正常分布曲线。他把人类智力曲线分成16个等分——8个在平均值以上，8个在平均值以下——然后，根据曲线的形状计算每段的人口比例。他说，两个最高的段加起来只有百万分之二百四十八，这符合四千分之一的杰出人物讣文比例。可是，在曲线的两端，人数变得很少。真正杰出的人只有百万分之一，而且，他希望证明的是，这些人是天生如此，而不是造就或者自我教育而成的：

　　有人提出，婴儿生下来大都差不多，而且，在一个孩子与另一个孩子，一个人与另一个人之间造成差别的惟一原因就是稳步的教育和道德培养，我对这个假设没有什么耐心……对于天生平等这样的观点，我是持极力反对意见的。育儿园、中小学和大学的经验，再加上职业生涯的体验，都是与此相反的证据。

　　高尔顿感觉确定的是，在一个“进步的”社会里（他的原话），比如维多利亚时代的英国，天生能力一定会得到成功的嘉奖：“如果一个人有很高的智力水平，有愿意工作的急迫心情还有工作的力量，我无法理解这样一个人怎么可能被压抑住……（反过来，）他一定会受到万众的欢呼。”

　　高尔顿在宗谱研究上付出的辛勤劳动得出了成果，他发现，在他抽样调查的286位法官当中，约有九分之一是另一位法官的父亲、儿子或者兄弟；另外，在这些法官的亲戚当中，还有许多人是主教、海陆将军、小说家、诗人和医生。在这些人的家庭里面，杰出人物出现的几率比在普通家庭里面的出现几率高好几百倍；杰出人物其他方面的特征亦是如此。

　　他总结了有关杰出人物所有范畴里面的数据，并报告说，有百分之三十一的人有杰出的父亲，百分之四十一的人有杰出的兄弟，有百分之四十八的人有杰出的儿子。另外，一位杰出人物与其亲戚的关系越近，这位亲戚也会出名的可能性就越大。高尔顿很高兴，因为他已经彻底证明了他提出的假设——“人天生的能力来自遗传，与整个有机世界的自然特性遵守同一些严格规律。”

　　现代心理学家可以指出高尔顿方法学中好些天真的缺点，尤其是没有能够指出杰出人物成长的环境；如果大部分人是在极有利的环境中成长的，这些数据也许就会得出环境和遗传具有同样的影响力的结果。可是，不管高尔顿的方法中存在什么样的局限，他已经确立了智力当中的的遗传性，认为它是心理学研究当中一个有效的课题，从那以后，情况也的确如此。

　　可是，高尔顿的名声却蒙上了污点，因为根据其发现和历史给他显示出的意义，他提出一种社会政策。正是他合成了“优生学”这个术语的，从他1869年出版有关遗传天才的第一本书，到1911年死时为止，他一直认为，如果社会鼓励并奖励优秀人种的繁殖，社会就一定会有改善和进步：

　　（优生学是）改善血统的科学，它……认识到各种影响力的作用，而这些影响力倾向于以无论多么渺小的程度给予更合适的种族或者血统以更好的快速发展的机会，而不是给予那些不那么合适的种族以否则也会很快的速度发展的机会。

　　紧随着纳粹分子企图鼓励纯种“雅利安人”的繁殖，消灭犹太人、吉普赛人和其它被他们认为是人类害虫的人种之后，高尔顿的这个观点看上去就十分可怕了。按照他的传记作家们的说法，高尔顿本人看上去却是位温文尔雅和举止不俗的人，显然不是种族灭绝论的倡导者，可是，在有关对于不想要的民族的合适处理这个问题上，高尔顿所说的一些话就已经离这条线很近了：

　　我看不出，等级制度的蛮横之处，怎么可能会妨碍有天赋的社会阶层，因为他们有能力用慈爱对待同胞，只要他们保持住自己的独身生活。可是，如果这些人还接二连三地生出一些道德感、智力和生理素质都很差的孩子，很容易相信，这些人被视为国家的敌人，并且使许多仁慈之举前功尽弃的一天也许就会到来。

　　人们兴许会想，像这样一位把自己所属的这个种族以外的种族都看作下等人的人，他一定就是个种族歧视分子，可高尔顿却不是。尽管他估计黑人的平均智力比英国人低两个级别，但他却认为英国人比古希腊人的智力水平也低两个段位；他还说过，他倒想去调查一下意大利人和犹太人：“这两个国家好像都有很多具备高智商种子的家族。”

　　高尔顿有关优生学的思想并没有成为今日心理学的任何一个部分，不过，他的这些想法倒是引导他发明了一些在这个领域里非常有价值的研究方法。心理特征遗传学上的家族研究只是其中一例。另一例，也是更有用的一例是由对《遗传天赋》的评论引起的，这个批评指出了环境对智力的影响，特别是由瑞士植物学家阿方斯·康多尔提出的统计学数据，证明伟大的科学家倾向于来自气候温和、宗教宽容、政体民主和有健康商业兴趣的国家——这些都是环境的影响。

　　这刺激了高尔顿，使他想到要去区分遗传和环境在显著成就中的影响，特别是对科学的影响。1874年，在《科学英国人》中，他很公平地提出了这个问题，其对进入了语言的基因及环境对成长影响的论述非常简洁：

　　“天性和教养”这个词组是词汇方便的二轮马车，因为它把性格所从构成的无数元素分在两个不同的名目之下。天性是一个人随身带到这个世界里来的一切；教养是他出生之后对他造成的每一种影响。区别很清楚：一种使婴儿就是它实际的样子，包括它潜在的生长功能和意识；另一种提供生长的环境，这样，天性的倾向可能会加强或者受到阻碍，或者会造成全新的环境。

　　为了了解天性和教养在科学成就上产生的作用，高尔顿发明了另一个新的研究工具：自我问卷。他设计了一套问卷，让被调查者回答有关民族、宗教、社会和政治背景、性格特征和甚至头发颜色及帽子大小的问题，再将问卷分发给皇家协会的200名会员。其中的一些关键问题有：“您的科学品位看上去有多少像是天生的？对科学的这些兴趣很大程度上是在成人之后因为某些事而产生的吗？如果是，是哪些事件呢？”

　　尽管问卷长得“惊人”——高尔顿自己无奈的用语——但大部分受试者都完成并寄回了问卷。（这是历史上第一份此类问卷；今天的研究者们也许不会遇到这样积极的配合。）高尔顿将反馈列入表中后发现，大部分人相信他们对科学的兴趣是天生的；另一方面，大部分反馈者在教育对他们的帮助或者阻碍这个话题上有很多要说。高尔顿感觉到非得承认环境因素不可，特别是教育，它可以加强或者阻碍科学资质的发展，科学资质的遗传并不一定就会引向成功。可是，他认为，遗传资质是科学成就中最为基本的因素，这一点已经显示出来。

　　过了很长一段时间以后，由于研究方法在不断发展，人们会发现，高尔顿的问卷和他对数据的分析都有严重的错误。一方面，其中许多问题，特别是有关受试者成功因素的问题，只会得出非常主观的答案。另一方面，高尔顿没有把问卷交给一些不那么出名的科学家和非科学家们来做；第三方面，他没有办法（虽然后来他又发明了一个）用数学办法来衡量任何两个因素之间的关系，因而就无法评判到底是偶然还是重要的因素。不过，高尔顿使用的问卷和数据分析法都是具有极重要意义的发明，并且，从此之后就成了心理学研究当中重要的工具。

　　在接下来的10年中，已届中年的高尔顿工作更加勤奋，他致力于个人之间的心理学差异的研究。1883年，他发表了一个杂篇，书名是《人类才能及其发展探索》，里面讨论到了约3O个不同的课题，这是科学与思辩、数据和猜想、统计与传闻的奇妙结合。其中一些本来是要传达科学的意义，结果却变成了一位维多利亚时代男子的偏见集。比如，在论“性格”这章里，高尔顿在没有任何证据的情况下提出妄断说：“在妇女的性格中，有一个十分明显的特别之处，那就是，她们反复无常，喜欢忸怩作态，不像男人那么直截了当。”他在进化论基础上证明这个观点：在追求配偶时，如果没有雌性的犹豫和雄性的竞争，“种族可能会因为没有性选择而降低水平，而做爱前拖泥带水的前戏正好就是要提供性选择机会的”。

　　可是，《人类才能及其发展》中有很大一部分是极有创见的科学研究成果。有一种是要解决唤取心理图象的能力的。高尔顿发现，许多非科学家都以非常鲜明的心理图象思考问题，而许多科学家都是以纯粹抽象的用语来思考的，而他推想，唤取鲜明心理图象的能力会妨碍以高度概括和抽象的形式思考问题。在另一份研究中，他报告了他发明的词汇联想测试；他设计了一个由75个刺激用的单词构成的单词表，让自己一个一个地看这些单词，把自己想到的两个或者三个联想单词写在旁边。他所学的大部分单词都不是什么了不起的，比如，重复测试时，他会得到同样的联想词。可是，他观察到，许多联想单词是从他自己的经验中得来的，而别人是不太可能跟他产生同样的联想的，这个发现有极重要的价值。结果，词汇联想测试成了研究个体间性格特征差异的主要手段。

　　另一项值得注意的研究是高尔顿的另一个发明。在苦苦思索如何演示天性和教养对意识和性格的影响这个问题时，他想到了一绝妙的主意：检查“两个儿时极相像，但后来分开养；或者原来不太像，后来却一起养大的双胞胎后来的情况。”他知道，双胞胎有两种：有些属于在生理上几乎一模一样的，另一些与普通兄弟姐妹之间的相似性差不多。如果两个双胞胎原来很相像，可后来却又不太相像，这可能是后天的教养使然；如果两个原来不怎么相像，后来却一起同样哺育，因而长得很相像，则很可能是天性使然。

　　这是个非常了不起的假设，不过，高尔顿证明它的方法却很粗浅。他给认识的双胞胎或者他们的亲戚寄去问卷；他还请他们把其他一些双胞胎的名字告诉他。最终，他找到了94个例子，其中80个“极相像”（也许一模一样），35个提供了足够派上用场的细节。

　　他对双胞胎的研究报告在很大程度上是由逸闻趣事构成的；报告讲到了一些跟人开玩笑的双胞胎，或者，由于校长分不清哪一个应该受处罚而同时处罚两个人，还讲到有时候弟弟会去追哥哥的女朋友，等等。可是，当高尔顿对档案材料进行分类，希望找到后来性格不一样的双胞胎，他发现，对某些人来说，“肉体和意识的相像到老一直不变，不管生活的环境如何不同”。其他人没有显示出差异，而在每种情况下，这都是因为一种疾病或者事故只影响到了其中的一个。对照而言，儿童时期不相像的双胞胎（可能是兄弟），哪怕是在一起以一样的方法哺养，可在许多年里仍然不相像。

　　虽然没有人注意到他宣布的内容，可是，他说：“这个结论没有例外，即，当教养的差别不能够超过在同一个国家，同一个社会阶层的人群中常见的那种东西时，天性会极大地胜过教养。”按照现代的观点，这项研究过于简单化，不准确，而且远远构不成一个结论。但是，这仍然是个值得注意的首次，双胞胎研究方法一直以来就成了一个重要的研究策略，而且也是评估遗传和环境对智力、性格特征和其它心理学特征的影响上几乎最有决定性的办法。

　　最后，高尔顿还在《人类才能及其发展探索》中讨论过一系列的心理测试，以便于快速简单地辨认较高智力的人，因而成为他通过优生学来改善人类的庞大梦想的一部分。《人类才能及其发展探索》发表的那一年，他开始在国际健康展览会上尝试他的试验。展览会闭幕后，他得到南肯辛顿博物馆的许可，在那里再进行几年实验室试验。他在这个时期发明了一系列新的心理测试办法，其中有一根铁棒，上面刻有不同的距离，以测验估计长度的能力。有一块转盘，用来测验判断垂直度的能力，一套重物按照重量排列起来，还有一些瓶子，里面装着芬芳物质，瓶子按气味浓度排列起来。

　　高尔顿已到了60岁，这个年龄远远超出了科学家们作出其重大贡献的年头，而他却是在这个时候取得重大成就的。相应地，这项工作花费了他毕生的精力，一辈子测个没完。他在“人体测验实验室”里面进行的每一种测量都得出了一个钟形的或然曲线，可是，高尔顿感觉到，如果他能够发现不同的几套测量结果之间的相互关系，兴许可以从中收集到其它一些极为重要的信息。有些关系是非常明显的——比如，个子较高的人倾向于更重些——可是，其它几组测量结果中的关系是怎样的呢？它们当中的哪些一起变化，而且变化的角度相同？只有了解数据是如何相关的，哪些测量与其它一些测量没有什么关系，他才能设计一套理想的测试来指示智力情况。

　　在他进行遗传天才研究时，其中的一个奇怪发现使他开始考虑到了这个问题：父母不同寻常的孩子一般不那么与众不同。比如，从生理特征上来说，父母很高的孩子倾向于不那么高，不过仍然高于平均值，而父母很矮的孩子却不那么矮，可平均还是比别人矮，这个倾向，高尔顿把它叫做“回归平常”（后来，这个词变成了“回归中间值”）。他希望知道，它在指示遗传力量上有什么意义，以及如何以数学方式表达出来。从表面上看去，这似乎就是一个纯粹的智力谜，但结果，解决这个问题的办法将成为心理学和其它许多学科当中最为有用的研究工具之一。

　　高尔顿对这个问题考虑了很长一段时间，然后对约3O0名儿童的身高确定了一个“散点方案”。首先，他画一个栅栏，横向的尺度是孩子的高度，垂直尺度为父母的身高（实际上是“中间父母”的身高——每对父母的平均身高）。然后，在每个栅栏的格子里面（特定的某个孩子的身高与某个特定的父母身高之间的交叉点），他填上符合这个条件的孩子们的人数。这张散点图的样子如下所示：

有一阵子，这个图没有给他带来任何启示；接着，一天早晨，他一边等车一边仔细看这个图，突然间，他发现了数字间的规律。如果他画一条线，将任何一组几乎相等的值连接起来，这条线将会描述出一个斜过去的椭圆，其中心点是散点图的中心点（父母和孩子的平均值）。当他这样做，并跨过椭圆画一些线条，将其极点的横点和竖点连接起来时，它们在每个垂直栏上都通过了孩子的平均身高，且在每个横排上通过了父母的平均身高值。该图形状如下所示：

　　这个椭圆和跨过中间的线条显示了他一直在寻找的关系。在任何给定的父母身高中（“横向正切点轨迹”），孩子的平均身高与中间值（平均值）只有父母身高平均值与中间值偏差的三分之二，换句话说，孩子们已经向中间值“回归了”三分之一。反过来说，对于任何一个孩子的身高来说（“垂直正切点的轨迹”），父母都更加接近中间值了（也就是说，异常孩子的父母没有孩子们那么异常。）高尔顿已经发现了“回归线”这个分析工具。如果孩子们的身高与父母的身高一模一样，两条回归线就会偶合；如果孩子们的身高与父母的身高没有任何关系，则回归线互彼此垂直。而事实是，这两条线相当接近，意思是，在同一情况下的两个变量之间的关系——它们的相关性——约在总量与零之间的某个地方。

　　那是1886年。10年之后，高尔顿的学生，后来也是他的传记作家，英国生物测定学家卡尔·皮尔逊研究出了一个计算“相关关系系数”的数学平均值——他把它叫做r，代表回归——而不需要再建立散点图。对于任何两组数据，它将会显示出一个相关关系，从1（一种完美的一对一协变关系）到0（没有任何关系），再到——l（完全相反的关系）。到今天为止，皮尔逊法一直是评估相关性的标准方法。在父母孩子的关系中，r系数为0．47（与高尔顿第一次的计算结果稍有不同）：也就是说，孩子们与人口的平均值只有父母的约一半远。

　　高尔顿对相关性分析的发现，其重要性无论怎么强调都不能算过分。它意味着，无论什么时候，当两个变量朝同一个方向（或者向反方向）改变时，哪怕不是同一种程度，它们也都是相关的，而相关的强度会指示它们之间的关系有多大意义。关系越紧密，它是偶然性的可能性就越小，这种连接的因果关系就越强。一个变量可能是另一个变量的原因（或者是原因之一），反过来亦是一样，或者，它们也许是其它一些原因共同发生和相关的效果。在两种情况下，一种紧密的联系表明可以解释正在研究中的某个现象。在这些数字中，如果没有一个答案，至少有一些线索存在。

　　（哪怕是紧密的相关关系，严格来说也有可能是“以假乱真的”——即其它一些因素的人为结果。比如，在男人中间，秃头的程度与婚姻时间的长短相关——这不是因为其中的一个因素与另一个因素有什么关系，而是因为年岁与这两个因素都有关系。后来的分析技巧已经能够筛选出这些误导性的相关关系。）

　　心理学家乔治·米勒在评估高尔顿的发现成果的价值时写道：

　　协变关系是一个重要的概念，不仅对基因学和心理学是如此，而且对所有的科学探索都同样重要。科学家就是要寻找各种现象的原因；他所发现的一切都是先决条件和必然条件之间的相关关系……高尔顿的洞察力一直，而且还将继续处在现代社会及行为科学广大的伸展地带的中心，对工程师和自然科学工作者同样都有着数不清的用途。

　　再加上他在重要的方法学上面所做的其它贡献，人们不难看出，尽管高尔顿不是一位深刻的思想家，可是，雷蒙德·番切尔为什么会说：“对现代心理学来说，没有多少人产生过像他这样大的影响。”　

高尔顿的矛盾

　　高尔顿工作的成果却是个矛盾。尽管他在方法学上的许多发明在现代心理学研究中具有至关重要的意义，可是，他的名字对大部分心理学家没有什么意义，而对一般公众更是闻所未闻。他长期于大学氛围之外进行研究工作，没有创立任何心理学学派，没有指导博士论文，弟子也没有几个。另外，他主要的贡献都是研究方法而不是给予人以启发的理论，可世界只记得后者，哪怕真正有创见的研究方法经常是伟大思想的通道。

　　还有另外一个更大的矛盾。对个人间智力的差别进行测量，这是高尔顿一生的主要目标，它对西方社会产生的巨大影响从目前这个世纪的早期就开始了——可并不是通过他的方法。尽管他想到过，也创立了心理测试，可是，他的名字并未与今天使用的任何测试法联系在一起，在过去的80年内也没有；除了心理学历史以外，如果说还有人记得他的话，那不是因为他是心理测试的创始人，而是优生学的创始人。

　　在大不列巅，高尔顿是一门个人差别“新心理学”的创立者，可是，几乎没有任何英国心理学家认为他们自己是高尔顿派的。在19世纪晚期，大部分英国实验心理学家都去了德国学习培训，并将冯特过程及理论带回了英国。他们采纳了高尔顿的一些思想和方法学上的发明创造，可是，还是认为他们自己属于冯特派。德国新心理学比在英国享有高得多的声望；这是大学系统内的产物，因而是“纯”科学，而高尔顿的思想和方法学的发明创造却是一位有天才的业余学者弄出来的产品，而且是服务于实践用途的。

　　高尔顿的影响在美国是很大的，可是，在这里，同样也不是以心理学学派的形式出现的。到上个世纪之交时，许多美国心理学家都成了结构主义学家（冯特式的），他们对个人差别的测量没有什么兴趣。到1905年，功能主义（詹姆斯学派）处于控制地位，可是，尽管他们对高尔顿的许多观点意见一致，可是，他们对自己的称呼远远大于他的心理学，他们认为自己是更高级别的理论学派。许多美国心理学者当中最出名的一些人物，如约翰·杜威、詹姆斯·罗兰德·安吉尔、乔治·H·米德、詹姆斯·麦基恩·卡特尔、爱德华·李·桑代克和罗伯茨·S·伍德沃思，他们都跟詹姆斯一样，将自己的理论建立在心理生存的进化论及其社会等同物，即出人头地的愿望。没有哪个人把自己叫做高尔顿主义者，可是，他们都共有一个实用主义的世界观，因此，他们所有的人都认为高尔顿的测量方法很有价值，因为这些方法对个人间的差别的判定如此实际可行。

　　人体测量最热情的倡导者是詹姆斯·麦基思·卡特尔（1860－1944）。他出生在宾夕法尼亚的伊斯顿城，在拉弗页大学接受教育，1883年去莱比锡，跟随冯特学习到1886年。他主要的研究兴趣是反应时间，可是，他是个极端独立的青年学生，敢于向冯特就一些关键的方法问题提出挑战：卡特尔提出怀疑，说并不是所有的人都能真正以冯特提出的办法内省的，也就是把反应时间分成感觉、选择等等。结果，卡特尔尽管是冯特的实验室助手，但他只有在自己的住处进行一些实验，因为冯特不允许他在实验室进行不遵守他的内省法的实验。

　　卡特尔对他检测过的一些人当中不同的反应时间感到兴趣，并在1885年的一篇论文里讨论了这件事，把它看作是“特别兴趣”。次年获取博士学位后，他来到伦敦，遇到了高尔顿，而且，尽管他们年龄相差40岁，他觉得这人十分亲近。他对高尔顿的工作留下了深刻印象——许多年之后，卡特尔称他是“我认识的最伟大的一个人”——在两年时间里，他在南肯辛顿博物馆的“人体测验实验室”里时不时地为高尔顿工作，并熟悉了在这里进行的一些测验。

　　卡特尔1889年刚28岁，他成了宾夕法尼亚大学的心理学教授（也许是世界上第一位获得这个教衔的人；詹姆斯在哈佛并非授予这样一个头衔，直到次年才授予他心理学教授头衔。）卡特尔收集了一套测试题，约50个，有些是高尔顿的，有些是从费希纳、冯特和其它的来源搞来的，并把其中的十项测验交给学生去测量智力的个体差异。他提出，如高尔顿所说，通过这些测量得出的主要生理特征与智力是相关的：握力、臂膀运动的速度、对声音的反应时间、重量上仅仅可以辨别出来的差别、对字母的记忆宽度和其它五种特征。1890年，他在《意识》杂志的一篇论文中描述了他的工作，这篇文章叫做“心理测试和测量”；这篇文章第一次用到了这个术语，并掀起了心理测试运动。

　　卡特尔于1891年去了哥伦比亚大学，成了心理学教授和系主任。他把心理测试的范围扩大了，每年让50个新生志愿者进行这些测试。他的目的使人敬佩，那就是要证明，这些测量可以测出智力来，可以显示测试结果与学生的成绩之间的关系；为了达到这个目的，他收集了近10年的测试数据和学生成绩。同时，同一种测验智力方法在1893年的芝加哥世界博览会上也展示出来，美国心理学协会的一位领导人约瑟夫·贾斯特罗在这里建起了一座与高尔顿的“人体测量学实验室”差不多的复制品实验室。到访的心理学家们毫不例外地感到有兴趣，而且都留下了深刻的印象；在19世纪90年代，这样的测试是在美国和欧洲的一些实验室里开始的。

　　到1901年，卡特尔已经收集到了足够的数据，可以进行确定的研究了，而他的学生之一克拉克·威斯勒，也对这些数据进行了一项高尔顿-皮尔逊式的相关性分析。他的发现使卡特尔十分吃惊，也很沮丧：学生的成绩与任何一项人体测验结果都没有明显的相关性。如果说成绩与学术地位可以指示智力水平，人体测试却不能够。另外，这些测试之间的相关性也极差，看上去好像很明显，这些测试根本就没有在测量同一个特征，而不是事先假设的那样可以测量智力。这样，由于又出现了一个矛盾，正如高尔顿的发现，即相关关系的分析所示，他的智力测验方法证明是无效的。

　　可是，这并不是卡特尔或者心理测试的末日。毫不气馁的卡特尔设计了其它的一系列测试，特别是在价值评判方面，编辑了两份科学杂志，创立了心理学公司，把心理学应用作为一门生意来做，并成为心理学忙碌、实际、商业性一面的代表人物。

　　尽管高尔顿利用人体测量方法来进行心理测验的活动很快就告一段落了。可是，不同的一种智力测试法很快又替代了他们的位置，并很快使个体差异研究成了美国心理学当中影响最大的一个领域。到1917年，美国心理学协会会议上近一半多的研究报告都是关于个体差异的。高尔顿对心理测试的评估控制了美国心理学，而智力测试也成了一个主要的方法，通过这些方法，遗传主义者的观点影响了学校开设的课程、军事机构里让男兵们操练的任务和这个国家的移民政策。

　　最后一个矛盾是，这些结果没有哪一项是发明了智力测试并排除了高尔顿法的人所要看到的。阿尔弗雷德·比亲的测试胜过了高尔顿法；高尔顿的观点胜过了比奈的观点。　　

心理年龄法：阿尔弗雷德·比奈

　　每个学《心理学导论》的本科生都知道阿尔弗雷德·比奈，可他并不是一位伟大的心理学家；他没有形成任何公式，没有任何聪明的发现，也算不得一位有号召力的教师。可是，他曾有过一个虽然比较简单，但极富创意的想法，根据这个想法，他和合作者西奥多·西蒙搞出了一种心理测试，该项测试给千百万人的生活带来了深刻的影响。

　　比奈1857年出生于法国的尼斯；他父亲是位医生，母亲是位有艺术天才的妇女。父母在他年轻的时候离异，他因此跟母亲一起长大。不管是不是出于这个在当时不多见的原因，还是因为他是家里惟一的孩子，或者是因为他的天性如此，他长大之后成了一个相当内向的人，没有什么朋友，一个人独自工作和学习的时候感到最自在。

　　为了找到适合自己的专长，比奈走了好几段弯路。在学生时代，他曾拿到一个法律学位，可又认为科学更有趣，因此转而学医。可是，由于他有固定的收入，因此不需要自己去谋一份生活，他又放弃学医，转而研究心理学，因为他受心理学的吸引已经有年头了。他很不聪明地选择了不以正规的方式接受心理学培训，却让自己独自埋头于图书馆的阅读之中（除了其它著作外，他还在这里阅读了高尔顿的《遗传天赋》一书）。

　　他这种自我教育法本不会得出什么成果的，可是，1883年，他的一位老同学，即约琴夫·巴宾斯基（这人后来会发现以他的名字命名的婴儿反射），把他介绍给查尔斯·弗雷，他是萨尔佩特里埃医院的员工，后来又把比奈介绍给了自己的院长让·巴丁·夏尔科。虽然比奈没有医学学位，也没有心理学学位，但夏尔科对他的智力、知识和对催眠的兴趣留下了深刻印象，并让他在萨尔佩特里埃医院担任了神经学和催眠法的职位。

　　比奈在这里颇有成果地工作了几年，可又走了一条弯路。他和弗雷进行了一些控制得不太好的催眠试验，他们想象，自己已经发现了在歇斯底里病人中以前不知道的现象，并把他们的发现公之于世了。他们说，通过磁铁的使用，他们已经可以转移处于催眠状态下的病人正在进行的任何行动，比如举臂、从身体的一边到另一边。更令人吃惊的是，他们已经能够通过磁铁的使用来让病人的情绪或者感觉变成相反的内容，比如，将对蛇的害怕变成对蛇的喜欢。

　　这种就算是在梅斯梅尔的时代看上去都令人生疑的戏法立即招至批评。奥古斯丁·里埃波及其弟子，即催眠术中的兰西学派，都说这是通过暗示达到效果的；他们在非歇斯底里受试者身上光通过暗示就达到了同样的效果，根本就用不着什么磁铁。因为这项测试的结果而使自己的名声受到威胁的比奈只得公开宣称，这些结果是无意间由实验者暗示得来的，因而没有什么价值。（后来，他经常说：“告诉我你在找什么，我就可以把你想要的东西告诉你。”这句简洁的话后来在心理学家中成了著名的“实验者期望效果”。）

　　这次令人不安的经历使比奈只好退出医院，也不再与其它心理学家们接触了。在约两年的孤独生活里，他就恐怖、谋杀和心理疾病等主题编导了好几部戏剧。他还兴高采烈地花费很多时间观察他的两个孩子，马德兰和艾丽丝的思想过程，这两个孩子当时一个4岁半，另一个才2岁半。为了研究这个年岁的思维本质，他设计了一系列简单地测试：在一项测试中，他请孩子们说出某些日常用品的用途；在另一项测试中，他请孩子们判断两叠硬币或者两堆豆子中哪堆或者哪叠数量多些；在第三项测试中，他从一堆物件里面当面拿走一些，然后一件一件还原，再问他们还有多少没有还回来。当这两个小姑娘长大一些时，他让她们解决一些问题，以便研究推理过程的发展。他在三篇论文里发表的这些研究埋下了发展心理学家让·皮亚杰未来成就的伏笔，而且也是使比奈出名的第一部分工作。

　　朝这个方向迈出的另一步是，在35岁的时候，他又回到了职业生活当中。1892年，在一个火车站的站台上，他碰巧遇见享利·波尼斯，即巴黎大学生理心理学实验室的负责人，并与他就催眠法进行了友好的争辩。结局是，波尼斯邀请比奈当他的助手，而且，两年后，当波尼斯退休时，比奈接替了他的职位。他在实验室里进行了自己的研究，指导了许多学生，并在37岁时获得了迟来的博士学位。这个学位是自然科学学位，而不是心理学，可是，到这时，由于他的地位和发表的作品，他成了法国心理学界的著名人物。而且，也因为他满脸卷起的胡须，夹鼻眼镜和一头很有艺术气息地散布于前额上的卷发，他看上去也的确像那么回事。可他最大的愿望，即要当心理学教授的愿望，却从来没有兑现；对于这个机构内的成员来说，他在催眠法上的恶名、他不正规的教育和他博士学位的错位，都对他不利。

　　除此之外，还有他最近奇怪的一种热情：他想证明，智力直接与大脑的体积相关，并可以通过“测颅术”（头颅测量）进行测量。他读过保尔·洛克的书，也相信他（也许还有高尔顿）这方面的观点。比奈回顾了以前的测颅研究，在他自己身上做了一些颅部测量，并且在1898年和1901年发表了九篇论述这个问题的论文，这些论文都发表在《心理学年刊》上，这是他创办的一家杂志，而且由他当编辑。

　　这次，他又走了弯路。在这个系列的初期，他曾说过，大脑尺寸与智力有相关关系这一点是“不容置疑的”，可后来，他测量了好多学童的头颅，这些学童都是他们的老师作为班上智力最佳的学生和其它一些作为最差的学生选出来的，他发现，头脑大小的差别没有什么意义。在大量重新测量工作和对他的数据重新认识之后，他得出结论说，大脑尺寸的确存在有规律但程度很小的差别，可是，这些差别只存在于每组最聪明和最不聪明的5个学生中。他抛弃了把测颅术当作测量智力的方法。

　　到这个时候，人们很难猜测，已届中年的比奈会很快干出一份的确有相当学术内容的工作来，这份工作对全世界产生了相当大的影响。

　　他仍然保持着对智力测量的兴趣，可是，他回到了他研究女儿们的思维过程的方法中去了。他认为智力不是高尔顿所设想的那一种，即以感觉和运动能力来认识智力，而是认知能力的综合。比奈与实验室的一位同事维克多·享利开始在一些巴黎儿童身上进行实验，他们用一系列测试测验他们的能力——记忆测试（对词汇、音乐符号、颜色和数字的记忆）、词汇联想测试、句法完形测试等等。他们的发现说明，如果知道如何评价这些数据，这一系列类似的测试可能会测量出智力来。

　　一系列顺利的事情使比奈不断地发展他的研究工作。对儿童的强制普通教育是1881年在法国制定的，儿童心理学研究自由协会是一个专业组织，比奈是其中成员，1889年，这个协会开始催促公共教育部，让他们想法帮助一些心理迟钝儿童，这些孩子得上学学习，可很难跟上正常的班级。1904年，公共教育部指定了一个委员会，比奈亦是其成员之一，让他们研究这个问题。这个委员会一致推荐说，通过考试确定为心理迟钝的儿童应该放在一个特殊的班级或者学校里，让他们在这里接受合适的教育，可是，关于这个考试应该包括什么内容，委员会未置一词。

　　比奈及其以前在测颅研究中的同事西奥多·西蒙自觉承担起这份工作来，以编制一份考题。他们首先汇集了一系列试题，有些从早期在萨尔佩特里埃医院研究的题目中抽出来，其它一些从比奈和享利在巴黎大学实验室的工作中抽出来，再还有一些是他们自己设计的。然后，他们去一些小学，让3－12岁的学生做这些试题。这些学生有些是老师认为一般的，还有一些是中下等水平的学生。他们还测试了在萨尔佩特里埃医院住院的一些儿童，这些孩子被认为是白痴、低能和弱智儿童。

　　比奈和西蒙很费力地指导几百儿童进行这些考试，然后删去或者修改一些不合适的题目，最后形成了著名的“智力测定表”。他们在1905年的《心理学年刊》里将这个测定表描述为“一系列越来越难的测试题，从可以观察到的最低的难度水平，到最后以普通的智力题结束。系列中的每组（测试）对应于某种不同的智力水平”。

　　到现在，它还不是智力测验，因为它没有提供评分办法；它只是第一次尝试，告诉人们可以通过什么样的方法来设计智力测验。这套试题的前30道题极为容易。实验者将一根点着的火柴在受试者的面前前后晃动，看看是否存在与视力相关的头眼谐调。后面的测试极难，包括一些判断能力，如哪些线段长些，重复三个数字，重复15个单词长的词汇，从记忆里面回忆出展示过的图案，从一张折了一层或者数层的纸里面剪下一部分后，展开来的图案看上去会是什么样子，最后还有最难的问题，即确定一些抽象术语的意义（“尊敬与喜爱之间有何差别？疲倦与悲伤之间有何差别？”）。在每个年龄段内，正常的孩子都可以在某个程度上令人满意地回答问题，并完成任务；年龄越大，他们能够进行下去的题目就越多。这个测定表实际上的确是某种测量工具。

　　比奈和西蒙在测定某些孩子是可以认作正常的，其它一些孩子可以认作心理迟钝的，这样做的时候，他们产生了一个了不起的想法：心理迟钝儿童的智力与正常儿童的智力并非是不同的智力，而只是没有完全发育到这个年龄应有的水平；他们以大约与比自己小一些的儿童一样的方式回答这些问题。因此，智力可以通过比较一个孩子的操作能力与这个年龄组的正常孩子平均的操作能力而测量。如比奈和西蒙所言：　　

　　我们将了解……一个（孩子）是否在被认为是正常孩子的其它孩子的平均水平之上，或者他是否还留在这个水平之下。理解正常人智力发育的正常过程，我们就能够确定一个人超前或者落后了多少年。一句话，我们将能够确定白痴、低能和弱智对应于这个表的哪一级。

　　按照年龄来确定智力，并收集一套可以测量一个孩子的心理年龄的认知任务，这就替代了高尔顿的人体测验法，并成了智力测验运动的基础。

　　比奈和西蒙发表了成果之后，他们开始考虑自己发现的一些缺点和别人提出的一些批评，然后于1908年，后来又在1911年广泛地修改了这套测定法。这些修改还包括了一些评分信息——任何年龄的孩子应该能够回答的问题或者完成的任务的一套标准。（如果任何年龄组百分之六十到九十的孩子都能通过某项测试，比奈和西蒙就认为这项测试对这个年龄组是正常的。）1911年的测定表上有下列项目：

　　3岁：

　　指鼻子、眼睛和嘴。

　　重复两位数字。

　　列举图画中物体。

　　说出一些人的姓。

　　重复一个由6个音节组成的句子。

　　6岁：

　　区别早晨和晚上。

　　通过用途定义一个词。（例如：“叉子是吃东西用的。”）

　　照样子画一个心形物。

　　数13便士。

　　在图画中指出画得丑的脸和好看的脸。

　　9岁：

　　从20苏中找出零钱来。（苏为法国旧币名）

　　指出一些词比用途更高的形式。（例如：“叉子是一种进餐用具。”）

　　分出9种钱币的价值来。

　　按顺序报出月份的名字来。

　　回答简单的“综合问题”。（如：问：“错过火车后怎么办？答：等下趟车。”）

　　12岁：

　　抵抗暗示。（让孩子看四对不同长度的线条，然后问每对中哪根长些；最后一对线条的长度是一样的。）

　　用三个既定的词汇组成一个句子。

　　3分钟内说出6O个单词。

　　给三个抽象词定义（慈善、公正、善良）。

　　根据一个杂乱的句子说出有意义的话。

　　1908年的测定表包括了对13岁儿童的测试，1911年的表包括了对成人的测试。如以后的研究人员会指出的一样，智力的发育一直到成人的早期，然后就停下来了。

　　1908年和1911年的修改版是第一份功能性智力测试，对课堂操作和“智力水平”有效（里面有代表每一种年龄正常反应水平的分数）。心理学家们第一次可以确定，一个孩子的心理发育水平比正常水平超前或者落后多少年。比奈和西蒙说，如果孩子的心理年龄比他或她的自然年龄晚2－3年，这孩子可能就需要特别教育了。他们还按心理年龄确定了三种心理迟钝水平。他们说，白痴只有2岁或者以下的心理年龄；低能为2－7岁；弱智为7岁以上，但比他或她的自然年龄还是晚许多。

　　这些归档中的弱点是，年龄都固定在某个心理年龄上，而几乎所有的心理迟钝儿童都还在持续发育，尽管比正常发育速度慢些。一个4岁的孩子，如果他的心理年龄只有2岁，他就是个白痴，可到8岁或者10岁的时候，尽管仍然是个白痴，可他的心理年龄可能已经到了4岁或者5岁的水平。

　　一位德国心理学家威廉·斯登于1912年解决了这个问题，他说，如果孩子的心理年龄用自然年龄去除，结果将会是他的“心理商数”（很快重新命名为“智力商数”，或者叫智商IQ），这个比率可以表达孩子相对的心理迟钝或者超前的程度。一个4岁孩子如果只有2岁的心理年龄，其智商就是50（比率要乘以100以去除小数点的麻烦），如果10岁的时候还只有5岁的心理年龄，则其智商仍然是50。同样，一个5岁的孩子如果有8岁的心理年龄，或者一个10岁的孩子有16岁的心理年龄，则其智商为160，这是天才水平的智商。因此，智商是一个有用的办法，可以表达考试结果，并提供一个基础，可以预测孩子的发育潜势。

　　尽管比奈和西蒙在选择测试材料时在想办法测量“天然智力”——天生的能力——而不是死记硬背的能力，可是，比奈却不是高尔顿那样执着的遗传论者。他明确地宣称，这个测定表丝毫没有涉及这个孩子的过去或者将来，而只是对他目前状况的一种评估。比奈提醒人们注意，这些测试结果，如果生硬地地去加以解释，有可能会给一些孩子贴上错误的标签，或者彻底毁灭一个孩子的生活，因为他们在特别的帮助或者培训下可以提高他们的智力水平，而且，他在后来的作品中还骄傲地引用了一些例子。他创立的一所实验学校里，有一些低于正常水平的孩子在特殊班级里已经提高了自己的智力水平。

　　1908年的测定表是一个巨大的成功。到1914年，出版了约250多篇文章和书籍评论或者利用这个成果，到1916年，1908年版或者1911年版在美国、加拿大、英国、澳大利亚、新西兰、南非、德国、瑞士、意大利、俄国和中国的大部分地方广泛使用，并被翻译成了日语和土耳其语。对这样一个测量标准的需要很明显地在一些工业部门产生了。心理学家亨利·H·哥达德于1910年将此标准介绍给了美国心理学家们，并在1916年写道，如果说“整个世界都在谈论比奈－西蒙标准”，那根本就算不上是夸张。而这还只是开端。

　　比奈死于1911年，享年54岁，他没有能够活到看见自己的胜利的一天，可是，如果他果真活到了这一天，他可能会很悲伤地发现，他的这个标准虽然已经在许多国家采用了，可在法国却既不受欢迎，也没有被采用。只是到20年代才在法国进入使用中，而且还是一位法国社会工作者从美国带回来的。比奈本人直到1971年才开始在法国国内受到尊敬，这年，人们终于在他实行心理迟钝儿童实验教育法的那所学校举行了一个仪式，纪念他和西蒙。

测验狂潮

　　智力测验采用的速度之快，热情之高，没有哪个地方能跟在美国相比。而且相当有理由。美国是一个流动的社会结构，对能掌握复杂技术工作的工人的需求在不断快速地增长，由行为不良者、穷人和罪犯构成的下层阶级人数众多，成百上千万教育不足和看上去像半原始人的移民蜂拥而入，一种能评估人的心理能力的科学方法可以为社会领导者们提供一条从混乱中理出秩序的办法。

　　可是，虽然比奈相信，心理有缺陷的人，特别是接近正常心理年龄值的人，他们的智力是可以通过特殊培训加以提高的，可是，美国大部分心理测试倡导者们都接受了高尔顿的立场，认为遗传是心理发育中最大的决定因素，并认为人的智力因而是不可改变的。他们把心理测量当作一种手段，让社会借以将其成员分配到适合他们天生能力的一些学校和工种上，并作为一种诊断手段，用以分辨那些应该限制其繁殖以免将其缺陷传递下去的人。

　　亨利·哥达德就是持这种观点的领袖人物之一。哥达德（1865－1957）是位强有力而生机活泼的人，他曾在克拉克大学接受过培训，当时，G·斯坦雷·黑尔（冯特的早期弟子之一）是心理学系的主任，他是位坚定的遗传论者。哥达德吸收了遗传学观点，1906年他成为新泽西葡萄园研究基地——“心理迟钝者培训学校”的校长时，在他看来，一切都在身边确切地证实了。许多心理迟钝者不仅行动有问题，他们看上去也是天生有毛病的。哥达德甚至提出假设说，心理缺陷是因为某个退行性基因引起的。

　　不过，他的确看出，葡萄园的孩子们的缺陷并非都在同一个程度上，因此，为了确定什么样的训练对某个孩子特别适合，他需要有一种办法来测量每个人的心理能力水平。有一阵子，他试图使用卡特尔的人体测验试验，可是没有成功。然后，在去法国的一次旅行中，他得知有1908年版的比奈-西蒙标准，认识到它的长处后，他立即将它翻译成英语，除了将一些法国文化上面的事例用美国事例替代外，他没有做任何修改。

　　哥达德是第一位使用比奈-西蒙标准来进行大规模测试的人，他想法让培训学校的400名儿童和新泽西公共学校的2000名儿童参加了测试。他的结果显示，在心理迟钝儿童中，智力得分有很大的一些差距，而且，令人吃惊的是，在公共学校的学生中间，情形也是差不多的，而且其中有相当多的学生低于其心理年龄正常水平。

　　这就促使他开始了一项活动，要在公共学校里进行智力测试，以确定低于正常水平的学生，并使他们分流至特别班级；他还开始给一些教师讲课，宣传比奈-西蒙标准的用法，并向全美国的同行们散发了数千份宣传资料。在6年时间内，比奈-西蒙标准就在许多公校里开始使用了，它起了很大的作用，教师们根据这个标准决定对学生的教育方法。它还在许多机构里得到使用，以测验“心理缺陷”，在教养院和少年管理机构及治安法庭上使用，以改善对被管治者和犯人相应的处理办法。

　　哥达德认为，低智商是一个严重的社会问题，必须花大力气加以解决。白痴和弱者对社会不是个威胁，他说，因为他们通常不会繁殖自己，可是，“高级缺陷者”或者痴愚者（这个词是哥达德发明的）却很有可能，他们也许会成为不能适应社会的人或者罪犯，而且同样有可能成为反社会者。他还从另外一个角度看待过这个问题，他说，许多罪犯，大部分是嗜酒者和妓女，还有“所有那些不能使自己适应其环境，不能信守社会传统或者按感官需要行动的人”，都在遗传水平和心理能力上次人一等。

　　这些说法一方面是根据比奈-西蒙标准来的，还有他自己对美国内战时期一位士兵的后代的研究。一位名叫马丁·卡里卡克（化名）的人与一个弱智的吧女生下了一个儿子，后来又娶了一位教友派的妇女，并与她生了孩子。哥达德追踪卡里卡克跟这两位妇女的好几百名后裔，直到本世纪初为止。哥达德报告说，与吧女所生的大部分后代都是弱智、不道德或者是犯罪分子，而教友派妇女这边几乎所有的后代都是社会上正派诚实的人。

　　我们现在知道，这项研究有很大的毛病。除开其它方面不说，只有很少的家庭是经过，或者可能进行过测试的，所说的大部分例子里面的智力问题都是仅凭长相或者二手报告及谣传。另外，哥达德说，两边的孩子们生长的环境都大致相同，可现存的信息（比如两边孩子们的成活率）却清楚地显示了相反的情况。可是，在当时（1912年）及许多年里，“卡里卡克一家”被许多心理学家和普通读者看作有力的证据，证明智力能力的基因传递——哥达德实际上用了“好血”和“坏血”——及其社会后果。

　　哥达德得出的比西氏数据及其有关卡里卡克一家的发现，引导他采取了一个比高尔顿严重得多的立场：“非常清楚，弱智者不应该允许其结婚，或者成为父母。要使这项规定得以实行，很明显，社会的智力部分应该强化它。”为了实现这个目标，哥达德作为专家证人两次出席全国委员会的听证会，倡导对“弱智者”实行绝育措施，其中的一次会议很快延伸到了贫民、罪犯、癫痫病患者、精神病人和先天残障者。

　　立法者对哥达德和其它心理学家的申述印象颇深，到1931年，27个州都颁布了法令，强化执行优生绝育法，成千上万心理和社会“有毛病”的人都在接下来的30年内实施了绝育手术——光在加利福尼亚一地就有近10000人。可是，到60年代，一方面，对不适生存者强行实施绝育手术看上去与纳粹暴行无异，另一方面，对心理和社会能力缺乏的环境解释占了主导地位，一些州的立法机构开始呼吁立法机关批准新法规，对心理迟钝者实施自愿基础上的绝育。

　　哥达德在移民问题上也积极地呼吁采用比西氏标准，并带来了实施的结果。从世纪之交开始，移民一直就在向美国倾入。许多人是文盲和社会能力落后的人，这就在美国引起耽心，怕这个国家会因为心理和社会能力“有缺陷的人”而出现问题。此前，国会早已通过一项法令，禁止精神病人和白痴进入美国，在每天到达的数千申请者中，移民官员拒签约十分之一，可是，还是认为有可能通过别的渠道悄悄溜进来一些。1913年，美国移民局长官请哥达德研究艾利岛上的甄别手续，并拿出一个方案来。哥达德和其他几位助手挑出一些从外表上看去有点像心理有缺陷的移民，再通过翻译让他们做比西氏标准测试。大部分人的得分都在缺陷范围内——这一点也不奇怪，因为他们的疲劳、害怕、缺乏教育，再加上翻译的困难——因此，工作一周后，哥达德建议，移民官员在此使用简洁的“心理学方法”，以比西氏测试为基础。1913年，拒签明显低能移民者的比例升到百分之三百五十，到1914年，又在此基础上上升一半。

　　哥达德1914年继续在艾利岛工作了几个月；从到达的移民中抽取的样品看出，犹太人、匈牙利人、意大利人和俄国人有五分之四属于低能者。哥达德本人都有些怀疑了。他再次检查这些数据，对答案进行思考，再把数字降低一些，可也只是在百分之四十到五十的范围内。这些发现，加上由思路差不多的一些心理学家们提供的证据，影响国会于1924年起草了一个严厉的控制移民法，对东欧和南欧的配额减少到北欧和西欧配额的五分之一。

　　斯坦福大学的心理学教授刘易斯·M·特曼，他虽然接受了哥达德翻译的比西氏标准，但发现了其中的一些错误，并感觉到，他可以纠正这个标准，并使之更加准确。跟哥达德和其他许多同意智力遗传主义论调的人一样，特曼相信，有一种对这种方法的社会需要。他还看到了科学对此的需要：尽管他是位遗传论者，但他说，只有当非常完善的智力测试法进入广泛使用之后，遗传和环境的相对影响才会弄清楚，因此，他对比西氏标准做了重大修改，亦既斯坦福－比奈标准。

　　特曼自己没有任何理由去相信智力遗传说；他是印第安那一个农家14个孩子中的第12个，其成员或者在其两边的祖辈当中，都没有几个属于某个高级职位或者上过大学的人。可是，当他10岁的时候，一个巡回书贩子一边卖给特曼家一本论颅相学的书，一边摸着这个男孩子的头，并宣称他是旷世奇才。这件事可能促使特曼执着地相信先天论，他后来的历史也证明了这一点。尽管有很大的经济困难，他还是想法从一个乡村学校读到了正常的学校，再到大学，最终通过一份奖学金读到了克拉克大学，1905年在这里获得了心理学博士学位。这个时候，他是一位确信不疑的遗传论者，也是高尔顿法的赞扬者。

　　在斯坦福大学，他在教育系呆了几年，然后成了系主任。在漫长和不简单的生涯中，特曼把这个系变成了具有领先地位的研究生院和研究中心，对有天赋的儿童进行了一项受人尊敬的长期研究，并对婚后幸福的心理学因素进行了古典式的研究。可是，他在心理学上出名的主要原因，对心理学的主要贡献和对美国生活产生的最大影响，却是斯坦福-比奈标准。

　　特曼与比西氏标准的经历，哪怕是在其1911年版时，使他相信，在较上层的心理水平上测试项目太少了，高级和低级阶段的许多测试顺序都放错了位置，而给予和解释试题的正确步骤也没有严格定义。在8位同事和许多公共学校教师的帮助下，他用旧法进行了试验，然后又设计了40道新题（从这套题目中选取了27题，再从别的来源选取了9题，共同形成最后的系列），让1700名正常儿童、200名心理迟钝儿童和聪明儿童及400名成人参与了测试。最后的标准即斯坦福-比奈标准由90道题构成；适用于3－5岁的儿童的那些题需要约半小时完成，为较大年纪的测试组设计的题需要越来越长的时间。成人水平需要一小时到一个半小时。

　　任何年龄组的孩子做每套题的成绩是另一组的成绩对比而分成好坏；对于一个年龄组的孩子太容易的题会移到更小的年龄组，太难的就移到后面去。为了让整个标准平衡起来，再加上较高和较低段的试题。测试结果与教师与同一些孩子的智力评判相比较，比较方法采用皮尔逊相关关系法；整体的相关系数为0．48，或者稍高一点，这样就使该标准有效。如果教师在评估这些孩子的智力时，没有考虑到有些孩子比同班孩子年龄小些或者大些，相关系数可能会再高一些。

　　这次修改最有价值的是，整个标准比比西氏或者哥达德-比奈-西蒙法更为“标准些”。也就是说，分数以结果为标准，这些结果是用正常儿童、心理迟钝儿童和优秀儿童以及成人的较大标准抽样中得来的。在这个基础上，一个孩子或者成人如果得到100分，则他就是个一般的考生；得了130或者更高分的孩子比总的人口水平中百分之九十九的人更聪明些，而得了7O分或者低于这个分数的人，就比人口中百分之九十九的人稍笨些。特曼把智力分数分成以下级别：

　　140及以上：“近乎”天才或者就是天才；

　　120－140：很高智力水平

　　110－120：较高智力水平

　　90－110：正常或者平均智力

　　80－90：较木讷，很少能判定为低能

　　70－80：接近有缺陷，有时候分类为木讷型，经常作为低能儿对待

　　低于70：肯定是低能儿

　　特曼是位文质彬彬和软心肠的绅士，他对这套新标准的使用表达了自己的良好愿望：

　　在我们接受了智力测试给我们的教训之后，就不该再去责备心理有缺陷的工人们工作不得力了，也不应该去惩罚智力欠佳的孩子们学习不专心了，更不该去囚禁或者吊死心理有缺陷的罪犯了，因为他们缺那份智力来掌握社会行为的一般法则。

　　如果说斯坦福－比奈标准没有能够将这些恳请变成现实的话，很幸运的是，它也没有能够将特曼将它用作优生学办法的想法变成现实：

　　可以放心地预测，在最近的将来，智力测试将会把成千上万的……高级低能儿置于社会的看管和保护之下。最终，它就会得出一个美妙的结果，使低能者不会继续繁殖下去，也杜绝了庞大数量的犯罪、赤贫和工业低效率。

　　出版于1916的斯坦福－比奈标准立即成为，并在后来的二十多年时间内一直是，测量智力的标准试题。后来，它还在一系列学校、预习学校、大学及各种机构里成为低能者的测试办法。可是，其影响远非仅止于此，它会在更广泛的范围和更深刻的意义上产生影响；斯坦福－比奈标准测试法（及其后来的1937版）成了后来兴起的几乎所有智商测定法的标准。比奈、西蒙和特曼认为是构成智力的主要元素的一些特点，成了后来几乎所有的智力测验的模式；这些元素包括记忆力、语言理解力、词汇量大小、眼手协调能力、对熟悉事物的知识、判断不合理事物的能力、思想联想的速度及丰富性以及其它一些能力特点。

　　后来按照斯坦福－比奈标准元素进行的一项测试，在智力测试的领域里掀起了一场革命。

　　几乎所有的比奈标准版——后来到了十几种之多——都得由一位心理学家或者受过培训的专业人员一次对一个人进行测试。可是，集体测试，即受试者自己阅读试卷，然后在多重选择题上选择答案，或者在表格上做一些合适的标记，操作起来将会更快些，简单些，也便宜得多。

　　在心理测量上作出的这项突破，是因为美国卷入第一次世界大战引起的。伍德罗·威尔逊总统于1917年4月6日签署作战宣言两周后，美国心理学协会指定了一个委员会，专门研究心理学可以为战争做哪些服务。这个委员会报告说，这门专业能够为战争作出的最为有用的贡献，不过是设计一套心理学测试办法，以快速地检查大批的军事人员，清除掉心理不健全和能力不足的人，按军事人员的能力分成类别，把最合适做特种培训和责任重大工作的人挑选出来。

　　一组心理学家——其中有特曼、哥达德和哈佛教授罗伯特·耶基斯——汇集在葡萄园，开始设计这套试题。8月份，耶基斯被任命为陆军少校，并受命执行该计划。他汇集了约40名心理学家，在两个月时间内拿出了“陆军阿尔法方案”，即书面智力测试题和“陆军贝塔方案”，为应召士兵中百分之四十识字不多的士兵设计的图画测试题（做贝塔题的试题要求由助手大声念出来）。从今天的观点来看，广泛使用的阿尔法方案看上去像是一个奇怪的混合物，里面是科学常识、民间智慧和道德观念的总汇，如下例所示：

　　1．如果植物因为没有雨水快要干死了，你应该

　　——给它们浇水，

　　——征求花匠的意见，

　　——在旁边施化肥。

　　8．宁可战斗而不逃跑，因为

　　——懦夫常常被打死，

　　——战死更光荣，

　　——如果逃跑，可能背后挨子弹。

　　11．回声的起因是

　　——声波的反射，

　　——空气中有电子，

　　——空气中有湿气。

　　耶基斯的小组开始在4个军营中进行测试，可是，在几个星期内，总军医决定在全军实施该方案；到战争结束时，即1918年11月，有170万人接受了这些测试，耶基斯手下约300名心理学家给每个人都打了分，并为他推荐了合适的军事任务。尽管耶基斯的心理学家队伍遇到了职业军官们的抵抗和不配合，但这些测试结果使约8000人因为不适合岗位而被撤换下来，并有约10000低智力水平的人被分配到劳动营或者进行类似的服务工作。更重要的是，阿尔法方案是一个重要的选拔标准，整个战争期间成为军官的20万人中有三分之二的人受到这种测试的影响。

　　然而，“陆军测试方案”在军内的影响远没有它在军外的影响大。它使美国更加意识到了心理学的实际用途，特别是从心理测量当中得出来的用途。（詹姆斯·麦基思·卡特尔说，战争把心理学推上了“作战图”；斯坦雷·黑尔说，战争给了心理学一种无法估量的方向，使它朝着实际而不是“纯科学”的方向前进。）

　　特别是阿尔法方案，它导致了智力测试爆炸性的扩张，使其很快成了一项数百万美元的行业。战争结束数年后，一系列只用铅笔和纸就可以做的阿尔法类型的智力测试推向了全国的学校管理人。最成功的一种是1923年出现的，由特曼、耶基斯和三位合作人员在国立研究委员会的赞助下进行。他们鼓吹这套方案是“军用测试法针对学校需要而进行应用的直接成果”。到本世纪20年代末尾，约7O0万美国学生接受了这些考试。另一项巨大的成功是由耶基斯的同事卡尔·C·布里格姆根据军队模式开发出来的“学业资质测试”。大中小学、军事机构、各种机关协会及不同的工业领域都十分流行采用测试。

　　智力测试的广泛使用，因为得到统计证据而增加了更强的动力，统计证明，这些测试不仅测量了一系列单独的心理资质，而且是对先天心理能力总体核心或者“总体智力”的测试。查尔斯·斯皮尔曼是一位英国心理学家和统计学家，他向人们显示，许多心理能力都是互为关联的。（比如，一个词汇量广泛的人，通常也可能在算术和其它子项测试中得分很高。）他用这一点指明，天生的总体智力，他称之为g，是所有具体能力的基础。哪怕知识测试有，部分依靠学习，但相关关系暗示着一种天生学习能力的存在。

　　这就为在学校进行的智力测试提供了另外的依据，因为在30年代，美国和英国都在学校教育过程的早期对学生进行分类工作，让一部分学生学习很多宽泛的课程，以准备好进入高等教育，或者，让一部分学生学习范围较小的“职业性”或者“技术性”的课程，以使他们准备好从事蓝领阶层的工种。在美国，这就叫“分轨”，在英国叫“分班”。

　　测试的发展不仅限于智力的测验。在20年代和30年代，许多其它的标准也开发出来，以测量音乐、机械、图形、言语和其它方面的能力，还有一系列职业方面的天资。尽管智力测试本身早在20年代就受到攻击了，可是，比奈的心理能力测试法却在心理学研究中打开了一个广阔的新天地，而美国陆军阿尔法方案更是将比奈繁重和昂贵的测试变成了很容易，也很廉价的方法，使其成为心理学方面的流水生产线。

智商争议

　　智力测验并没有长期保持住其无可置疑的地位。从1921年起，当时，耶基斯根据陆军测试方案的结果编辑了一篇庞杂的报告，智力测试就受到一些人的攻击了，因为，他们说，它测量的不是天生的智力水平，而是后天所学的知识和文化价值，因而对处于主导地位的白人中产阶级有利，而对低层阶级和移民产生了偏见。

　　这种抨击自有其道理在里面，至少在斯坦福-比奈标准测试中是有这些问题的。这个标准测试中的许多或者大部分项目，测量的是遗传能力和后天所学知识或者技能的组合，可是，一个没有什么机会去获取知识或者技能的人会作出不太令人满意的答案，而不论他或她天生的心理能力是强或是弱。

　　比如，在12岁水平上，斯坦福-比奈法问到“慈善”和“公正”这两个词的定义问题。如果一位来自西南农村地区棚屋的墨西哥裔美国孩子答题不充分，这说明有天生的智力缺陷，还是说明这个孩子没有能够在白人中产阶级的美国学习到这些概念的意义呢？再者，在8岁水平的斯坦福-比奈标准测试中，有这么一道题：“如果你把属于别人的某件东西弄坏了，你应该怎么做呢？”如果这位8岁的孩子生活在城市的贫民窟里，孩子们需要拼命挣扎才能在这里活下去，那么，他或者她的答案测量的是其天生的智力水平呢，还是贫民窟的传统或者这种子文化中的习俗？

　　比奈留下了一个悬而未决的问题，即，按照他的标准测试下来的结果，心理发育到什么程度才是因为遗传或者经验所致？可是，特曼在“智力的测量”（斯坦福-比奈标准测试的说明手册）中所说的要旨是，尽管有如上引述的反证情况，智力很大程度上还是遗传所致，而很差的分数表明有心理缺陷，而这种心理缺陷，他说，是一种基因和种族的特征：

　　（低智力）在西南部的西班牙——印第安和墨西哥家族以及黑人中相当普遍。他们的木讷看上去好像是与种族有关的，或者至少是从他们来自的家族中遗传而来的……笔者预测……将会发现，种族间存在着巨大的智力差别，这些差别决非任何形式的心理培养所能消弥。

　　一位受人尊敬的专栏作家和十分博学的专家沃尔特·李普曼，他于1922年在《新共和党》杂志上发动了一场批判运动，批评特曼、耶基斯和其他宣称智力测试能够测量天生心理能力的人。李普曼评判了这个课题，从过去一直到目前，说这样的测试给一些孩子，特别是一些贫穷人家的孩子贴上了次人一等的永久标签，从而服务于抱有偏见和有权有势的人。

　　他和其他持有共同观点的人有非常充足的理由来反对陆军阿尔法测试法，甚至超过反对斯坦福－比奈法。他们也批评耶基斯认为这些以阿尔法方案为模型的测试法可以“测量天生智力”的观点。阿尔法问题中的许多答案明显要求后天所学知识而不是智力。斯迪芬·杰伊·古尔德在他的辩证研究《人的误测》一书中把这一点表述得很明白。他在书中引述了下列例子：

　　华盛顿与作为第一个人的亚当的关系，就像与……的关系。

　　克里斯哥是：一种专利药，抗感染药，牙膏，食品。

　　非洲黑人的腿的数量是：2，4，6，8。

　　克里斯蒂·马修森之所以出名是因为他是：一位作家，艺术家，垒球手，喜剧演员。

　　古尔德教授说，贝塔方案中的一些问题的确可以合理地测量普通的心理能力，因为识字不多的受试者可以完成一些没有画完的图形（比如，在一张脸上补上嘴，或者给一只兔子加上耳朵），可其它许多问题只有当受试者有专业的信息（给一只灯泡加上灯丝，给网球场加上球网，给投手的手上放一只球）时才能正确完成。当一些来自与我们的文化不同的国家的移民回答这些问题时，他们的答案看上去肯定是愚不可及的。

　　而且，的确，陆军测试方案的结果，正如耶基斯在1921年他自己的报告中所表述的一样，描述的是一个其人口正由于较差的基因血统的增加而降格的社会。按照阿尔法和贝塔方案，美国白人男子的平均心理年龄只有13岁，仅仅高出低能儿水平一点点，尽管特曼以前曾把这个年龄拔高到16岁。古尔德说，这些令人万分惊讶的数据增强了美国的仇外心理、种族仇恨和精英治国思想：

　　新数字达到了使优生主义者嘲笑的地步，而他们早就预测了最后的结果，并为我们不断下降的智力水平发出过哀叹。智力下降是对低能儿和贫穷者的生育不加控制的后果，是黑人的血液通过种族通婚广泛传播的后果，也是把大量南欧及东欧移民渣滓放进国内来酿成的后果。

　　耶基斯还支持哥达德在艾利岛上的数据，他报告说，阿尔法及贝塔方案显示，南欧及东欧的斯拉夫人种比北欧和西欧人种智力差些，这些“发现”促成了1924年的移民法。

　　然而，随着智商争议的升温，智力测试在30年代也开始在心理学家中降温了，到40年代，这种降温速度更加提速了。同时，总体智力的观点也退下来了，利用先进统计方法而形成的新研究法，在心理特征的所有“因素”或者特征簇中都找到了特别的相关性，因而使g的意义或者有用性蒙上了阴影。

　　尽管如此，一些测量一系列心理能力，并能得出叫做智力的综合分数的测试法，继续被教育工作者、商业机构负责人和其他一些人使用着。到60年代，这样一些测试又一次受到攻击，这次是受到人权运动者的攻击。有些心理学家甚至走到了否认有任何智力存在的地步。比如，纽约大学的马丁·多依奇教授1971年强调说：“智力是一个很方便的用词，可以解释某些行为，可我怀疑，事实上，这东西本身是不是真的存在。”其他的一些心理学家和教育工作者都倾向于像波林早些时候所做的那样，说人们不能讲出智力是什么东西，可是，那就是智力测试可以测验出来的东西。

　　尽管长期以来都有对智力测验的反对意见，可智力测试总还是在被人们广泛使用着，而且用得有其道理。

　　一方面，这些测验的确可以相当准确地预测出孩子们在学校里面会有何等的表现，哪些孩子应该给予特别的关心，或者应该施以何等样的强化教育。

　　另外一方面，最近有一些对完全双胞胎和兄弟双胞胎的复杂统计研究，特别是那些出生不久即分开在不同家庭哺养的双胞胎，研究结果比古尔德所能确立的证据有力得多，即心理能力在很大程度上是可遗传的，因此，智力测试除开能测试后天所学外，的确还能测出天生的能力。

　　（“可遗传性”是指在某一指定特征中，人们之间差异的范围有多大一部分来自基因。如果智力的可遗传性发现为零，则智商测定可变性中的任何一个从近乎零到200左右的变量都不是基因导致的；如果可遗传性为百分之百，则所有的变量都是基因来源所致。今天，持“遗传信仰”的心理学家们将智商的可遗传性定在百分之八十左右，而持后天教养说的心理学家们则认为从百分之五十到零不等。在最近的一次相当有说服力的研究中，心理学家大卫·W·富尔克、约翰·C·德富里和罗伯特·普罗明测试了245位不同年龄的继子、其生物学父母及其继父母的认知能力，结果吃惊地发现：与不在场的生身父母的相关性随时间增加，而与继父母的相关性却随时间减少。从这个数据当中，研究者计算出，心理能力的可遗传性在7岁时为约百分之三十六，而在儿童期稍后几年会变得高一些。）

　　智商争议潮起潮落，反复起伏；政治蒙蔽科学，科学又为政治所用。这场争斗还在继续着，目前还看不到有终止的迹象。不过，从早期智力测试中直接传下来的正统版本，现在已经得到很大修改，比早期更贴近“文化公平”。它们还在学校、机构、军方、工业和其它地方得到广泛使用。

　　不管人们管它叫做什么，也不管人们对智力测试的观点如何，事实是，心理测量是有用的，对社会（尽管不是哥达德和特曼脑海中的社会意义）是有益的，而且始终还是心理学F对现代美国生活和其它大部分发达国家的社会生活作出的主要贡献之一。