不诚实的智力测验 看世界各大种族智商排行榜

图:中文互联网流传多年的“全球平均智商分布图”

相信很多人看过上面这张“全球平均智商分布图”。

图中,东亚人(包括中国人、日本人和朝鲜人等)拥有超过105的世界最高平均智商。

因为让许多中国人自豪感油然而生,这张图(包括相似者)已在中文互联网流传十余年之久。

图中数据,出自英国阿尔斯特大学退休教授理查德·林恩(Richard Lynn)2006年的著作《种族智力的差异:一种进化分析》(Race Differences in Intelligence:An Evolutionary Analysis)。

在这本书里,林恩“收集研究了130个国家的智商测试”,然后列出了一个“世界各大种族智商排行榜”。根据这个排行榜:

“东亚人(包括中国人、日本人、朝鲜人)拥有全世界最高的平均智商,平均值(笔者注:其实应该叫中位值)为105。而之后排位是欧洲人(100),爱斯基摩人(91),东南亚人(87),美洲本土印第安人(87),太平洋诸岛土著居民(85),南亚及北非人(84),撒哈拉非洲人(67),澳大利亚原住民(62)。而人种智商最低地区是南非沙漠高原的丛林人和刚果雨林地区的俾格米人,平均智商为54。”①

这个排行榜,在中文媒体及中文互联网,被冠以“英国研究者称中国人是智商最高人种”之类的标题广泛传播——虽然在林恩的排行榜里,新加坡、朝鲜人和韩国人的智商数据,其实是高于中国人的。

图:林恩在《种族智力的差异:一种进化分析》一书中所制的智商排行榜(该数据后来还有调整,新加坡被提升至首位;另外,林恩将香港、台湾归入“Nations”是错误的,特此说明)

可惜的是,林恩的研究,在处理材料时,并不诚实。

早已有人指出:

“林恩号称在收集研究了130个国家的智商测试后加以统计而得出结论。但是他在收集别人的研究成果时,做了巧妙的取舍,只选用有利于自己的结论的数据,而舍去不利的数据。这在处理非洲黑人的数据时表现得最为明显。例如,有一篇研究报告报道了两项对非洲黑人的智力测试结果,一项低于白人,一项高于白人,林恩便只选取前一项。更有甚者,在6项有关非洲黑人的测试结果中,林恩只从中选符合自己的结论的1项。《科学美国人》在1995年2月发表的一篇书评曾尖锐地指出:‘林恩对数据的歪曲构成了真正恶毒的种族主义行为,以及对科学客观性的可耻蔑视。’”②

这种结论先行、只选取对证实结论有利的材料的治学作风,贯穿了林恩的整个“智力研究”生涯。

2013年,林恩发布了一篇题为《中国三十一个地区的智力差异及其经济、人口关系》的论文,试图在“包括中国人在内的东亚人智商全球最高”的基础上,进一步证明“在中国境内汉族的智商最高”。为证成该结论,林恩引用了很多中国学术界80、90年代关于智力测验的学术成果。③

据笔者观察比对,林恩的引用非常地不诚实。

比如,林恩在论文中提到:

“有三份研究报告认为,汉族儿童平均智商高于蒙古族儿童。”

根据论文注释,这三份中文研究报告分别是:

(1)娜岱、欧尔兰的《新疆巴音郭楞蒙古自治州5~14岁蒙古族集体儿童瑞文测验》(1994)。

(2)杨蕴萍、龚耀先的《5-6岁蒙古族和汉族儿童智力的比较研究》(1994)。

(3)玉山的《汉、蒙、达斡尔、鄂温克等四个民族12~16岁青少年智力发展问题比较研究》(2008)。

图:林恩的论文中关于汉族与蒙古族智商测试的中文学术成果的引用

简略对照一下林恩论文的引用,与“研究报告”原始表述之间的区别,就可以发现其中的问题(为对比需要,引用略长,不耐者可跳过直接阅读黑体字的总结)。

对娜岱、欧尔兰的研究,林恩的总结是:

“结果显示,汉族孩子的平均智力,比蒙古族孩子高出5.3个IQ点。”

娜岱、欧尔兰采用了非文字测验“CRT”来研究孩子的智力,这种测验被认为“可以较少受文化、经验的影响”。论文写道:

“5~14岁智商均值及标准差为96.32±11.08。与巴州同年调查的5~14岁3213例汉族儿童智商均值及标准差101.59±12.16比较,P﹤0.001,在统计学上有极显著差异,但两者均属中等智力水平,无实际意义。”④

林恩取用了论文所提供的两个“智商均值”并将它们相减,但砍掉了原论文的后续结论:“两者均属中等智力水平,无实际意义。”

图:娜岱、欧尔兰论文的原始表述

对杨蕴萍、龚耀先的研究,林恩的总结是:

“两组孩子一起住在内蒙古。汉族孩子测验所得平均智商值为99.1,蒙古儿童所得平均智商值为94.9,汉族儿童高出4.2个智商点。”

杨蕴萍、龚耀先论文的原始表述,远比林恩的总结复杂:

(1)采用以汉文化为背景修订的“中国-韦氏幼儿智力量表(C-WYCSI)”进行测验时,汉族儿童具有优势:

“蒙族儿童平均总智商(FIQ)和言语智商(VIQ)低于汉族儿童分别达4.2和10.2个IQ值,差异极显著(P图:林恩在《种族智力的差异:一种进化分析》一书中所列举的与中国人智商有关的学术论文

当代智力测验的诞生,至晚可以追溯到英国绅士弗朗西斯·高尔顿(Francis Galton,1822-1911)。

高尔顿认为,既然身体特征可以代代相传,那么智力的高低也应该同样可以。故此,他坚信遗传能够决定人的社会地位,进而主张应该只允许那些继承了前人的高等智商和勤劳品质、且积累了相当数量财富的人生育后代。

但高尔顿没能找到“合适的工具”,来筛选究竟哪些人有资格生育后代。

1905年,法国人埃尔弗雷德·宾尼特(Alfred Binet)与希奥多·西蒙(Theodore Simon)设计出了当代第一套智力测试题。

这种智力测验,迅速与“优生学”结合到了一起,成为一场漫长的噩梦。

1912年,美国学者亨利·戈达德出版著作《卡里卡克家族:低能遗传之研究》,历数该家族的智力低下如何代代相传以至于祸害上千人。该书风行一时。如何阻断智力低下者生育,成了美国社会的热议话题。

戈达德主张把智力低下者“从每个角落找出来,把他们看管起来,以确保他们不再繁衍后代,不再使问题更加严重。”受此影响,美国移民局开始推行所谓的“智力测验”,拒绝智力低下者入境;有至少超过6万美国人在经过所谓的“智力测试”后——比如被问“水管结冰后为什么会破?”——被强制施以“合法”的绝育手术(另有许多“非法手术”,很多被送入收容所做手术的姑娘,并不知道她们做的是绝育手术)。

1930年代,纳粹掌握德国政权,智力测验与强制绝育的结合达到巅峰。

“从1934年到1936年间,提交到(德国遗传病)法庭的个案有84%~92%被判定为执行强制绝育,导致强制绝育判决总数令人震惊地达到了38.8万件。……法庭判决之快,令医生们费尽九牛二虎之力也跟不上趟。……多数走上法庭的被告和三分之二被判强制绝育的人,被诊断为智力缺失。”

诊断的办法正是智力测验——诸如“谁发现了美洲”这类问题,测的其实只是一个人的知识水平,答错者却会被定性为智力低下者。到二战结束时,约有40万德国人被强制绝育,大约100个生育人口(15~50岁)里,就有一个被强制绝育。

图:1924年,Carrie Buck(左)与母亲Emma Buck(右)在纽约合影。Carrie Buck父亲早逝,母亲没有受过教育。在Carrie Buck很小的时候,母亲被当局认定为智力低下者送进了收容所。3岁开始,Carrie Buck与养父母一同生活,上了五年小学后辍学。17岁时遭养父的侄子强奸,养父母遂指其智力低下,将其送进收容所。在收容所里,她被智商测验鉴定为智力低下,强制施以绝育手术——事实上,辍学前,老师给她的评语是“品德和学习两方面都非常好”。

尴尬的是,各式智力测验将“智力低下者”不断送往手术台乃至炼尸炉的同时,心理学家们百年来,对何谓“智力”仍在众说纷纭,对自己的智力测验究竟能测出什么也难有定论。

比如,“韦氏智力测验”的创制者大卫-韦克斯勒(David Wechsler)曾经说过:

“测出的肯定不是某种单一因素能够表示清楚的东西,无论如何也不能用人们常说的词汇进行定义,例如智能、演绎能力、智慧因素等等,更不用说常规智力指数了。智力可能是这个东西,也可能是其他东西。”

再比如,试题长期不变的“瑞文测评”,作为一种非文字测验,避开了足够多的后天习得的文化因素,被认为可以有效地测试先天智力水准,但詹姆斯·弗林(James Flynn)等人的研究却证明:

发达国家的瑞文测评分值一直在涨。1952年,荷兰军队的入伍新兵,只有31%的人能在测试中及格,1962年提升至46%,1972年是63%,1982年达到了82%。

如果“瑞文测评”测出来的真是所谓的先天智力水准,这种提升比例,恐怕只能用荷兰人的遗传基因发生了突变来解释。⑦

图:瑞文测评,特点是极大地削弱了文字及文字所属文化给测验造成的影响

迄今为止,尚没有任何智力测验,可以测出人的先天智力。

智力测验更多的是在测人对知识的掌握(如韦氏测验里的“谁发现了美洲”这类问题),以及解决问题的能力(如瑞文测评里的填补图片),这只是人的“智力”的一小部分,且多属于/能够后天习得。

林恩搜集的那些中国80、90年代的测验数据,很多都提到了后天环境对测验结果有着重要影响。只是林恩习惯性地没有将这些结论和相关数据纳入他的“研究”。

比如娜岱、欧尔兰的统计显示:在对1481例5~14岁蒙古族儿童的智商测验中,“将其填写家长职业、文化程度等清楚的1135份资料进行统计分析,其智商均值:科技家庭101.05±2.84、干部家庭97.11±2.91、工人家庭93.73±2.80、牧民家庭88.35±3.21。”⑧

显然,文化、物质条件更优越的家庭出生的孩子,在智商测验中拿到的分数更高(并不能等同于先天智力更高)。

1989年唐彩虹等人利用韦氏测验法调查上海郊县儿童时,也发现“(郊县)各组小儿的量表分和智商均低于上海市区样组”。具体可参见下表⑨:

图:上海郊县儿童所得智商测验分值,全面低于上海市区儿童

这方面最著名的实验,是1970年代由桑德拉·斯卡尔(Sandra Scarr)和理查德·温伯格(Richard Weinberg)进行的一场跨种族收养研究。

他们的研究对象是115名白人孩子与176名非裔孩子。实验结果发现:由白人家庭抚养的非裔孩子所获得的智商测验分数(约110),高出了白人的平均智商(106)。斯卡尔和温伯格据此作出解释:智商测验无法测出人的先天智力,智商分数的高低不等于智力高低。非裔儿童智商测验分数提高,并不是白人或中产阶级的环境让非裔儿童变得更聪明,而是智商测验本身偏向白人文化背景,被白人抚养的非裔儿童,获得了回应智商测验的更好的外部环境。⑩

智商测验虽然测不出人的先天智力,但人的后天智力,却是“可控”的——它主要取决于两点:(1)信息获取能力;(2)逻辑思维能力。前者关系到原材料的多寡,后者关系到材料加工能力的强弱;前者需要让孩子看见更广阔的世界;后者需要给孩子提供正规的逻辑教育。

人吐槽 人点赞

猜你喜欢

0 条评论

用户名: 密码:
验证码: 匿名发表

你可以使用这些语言

查看评论:不诚实的智力测验 看世界各大种族智商排行榜