【新语丝电子文库(www.xys.org)(www.xys2.org)】 ———————————————— 农民可以忽略吗? ——也评2001年中国公众科学素养调查 ·方舟子· 去年11月份时我在北京遇到何祚庥院士,他希望我关注一下当时刚刚 公布的《2001年我国公众科学素养调查》。我本来是不想评论此事的,原 因很简单,没有这个条件,因为这个调查报告是个内部文件,不对外公布, 不像美国的类似调查,可以从网上直接查到原始数据。对外公布的只有一 个仅8页纸的《2001年我国公众科学素养调查主要数据》,列了一些主要 结论,从中很难看出什么名堂。它甚至连误差大小都没有公布,而众所周 知,不公布正负误差的调查结果不具有科学性。比如,最引人注目的一个 数据“2001年我国公众具备基本科学素养的比例为1.4%(每千人中有14人 具备基本科学素养)”,这个结果误差多大?公布的“主要数据”里就没 有提。我手上这份“主要数据”是何院士给我的,他在这个数据的旁边注 了“1.5%〈 〉1.65%”,大概就是此一数据的正负波动范围,这么一算, 误差在±17.9%,是否太大? 更值得注意的是紧接着的下面一句:“比1996年的0.2%提高了1.2个百 分点,在过去的五年里,平均每年增长0.24个百分点。”何院士在这句话 下面划了线,在旁边打了个问号。这的确非常令人疑惑,在短短的五年内, 中国具有基本科学素养的公众人数整整增加了六倍,简直是个奇迹!即使 在1999年法轮功事件之后国内开始重视科普,也不可能在一、两年内就有 如此显著的变化。按常理推断,肯定是这两次调查的某一次或全部都有问 题,即或者1996年的调查结果过低,或者2001年的调查结果过高,或者二 者兼而有之,不可能两次都对。这次调查的组织者当然是要人们相信上一 次错了,这一次才可靠。但是凭什么人家要相信他们?最好的办法是公布 全部原始数据和计算公式。对此,组织者却遮遮掩掩。我见到刘华杰向负 责这次调查的数据统计的中国人民大学统计系副主任金勇进教授及其学生 询问这个1.4%是怎么算出来的,得到的回答是直接数出来的,即数一数一 共有多少人全部答对了关于科学素养的三类题目,自然还需加权处理一下。 那么究竟有多少人答对了,如何加权处理的呢?答复是:“原始数据版权 属于科协,我们无法提供,若需要请与科协联系。”新鲜!这是花费纳税 人上百万元资金所从事的工作,又不涉及国家安全机密,所有的结果都必 须进入公共领域,任何中国公民都有权知道,哪来的版权问题?何况公布 数据,和有没有版权又有什么关系? 这种态度,不由得让人强烈地怀疑其中有猫腻。一位网友从公开的数 据中发现的一个奇怪现象,更让人觉得其数据处理大成问题。这个漏洞出 在对农民的调查上。根据公布的数据,农民中有基本科学素养者占0.04%。 这次调查的有效样本为8350人,农民占43.2%,即3607人,也就是说,被 调查的农民中,有1.44个有基本科学素养。按照这个调查的设计,一个人 是否有基本科学素养,只有定性的“有”和“没有”两种可能,怎么会出 现被调查者中有0.44个人有基本科学素养?这究竟是公布的数据有误、计 算失误还是根本就是胡编乱造的?组织者如果不公布全部原始数据让大家 验算,如何能洗刷自己?如何能让人相信其调查结果? 在如何看待这个与农民有关的数据上,也引起了争议。刘华杰写了一 篇《农民职业当下可以忽略不计:2001年中国公众科学素养调查数据点评 之二》,认为“0.02%与平均值1.4%相比是很小的,这相当于说农民的科 学素养状况不影响最终的全国平均值,尽管农民人口众多。”“这也就是 说,农民群体的数据对整体统计的贡献可以忽略(这绝对不等于说农民的 科学素养水平不重要),不但如此,农民的科学素养数据的变化对全国平 均值也没有实质影响。”这种措辞,让人以为他认为在统计结果时可以把 人口比例最大的农民部分抛弃不管,这当然是违背统计常识的。根据他后 来非正式文章中的解释,他的意思其实是说有基本科学素养的农民数目太 少,可以忽略不计,但在统计时基数部分还是要把农民整体考虑进去的。 这在数学上当然是可以成立的,但是他由此得出的推论却还是大有问题的: “以后(10年内)调查,农民一类不必过多采样,甚至不采样都行, 在这一类群众上过多地入户口调查对于计算全国平均的公众科学素养值几 乎没有任何用处。”“如果今后每两年进行一次类似的调查,我觉得确实 可以考虑大大减少农民职业的样本。” 恰恰相反,按现在的农民样本(3607人),只查出了1个或2个有基本 科学素养,说明样本取得太小,0.04%的结果根本就靠不住,今后再做类 似的调查,必须大大地增加农民职业的样本才能得出可靠的结果(统计学 有简单的公式计算在P=0.0004时该取多大的样本,不必我代劳),如果再 减少样本,甚至大大减少,结果必然为零,岂不是做无用功? 即使农民的科学素养值对全国平均值几乎没有贡献,甚至再增长10倍 也没有什么影响,也绝不意味着我们在以后的调查中就可以对农民忽略不 计。进行公众科学素养调查,并不仅仅是为了得到一个全国平均值。了解 在所有职业中占了最高比例的农民的基本科学素质的真实情况和变化程度, 也是非常有意义的。如果农民中有科学素养者真的能成倍增长(由于农民 部分的起点低,并非不可能),即使不能带来全国平均值的显著增长,也 是一项重大的政绩,甚至是比全国平均值的增长更大的政绩。仅仅为了省 一些科研经费就放弃人口比例最大的这部分,是不可取的。 2002.1.12. ———————————————— 【新语丝电子文库(www.xys.org)(www.xys2.org)】