◇◇新语丝(www.xys.org)(xys.dxiong.com)(xys.3322.org)(xys.xlogit.com)◇◇   从央视的语音识别成果报道看国内学术风气   lxd   最近的韩国黄锡禹事件引起了国内媒体的相继报道和众多的评论,如以此为 鉴,深刻比照与反思云云等。其实,中国科学界除了为数不多的科学家支持打假 并参与,总体上是不愿直面学术腐败的(中国工程院副院长沈国舫就曾义正词严 地表示,“他可以勇敢地说,目前社会上存在的学术浮躁和学术不良作风,不会 影响中国工程院。”)。这也凸显新语丝网站学术打假的难度和意义所在。另一 方面,对中国学术腐败的揭露,少有公共媒体的支持,相反,在新闻媒体中充斥 着对不实科研成果的宣传。试举一例:   中央电视台《新闻30分》栏目在去年12月14日报道了一则新闻“让机器听懂 人的话”,介绍了中国科学院自动化研究所在“信息领域最前沿的技术——语音 识别技术”领域取得的科研成果(文字版参见 http://www.cctv.com/news/science/20051214/100949.shtml,新闻视频可通过 链接mms://movie.shm.com.cn/movie/ytnews/ytnews-284.wmv观看)。在该报道 中,自动化所国家863计划计算机软硬件主题专家组成员徐波研究员宣称,该单 位研究的新闻节目类的实时自动听写系统识别精度达到了95%。   果真如此,真要为国内语音界在语音识别技术方面取得的重大突破而骄傲。 然而,事实如何呢?普通观众可能相信专家的话,对于准确率95%这一数字不太 敏感。徐波研究员的这种要让“让机器听懂人的话”的宣传,其真实性是有待商 榷的。   国际上的语音识别技术在近20年有了很大的发展,可至今其识别率还不高, 这正是影响语音识别技术的大规模应用的主要原因。自动化所在中央电视台等媒 体上宣称的95%汉字正确率,意味着每二十个字里面只有一个汉字是错的,这种 技术水平已经大大超越了国际最好水平。即使是人去记录新闻节目,也会出现一 些错字(如中文人名和地名由于多音字的存在,是很难仅凭发音就把字写对的), 何况还很有可能遇到一些不熟悉的主题和术语。美国技术标准局连续多年对广播 电视新闻的语音文字自动转换技术做了大量的评估工作,参评单位包括剑桥、 IBM和BBN等知名大学、公司的相关研究小组(参见http://nist.gov/speech/)。 在2004年的评测中,最好的10倍实时(识别时间是节目时间的10倍)系统错误率 为11.6%。一般来说,语音识别技术的进步是按相对错误率下降来描述的,如从 10%的错误率到5%的错误率,相对错误率就下降了50%。根据美国技术标准局过去 十几年的评测结果估计,再考虑中英文识别难度的相似性, 这些国际知名研究单 位要达到自动化所目前所提到的水平需要3年左右的时间。换句话说,自动化所 自己宣传的结果比国际最好水平至少领先3年,这与该领域的实际情况恐怕是正 好相反了。   中央电视台作为国内影响广泛的大众媒体,它的不实宣传会误导科研主管和 社会大众;而由此宣传可能带给相关单位和个人的荣誉将会造成国内学术风气的 进一步恶化。在国内媒体纷纷扬扬的报道韩国克隆造假的同时,国内学术界和新 闻界的同仁是否也应该反思一下,不再漠视发生在自己身边的问题。就像新语丝 新到资料上陶世龙先生说的:“我们不应象手电筒一样,只照见别人而看不到自 已。”才能够如邹承鲁院士指出的“敢扬家丑才能避免家丑”。 (XYS20060107) ◇◇新语丝(www.xys.org)(xys.dxiong.com)(xys.3322.org)(xys.xlogit.com)◇◇