◇◇新语丝(www.xys.org)(xys4.dxiong.com)(www.xinyusi.info)(xys2.dropin.org)◇◇   南京大学周志华弟子们的改头换面术   作者:啄木鸟   话说改头换面术,乃一失传已久的传说中的千年巫术。今赫见其复活,不敢 独享。怎么发现的?这当然是需要些时间和经验的,且听我慢慢道来。   最近读了周志华两个弟子和周志华合写的如下一篇论文,再结合其它的他们 被揭发出来的剽窃大作,终于恍然大悟,悟出了他们做研究的手段之一,如果不 是全部,改头换面术:   N. Li, Y. Yu, Z.H. Zhou. Semi-Naive Exploitation of One-Dependence Estimators, ICDM'09.   虽然前两位是周教授的学生,周教授是第三作者,但周教授是个“亲自做研 究的人”,有授业解惑职责,应也难咎其责。况且,这一巫术早在2001的 IJCAI01那篇里就施用过。现在如出一辙,不免恭喜此术不会再次失传。   在ICDM09,他们声称发明了个SNODE,但这个SNODE就是如下这篇里被改头换 面的HNB:   H. Zhang, L. Jiang, Jiang Su. Hidden Naive Bayes. AAAI'05.   所谓的HNB,就是在Naive Bayes里为每一个属性变量配一个父亲变量,这个 父亲变量包含所有来自其他属性变量的对这个属性变量的依赖性。方法就是 AAAI05的公式6。这样一来,Naive Bayes对于属性变量之间独立性的假定就被大 大削弱,从而提高其性能。另一方面,HNB的学习复杂性相较Naive Bayes又没有 恶化。应当说明目前对于Naive Bayes有很多改法,但这一改法目前似乎最好。   每一次对于提高Naive Bayes性能的改动,都会配有一个结构示意图,表明 怎样改了其结构,为什么好。HNB的示意图就是AAAI05的图3。应当说明图3和公 式6就是此发明的全部,至于怎么学习属性变量依赖性的权重,也就是公式6里的 W_ij有很多方法。我要说的是,ICDM09不同于AAAI05恰恰只在于怎么样求这个权。 这么个改法也能发,而且在ICDM?他们当然不会这么说,他们要施用改头换面术。   好了,现在可以说说ICDM09怎么对AAAI05施用改头换面术了。   首先,大家看看ICDM09,没有一个有关的Naive Bayes的图。象这种文章, 不画Naive Bayes,最后你也得画出你改动后的结构以便一个形象化的理解。为 什么,他们非不画也,乃不敢也。因为画出来就只能是AAAI05图3那样。这样, 大家一看即明剽窃。好了,图没法改,就不画,索性一个相关图都不要。   那么剩下的父亲变量的形成,也就是AAAI05公式6,较容易遮盖。他们用个 所谓的GAM包装这个公式。实际上不用GAM的AAAI05的公式6更清楚。既然遮盖, 就得把简单的弄复杂,还得弄个名字GAM。但任你怎么遮盖,实质的东西不会变。 最后AAAI05公式6化身成了他们的那个公式7和8之间的那个公式(且称其为公式 7.5)。大家看看,公式7.5的exp和log是完全可以相互抵消掉的。抵消掉后,和 AAAI公式6还有什么区别?!   好了,一个发明的两个基本点就被这样非常专业的掩盖过去了。至于其他部 分,他们所做的就是用了一个不同于conditional mutual information的方法求 权重,也就是公式6里的W_ij。但是最优求解方法千千万,换个方法求解是不可 能在ICDM上发表的,只能是个练习。   那么他们怎能蒙过同行评议呢?除了前面的掩盖外,他们介绍HNB时还克意 模糊HNB的贡献,   “Note that in previous studies, ODEs were exploited directly in a simple way, e.g., simple average of ODEs."   "However, in previous approaches, ODEs were used directly in simple ways for classification."   实际上,剽窃的东西很难完全抛掉被剽窃的东西的。他们的公式1下面的那 两段表明他们要造的SNODE实际上就是HNB,其不同就是优化方法。   最后说说那个实验。AAAI05用了36个数据集,用了WEKA的DISCRETIZE。这36 个数据存在于一个压缩包里。用WEKA直接下载处理,可以一气呵成。他们不,非 要用其他数据集替换其中的20个而且还要做自己的DISCRETIZE。不知道为什么舍 近求远。一个猜测是他们的优化方法在这36个数据上不如HNB,选择性使用实验 数据。   写到这里,回顾不久前揭发出的周教授等人发表在IJCAI01和IJCAI09那两篇, 终于悟到IJCAI01和IJCAI09不也是对别人的成果施用了改头换面术吗?原来,这 一巫术不但在那时就已复活而且日久弥新后来有人啊。 (XYS20100112) ◇◇新语丝(www.xys.org)(xys4.dxiong.com)(www.xinyusi.info)(xys2.dropin.org)◇◇