Unbending Notes
透视词库门(1)搜狐和谷歌的文化良知在哪里?!
[“词库门”事件升级了]
啥叫“词库门”事件?它是指2007年4月4日Google在全球发布的首款输入法,后就被网友和行业资深人士质疑谷歌拼音涉嫌抄袭和盗用,并提出确凿证据证明该输入法盗用了搜狗拼音输入法词库。而引起的一场关于搜索引擎输入法词库版权争论事件(尚未升级到“案件”阶段)。
“词库门”事件主角是Nasdaq上市公司:搜狐(Sohu)和谷歌(Google)。
[“错误超过10000个”如此“创新”产品]
2007年4月12日《新快报》记者董毅《词库门背后的阴谋与阳谋》(http://www.donews.com/Content/200704/a13930e62c2e41ebb1fafcb20d61106a.shtm )一文披露了“词库门”事件中让人感到很恶心的一个细节:
搜狐公司副总裁王小川表示,“谷歌与搜狗,完全相同的错误超过10000个。”人们不禁要问,如此多错误,在这么相当长的开发时间里,两家公司为什么都没有进行改正呢?
董毅记者还举更加具体例子:
在搜狐公司制作的专题中看到所谓的证据:“冯巩”的输入“pinggong”,两个输入法的结果都是错误的。谷歌拼音在最新版本中已经修正了这个问题,而搜狗输入法在最新3.0b1版本中,却仍然“执著”地保留此错误。同样,谷歌输入法某些错误也非常低级而诡异,例如“大”字,在谷歌拼音中,竟然输入“tai”也可以,而查阅多本权威辞典均没有发现该常用字有此发音。
至此,我们真的要反问一下:王小川(博士?) 与李开复博士,您们是以什么人文科学态度制成了“错误超过10000个”如此“创新”产品问世的?
[Nasdaq上市公司的文化良知在哪里]
1、另一场类似战争
其实这场“词库门”争议与近8年来在全球展开的另一场文化资源竞争类似,那就是互联网中文域名,即“中文.com”与“中文.cn”的标准争夺战:在1999-2002年,“中文.com”终于被IETF赶出标准以外,“中文.cn”成为全球中文域名标准。关键原因是“中文.com”词库出错率高达23.99%(当年TWNIC的CEO陈文生教授的研究报告),而“中文.cn”词库准确率在2002年10月24日时已经高达99.999%, 这是中(包括港澳台)、日、韩、新加坡七家互联网络信息中心(NIC)的专家联手研究的成果,它战胜了Nasdaq上市公司VeriSign的“中文.com”词库,而且从技术上解决了punycode的难题(这是钱华林老师的技术创新)。
笔者是从2000年开始跟踪、采访全球中文域名(IDN)专家的媒体人员,自已也写了近10万字专访、评论。从中文域名标准之战结果看,中(包括港澳台)、日、韩、新加坡七家互联网络信息中心(NIC)的专家联手是从为本国文化寻址造福,而Nasdaq上市公司VeriSign的“中文.com”完全是为了抢夺中国用户手中钱财而粗制滥造。
2、“词库门”事件双方应该检讨公司的文化良知
如果“词库门”事件涉及的词库是一个“错误超过10000个”搜索引擎输入法词库,它意味着Nasdaq上市公司搜狐(Sohu)和谷歌(Google)在极为不负责任的制造环境中,给咱们中文文化实施“变异”手术、对于公众(使用者)而言,此二家公司是在误导用户的中文准确使用,是欠缺文化良知!
本文先写至此,后面再写了。
沈阳(sz1961sy)
2007年4月15日 14时30分 写于北京家中
Re:透视词库门(1)搜狐和谷歌的文化良知在哪里?!
very good
Re:透视词库门(1)搜狐和谷歌的文化良知在哪里?!
好文章,支持下!
Re:透视词库门(1)搜狐和谷歌的文化良知在哪里?!
本来就是你炒我.我炒你
Re:透视词库门(1)搜狐和谷歌的文化良知在哪里?!
你好,发表一下自己看法 1 [“词库门”事件升级了] 很简单。就好比你自己的老婆,被别人摸胸,什么感觉?懂得维护的自己的权益不比什么都好么,在这个媚外的年代。 2 [“错误超过10000个”如此“创新”产品] 世间没有任何完美的。如果搜狗和谷歌能都有10000个错误,那么你应该感到高兴,原来我们自己的公司在自己的母语方面跟一些外国公司还有的一比。尤其是一个比自己强的多对手面前.况且搜狗一直在努力,你知道一个面试一年的新产品更新数十次的概念吗.如果你用了智能ABC就知道原来他的错误很多 3 我刚用搜狗输入法.很好用.支持,当然也希望能继续改进 9884680@163.com