鬼吹灯

字:
关灯 护眼
鬼吹灯 > 军事资料百科 > 第984页

第984页

    汉字的重复利用率非常高,历代积累的汉字总数以万计,康熙字典就收录了4万多,专家指出常用仅三千五,选取当代的常用字作为学习和使用汉字的重点,是历代历朝整理和教学汉字的一个重要内容。历史上的《三字经》《千字文》都是用当时的常用字编成的识字课本。


    而英文呢?例如因为一个地名就是一个单词,想正确认识,需要的时间精力只有少数人能够应付,英文真是笨人的语言,由于在表达方面的缺陷,靠字母的一维线性组合,试图给天下每一事物起一个名字,一种东西就是一个单词。宇宙无穷,英文词彙无穷——可惜人的精力有限!


    英文是发散的。


    在英文世界里,一般美国高中毕业生掌握的单词量也就在三千到三千五百个左右,这样已经应付日常生活需求足矣,但是没有20000个字别想读报,没有30000个字别想把周刊读顺,大学毕业10年后的职业人士一般都懂80000字。新事物的涌现,总伴随着英文新词,例如火箭(rocket),计算机puter)等,可汉语表达这些很轻松,不就是用“火”驱动的“箭”么,会“计算”的“机”么!可英文就不能这么干,不能靠组词,原因是“太长”了。如火箭将成为“fire-driven-arrow”,计算机将成为&ldquoputaional-machine”等。人的视角有限,太长的字会降低文章的可读性与读者的理解能力。这是因为英语的字母对应汉字的笔划,单个汉字对应的是英语的词,中文的词对应的是英语的词组,中文表达、传递信息的优势一目了然。


    目前英语词彙量已经超过40万,预计本世纪中叶会达到百万。而汉语则相对稳定,现在只有很少的古文知识的中学生就可以琅琅上口地读屈原的楚辞。英文就难了,太不稳定。现在的人们读沙士比亚的原着已困难重重,更不用说读400年前英国诗人乔叟的诗了。由于英语以表音为主,同时号称是讲者分布最广泛的语言。正因如此,讲英语者往往因语义词彙和地域习惯,引起误会。因此谓英语是“世上最广泛被误解语言”,也绝不过分。英语也是世界上最容易引起人事纠纷的语言。就目前英国和美国还分出了英式和美式英语,加上其他所谓的英语国家,虽然都说英语,其拼写读的差异不次于中国各地方言之间的差别,交流的难度是远超过使用表意的中文的。


    现代所有学科领域,中国都有很好的学者,没听说哪位因汉语“不精确”而搞不好研究的。中国的火箭照样可以精确升空,中国的原子弹照样可以精确爆炸。所有的英文科技文献都可以翻译成汉语。个别人会说了,为什么中国现在落后,就是由于中华文化中杀气少,数百年来对杀人武器研究太少,遭到掠夺以至落后了,虽然如此,最困难的时候已经过去,中国现在正以世界最快的速度复兴。汉语文献影响力正随着国力的增强而在世界范围内增强。


    .


    *现代汉语的发展(本节引用自《谈汉语与英语的优劣》)


    研究表明:汉字作为一个复杂的文字符号系统,其信息熵很高。研究的基本方法是:逐渐扩大汉字容量,随着汉字容量增大,信息熵的增加趋缓;汉字增加到12370以后,不再使信息熵有明显的增加。我国科学家指出:汉字的容量极限是12366个汉字,汉字静态平均信息熵的值 (平均信息量)是9.65比特。通过数理语言学中着名的齐普夫定律(zipf’w)核算,这是当今世界上信息量最大的文字符号系统。联合国五种工作语言文字的信息熵的比较如下:


    法文:3.98比特


    西班牙文:4.01比特


    英文:4.03比特


    俄文:4.35比特


    中文:9.65比特


    可以看出,拼音文字的信息熵小,差别不大。汉字的信息量最大。


    汉字对拼音文字的这种信息熵优势是什么概念?简单的比喻就是十进位数与二进位数的差别。十进位数字系统需要人记忆0-9,10个符号,二进位只需要记忆0和1两个符号。十进位乘除要记忆9x9表,二进位只需要学会与、或、非的简单逻辑。但是,人类在日常生活中为什么不使用二进位数字系统呢?因为那样很浪费,一个数字“7”表示成二进位就成了“111”,记个大数不把人累死?反过来,人类为什么不用十六进位,或更高的进位呢?一方面是人脑智力的限制,另一方面,十六进位也未必能大幅度提高信息熵。这种信息熵反映在文字上,就是联合国文件中,中文版本一定是最薄的。信息熵高是不是就不利于计算机处理呢?这方面恐怕还很难下结论。简单的比较汉与英文的输入速度是不能说明问题的,因为“字”与“word”是不同的概念。要比较只能比较同一内容的中英文两个不同文本,计算击键数的差值。在“词”的单位基础上,现代汉语与英语是可以进行比较的。现代英语为了应付不断涌现的新事物、新思想、新科技、新概念,也在不断地造词。无非是藉助拉丁词根、或重新组合已有单词,结果越是专业科技的词彙,就越长、越难记。或者是大量使用缩写:如wto、fbi、ibm、ufo等等,缩写一多就容易混淆、难以理解。在这方面,现代汉语造词的优势就十分突出了。这就是汉字字符集信息熵高的优势。


    用现代计算机技术作为信息化的标准,来衡量汉字与英文字母的优劣是件很荒诞的事情。现代计算机技术说到底就是基于“二极体”的技术,将来的发展很难预料。难道要人类高度智能的思维模式,去模仿“二极体”式的思维?那是典型的削足适履。试想,难道当年就因为发明了黑白照像术,人们就该废掉油画的色彩?难道当年就因为摩尔斯电码适合新发明的电报,人们的语言就都应该改成“ 嘀嗒”?
『加入书签,方便阅读』
内容有问题?点击>>>邮件反馈
热门推荐
星期五谈个恋爱吧 绑定气运,我镇守人族能看见提示 村上无探戈 漫界暴君 斗破:我能将万物无限升级 漫威之守护