语言是人类信息交流的最主要手段。它的产生和发展,是与人类的进步和发展同步进行的。随着生产力的发展,活动范围的扩大,人类的信息交流受到语言即时性、即地性、不可保留性的严重制约,书面语言(文字及其排列顺序)也就必然产生了。
汉语是汉族人使用的语言,现在是中华民族的主体语言,是世界上使用人数最多的语种;汉字是记录汉语的符号,是世界上文献延续最久的文字。
世界上任何一种语言文字,都是一个相对独立、完整的体系,它既有所有语言文字的共性,又有区别于其它语言文字的特性。那么汉字区别于其它文字的特点是什么呢?
需要说明的是,汉字系统是一个非常奇特的系统,区别于其它文字的特点很多。在这里,我们只能探讨一些特别重要的,而且对中文输入有积极意义的特点,这就是汉字的表意性和单音节性。
文字是语言的视觉符号,我们可以利用这种符号系统来表示世界上存在的一切事物及其发展变化,我们甚至可以用它来虚构世上并不存在的事物和事件。社会愈进步,符号就愈抽象,以至到了信息化时代,数字化世界,我们可以用0和1二个符号的无穷排列和组合,来表示世界上的一切事物及其发展变化。从本质上说,世界上任何一种文字都是表意的。
既然任何文字都是表意的,也都是有读音的。那为什么文字专家把汉字称为表意文字,而把西文、阿拉伯文等称为表音文字呢?这是因为汉字的字形和字义之间,有相当多的直接关系,而很多其它文字,必须通过语音的的媒介,才能使字母符号的排列与表示的意义联系起来。
汉字是表意性的图形文字,有很多字,最早都是很生动的图画。它的造字法,大致走过了象形、指事、会意、形声四个阶段。在这四个阶段中,象形是造字的最初阶段,形声是造字的最高阶段。在漫长的发展过程中,它的形状发生了脱胎换骨的变异,它的形象性不断减少,抽象性不断增加,现在,除少数字还可以辨析出原来的形象外,大多数已经是面目全非了。但是,不管汉字的字形变化有多大,绝大多数汉字还保留着一个表示相关意思的符号,这个符号就是部首。
部首是汉字独有的用来组字的固定成分,任何别的文字中没有类似的对应物,每一个汉字只包括一个部首,再加上或者不加上别的部分。部首是汉字的重要部分,它可以帮助我们理解字义,记住字形。在汉字检索法里,部首检索法是最基本的检索法,它以部首为主序列对汉字进行第一次分类,再按笔划数和笔形对部内汉字进行排序。
汉字的另一个特点是单音节性。任何一个汉字,不论是用普通话来读,
还是用任何一种方言来读,也不论是单独表示一个意思,还是与其它字共同
表示一个意思,都只读一个音节。一句书面语有5个字,读起来就是5个音节,讲出来6个音节的一句话,完整记录下来必须用6个汉字。
汉字的单音节性是由汉语语素的单音节性决定的。汉语语素中绝大多数是单音节的。例如:
|
名词: 人、口、手、马、牛、羊……
动词: 说、想、做、走、跑、跳……
代词: 我、你、他、谁、这、那……
助词:
着、了、过、的、地、得……
数量词:一、二、三、个、只、支……
形容词:大、小、高、矮、红、绿……
…… |
即使是现代汉语中使用的许多多音节词,也大多是由单音节词按规则组合而成的固定结构。汉语语素和汉字的单音节性,使汉语和中文的表达特别简洁、确切,一般而言,相同内容的文本,中文总是最短的。
汉语语素的单音节性,是在汉族人在数十万年进步发展中形成的,其间
经历了多次多民族的融合和影响,但其单音节性仍顽强地保留了下来,而且由于汉字的发明和使用而得到了加强。其它民族在借用汉字来表意时,可以根据他们民族的语言习惯,使汉字多音节化,但汉人使用汉字却只能是单音节的。汉字的改革者们也曾提议汉字的多音节化,但这样的改革从未获得成功,估计今后也不会获得成功。
汉语语素的单音节性限制了汉字向音素文字方向的发展,使汉字成为一种独具特色的文字。在社会科技文化高度发展的今天,它同样限制着汉字朝拼音化方向的发展。
汉字的单音节性,使它的同音字特别多,国标GB2312-80中6763个汉字只有400多个音节,包括一字多音的情况,平均每个音节约有20多个同音字,个别音节的同音字达到一百多个。为了区别同音字的不同意义,形声造字法就必然成了汉字造字的最主要方法。
所谓形声造字法,就是在较简单的汉字的基础上,分别加上意符(即部首)来表示各种不同的意义,据统计,汉字中形声字占总字数的80%以上,大量的形声字,使阅读和理解中文变得相对容易,而字形变得相对复杂。汉字简化以后,写字也容易得多了。今后如果普及了平均二键一字的中文输入,写字的困难将更加减轻。
汉字的表意性和单音节性,对设计普及型中文输入法具有重要的意义。
前文提到中文输入是以电脑检索代替用手写字,二键码是最简单的检索编码,那么,用以部首为代表的形码和以声母为代表的声码,对汉字进行二键检索,无疑是最符合汉字造字规则和国人知识背景的方法。
|