从目前我们能看到的最早的成批的文字资料——商代甲骨文字算起,汉字已有3000年的历史。由于甲骨文字已经是相当成熟的文字体系,我们可以推断汉字的发生一定远在3000年以前。汉字的发展可以划分为两个大阶段。从甲骨文字到小篆是一个阶段;从秦汉时代的隶书以下是另一个阶段。前者属于古文字的范畴,后者属于近代文字的范畴。大体说来,从隶书到今天使用的现代汉字形体上没有太大的变化。从汉字跟汉语的关系看,汉字是一种语素文字。从汉字本身的构造看,汉字是由表意、表音的偏旁(形旁、声旁)和既不表意也不表音的记号组成的文字体系。汉字起源于图画。在汉字产生的早期阶段,象形字的字形跟它所代表的语素的意义直接发生联系。虽然每个字也都有自己固定的读音,但是字形本身不是表音的符号,跟拼音文字的字母的性质不同。象形字的读音是它所代表的语素转嫁给它的。随着字形的演变,象形字变得越来越不象形。结果是字形跟它所代表的语素在意义上也失去了原有的联系。这个时候,字形本身既不表音,也不表义,变成了抽象的记号。如果汉语里所有的语素都是由这种既不表音也不表义的记号代表的,那么汉字可以说是一种纯记号文字。不过事实并非如此。汉字有独体字与合体字的区别。只有独体字才是纯粹的记号文字。合体字是由独体字组合造成的。从构造上说,合体字比独体字高一个层次。因为组成合体字的独体字本身虽然也是记号,可是当它作为合体字的组成成分时,它是以有音有义的“字”的身份参加的。合体字可以分成以下3类:①形声字。形声字由表示意义的形旁和表示读音的声旁两部分组成。拿构造最简单的形声字来说,形旁和声旁都是由独体字充当的。作为形声字的组成部分,这些独体字都是有音有义的字。不过形旁只取其义,不取其音,例如“鸠”字的偏旁“鸟”;声旁则只取其音,不取其义,例如“鸠”字的偏旁“九”。 由于字义和字音的演变,有些形声字的形旁或声旁现在已失去了表意或表音的功能。例如“球”本来是一种玉的名称,所以以“玉”为形旁。现在“球”字不再指玉,这个形旁就没有作用了。再如“海”字本来以“每”为声旁。由于字音的变化,现在“海”和“每”的读音相去甚远,声旁“每”也就不起作用了。有的时梁清候,形旁和声旁都丧失了原来的功能,例如“给、等、短”。这一类字已经不能再作为形声字看待了。形声字和非形声字之间并没有明确的界限。造字之初,形声字和它的声旁的读音本来就不一定密合。发展到现代汉字,出入就更大了。有人拿7500多个现代合体汉字进行统计。就普通话读音来说,合体字跟声旁完全同音(声母、韵母、声调全同)的不到 5%。声母、韵母相同而声调不同的约占10%。只有韵母一项相同的约占20%。如果我们只把前两类看作形声字,那么形声字大概只占通行汉字的15%。如果把以上三类全看作形声字,形声字大概会占通行汉字35%的样子。要是把标准再放宽或者完全根据来历确定形声字,那么通行汉字中形声字的百分比还要高得多。②合体会意字。古人说“止戈为武”,“人言为信”。对于“武”、“信”两个字来说,这种解释是错误的。不过汉字体系里确实有按照这种方式造成的字,例如“不正为歪”,“不好为孬”闭世。这一类轿渣肢字的特点是会合偏旁的字义来表现整个合体字的意义。这种字为数很少,只有个别的例子。以上两类合体字里的偏旁有的有表意作用,有的有表音作用。下边一类的情形不同。 ③合体记号字。这一类合体字的偏旁既不表意,也不表音。这主要有两种情形。一是由于字音和字义的变化,原来的声旁和形旁已经不再表音、表意了。例如上文举过的“给、等、 短”一类字。 另一种情形可以举“章”字为例。 按照汉代许慎《说文解字》的分析,“章”字从“音”从“十”。 可是现在一般人说“立早章” (以区别于“弓长张”)的时候,是把它分析成“立”和“早”两部分。其实从古文字看,“章”本来是一个独体象形字,跟“音、十、立、早”都没有关系。汉字用来记录汉语已经有3000年以上的历史,一直沿用到今天,没有中断过。在如此长的历史时期里,汉字不仅为人们的现实生活服务,而且记录下极其丰富的文化资料;甚至跨越国界,被日本、朝鲜、越南等邻国借去记录非汉语语言。另一方面,长期以来也不断有人批评汉字的缺点,主要是说汉字难认、难写、难于机械化(印刷排版、打字等)。因此在扫盲、儿童识字教育、文化传播等方面,都不如拼音文字效率高。跟拼音文字比较起来,汉字有它的短处,但是也有它的长处。汉字最大的长处就是能够超越空间和时间的限制。古今汉语字音的差别很大。但由于2000年来字形相当稳定,没有太大变化,字义的变化比较小,所以先秦两汉的古书今天一般人还能部分看懂。如果古书是用拼音文字写的,现代人就根本无法理解了。有些方言语音差别也很大,彼此不能交谈,可是写成汉字,就能互相了解,道理也是一样的。50年代开始进行简化汉字的工作。1986年重新公布的《简化字总表》规定了2200多个简化汉字(包括用简化偏旁类推的字)。这项工作目前已告一段落,今后在一个时期内将保持稳定,不继续简化。因为不断简化会破坏文字的稳定性,而且简化一批字以后,原来的繁体字并不能废除。结果是汉字的总数有增无减,反而加重了学习和使用的人的负担。关于文字拼音化问题,长期以来一直有争论。从理论上说,任何自然语言都可以用拼音文字记录。但是由于汉语方言分歧,在推广普通话的工作没有取得广泛、切实的成效以前,改用拼音文字会给方言区的人带来很大的困难。此外,由于汉字历史悠久,大量的文献都是用汉字记录的。一旦改弦易辙,势必在文献的广泛利用上造成一定困难,在社会心理和民族感情上也可能引起波动。象形文字(Hieroglyphic)是指纯粹利用图形来作文字使用,而这些文字又与所代表的东西,在形状上很相像。一般而言,象形文字是最早产生的文字。用文字的线条或笔画,把要表达物体的外形特征,具体地勾画出来。例如“月”字像一弯月亮的形状,“龟”(特别是繁体的[龟])字像一只龟的侧面形状,“马”字就是一匹有马鬣、有四腿的马,“鱼”是一尾有鱼头、鱼身、鱼尾的游鱼,“艹”(草的本字)是两束草,“门”(繁体的[门]更像)字就是左右两扇门的形状。而“日”字就像一个圆形,中间有一点,很像人们在直视太阳时,所看到的形态。象形字来自于图画文字,但是图画性质减弱,象征性质增强,它是一种最原始的造字方法。它的局限性很大,因为有些实体事物和抽象事物是画不出来的。因此,以象形字为基础后,汉字发展成表意文字,增加了其他的造字方法,例如六书中的会意、指事、形声。然而,这些新的造字方法,仍须建基在原有的象形字上,以象形字作基础,拼合、减省或增删象征性符号而成。现时世上最广为人知的象形文字,是古埃及的象形文字——圣书体。约5000年前,古埃及人发明了一种图形文字,称为象形文字。这种字写起来既慢又很难看懂,国此大约在3400年前,埃及人又演化一种写得较快并且较易使用的字体。此外,现时中国西南部纳西族所采用的东巴文和水族的水书,是现存世上唯一仍在使用的象形文字系统。随着时光的流逝,最终连埃及人自己也忘记了如何释讳早期的那种象形文字了。若不是因为拿破仑大军入侵埃及时,随军的法国古文字学家们的那次发现,极有可能至今考古学家们仍无法辩认这种文字。 1799年,这些法国古文字学家们发掘出一块文字的黑石碑。碑文用3种文字写成,分别是希腊文、古埃及象形文字和后期的埃及文字。一位法国古代语学者吉恩·保罗·商博良研究了这些文字,并设法释读了古埃及的象形文字。 商博良释讳古埃及象形文字的方法是:对石碑上的文字进行比较,先设法挑选出埃有最后一个法老王族托勒密王朝时期的象形字,随后再想方法辩认出其他象形文字的词意。商博良于1822年将自己的发现公诸于众。 罗塞塔石碑用3种文字记载了同样的内容,因此成为释读古埃及象形文字的关键所在。法国名将拿破仑·波拿巴在埃及地行过一场重大的战役。为了研究埃及文化,拿破仑派遣的历史学家们又发掘了许多古代遗址。值得一说的是 ,中国最初的文字就属于象形文字。汉字虽然还保留象形文字的特征,但由于汉字除了象形以外,还有其他构成文字的方式;而汉字经过数千年的演变,已跟原来的形象相去甚远,所以不属于象形文字,而属于表意文字。然而,甲骨文和金文亦算是象形文字。此外,玛雅文字的“头字体”和“几何体”亦是。 wenzi文字 writing 语言的书写符号,人与人之间交流信息的约定俗成的视觉信号系统。这些符号要能灵活地书写由声音构成的语言,使信息送到远方,传到后代。 文字的先驱 文字起源于图画。原始图画向两方面发展,一方面成为图画艺术,另一方面成为文字。原始人用图形来表达意思,通常称为“图形文字”。这种图形虽然能交流信息,但是跟语言并无联系。例如,画一个箭头表示“由此前进”,画一个人高举双手表示“欢迎”,大家都看得懂,可是如果用语言来说出图画中的意思, 那就各不相同。你可以说英语 ,他可以说法语。这样的图形可以说是文字的先驱,还没有成为真正的文字。(图1[文字的先驱,举例:渔王率五舟,各乘若干人,历三日,][渡湖,安抵对岸]) 表示意义的图画要发展到跟语言相结合,能够完整地书写语言,这才成为语言的有效记录,即成熟的文字。许多民族都创造过原始文字,但是只有极少几个民族的文字发展到成熟程度。有些文字,只能写出实词,不能写出虚词,阅读时候要由读者自行补充,这是不完备的文字。大多数民族都借入其他民族已经成熟了的符号系统,再加以修改补充,书写自己的语言。 词符与音节符并用的文字 名副其实的文字有 3种主要类型:词符与音节符并用的文字、音节文字和字母文字。这3种类型代表文字发展的3个阶段。 如果每一个词用一个符号来表示,那就需要许许多多的符号,而抽象词仍旧难于写出,这样的文字是不切实用的。解决的办法是,把一部分词符改成只表音,不表意,夹在词符中间,那就成为词符与音节符并用的文字。这是最早达到成熟程度的文字类型。 用汉字书写的中文,基本上属于词符与音节符并用的类型。在古汉语中,表示实词的汉字大都是词符,表示虚词以及拟声和译音的汉字是音节符号例如,原来表示簸箕的“其”字是词符,后来借来表示虚词的“其”,就成为音节符号了。又如,“丁当”、“可”都是音节符号。有些汉字只是多音节实词中的音节符号而不是词符,如“葡萄”是由两音节构成的词,要用两个音节符号写出。 [文字发展示意表] 汉字和假名混合体的日文是典型的词符与音节符并用的文字,其中汉字大都是书写词根的词符,假名是书写词尾助词等的音节符假名是从汉字变化出来的(图2[日文假名举例]) 音节文字 词符与音节符并用的文字,如果丢掉了词符,全用音节符,那就成为“音节文字”。在任何语言中,词的数量是很大的,而且不断增加。音节的数目少得多,而且是相对稳定的。音节文字只要用数目有限的符号,就可以完备地书写语言。 日本有“假名文字运动”,主张不用汉字,全用假名。这个主张如果实现,日文就成为音节文字了。 埃塞俄比亚文字(近代体称为阿姆哈拉文字)是一种现行的音节文字。它用大致相同的符号代表相同的辅音,附带微小的笔画变化表示元音,成为音节符号。(图3[阿姆哈拉音节字母举例]) 比较一下日文的假名和阿姆哈拉音节符号,可以看出其间的主要区别是,假名用不同的符号表示相同的辅音,阿姆哈拉文字用基本上相同的符号表示相同的辅音(比较图2和图3)。 有些音节文字,不管元音如何不同,辅音相同的音节都用相同的符号来表示。好比 ka、ki、ku 都写成 k。这样就产生了所谓“辅音字母”。这样的字母虽然叫做辅音字母,可是带有不写出来的元音,仍然具有音节符号的性质,它是从音节符号向音素(音位)符号演变的中间形态。 公元前11世纪的比布鲁斯字母(阿希拉姆碑铭文字,发现于比布鲁斯,在今黎巴嫩,现名朱拜勒)是现存最早的已经解读的辅音字母,可以说是字母的老祖宗。(图4[比布鲁斯字母]) 从字母的老祖宗间接传下来的阿拉伯字母是今天应用比较广泛的辅音字母。阿拉伯文字把同样的几个字母写在一起,要求读者根据上下文的不同而读成不同的词。这很象用字母来缩写语言。打个比方:d、p两个字母连写在一起,成为 dp,但在一个地方要念成dipu“地铺”,在另一个地方要念成dapo“打破”。这样,虽然书写省事,可是阅读太不方便了。所以后来又在辅音字母上加几个点子表示元音。(图5[阿拉伯字母举例]) 字母文字 字母表示元音的方法有 3种:①用独立的符号表示元音,例如希腊字母、拉丁字母等。②用不连接的分音符号表示元音,例如阿拉米字母、希伯来字母、阿拉伯字母等。③把分音符号连接在字母上表示元音,例如印度字母、阿姆哈拉字母等。第 3种被认为是音节符号字母。第 2种如果以不加元音符号为正体,也是音节字母。 严格意义的“字母文字”,既有辅音字母,又有元音字母。创造元音字母是希腊人的贡献。他们在公元前8 世纪传入辅音字母,把其中几个改为专门表示元音,其余仍旧表示辅音,但是不再附带元音。这好比原来k可以表示ka、ki、ku的音,现在用k、a、i、u几个字母分别写成 k—a、k—i、k—u。这样就产生了“音素(音位)字母”。音素字母文字,在书写时候要把音节分析成为辅音和元音,在阅读时候要把辅音和元音拼合成为音节。这是完备的拼音制度。(图6[希腊古典字母]) 完备的拼音制度的产生,使文字历史进入新的阶段。一切语言的声音,如果分析成为音素(音位),一共只有几十个基本的辅音和元音,只要用几十个字母就可以写出。跟音节字母相比,音素字母不但符号数目少得多,而且表音更加灵活。但是文字记录语音总有遗漏。例如重音、句调、节奏等等,字母文字还是不作表示的。 文字的表达方法 从单个符号来看,文字有 3种基本的表达方法:表形(象形)、表意(会意、指事)和表音(假借、谐声)。具体的文字,往往混合应用几种表达方法,而以一种或两种方法为主。 原始图形文字主要用表形方法,可是也夹用表意方法,例如用点子或短线表示数目, 所以又称“形意文字”(图 1)。词符与音节符并用的文字兼用表意和表音两种方法,所以又称“意音文字”。意音文字中间一般还有既不表意、又不表音、只有区别功能的所谓“定符”。从广义来看,区别功能也是一种表意功能。 除新设计的文字以外,音节文字和音素字母文字都在表音之中夹用表意。例如英文或法文中间,有些词的读音相同而拼法不同,有些词附带不读音的字母,这些由于历史或其他原因而形成的特点,今天成为具有区别词义的拼法。阿拉伯数字是表意符号,但经常夹用在表音的字母文字中间,这也是表达方法的混合应用。 从语言的内容来看, 文字符号所书写的“语言单位”是可小可大的。从小到大,可以分为 5等:①音素或音位,用音素或音位字母。②音节,用音节符号。③词儿,用词符。④词组,用词组符号。⑤语段,用语段符号。今天各国的文字符号,极大多数代表音素或音位,少数几种代表音节。汉字有的是音节符号,有的是词符。代表词组和语段的文字现在没有。但是,文字中间夹进阿拉伯数字和科技符号,也可以表词、词组或语段。 文字的体式变化 体式是文字的外形。任何文字的体式都是不断变化的,可是成熟了的文字就变化很慢现存资料开始于5500年前的古埃及文字,早期大都是图形符号,主要用于碑铭,称为“圣书体”。这些图形符号大部分已经失去表形性质,成为表意或表音符号。中期由于用软笔在纸莎草上书写,体式变为草书笔画,丢掉了图形的外表,主要用于书写经文,称为“僧侣体”。晚期笔画大为简化,主要用于写信和记帐,称为“大众体”。3种体式很不相同,但是基本结构相同。(图7[古埃及字演变举例]) 西亚的美索不达米亚( 即两河流域,在今伊拉克)的苏美尔文字,可能更古于埃及文字。苏美尔文字早期也是以图形符号为主,后来由于在软泥板上用硬笔压刻成字,符号变成一头粗、一头细的短线条,类似楔子,称为楔形字(又称钉头字)。楔形字的笔画渐渐变得越来越简。这种以泥板为纸张、用压刻方法书写的奇特文字,以西亚的美索不达米亚为中心,传播到四周的民族,写成各种文字。其中最重要的是阿卡德文字,也就是巴比伦和亚述的文字,在历史上曾经是西亚的国际通用文字。(图8[楔形字演变举例]) 以上两种词符与音节符并用的文字都在一两千年前被废弃了。同类型的中国汉字,从殷商甲骨文算起,有3300年以上的历史,也经过多次体式变化,甲骨文、金文变为大篆、小篆,再变为隶书、楷书,同时又有行书、草书,但是基本结构未变。它屹立数千年,应用到今天。 文字的主要发源地,除北非、西亚和东亚以外,还有美洲的墨西哥(尤卡坦半岛)。那里的玛雅文字有别致的图形符号,但是也已经失去表形功能,成为以音节符号为主,兼用意符、音符和定符。最早的遗物是公元328 年的刻碑。玛雅文字到16世纪被废弃。(图9[玛雅文字举例]) 字母的传播 文字从原来创造的民族传播到另一民族,由于语言特点不同和应用要求不同,发生了矛盾。结果是,接受外来文字的民族,为了自己的需要,对传入的文字进行调整、补充或改革。汉字传到日本产生假名,就是由传播而改变的一个例子。 产生比布鲁斯字母的黎巴嫩,在地中海东岸,那里是古代埃及和美索不达米亚两大文化往来交流的走廊地带。当地的居民,后来被称为腓尼基人,意思是“商人”,因为他们主要经营商业他们需要简便的文字来记帐,但是埃及文字和美索不达米亚的楔形文字都太繁难。他们从埃及文字中的辅音符号得到启发,创造出一套辅音字母。 这套字母的产生, 比埃及文字和楔形文字晚2000年。这说明字母的产生是经过极长时期的酝酿才瓜熟蒂落(另一说认为比布鲁斯字母源出爱琴海音节文字)。 文字随着文化——尤其是宗教——传播四方。同一种文字可以传播到语言完全不同的民族。文字的类型跟语言的类型没有必然的关系。例如,日语跟汉语在语言类型上很不相同,可是日本采用了汉字。日语的特点只促进了假名的产生,没有妨碍汉字的采用。 字母在比布鲁斯形成以后,由于简便好用,不胫而走,无远勿及。在向东传播的路线上,形成阿拉米字母系统今天的阿拉伯字母是这一系统的一种晚期变体自成系统的印度各种字母,流传于印度各邦、东南亚各民族和中国的西藏。印度字母系统可能也是从阿拉米系统分化演变而来。在向西传播的路线上,形成腓尼基字母系统,它变成希腊字母,又变成基里尔字母(又称斯拉夫字母)、罗马字母(又称拉丁字母)以及其他字母。东正教国家用基里尔字母,天主教国家用罗马字母。在过去的 300年中,随着西欧国家的大扩张,罗马字母传播到非洲、美洲和亚洲许多国家,成为今天世界上流通最广的字母(见彩图[苏美尔楔形文字]、[楔形文字]、[古埃及文字-碑铭体]、[古埃及文字-碑铭体]、[古埃及文字-僧侣体]、[古埃及文字-大众体]、[用三种文字书写的埃及罗塞塔石碑(上)碑铭体(中)大众体(下)希腊文]、[玛雅文石碑][玛雅文抄本][古腓尼基字母文字]、[古腓尼基字母文字]、[公元前9世纪的希腊字母])