文字 编辑

汉语词汇

文字是人类用符号记录息以传之久远的方式和工具。现代文字大多是记录语言的工具。人类往往先有口头的语言后产生书面文字,很多小语种,有语言但没有文字。文字的不同体现了国家民族的书面表达的方式和思维不同。文字使人类进入有历史记录的文明会。

文字按字音和字形,可分为表形文字、表音文字和意音文字。按语音和语素,可分为音素文字、音节文字和语素文字。 表形文字是人类早期原生文字的象形文字,比如:古埃及的书字、两河流域的楔形文字、古印度文字、美洲的玛文和早期的字。

意音文字是由表的象形符号和表音的声旁组成的文字,汉字是由表形文字进化成的表意文字,汉字也是语素文字,也是一种二维文字。

基本信息

编辑

中文名:文字

外文名:characters

拼音:wénzì

定义:文字是语言的符号

例子:汉字、英文、俄文

要素:音(语音)、形(字符)、义(意义)

文字概念

编辑

定义

文字是人类用表义符号记录表达信息以传之久远的方式和工具。现代文字多是记录语言的工具,人类往往先有口头的语言后产生书面的文字,很多小语种,有语言但没有文字。

文与字

东汉许慎《〈说文解字〉叙》:“盖依类象形,故谓之文;其后形声相益,即谓之字,也就是说,“文”是独体字(包含象形字和指事字),而“字”是由独体字组合的合体字(包含会意字、形声字、假借字)。

分类

文字按字音和字形,可分为表形文字、表音文字和意音文字。按语音和语素,可分为音素文字、音节文字和语素文字。

表形文字是人类早期原生文字的象形文字,比如:古埃及的圣书字、两河流域的楔形文字、古印度文字、美洲的玛雅文和早期的汉字。

表音文字用少量字母(大多不到50个)组成单记录语言的语音进行表义的文字。表音文字可分为音节文字和音素文字。音节文字是以音节为单位的文字,如日文的假名。音素文字是以音素为单位的文字,比如英文字母26个,西文字母29个,俄文字母33个。

意音文字是由表义的象形符号和表音的声旁组成的文字,汉字是由表形文字进化成的意音文字,汉字也是语素文字。

要素

语言的三要素是:语音、词汇和语法,文字的三要素是:音--语音、形--字符形状、义--意义。学习一语言,往往连带学习它的文字,语言文字的要素有重复,合并同类型为四要素:语音、字符、词汇、语法。

属性

文字是不同国家和民族约定俗成的,由众多笔画简单的符号组成的,表达信息和传承文化的字符系统。

字符笔画简单

文字的笔画往往不多,复杂的符号就是图画了,虽然也能表义,但不便于书写和传播。

约定俗成

文字是不同民族和国家创造的约定俗成的字符系统,个人自创的不被民族和国家广泛认可的字符不算真正的文字。

系统

少数几个孤立的字符难以表达万事万物的海量信息,还不是文字,文字是由众多字符组成的一个表义的符号系统。基本的字符少,意味字符的组合越长越复杂,基本字符越多,意味表达信息越简单。改革文字会牵一发而动全身。

发展史

编辑

文字突破口语受到时间和空间的限制,是人类可以在书面语的基础上完整地传承人类的智慧和精神财富,使人类能够完善教育体系,提自己的智慧,发展科学技术,进入文明社会

普通文字是用简单图形形成,早期更加接近图画,更加接近几何线条。例如拉丁字母是简单的直线、弧线和点构成。汉字主要是由直线构成,所以叫做“方块汉字”。古代的甲骨文汉字,埃及象形文字和玛雅文字文字图画性比较强。

由于特殊人群视觉能力的局限,还可以发明异的视觉符号或触觉符号来代替普通文字。盲文是为了适应没有视觉能力的盲人发明的触觉符号。手语是为了适应没有语音能力的聋哑人发明的用手舞动的动态视觉符号。旗语是为了适应航海等远距离听觉和视觉局限发明的用旗子舞动的动态视觉符号。

子信息传输的初期,人们还采用阿拉伯数字代替汉字传输书面语。这种数字代码可以给任何文字编码。但是汉字因为数量多,需要专门的代码翻译人员才能使用。

有人把文字分成线性文字和非线性文字。这样有一定理,但无是普通文字还是代码文字都有线条和点等视觉元素。

1.表形文字/象形文字

描画事物形状的文字是象形文字或表形文字。像中文中的“日”、“”等字都属于象形文字。象形文字是文字萌芽时期的产物,主要的优势便是易于理解,一看便懂,用于记录语言会有些困难,尤其是纪录虚词,可以分为四种类型--刻符、岩画、文字画和图画字。不过到今天,这种表达意义的符号依旧很常见。比如网络上流行的颜文字和绘文字(emoji)。

2.表音文字/拼音文字

拼音文字是一种使用少量的字母记录语言中的语音的文字。主要分以下四大类:

(1)Consonant alphabets/Abjads 辅音文字

基本特征:

正式书写系统只表记语流中的辅音音位。

辅音字母依照在语流中出现的顺序,呈线性排列。

(2)Alphabets 音位文字

基本特征:

有独立的元音字母和辅音字母分别表记元音和辅音(有些语言中也存在既能表示元音又能表示辅音的字母)。

字母依照所代表的音位在语流中出现的顺序,呈线性排列。

元音字母和辅音字母在形态和位置上不带有各自的分类属性。

元音字母可以独立表记音节,辅音字母通常要和元音字母拼合才能表记音节。

(3)Syllabic alphabets/Abugidas 音节拼写文字

基本特征:

音节的书写呈线性排列,每个音节内音位的书写并非呈线性排列。

在每个音节中,以表记该音节起始辅音或零辅音的辅音字母(类似汉语拼音体系的声母)为中心,在周围特定方位(上下左右半包围等)以添加符号、符号组合、辅音字母、辅音字母和符号的组合等形式,表记韵头、韵腹、韵尾以及声调(如有)等。

辅音字母可以单独出现,代表该辅音与特定元音拼合成的音节。

元音符号不能单独出现,表记纯元音或以元音开头的音节时,必须伴随零辅音字母。

当辅音字母和添加部分共同构成音节时,在有些文字中,为保持音节字形结构的平衡和美观,字母或符号的形态会发生变化

4)Syllabaries 音节文字

基本特征:

每个音节有一种或多种独立不可拆分的表记形式。

音节文字中不含有任何表记元音辅音音位的部分。

书写时,依照所代表的音节在语流中出现的顺序,呈线性排列。

音节文字又分成整体音节文字和非整体音节文字。日语假名是整体音节文字。非整体音节文字又分成半音素化音节文字和全音素化音节文字。半音素化音节文字例如阿拉伯文字,每个字(字母)内部的主体部件写音节中的辅音音素,元音音素可以不写或者用附加部件写。

在音节文字中韩文是例外,韩文(谚文)表示音素的字母按音节组合起来写成一个方块字,但其实它并不属于学术定义上的音节文字,而和拉丁字母一样属于音位文字,只不过它的字母排列不是线形拼写,而是依照音节块形拼写而已。谚文的方块字才能为字,把音素字母看成构件。所以谚文应该看作是音节文字。

3.语素文字/意音文字

意音文字,或称语素文字、语素-音节文字、语词-音节文字,是一种图形符号既代表语素,又代表音节的文字系统。一般来说意音文字可以分解为字位,一个字位代表一个语素。语素文字的文字本身可能有表示声音、意义或是形状的部份。

基本特征:

每个单字表记独立语素,不直接表记发音(注意并不是“完全不表记发音”)。

每个单字创制时通常有唯一对应的音节,但由于语音历史演变、文字借用等因素,现今单字和具体发音之间的映射关系已非常复杂。

对应相同音节的可能有非常多的不同单字。在不结合语意的前提下,无法判断每个音节所对应的具体是哪个单字。

文字的三种类型如下表所示:

文字类型

代表文字

表形文字(象形文字)

圣书字、古汉字、玛雅文等

表音文字

(拼音文字)

辅音文字

阿拉伯字母、希伯来字母、塔纳字母、叙利亚字母

音位文字

拉丁字母、希腊字母、西里尔字母、亚美尼亚字母、格鲁吉亚字母等

音节拼写文字

天城文、孟加拉文、藏文、缅甸文、泰尔文、高棉文、泰文、老挝文等

音节文字

日文平假名、日文片假名、切诺基文等

意音文字(语素文字)

汉字、喃字等

(二)文字的发展史

最原始的文字大多是图画符号,即通过象物来表达。古代埃及文字中,也有几个图画符号来表达其音组合后对应事物的做法。苏美尔文字也经历过这个时期。但值得注意的是,汉字的“象形”与古西方文字的“象形”是两个完全不同的概念,事实上古埃及文字中绝大部分图画符号并非以形表意,而是表音符号。实质上类似于字母文字。举个例子来说,在古埃及文字语法中,看起来像是各种的符号,其实跟鸟无关,而是表示不同的的发音。所以所谓的“古埃及象形文字”,其实是世界上最早的拼音文字。(按:早中国学者在翻译“hieroglyph”时错误的放弃了直译法,而是比较形象的根据古埃及文字的图画特征,套用汉字造字法中的象形,翻译为象形文字流传至今。)

随后楔形文字放弃了图画符号,不再以形表音,而是用线条来标音,今天我们看到的众多字母体系,从腓尼基字母借用古埃及象形文字的形而用其声,再经过一系列演变,分化出希腊字母,罗字母,阿拉伯字母,西里尔字母等等,从古代到现在的字母文字,几乎都可追溯到腓尼基字母。在东亚,日本利用汉字,从其草书楷书形态演化出平假名和片假名。

文字变化的机理和拼音文字存在的原因在哪里?很重要的一点是文字还没发生和成熟之前,言语已经高度成熟了,即使是没有文字的民族,它们的口语也能涵盖日常生产生活的诸多内容。在语言还没有产生之前,人们已经能认识周围事物,而文字则是对周围事物的抽象化体现,又比如在汉字这样的意音系统里,虚词普遍采用了“假借”手法,譬如“然”即是今天的“燃”的本字,火字旁乃是后人为了和“虚词”用法相区分而加上去的(容易注意到,火字旁其实是和“然”字的火字底(四点底)相重复的),以今人度之,即如画一个抽象符号即可。

中国汉字

编辑

汉字历史

汉字是世界上最古老的文字之一,对周边的影响也是非常巨大的,是其它文字的母字。它是记录事件的书写符号。在形体上逐渐由图形变为由笔画构成的方块形符号,所以汉字一般也叫“方块字”。它由象形文字(表形文字)演变成兼表音义的意音文字,但总的体系仍属表意文字。所以,汉字具有集形象、声音和辞义三者于一体的特性。这一特性在世界文字中是独一无二的,因此它具有独特的魅力。汉字是汉民族几千年文化的瑰宝,也是我们终生的良师益友,每个人的精神家园。汉字往往可以引起我们美妙而大胆的联想,给人美的享受。

据考证,这是中国古代甲骨文的某一载体。据考证,这是中国古代甲骨文的某一载体。

各地出土的陶器上的一些陶符纹饰,已具有文字的雏形。从我们能看到的现存最早的成批的文字料──商代甲骨文字算起,汉字已经有3600年的历史。由于甲骨文字已经是相当成熟的文字体系,我们可以推断汉字的发生一定远在3600年以前。汉字的发展可以划分成两个大阶段。从甲骨文字到小篆是一个阶段;从秦汉时代隶书到如今是一个阶段。

2013年7月6日,来自全国古文字研究专家们齐聚平,现场对这些符号进行论证。专家们认为庄桥遗址出土的确为良渚原始文字,是迄今为止在我国发现的最早的原始文字。国家文物考古专家组成员、中国考古学会理事培表示,庄桥坟遗址所有出土文物是真实而有科学依据的。

图为“甘桑石刻字符”

图为“甘桑石刻字符”

汉字性质

射的演变射的演变

古人说“止戈为武”,“人言为信”。对于“武”、“信”两个字来说,这种解释是错误的。不过汉字体系里确实有按照这种方式造的字,例如“不正为歪”,“不好为孬”。这一类字的特点是会合偏旁的字义来表现整个合体字的意义。这种字为数很少,只有个别的例子。

形声字和非形声字之间并没有明确的界限。造字之初,形声字和它的声旁的读音本来就不一定密合。发展到现代汉字,出入就更大了。有人拿7500多个现代合体汉字进行统计。就普通话读音来说,合体字跟声旁完全同音(声母、韵母、声调全同)的不到 5%。声母、韵母相同而声调不同的约占10%。只有韵母一项相同的约占20%。如果我们只把前两类看作形声字,那么形声字大概只占通行汉字的15%。如果把以上三类全看作形声字,形声字大概会占通行汉字35%的样子。要是把标准再放宽或者完全根据来历确定形声字,那么通行汉字中形声字的百分比还要高得多。还有一些理据模糊的字,看起来是合体字。一种是由于变化,原来的声旁和形旁已经失去理据价值,例如“给、等、 短”等。一种是原来的独体字被分解成不同部件,例如“章, 按照汉代许慎《说文解字》的分析,“章”字从“音”从“十”。可是一般人说“立早章”(以区别于“弓长张”)的时候,是把它分析成“立”和“早”两部分。其实从古文字看,“章”本来是一个独体象形字,跟“音、十、立、早”都没有关系。

在汉字形成的过程中,由于部件的笔画化甚至讹化,以及古今异义等原因,很多字难解甚至错解,比如有个奇谈:用错互换的“射”字和“短”字。寸身不是很短吗?射字其实是短字。豆矢就是飞着的箭,短字其实是射字。实际上射在金文中就是引弓射箭的形象。不过在篆书中,左边被讹化成了“身”,右边的“寸”,“寸”作为构字部件同“又”一样是手的形象,而不是今天人们常用的“长度单位”义。短是个形声字,“豆”是声旁即便认为“豆”也可能是形旁,豆,食肉器也,造字部件中多为这个意思,而人们所熟知的“豆”义后起得多,是个假借用法。

汉字演变

贾湖刻符

八千多年前的河南舞阳贾湖遗址(距今9000—7800年),出土了一批刻符,号称贾湖刻符。有的学者认为只是刻符,有的认为是文字。香港中文大学饶宗颐曾对贾湖契刻进行了深入探讨考证,提出“贾湖刻符对汉字来源的关健性问题提供了崭新的资料”。贾湖21个刻符里,已认识的11个字,分别属于反映易学里离、坤两卦之象的卦象汉字。

双墩刻符

七千多年前的蚌埠双墩遗址,发现630多个刻划符号,丰富多样,就同期国内外文化遗存来说,都十分罕见,惊人。符号种类之多、内容之丰富是同时期其他遗址所无法比拟的。双墩刻符的功能可以分为表意、戳记、计数三大类。 2009年10月24日至25日,30多位来自国内外的著名专家学者聚集蚌埠,就“蚌埠双墩遗址刻划符号暨早期文明起源”展开研讨。众多与会专家一致认为,双墩刻符反映了早期双墩先民的生活形态,已经具备了原始文字的性质,是汉字源头之一。

半坡陶符

距今6000年前的属于仰韶文化的半坡遗址的陶钵口沿上刻的二三十种刻划符号,即半坡陶符,于吾认为“是文字起源阶段所产生的一些简单文字”。其中一些是数字。

青墩刻符

属于长江下游区域良渚文化的江苏省青墩遗址,距今5000年前,有数字刻符。

庄桥坟刻符

属于长江下游区域良渚文化的浙江省庄桥坟遗址刻符,距今5000年前,有的连字成句了。

骨刻文

骨刻文是指在兽骨上刻画的符号——象形文字或图形文字,在山东集中发现(赤峰、关中等地也有发现),是我国最早的以记事为主的可识文字。2005年,著名考古学家山东大学美术考古研究所所长刘凤君教授发现,后称“骨刻文”,并认定刻画工具为玛瑙等锐角宝石,形成约在公元前2600~前1300年之间,是龙山文化时期流行的文字。自2010年底开始,著名学者、山东省旅游行业协会专职副会长丁再献研究员将骨刻文成功系统破译,从文字的起源和构造等方面较全面的论述了与甲骨文及现代汉字的传承关系。

陶寺朱文

山西省襄汾县的陶寺遗址,据放射性碳素断代并经校正,其年代约当公元前2500~前1900年。1984年考古工作者在陶寺遗址中发现一片扁壶残片,残片断茬周围涂有色,残片上朱书两个文字,其中的一个字为“文”,另外一个字专家们有“尧”“易”“命”等多种解释。 中国社会科学院考古研究所研究员、信息中心主任朱乃诚表示,朱书文字比甲骨文还早了1500年。考古学家苏秉琦先生曾这样评价:“陶寺文化不仅达到了比红山文化后期社会更高一阶段的‘方国’时代,而且确立了在当时诸方国中的中心地位,它相当于古史上的尧舜时代,亦即先秦史籍中出现的最早的‘中国’,奠定了华夏的根基。”襄汾县所靠近的东南方翼城县就是传说的陶唐氏唐尧的后代的封国唐。

夏代水书

河南省洛阳市偃师二里头夏墟出土的陶器有24个水书文字。

一种比较折衷的意见认为中国文字“形成比较完整的文字体系”则在距今4000年前的夏朝中、后期。当然,这不是公认看法,因为夏代出土的文字还少。

甲骨文

卜骨 商王武丁时期卜骨 商王武丁时期

1959年,在山东大汶口出土了一些陶器,上边刻有一些符号,可以看成是早期(约公元前4300年)的雏形文字。但如今看到的,已经初具规模、比较完备的文字是殷商时期的甲骨文。清朝末年在河南安阳小屯村发现了许多龟甲和兽骨,上面刻有文字,引起了学术界的极大兴趣,并把这种文字叫作甲骨文。

金文

随着社会的发展,字体也不断地在演变。从殷商到秦统一之前的金文,就是在甲骨文的基础上发展而来的。金文是铜器铭文的通称,古代的铜器多为鼎,所以也叫钟鼎文。金文笔画也比甲骨文丰富多了,大小匀称,也有了行款,并有了一定的装饰性。

大小篆

我们学过历史,都知道春秋战国时,诸侯争战,你争我夺,也造成了语言异声,文字异形,直到秦始皇统一六国后,才将文字统一为小篆。以前的甲骨文、金文呢,就称为大篆,传世的《琅邪台刻石》《泰山刻石》都是小篆的代表作

隶书

小篆虽然规范,看起来也漂亮,但写起来并不容易,应用时不能人满意。人们对文字这一传播思想记录语言的工具的希望,是越方便越好,于是在小篆的基础上又产生了新的字体——隶书。相传隶书的创始人是程邈,因他得罪了秦始皇,下了监狱,在狱中用了十年的工夫,整理出一套应用简便的新字体,被后人称为隶书。秦始皇很高兴,不但赦免了他的罪,还封他为御史。

到了汉代,隶书逐渐成熟,占据了主要地位,这时由于人们审美意识的提高,隶书已写得相当美观,留下了许多名碑,如《张迁碑》《石门颂》《曹全碑》等风格各异的杰作,至今仍是学习隶书的最好范本。

楷书

隶书进一步演化而成为楷书,也就是我们今天所用的字体,它比隶书更丰富而完备。三国时期的钟繇是在楷书加工整理上有巨大贡献的人。到了唐朝,文化高度发展,书法也发展到了顶峰,出现了一大批擅长写楷书的名家.像欧阳询虞世南褚遂良颜真卿柳公权等。

草书

下面说一说草书。草书并不是在楷书出现以后才有的。“草”是初步、草率的意思。无论哪种字体写得潦草,都算草书。作为一种专门的字体,是汉代才有的。到汉末,草书才大为风行,先为章草,又为今草,最后发展为狂草,还有小草。草书种类繁多,初学者不宜学,所以在这儿也不多说了。

行书

最后说一说行书,这是介乎楷、草书之间的一种字体,产生于东汉之末。真正繁荣时期是东晋,被称为书圣的王羲之的代表作《兰亭序》就是行书。由于行书比较实用,书写比楷书更为便利,又不像草书那样难认,所以直到今天仍是最常用的字体。

汉字的演变,大体经历了甲骨文——大篆——小篆——隶书——草书——楷书——行书等几个阶段。这是符合文字的发展由繁到简,由不规范到规范的规律的。甲骨文、大篆、小篆可以合称篆书。那么,篆、隶、楷、行、草书便构成了中国书法的五种字体。汉字发展到了今天,楷书和行书还在应用着,而篆书、隶书、草书,特别是篆书已不在日常生活中应用,只作为一种书法艺术存在了。

现代汉字是指楷化后的汉字正楷字形,包括繁体字和简体字。现代汉字即从甲骨文、金文、大篆(籀文)、小篆,至隶书、草书、楷书、行书等演变而来。汉字为汉民族先民发明创制并作改进,是维系汉族各方言区不可或缺的纽带。现存最早的汉字是约公元前1300年殷商的甲骨文和稍后的金文 西周时演变成籀文 ,再到秦朝的小篆 和隶书,至汉魏隶书盛行,到了汉末隶书楷化为正楷。楷书盛行于魏晋南北朝,至今通行。

汉字内容丰富,但有些应有的读音、特殊或新意思的汉字欠缺,尤其是创新意义的汉字应当不断完善、发明,这是一种进化,至少凡是拼音可拼出的都应当有对应的汉字:如图例: