节物风光不相待,桑田碧海须臾改。在漫长的演化历史中,语言曾经发生过无数的分化,从而形成了现在的语言分布状态。如果追溯历史,很多语言便会找到共同的源头。那么就让我们跟随上一期的脚步,继续在北京外国语大学世界语言博物馆中探索。这一期让我们继续在溯源厅漫步,去发现语言谱系的分化奥秘、语言与时空变化的联系以及语言之间的亲属关系吧!
一、语言的分化
语言在时间中的演化与现在世界语言的空间分布又有什么关联呢?换句话说,现在世界上众多的语言是各自完全独自发展起来的,还是在历史上有某些共同的来源呢?已有的研究证明,从历时演化的角度看,现存的几千种语言并不是各不相干。漫长的演化历史中,语言曾经发生过无数的分化,形成现在的语言分布状态。如果追溯历史,会发现很多语言会找到共同的源头。

语言是社会人群连接的纽带,也是社群的重要标志。在人类历史中,由于自然或社会政治经济的各种原因,不同历史阶段都有大规模的人群扩散和迁移活动。这使原来统一的社会群体逐渐分散,生活在地球的不同区域,形成各自的文明。在交通阻塞的古代,分隔开的群体不再有密切的交流,甚至是彼此隔绝的。我们知道,语言在时间中是变化的,当分离的社群不再交际,就会有各自不同的语言演化速度和方向,日积月累,不同区域间的语言差异出现了。只要经历足够长久的历史,语言的彻底分化不可避免。
而社群的分散即使发生在地理上连续的区域内,也会带来语言的分化。根本原因还是交际密度的差异带来不同区域不同语言的演化结果。如果把一种语言音变比作一粒投入水中的石子,它影响的范围就会像在水中激起的波纹一样,越远越难以波及。
这样,原本说同一种语言的广大区域,由于不同的音变发生的原点并不一致,每一种音变产生的波浪影响区域有限,经过相当长的时间后,相隔较远的语言就会差异越来越大,直至完全不同,发展成不同的语言或方言。不过,这种相连区域的语言分化,不同语言或方言之间很难找到清晰的地理界限,通常有过渡地带的方言土语。
二.语言的亲属关系
那么,历经漫长的演变已经完全不同的语言,如何辨别其间可能曾有共同的来源呢?让我们来看看下面这个例子。

取自布龙菲尔德《语言论》
这个例子中有5个不同的概念,在5种不同语言中都有相应的词来表达。我们看到,5种语言之间语音形式不同,但在每种语言中这5个词都具有相同的元音。这样,5种语言明显表现出整齐的语音对应关系。为什么会出现这种情况呢?这是因为,语音的演变是成系统、有规律的。原本相同的语言,尽管分化演变后语音形式已经不同,但有规律的演变会使不同的语音形式之间具有系统整齐的对应关系。由此可以证明,这5种语言在历史上来自同一种语言,我们称这些有共同来源的不同语言为亲属语言。上例中的5种语言都来自原始日耳曼语。
这种通过不同语音对应关系的比较来确定语言的历史亲缘关系的方法就是历史比较法。历史比较法揭示出亲属语言空间差异中蕴涵着的语言在时间上的演变。这为追溯语言和人类的历史提供了无限的可能性。
三、语言的谱系分类
因为语言的分化在演化历史上会多次出现,所以有亲属关系的语言从历史发生的角度看,有亲疏远近的不同。如果我们能够重建这个分化的历史,无疑会对探索人类发展的历史和语言的奥秘提供一个视角和窗口。因此,众多学者都尝试着梳理历史的脉络,使原始的语言发展历程得以重现。而谱系树模型就是展现语言谱系分化的重要工具。
谱系树模型是一个重建语言演化历史的经典理论模型,可以用来解释亲属语言的谱系分类体系和在时间中的历史演化过程。模型用树形图展示出各亲属语言与原始语之间的历史派生关系。

德国学者施莱歇尔(August Schieicher)所画的最早的印欧语谱系树图
语言谱系树模型对于研究语言的历史发展有着重要作用,它建立起同源语言的发生分类系统。例如:在印欧语系中,所有的语言都来源于共同原始语——原始印欧语,而现代德语、英语、瑞典语等在树形图中处于同一大的分支,由共同的原始日耳曼语分化而来,而同为印欧语的法语、意大利语等则属于另一大的分支,由原始罗曼语分化而来。处于同一分支的语言共享其他分支所没有的创新性演变从而具有更近的亲缘关系。

印欧语系内的144种语言都源自共同的原始印欧语(Balter 2004:1325)
并且,随着研究的深入,谱系树可以不断得到修正,从而反映出最新的认识成果。这一理论模式与原始语的构拟和重建相结合,已用于世界上众多语系的发生演变研究。基于同样的理论,研究者进一步推进了在世界其他地区的语言比较研究,继印欧语系后又提出了汉藏语系、尼日尔-刚果语系、亚非语系、南岛语系、达罗毗荼语系和乌拉尔语系等等。
尼日尔-刚果语系,按第一语言人口来排名是世界上第三大语系,占世界人口的5.7%。分布在非洲的中部和非洲南部部分地区,该语系有大西洋-刚果语族、科尔多凡语族、曼德语族三个语族,共计1514种语言。尼日尔-刚果语系分布在非洲的中部和非洲南部部分地区。而斯瓦希里语为此语系使用人数最多的语言,使用范围位于坦桑尼亚东部和肯尼亚东南部。
亚非语系,又称非亚语系、非洲-亚洲语系或阿非罗-亚细亚语系,旧称闪含语系或闪米特-含米特语系,是现今世界的主要语系之一,包含300种语言,主要分布在亚洲西部的阿拉伯半岛、非洲北部和非洲之角。全球有5亿人母语为亚非语系语言,因此亚非语系便成为世界上母语人口第4多的语系,位在印欧语系、汉藏语系和尼日尔-刚果语系之后。亚非语系包括六个不同的语族:柏柏尔语族、乍得语族、闪米特语族、库希特语族、奥摩语族和已灭绝的埃及语族。
亚非语系中使用人数最多的语言是现代标准阿拉伯语,而如果包括所有阿拉伯语变体的母语人口在内,亚非语系的“阿拉伯语”共有3.1亿母语使用者,广泛分布在西亚、北非和东非地区。其他广泛使用的亚非语系语言还包括豪萨语、奥罗莫语、阿姆哈拉语、索马里语、希伯来语、提格里尼亚语、卡拜尔语、亚拉姆语和中阿特拉斯柏柏尔语。除上述现存的主要语言之外,许多具有极大历史价值的已灭绝语言也属于亚非语系,如埃及语、阿卡德语、圣经希伯来语和古亚拉姆语等。
南岛语系又称马来-波利尼西亚语系,分布于西自非洲东南的马达加斯加岛,东至智利的复活节岛,北自台湾和夏威夷岛,南至新西兰岛。1706年荷兰人H.莱兰特发现了南岛诸语言的亲属关系。1836年德国人W.F.洪堡特使用马来-波利尼西亚语这个术语来指称这个语系的语言。
19世纪末德国人施密特把它们命名为南岛语。一般按地域分成印度尼西亚、波利尼西亚、美拉尼西亚、密克罗尼西亚4个语族。这个语系主要由太平洋中各大小岛屿上的语言以及亚洲大陆东南端的中南半岛和印度洋中一些岛屿上的语言组成。根据世界语言资料库统计,该语系包括1262种语言,使用人口约2.7亿。
达罗毗荼语系,又译德拉维达语系,主要分布在印度南部和东南部,其次在斯里兰卡北部和巴基斯坦等地。达罗毗荼诸语言跟印度其他语言没有亲属关系,而且是黏着语。达罗毗荼语系通常分为南部、中部和北部3个语族。达罗毗荼语系的语言主要是南印度的语言,其包括泰米尔语、泰卢固语、马拉雅拉姆语和坎纳达语等。
达罗毗荼语系通常分为南部、中部和北部3个语族。早在1816年,语言学家就已证实达罗毗荼诸语言跟印度其他语言没有亲属关系,它们之间的一些相似点是语言接触和相互借用的结果。
一般认为,达罗毗荼语系包括约20种语言。但之后又新发现了分布在山区的一些使用人口较少的语言,确数有待调查。该语系中最重要的是泰米尔语、马拉雅拉姆语、坎纳达语(又称卡纳里斯语)和泰卢固语。这4种语言分别为印度泰米尔纳德邦、喀拉拉邦、卡纳塔克邦和安得拉邦的官方语言。它们有自己的文字和文化传统,其中泰米尔语的文化传统最悠久。
乌拉尔语系是语言学家按照语言系属分类方法划分的一组语群,包括38种语言,讲该语系语言的人有2500多万,主要分布于欧亚大陆。其中,使用人数最多的为匈牙利语、芬兰语和爱沙尼亚语,分别为匈牙利、芬兰和爱沙尼亚的官方语言。其他使用人数较多的语言有厄尔兹亚语、莫克沙语、马里语、乌德穆尔特语、萨米语和科米语,通行于斯堪的纳维亚和俄罗斯的北部地区。
乌拉尔语系的名字来源于乌拉尔山脉,根据原始乌拉尔语发源地假说,乌拉尔山脉地区是此语系的发源地。

世界语系分布图
四、史前语言的构想
既然谱系树的构建已经把语言演化的历史追溯到遥远的史前。那么如果我们把谱系树看作一个语言分化发展的历史图示,那么树形图末端的所有语言都可追溯到同一个原始语,树形图中的每一个节点都预设了节点下的后代语言在历史上曾有的一个共同原始语。
可是疑问也接踵而至。和现实当中的亲属关系不同,原始语不会和后代语言在时间上共存,是根据亲属语言材料推测出来的史前曾经存在的语言。那么,史前的语言可能是什么样子呢?在语言的历史比较研究中有一项重要的研究程序,就是根据已知语言的这些同源词的形式构拟出原始语可能的形式。
原始语构拟的原理如同数学中求最小公倍数。在确定了语言的同源关系之后,进一步比较这些语言中的同源词,根据这些词所具有的系统的语音对应关系拟出相应的原始语形式,要求拟出的原始语形式能够按所知的语音演变原理合理地解释所有后代语言的音形和词形。比如下面这组同源词都是英语father的意思,而用于比较和构拟的材料是古代文献材料保留下来的古代语言,包括古北欧语、古英语、古弗里斯兰语、古高德语、哥特语和古撒克逊语。

不过,历史不能再现,原始语的构拟并不能还原史前原始语的本来面目。史前原始语构拟的意义在于深化语言演化研究,构拟出的原始语形式就像是一个公式,为说明亲属语言的语音对应和音变过程提供了一种非常简明有效的参照。语音构拟本身促使研究者更加关注语音细节,从而加深对语言音变原理的认识,从语言的空间差异发掘出演变的时间顺序。可以推想,构拟的结果不是一成不变的,研究者对语言共性原理的认识以及用于比较的语料都会影响到构拟的结果。因此,与谱系树模型一样,原始语构拟至今在历史语言学研究中仍是一种重要研究方法。
而原始语拟构的研究方法对于研究中国的汉语历史发展十分重要,因为汉语的古代文献材料非常丰富,但是汉字不是表音文字,不能像表音的字母文字那样留下语音的痕迹。虽然历史上的音韵研究也为我们了解古代汉语的语音系统留下宝贵的成果。我们可以了解在古代哪些字是同音的,哪些是声母相同,哪些是韵母一致,但具体的音是什么,仍是无法了解。但运用历史比较和语音构拟的方法就可以根据汉语方言材料,与传统的音韵研究结合起来重建古代汉语的音系,更深入地认识汉语的演化历史。瑞典语言学家高本汉(Klas Bernhard Johannes Karlgren)最早运用历史比较法,结合中国传统音韵学,利用方言、对音等材料,为中古汉语构拟出音值。《中国音韵学研究》反映了他的这一研究成果,原文为法文本,1915-1926年间出版,后由赵元任、罗常培、李方桂合译,于1940年出版。下图为1994年商务印书馆出版,是1940年版的缩印版。


语言的谱系分化反映出语言与人类社会活动的密切关联以及语言、人与社会的相互依存。而语言为什么会变,语言又将向何处去,也许目前的语言变异研究还不能给出令人满意的解答。但语言的谱系分化以及变异是语言演化的开端,无论是语言的社会变异还是语体风格变异,都反映出语言与人类社会活动的密切关联,反映出语言、人与社会的相互依存。变异本身就是一种有意义表达。也许,由此我们对语言演化的动因会有新的理解。
来源: 北京外国语大学世界语言博物馆
科普中国公众号
科普中国微博

帮助
北京外国语大学世界语言博物馆 