wordmark

世界上的语言

联合国注册的语言有 6000 多种,而全球 97%的人使用的语言种类仅占全部语种的 4%,语言使用的集中度极高。

界定一个生物物种,可以看其雌雄两性能否交配;界定一种语言,可以看其任意两个使用者能否彼此理解。

语言的分类

语言分类层级:语系=>语族=>语支=>语言。

注意:语言的分类有很多争议,并不是确定的。这里不具体讨论不同分类的区别,只是借助分类来更好的理解不同语言间的关系。

  • 按母语人口最大的语系: 印欧语系 Indo-European,汉藏语系 Sino-Tibetan,尼日尔-刚果语系 Niger–Congo,亚非语系 Afroasiatic。
  • 非洲三大语言: 阿拉伯语(亚非语系,闪米特语族),豪萨语(亚非语系,乍得语族),斯瓦希里语(尼日尔-刚果语系)。

一些最常见的语言在语言分类上的位置(很多较小的语支和语言被省略):

  • 印欧语系
    • 日耳曼语族
      • 西日耳曼语支:英语德语,荷兰语
      • 北日耳曼语支:瑞典语,丹麦语,挪威语,冰岛语
    • 拉丁语族/意大利语族
      • 西班牙语法语,葡萄牙语,意大利语,罗马尼亚语
    • 凯尔特语族
    • 斯拉夫语族
      • 东斯拉夫语支:俄语,乌克兰语,白俄罗斯语。
      • 西斯拉夫语支:波兰语,捷克语,斯拉伐克语
      • 南斯拉夫语支:
        • 东南拉夫语:马其顿语,保加利亚语
        • 西南拉夫语:塞尔维亚语,克罗地亚语,斯洛文尼亚语,波斯尼亚语,黑山语
    • 波罗的语族
    • 印度-伊朗语族
      • 印度-雅利安语支:印地—乌尔都语
      • 伊朗语支:波斯语
    • 希腊语族
    • 阿尔巴尼亚语族(独立)
    • 亚美尼亚语族(独立)
    • 安纳托利亚语族(已灭绝)
    • 吐火罗语族(已灭绝)
  • 汉藏语系
    • 汉语族
    • 藏缅语族
  • 尼日尔-刚果语系(撒哈拉以南非洲)
    • 大西洋-刚果语族
      • 班图语支
        • 斯瓦希里语
  • 亚非语系(旧称“闪含语系”)(西亚、北非、东北非)
    • 闪米特语族
      • 中闪米特语支
        • 阿拉伯语
    • 乍得语族
      • 豪萨语
  • 南岛语系(东南亚、马达加斯加、大洋洲、台湾)
    • 印尼语马来语,爪哇语,塔加洛语(菲律宾)
  • 达罗毗荼语系(印度南部)
    • 泰米尔语(印度、斯里兰卡、新加坡官方语言)
  • 阿尔泰语系
    • 突厥语族(西亚、中亚、新疆、西伯利亚)
      • 乌古斯语支
        • 土耳其语
      • 葛逻禄语支 / 东南突厥语支
        • 乌孜别克语
        • 维吾尔语
      • 钦察语支
        • 哈萨克语
      • 西伯利亚语支 / 东北突厥语支
    • 蒙古语族
      • 蒙古语
    • 通古斯语族(中国东北,俄罗斯)
      • 满语
  • 南亚语系(南亚和东南亚)
    • 越南语高棉语、孟语、佤语
  • 乌拉尔语系
    • 匈牙利语、芬兰语和爱沙尼亚语

语言的扩张和衰落

  • 英语,法语,葡萄牙语,西班牙语在本土外有广泛的使用,它们的扩张主要靠海路;
  • 德语,俄语,日语不再是超中心语言。
    • 俄语:苏联解体后,中欧和东欧的卫星国独立后弃用俄语,但俄语仍被使用,尤其是上了年纪的人。
    • 德语:退缩到现在的德国,奥地利,瑞士北部和卢森堡(卢森堡语);一战后海外殖民地被国际联盟剥除,否则非洲前德国殖民地仍可能使用德语,如卢旺达,布隆迪,纳米比亚,坦桑尼亚。二战期间欧洲的德占区使用德语,二战后解放的区域很快就丢弃了德语。
    • 日语:曾在占领区推广日语(台湾,朝鲜,满洲,蒙古,东南亚部分地区);日本战败后,解放的国家排斥日语,日语不再被广泛使用,但很多词汇仍受日语影响。

印欧语系

拉丁语

拉丁语又分古典拉丁语和通俗拉丁语,现存的拉丁语族的语言都源自通俗拉丁语。

荷兰语 / 弗拉芒语

荷兰语(荷兰语:Nederlands),又称弗拉芒语(荷兰语:Vlaams),属于印欧语系日耳曼语族的西日耳曼语支,主要通行于荷兰全境,比利时弗拉芒大区与南美洲国家苏里南全境(这三个国家共同组成荷兰语联盟)

此外南非语Afrikaans是南非的荷兰语方言,在纳米比亚南部也有使用。

斯拉夫语族

东斯拉夫和西斯拉夫相对好记,各包括3个国家:东斯拉夫指俄罗斯,白俄罗斯和乌克兰;西斯拉夫指波兰,捷克,斯洛伐克。

前南斯拉夫分裂成多个国家,现在说的民族和语言意义上的“南斯拉夫”也大概可以分成三组:1. 东南斯拉夫语支的保加利亚和北马其顿,2. 西南斯拉夫语支里,斯洛文尼亚语相对独立,3. 西南斯拉夫语支里其他国家语言比较相近:塞尔维亚语, 克罗地亚语、波斯尼亚语、黑山语。

注意同在这一区域的阿尔巴尼亚并不属于斯拉夫语族。

斯瓦希里语 Swahili

斯瓦希里语属于班图语族

斯瓦希里语大量的单词来自于其他语言,最主要的是阿拉伯语(大概 15%的斯瓦希里语单词),包括“斯瓦希里语”这个名字也是来自阿拉伯语的 سَوَاحِلي sawāḥilī,意思是“濒海地区”('of the coast')。

斯瓦希里语使用范围:

  • 坦桑尼亚、肯尼亚、乌干达的官方语言。
  • 刚果民主共和国的“国家语言”(Recognised national languages)之一。官方语言为法语。
  • 斯瓦希里语的方言,科摩罗语,是科摩罗(Comoros)的官方语言之一。其他两个官方语言为法语和阿拉伯语。
  • 非官方语言但被使用:赞比亚、马拉维、布隆迪、卢旺达、莫桑比克。

亚非语系 Afroasiatic languages

旧称闪含语系或闪米特-含米特语系。《圣经》中,诺亚的两个儿子“”是希伯来人和亚述人的祖先,另一个儿子“”是非洲人的祖先。

通常分为 6 个分支:

  • 柏柏尔语族 Berber
  • 乍得语族 Chadic
  • 库希特语族 Cushitic
  • 埃及语 (已灭绝) Egyptian
  • 闪语族 Semitic
  • 奥摩语族 Omotic

已灭绝的埃及语(埃及语族)、阿卡德语(闪米特语族)、圣经希伯来语(闪米特语族)和古亚拉姆语(闪米特语族)也属于亚非语系。

  • 古波斯帝国用亚拉姆/阿拉姆语(Aramaic)。它是旧约圣经中的以斯拉记及但以理书书写时所用的语言,并被认为是耶稣基督时代的犹太人日常时的用语。

阿姆哈拉语 Amharic

阿姆哈拉语是在埃塞俄比亚使用的闪语的一种,与阿拉伯语、希伯来语同属闪语族,是闪语族中使用人数第二多的语言(仅次于阿拉伯语),是埃塞俄比亚的官方语言。

豪萨语 Hausa

豪萨语属于亚非语系乍得语族,是非洲最重要的三大语言之一。

使用范围:

  • 不是任何一个国家的官方语言。
  • 在尼日利亚北部、尼日尔南部、乍得湖沿岸、喀麦隆北部、加纳北部以及非洲萨赫勒地带的西非其它各国被广泛使用。

几乎相同的语言

一些相邻国家的语言非常相近,但出于政治的原因而叫做不同的语言。

  • 罗马尼亚和摩尔多瓦两国所使用的语言近乎相同。
  • 印地语和乌尔都语虽同属于印度斯坦语,但两者使用的文字不同,前者使用天城文,后者使用波斯—阿拉伯字母。
  • 马来语和印度尼西亚语非常相近。
  • 塞尔维亚语和克罗地亚语非常相近,事实上塞尔维亚语,克罗地亚语,波斯尼亚语,黑山语统称为塞尔维亚-克罗地亚语
  • 捷克语和斯洛伐克语非常相近。

“外语”

  • 洋泾浜语:操不同语言的群体在交际过程中作为接触语言发展起来的一种语言。
  • 克里奥语:已成为某一集团本族语的洋泾浜语。

语言也分高低贵贱?

十八世纪,欧洲大陆所有宫廷都采用了法语。任何人想要显得有品位,有教养,都要学习法语。欧洲的文人用文人用拉丁语。

在印度,征服者王朝的宫廷里讲波斯语,文人僧侣说梵语,大众使用各种本土方言,即普拉克利特诸语(和梵语相对)。

印度尼西亚使用印尼语而不是爪哇语:爪哇语有高低两种变体,敬语(krama)和俗语(ngoko),贵人们彼此一般使用敬语,词汇繁琐,有很多源自梵语的古词;上等人对下人说话使用俗语,而下人则要用较为简化的敬语回话。爪哇语光称谓形式就有几十种,适用于不同的尊卑关系。相反,马来语用于贸易和交通运输,历史千年,群岛上的商贾和船家都回讲马来语。

奥斯曼土耳其语中存在大量的阿拉伯语和波斯语借词,流行于奥斯曼帝国的贵族及上层社会中。1928年建立共和国后放弃阿拉伯字母改用拉丁字母,并去除了波斯语及阿拉伯语的词汇。(其他和土耳其语相近的突厥语则没有经历这一过程,而保留了一些波斯语和阿拉伯语的词汇,如阿塞拜疆语)。

什么是标记markedness?

语言学中,标记markedness是指不典型的,突出强调的,背离正常的。

如honest是典型的,unmarked;dishonest在正常的词的基础上加上dis-表示否定,就是marked。类似的还有happy/unhappy;lion表示狮子的时候可以公可以母,但lioness指表示母狮子,lioness是marked,lion是unmarked。

西班牙语中的祈使语气imperative mood也是marked,因为祈使语气语气中的动词结尾跟陈述语气indicative mood是不同的。

什么是PIE word?

A PIE word is a word that comes from the Proto-Indo-European (PIE) language, which is the reconstructed common ancestor of all Indo-European languages.