在中国民族语言研究历程中,资源和语料建设一直是重中之重。语料的形式和内容多种多样,譬如词汇、词典、文本、音档、语图、语音参数、文字图片、多语对照词汇、语言或方言地图,以及人名、地名等其他各类专题语料资源。
通过图书出版而面世的语料主要有各种民族语言描写专著提供的案例,特别是其中附载的词汇和文本,这是所谓单一语言或方言语料的常见汇集形式。零星出版的这类专著很多,此处不能一一列出,而以丛书形式发布的则影响较大,主要有“中国少数民族语言简志”丛书(近60卷)、“中国新发现语言研究”丛书(40余卷)和“中国少数民族语言方言研究”丛书(近20卷),以及“中国少数民族语言系列词典”丛书(20余卷)。此外,近年一批以“参考语法”为题的博士学位论文大多也附带一定数量的分类词汇和篇章文本。至于涉及多种语言或方言语料的各语族论著也蔚为大观,例如孙宏开主编的《藏缅语语音和词汇》、黄布凡主编的《藏缅语族语言词汇》、王辅世和毛宗武合著的《苗瑶语古音构拟》、梁敏和张均如合著的《侗台语族概论》、严其香和周植志合著的《中国孟高棉语族语言与南亚语系》(7种语言14个方言点)、孙竹主编的《蒙古语族语言词典》(6种语言16个方言点)、陈宗振主编的《中国突厥语族语言词汇集》(8种语言)、朝克编著的《满通古斯语族语言词汇比较》(6种语言),等等。
随着信息化时代的发展,21世纪以来,前期调查和出版的相当部分词汇数据进入了电子化资源检索平台,改变了语言学家的工作方式和工作流程,拓宽了他们的研究领域和研究方向,增强了他们驾驭语言资源的能力,甚至推动他们创造出新的语言学说和方法。据我们了解,这些电子化数据资源中影响较大的有“汉藏语同源词检索系统”和“东亚语言词汇语音数据检索系统”。有研究表明,这两个系统为学术研究的深度发展提供了新的契机,解决了不少研究中的疑难问题。
可是,以上所述成果形式无论是附着于描写或专题论著还是独立资源著作,似乎主要集中在各类民族语言的词汇和词典方面,说明学界历年积累的资源还有重大空白,尤其缺乏文本性质的熟语料标注资源。
随着语言研究的深入和研究领域的拓展,特别是伴随着语言类型学(语法类型、语音类型等)、普遍语法、语系学说、语言接触、语言心理、语言生态、语言检索和多语机器翻译等新兴跨学科研究在中国的蓬勃兴起,学术界开始呼唤一种跨语言、跨方言的资源性建设研究,呼唤创造多样性的真实文本资源和跨语言对齐文本资源。值得称道的是,中央民族大学少数民族语言文学学院适时推出了一套“中国少数民族语言话语材料”丛书,迄今己出版黎语、临高语、佤语、仡佬语、布央语、布依语、撒拉语等双语对照文本材料,初步弥补了该领域的不足。
独龙语是藏缅语族语言中形态较为丰富的语言, 以粘着手段为主表达各种语法关系, 有人称和数、使动、互动、反身、体、趋向、式、示证、格等语法范畴。本书以独龙语独龙江方言中部的土语孔当话为代表, 收录神话传说、民间故事和寓言为主, 同时增加一些说话人叙述事件的口语材料, 对每个词、语法成分进行系统的分析和梳理并加以标注。