由杨世铁所著的《先秦汉语常用词研究》一书先对一些重要的数量关系,如文献用字量、用词量、总字数、词汇总量、频次、覆盖率和常用词之间的关系作了梳理;然后分析了各阶段常用词数量变化的原因以及常用词内部常用度高低的表现情况。第六章则主要讨论的是先秦时期常用词的发展变化情况。此项研究首次利用词频统计的方法对上古汉语词汇作比较系统的研究而且在很大程度上带有原创性质;首次比较全面地探讨上古汉语的常用词问题;使用“潜词”这一术语并用它来指称上古汉语中大量存在的具有意义加合关系的双音组合,可在一定程度上解决学者们对这类词的归属所产生的争议问题。
本书通过对上古时期各阶段常用词的描写,将勾勒出上古汉语词汇的面貌,进一步理清上古汉语常用词演变的过程和规律。
《先秦汉语常用词研究》根据词彙统计学的相关原理,借鉴现代汉语词频统计的成功经验,对先秦时期成书年代可靠的9部传世文献和部分具有代表性的出土文献的用词情况进行了全面的整理和统计,得到了先秦时期四个阶段、五部分语料的词彙总表。四个阶段是:西周早期至西周中期、西周中期至春秋末期、春秋末期至战国中期、战国中期至秦代。五部分语料为:(1)西周早中期的231条金文;(2)《诗经》(部分)、《周易》本经、今文《尚书》(部分);(3)《诗经》(部分)、《春秋经》;(4)《论语》、《商君书》、《左氏传》;(5)《孟子》、《庄子》、《吕氏春秋》。每个词彙总表均由序号、词目、频次、频率和覆盖率五部分组成,且按词频高低排列,其中覆盖率和词的使用频次是确定各个时期常用词的重要标准。先秦时期各阶段的常用词数量有多有少,其数量多少与文本量大小有密切关系。从总体上看,各个阶段常用词的数量是大体固定的,常用词爲了保持数量上的这种平衡性,每个阶段每当有新的常用词产生时,就会有旧的常用词被挤掉。常用词发展的这种模式,表现在数量上是滚动式的,表现在内容上是更替式的。