时间:2015-12-25 16:05 文章来源:http://www.lunwenbuluo.com 作者:陈强 点击次数:
(一)王朝数据
本文的王朝数据涵盖了自公元前221年秦朝建立至1911年清朝灭亡的中国各主要朝代及游牧政权。被解释变量为虚拟变量“中原王朝是否被游牧政权征服”(conquered)。主要解释变量之一为中原王朝早于相邻游牧政权建立的年数(diff)。两个政权一旦建立,则变量diff保持不变,故为前定变量,不必担心其内生性。
所有王朝数据,包括中原与游牧政权的起讫年代,以及中原王朝是否被征服,均取自白寿彝(1999)。中原王朝的起讫年代众所周知。游牧政权的建立年份定为部落首领统一各部落,并且称王、单于或可汗之时。由于王朝数据都来自中原王朝而非游牧政权的历史记载,或许存在选择偏差。但如果中国历史的主流文献未提及某游牧政权,则说明该游牧政权未对中原王朝造成实质威胁,故没必要包括在样本中。
在本研究的对王朝观测值中,中原王朝共被征服了7次(约占15%),即316年西晋被前赵(匈奴)征服,589年南朝陈被隋征服,后唐与后晋分别于936年与947年被辽(契丹)征服,1127年北宋被金(女真)征服,1279年南宋被元(蒙古)征服,以及1644年明朝被清朝征服。
(二)历史气候数据
在理想情况下,应使用游牧地区的气候数据来解释游牧民族的征服活动。
但游牧地区的历史气候缺乏记载。由于蒙古草原与中国北方均受东北亚季风气候支配(ZhangandLin,1992),二者的气候条件具有较强相关性,故可以将中国北方农业区的气候作为相邻游牧区气候的代理变量。中国北方的定义为当今山东、山西、河南、河北、陕西、北京与天津之和,大致位于长城以南、秦岭—淮河一线以北。通过使用1957—1990年的降雨数据,BaiandKung(2011)发现这两个区域的气候条件高度相关。本文的所有气候数据均指中国北方。
沿用BaiandKung(2011)的方法,本文使用每十年的干旱年数(drought)作为降雨稀少的代理变量,而以每十年的黄河决堤年数(levee)作为降雨充沛的代理变量。降雨充沛的另一代理变量为每十年的水灾年数(flood)。其他气候变量包括每十年的雪灾年数(snow)和每十年的霜冻低温灾害年数(frost)。以上气候变量来自三个数据来源。变量levee的数据来自《黄河水利史述要》14。变量snow与frost的数据来自张波等(1994)15。张波等(1994)与陈高傭(1939)16都提供了旱灾与水灾的记录,包括发生年份与灾害地点17。有关旱灾与水灾的第一手历史记录均来自《二十五史》等史料;由于信息量巨大,故在张波等(1994)与陈高傭(1939)生成其第二手资料时,最可能的度量误差就是遗漏。拥有两个数据集可交叉检验数据质量,还可生成更完整的数据集。这两个数据集有很多重合记录,来自两个数据集的变量drought与flood的相关系数均达到0.68。将这两个数据来源整合在一起,得到本文所使用的变量drought与flood的时间序列,即只要张波等(1994)或陈高傭(1939)记载了某年有旱灾或水灾,则记该年为旱灾或水灾之年。
有关历史气温,本文使用古气候学家提供的两组数据来生成代理变量。
Tanetal.(2003)根据北京市房山县石花洞一块2650年历史的钟乳石年轮厚度在GeophysicalResearchLetters公布了一个气温重构序列,该序列与当代观测气温的相关系数达到0.55。Zhangetal.(2008)根据甘肃南部武都县万象洞一块1810年历史的钟乳石氧同位素信号在Science公布了一个气温重构序列,与当代观测气温的相关系数高达0.8。这两组历史气温数据的地点正好位于中国北方的东西两端,故将其平均值作为中国北方过去两千年的气温序列(temp),度量对于历史气温长期均值的偏离摄氏度。万象洞位于甘肃南部,接近中国北方的陕西省。
Tanetal.(2003)的数据为公元前665年—1985年间的年度数据,衡量对历史气温长期均值的偏离摄氏度。Zhangetal.(2008)的数据跨度为公元190—2003年,每隔2—3年有一个数据。首先对Zhangetal.(2008)的数据进行线性插值,以得到年度数据,然后再作线性变换使其变动幅度(即最大值与最小值)与Tanetal.(2003)的数据相同。将这两组数据进行算术平均,即得到中国北方的历史气温序列(temp)。以上气候数据均为年度或每隔十年。对于样本中的每对王朝,首先确定中原王朝与游牧政权共存的交叠期,然后计算此交叠期的平均气候。对于历史气温,还计算此交叠期的最低气温(temp_min),作为另一解释变量。
(三)其他数据
国家规模显然对古代战争结果有重大影响。但对于中原王朝与游牧政权的国土面积,缺乏很好的数据;而游牧民族的人口也不好估计。为此,使用虚拟变量“中国是否统一”(unified)作为其代理变量。中国统一的简单定义为中原王朝控制了中国本土(Chinaproper),即黄河流域与长江流域。
影响中原王朝与游牧政权战争结果的另一因素是,早在秦朝,为了防御游牧民族入侵就修建了长城。但有时中国边界位于长城以南,得不到长城的有效保护。因此,本文根据谭其骧(1982),引入虚拟变量“中国是否在长城的有效保护之下”(wall)。
四、王朝配对法
在最近的研究中,气候的外生变化被作为工具变量来估计经济冲击对于第1期陈强:气候冲击、王朝周期与游牧民族的征服内战的因果效应(Migueletal.,2004;Ciccone,2011;MiguelandSatyanath,2011)。受限于数据以及不清楚气候冲击影响游牧战争的中间渠道,故本文使用简化式模型。以虚拟变量conquered作为被解释变量,考虑以下Logit模型:
Prob(conqueredi=1|diffi,climatei,walli,unifiedi)=Λ(β0+β1diffi+β2climatei+β3walli+β4unifiedi),(1)其中,climate=(droughtfloodleveesnowfrosttemp_min)为气候向量,Λ(·)为逻辑分布的累积分布函数,而下标i为第i个王朝配对。由于变量temp总是不显著而temp_min为显著,故以temp_min替代气候向量中的temp。另外,由于变量wall与unified均不显著,也从方程(1)中去掉。如使用Probit模型结果也类似,为节省空间未汇报。
由于样本容量只有47且采用了Logit回归,故如将所有可用变量都作为解释变量,会导致估计困难(如进行OLS估计,则无此困难;为节省空间未汇报)。由于变量temp、wall、unified在作者尝试的各种模型设定中均很不显著,故去掉这些变量。由于这些去掉的变量均很不显著,相当于删除无关变量,只会损失很少信息。
第(1)列汇报了对方程(1)的估计结果。与王朝周期假说相一致,变量diff在5%水平上显著为正,说明中原王朝越早建立于游牧政权,则越可能被后者征服。变量drought在1%水平上显著为正,表明降雨稀少会迫使游牧民族为了生存而进攻农耕汉族,使得征服的概率上升。另一方面,虽然变量flood与levee的系数均为预期的负号,但并不显著,可能由于二者的多重共线性所致(二者的相关系数高达0.8)。变量snow在10%的水平上显著为正,意味着多雪天气也可能促使游牧民族进攻汉族。变量frost在1%水平上显著为负,意味着频繁的霜冻低温灾害反而降低了游牧征服的概率。变量temp_min显著为正,即当最低温下降时,游牧征服的可能性也下降。一个可能的解释是,极度严寒会伤害游牧民族的牲畜(特别是马匹),从而减弱其进攻的能力。例如,在北宋时期的辽国,许多牛马在1082年因大风雪而死去,而1083年大雪再次杀死了60%—70%的马匹(张波等1994)。
根据由大到小的建模策略,依次去掉最不显著的变量,直至所有变量均至少在10%水平上显著,结果汇报于表2第(2)列,与第(1)列的结果类似。主要区别在于,降雨充沛的代理变量flood被去掉,而变量levee变得显著为负;这意味着,降雨较多会降低游牧民族征服的概率,或通过降低游牧民族进攻的频率,或由于在雨季难以开展军事活动。变量snow变为在1%水平上显著为正。由于短命王朝过早地退出历史舞台,可能未经历完整的王朝生命周期,故或许不宜将其放在样本中。为此,去掉所有寿命小于50年的中原王朝,样本容量变为34,重新进行Logit回归。第(3)列汇报了此结果,与第2列类似。
使用第(2)列的回归结果,可预测每个中原王朝被游牧政权征服的概率,参见最后一列。将预测征服概率在0.5以上视为实际征服,则该模型的成功预测率高达91.49%,成功预测了47对观测值中的43对。提供了预测征服概率与实际征服的直观对比(按时间排序)。在大多数情况下,实际征服与预测征服概率的峰值相吻合。值得注意的是,有三次征服的预测征服概率超过0.9,即西晋对前赵,后唐对辽,明对清。北宋被金征服的概率也高达0.75。但模型预测南宋被元征服的概率仅为0.12,这意味着蒙古征服中国包含许多特殊原因,并非气候冲击与王朝周期等因素所能很好解释。模型预测清朝被准格尔征服的概率高达0.73,此征服未能实现也有特殊因素,比如清朝的明君以及火炮等军事技术的进步。
五、时间序列法
上述王朝配对法有两个缺点。首先,它必然限制了样本容量。其次,所有气候变量都是两个王朝共存时期的平均值,而此共存期可能较长。在共存期间,大数定律的作用可能使得平均气候趋向其长期均值,从而影响这些变量的显著性。另外,极端气候条件也可能有显著作用,因为游牧民族可能对剧烈气候冲击反应更大。同时解决以上两个弊端的方法是使用时间序列数据,以每十年作为一个观测单位,从而将样本容量扩充到。
大多数气候变量本来就以十年为观测单位,对于年度气温可计算其每十年的平均值。对于王朝周期变量diff,如果中原王朝同时面临多个游牧政权,则根据白寿彝(1999)找出对中原王朝威胁最大的游牧政权。比如,众所周知,在金建立之前,辽是北宋的最大威胁。采用时间序列数据后,可加入一个新的解释变量,即中原王朝的绝对年龄(age),该变量随时间推移而单调递增。同时将中原王朝的相对年龄(diff)与绝对年龄(age)放入回归,可以进一步检验王朝周期效应。另一新解释变量为对中原王朝造成实际威胁的游牧政权数目(rival)。通过表1的数据即可计算rival的取值。
在使用时间序列建模时,常考虑滞后效应。对于气候变量来说,由于其影响可能需要一段时间才能体现,故应考虑其滞后效应。首先,如果仅使用当期的气候变量进行Logit回归(为节省空间未汇报),则当期气候变量均很不显著。为此,在下面的模型设定中,去掉了所有气候变量的当期项。其次,AIC与BIC信息准则均显示应选择一阶滞后(即滞后十年)。汇报了时间序列法的Logit估计结果。第(1)列包括所有解释变量,其中“L.”表示一阶滞后。变量diff在5%水平上显著为正。变量L.drought在1%水平上显著为正,而其他气候变量均不显著。
依次去掉不显著变量后,第(2)列新增了一个显著变量,即王朝绝对年龄age在1%水平上显著为负。这意味着,给定王朝相对年龄(diff)与气候变量,中原王朝存在的时间越长,则越能抵抗游牧民族的进攻。一个可能的解释是王朝异质性,即长命王朝可能本身组织得更好,其优势可追溯至王朝建立的初始条件,比如制度安排、创始皇帝个性等。变量wall在10%水平上显著为负,表明长城可能有保护作用。根据第(2)列计算的实际征服与预测征服概率的时间序列图,二者的峰值大多相对应。
第(3)列去掉了元朝与清朝的观测值,因为这两个朝代均为游牧民族入主中原,可能更能抵挡尚在草原上的其他游牧民族(BaiandKung,2011)。第(3)列的结果与第(2)列类似。
联系方式
随机阅读
热门排行