迁移(migration)研究的方法论史,本质上是一部不断扩展可观测性的历史。每一次方法论进步都回应了一种具体的"看不见"——人口空间流动中某个无法被现有工具捕捉的维度——并发展出新的技术将其纳入分析视野。
现代迁移研究始于Ravenstein(1885, 1889)对英国普查数据的分析。他从出生地与现住地的交叉表中归纳出一组经验规律("迁移法则"):大多数迁移为短距离迁移,迁移量与距离成反比、与人口规模成正比,经济动机占主导。这些观察不是理论,而是普查数据所允许的最大限度的经验概括:Ravenstein能观测到迁移的净结果(人们现在住在哪里),但无法观测过程(何时迁移、迁移几次、经由何种路径)。
Zelinsky(1971)提出流动性转变假说(mobility transition hypothesis),将迁移模式与人口转变(demographic transition)阶段相联系:前转变社会以有限的本地流动为主;工业化阶段乡-城迁移(rural-to-urban migration)急剧增加;后工业社会则以城际迁移和循环流动为主。该假说提供了一个理解迁移体制(migration regime)如何随发展阶段演变的宏观历史框架。
迁移的基础测量工具——粗迁移率(crude migration rate)、年龄别迁移率(age-specific migration rate)、净迁移率(net migration rate)——在形式上与死亡率和生育率的度量平行。但关键区别在于:绝大多数迁移事件从未被作为事件直接记录过。 只有拥有连续人口登记系统(population register)的国家(北欧、荷兰、日本等少数国家)能直接观测个体地址变更并计算基于事件的迁移率。
多数国家依赖普查中的回顾性住址问题("一年前/五年前你住在哪里?"),获取的是转移数据(transition data)——两个时点之间常住地是否变更——而非事件数据(event data)。五年间搬了三次的人和搬了一次的人被同等计数为一个迁移者。
这一测量框架产生了一个迁移研究独有的根本性问题:迁移的测量量是测量工具本身的产物。 Bell等(2002)在JRSS-A发表的跨国系统比较研究表明,各国国内迁移率的表观差异在很大程度上由三个定义参数决定:
- 空间尺度(spatial scale):界定迁移所用行政区划的数量与面积。行政单元越小越多,机械记录的"迁移"越多。
- 时间间隔(temporal interval):回顾一年还是五年。
- 转移测量与事件测量(transition vs. event measurement):仅捕捉最后一次迁移,还是捕捉期间所有迁移。
这些差异不是迁移行为的差异,而是不兼容定义所制造的测量人工制品(measurement artifact)。这一可比性困境至今未解决。
国内迁移(internal migration)与国际迁移(international migration)面临部分重叠但性质不同的测量挑战。国内迁移的核心问题是行政区划尺度与登记系统缺失;国际迁移则面临更深层的不对称性——多数国家通过签证和边境管控系统记录入境,但不系统性地记录出境,使得总迁出率(gross emigration rate)无法从行政数据中直接计算。
尽管测量局限严重,跨人口的数据积累仍揭示了一个稳健的经验发现:迁移率的年龄模式在不同文化和时期中表现出高度稳定的特征形态。 Rogers和Castro(1981)识别了这一模式并用多指数模型(multi-exponential model)进行参数化:婴幼儿随迁高峰、青少年低谷、青年劳动力峰值(20–30岁)、中年下降、退休小峰、高龄制度性迁移。
Rogers-Castro模型的意义在于发现了迁移在定义模糊和测量异质的条件下仍然拥有跨文化稳定的年龄规律性。Tobler(1995)将这一规律性列为迁移的"定律"之一。
原始参数估计方法(非线性最小二乘)在数据稀疏时数值不稳定。Yeung, Alexander和Riffe(2023)在Demographic Research上发表了Rogers-Castro模型的贝叶斯实现(Bayesian implementation),使用MCMC估计和信息先验,解决了小样本稳定性问题,并输出参数的后验分布(posterior distribution),使参数不确定性可以传导到人口预测中。
当迁移无法直接测量时,形式人口学依赖间接估计方法(indirect estimation),将迁移作为其他已知量的残差推断。
人口学记账方程(demographic balancing equation)提供了基本逻辑:$M = P_2 - P_1 - B + D$。如果人口数、出生数和死亡数已知,净迁移可作为残差求得。该方法概念简单但实践脆弱——它累积了所有输入量的测量误差(United Nations, 1970)。
普查存活比法(census survival ratio method)通过对上一次普查人口施加年龄别存活概率来推算无迁移条件下的预期人口,差值即为分年龄净迁移估计。该方法在生命登记不完善的国家被广泛应用(United Nations, 2002)。
两种方法的共同局限是:只能估计净迁移(net migration),无法区分总流入和总流出(gross flows)。
前述方法回答了"有多少人在动"和"谁在动"(按年龄),但未回答"从哪里到哪里"——迁移流量的空间结构。
引力模型(gravity model)由Stewart(1941)和Zipf(1946)形式化:$M_{ij} = k \cdot P_i^{\alpha} \cdot P_j^{\beta} / d_{ij}^{\gamma}$。Wilson(1967)的熵最大化(entropy maximization)框架为引力模型提供了信息论基础,将其从物理类比转化为有原理依据的统计模型。Flowerdew和Aitkin(1982)引入了泊松回归(Poisson regression)框架用于起止矩阵(origin-destination matrix)估计,至今仍是标准方法。
引力模型适用于国内和国际迁移,但国际迁移需要纳入更多预测变量(语言亲缘、殖民纽带、签证制度、侨民网络等)。Massey等(1993)在Population and Development Review上的综合综述系统梳理了解释国际迁移的主要理论框架:新古典经济学(neoclassical economics)、新劳动迁移经济学(NELM)、双重劳动力市场理论(dual labor market theory)、世界体系理论(world systems theory)和网络理论(network theory)。De Haas(2021)近年提出意愿-能力框架(aspirations-capabilities framework),试图将这些视角整合为一个元理论结构。这些理论构成空间建模的理论背景,但多数位于形式人口学分析的边界之外。
Rogers(1966, 1968, 1975)将迁移嵌入人口再生产的数学框架,将经典的Leslie矩阵模型扩展为多区域框架(multiregional framework):多个区域通过年龄别迁移流量相连,各区域保持独立的生育和死亡时间表。
多区域模型确立了一个关键认识:迁移不是人口动态的外部扰动,而是人口再生产和空间再分配的内在组成部分。 这一框架成为全球范围内次国家人口预测(subnational population projection)的标准方法论基础(Wilson & Rees, 2005)。
国际迁移研究长期面临双边流量数据(bilateral flow data)的缺失。现有数据多为存量数据(stock data)——某一时点A国出生者在B国居住的人数。Abel和Sander(2014)在Science上发表的方法,利用人口学记账恒等式从连续存量数据的变化中间接估计双边流量,首次实现了全球196个国家双边迁移流量的系统性分析。Azose和Raftery(2019)在PNAS上用贝叶斯方法进一步扩展,利用迁移空间分布模式的时间稳定性产生概率性流量估计。
迁移是人口变动三要素中最后获得概率性处理的。迁移对政治事件、经济冲击和环境灾害的响应在速度和幅度上远超生育和死亡的长期趋势,使其预测本质上更为困难。联合国《世界人口展望》2024年修订版首次采用贝叶斯概率模型预测净迁移(基于Azose & Raftery, 2015; Azose, Ševčíková & Raftery, 2016),将各国历史迁移波动幅度纳入预测不确定性区间(United Nations, 2024)。
前述方法论演进始终受制于一个根本约束:无法大规模直接观测人口的空间流动。 从Ravenstein的出生地交叉表到Abel的双边流量估计,所有方法都在使用间接指标、残差或回顾性自报。数字革命正在第一次使迁移的直接、连续、大规模观测成为可能。
数字技术对迁移研究最根本的影响不是某种具体算法,而是可用数据性质的质变。手机信令数据(CDR)、移动应用定位信号和地理标签社交媒体帖文提供了数十亿个体的时间戳地理位置信息——作为日常技术使用的副产品被动且连续地生成。
这与塑造了全部此前方法论的数据体制根本不同。普查数据是周期性的(十年一次)、回顾性的(询问过去住址)、间接的(从住址比较中推断迁移)。数字定位数据是连续的(手机每次连接基站时生成)、同步的(记录观测当刻的位置)、直接的(观测到人实际所在之处)。
Blumenstock(2012)用卢旺达CDR数据证明了从手机数据推断国内迁移模式的可行性。Deville等(2014)在PNAS上进一步将其扩展为动态人口制图(dynamic population mapping),用基站活动密度与普查人口的经验关系生成高分辨率人口分布图,实现了从十年一次的静态快照到近实时更新的跨越。
在国际迁移领域,Zagheni, Weber和Gummadi(2017)在Population and Development Review上展示了利用Facebook广告平台估计国际移民存量的方法,其估计值与美国社区调查数据的相关性达到$r = 0.94$。Alexander, Polimis和Zagheni(2022)进一步将社交媒体与调查数据在贝叶斯框架中融合,产生整合了数字数据时效性与官方调查统计严谨性的"即时预测"(nowcast)。
在强迫迁移(forced displacement)情境中,传统数据采集完全失效,基于卷积神经网络(CNN)的卫星影像分析已成为估计难民营人口的主要工具——在没有任何其他数据源的条件下实现人口规模估计。
数字数据最深刻的方法论贡献,或许在于它重新打开了**"什么算迁移"这一作为可测量变量的基本问题**。
如1.2节所述,迁移的定义历来被硬编码在数据采集工具中——普查问了什么,迁移就是什么。研究者无法追溯性地改变定义参数并观察迁移估计如何响应。
Fiorio等(2021)在Demography上发表的研究,利用地理标签数字痕迹数据(georeferenced digital trace data)的高时间精度,在连续变化的定义参数下构建迁移估计。他们发展了一个包含三个时间组分的通用框架——起点(start,捕捉季节/时期效应)、缓冲期(buffer,捕捉居住标准效应)和间隔(interval,捕捉累积时间效应)——系统性地改变每个参数,生成迁移估计的连续谱。
由此产生的"迁移函数"揭示了迁移估计对定义选择的敏感性。如果函数平滑,则估计对定义变化是稳健的(robust);如果在特定阈值处出现急剧跳跃,则说明大量短期流动在该点被纳入或排除,估计不稳定。
这一贡献将测量可比性问题从挫败之源转化为可经验研究的对象:各国定义差异所导致的表观迁移率差异,究竟反映了真实行为差异还是定义人工制品,如今可以被系统性地检验。
数字数据的优势——规模、频率、直接性——伴随着结构性局限。手机渗透率虽高但非普遍覆盖:最贫困、最年长和最偏远的人群在CDR数据中被系统性低估。社交媒体平台的人口覆盖不均——Facebook用户偏向年轻和城市人口。卫星影像能计数建筑物但无法确定入住率和人口构成。
这些偏差不是随机的,而是与迁移研究最需要观测的人群系统性相关——难民、无证移民、非正规住区中的国内迁移者。将数字数据与传统来源在有原则的统计框架中整合,是当前方法论发展的活跃领域(Alexander et al., 2022)。
中国国内迁移涉及约3.76亿人(2020年七普数据;国家统计局, 2021),为本文讨论的定义与测量挑战提供了一个典型案例。
中国"流动人口"(floating population)的界定不基于人口学意义上的空间流动,而是基于常住地与户籍登记地的分离。这一制度性定义造成系统性测量扭曲(段成荣等, 2019; 乔晓春, 2023):高估流动性(在深圳居住二十年但保留四川户籍者仍为"流动人口");系统性遗漏城-城迁移;标准迁移率无法可靠计算(分母——风险人口——定义不清);国际不可比(3.76亿这一数字与基于常住地定义的他国统计无法对照)。
中国实际运行两套平行的人口统计系统:户籍人口(用于行政资源分配)和常住人口(用于普查与人口分析)。二者在地方层面的差异即为流动人口——但这意味着流动人口不是传统意义上的人口学变量,而是两个制度性计数系统之间的行政性产物(administrative artifact)。当深圳的常住人口为1700万而户籍人口为500万时,次国家人口预测选择哪个数字作为基准,将决定下游所有分析结果。
百度迁徙、腾讯位置大数据和三大运营商覆盖超17亿用户的手机信令数据,可以不依赖户籍系统地揭示实际人口分布与流动模式,包括普查无法捕捉的春运等临时性大规模流动(约30亿人次/年)。但数字数据仅解决了户籍问题的观测维度;制度维度——教育、医疗、社保等公共服务仍与户籍身份绑定——无论我们多么精确地观测实际居住地,都无法改变。人口学现实与行政现实之间的断裂不是更好的数据能解决的测量问题,而是只有制度改革才能弥合的治理问题。
迁移方法论的历史揭示了一条围绕直接观测人口空间流动之困难而组织的演进轨迹。从Ravenstein的出生地交叉表到Abel的双边流量估计,每一次方法论进步都扩展了可观测的范围。数字技术不是对既有方法的精度改善,而是实现了一种质性的新型观测模式——连续、被动、直接、大规模。与此同时,它也重新打开了此前数据基础设施所封闭的根本问题——首先是"迁移"作为人口学量究竟意味着什么。
Abel, G. J., & Sander, N. (2014). Quantifying global international migration flows. Science, 343(6178), 1520–1522.
Alexander, M., Polimis, K., & Zagheni, E. (2022). Combining social media and survey data to nowcast migrant stocks in the United States. Population Research and Policy Review, 41(1), 1–28.
Azose, J. J., & Raftery, A. E. (2015). Bayesian probabilistic projection of international migration. Demography, 52(5), 1627–1650.
Azose, J. J., & Raftery, A. E. (2019). Estimation of emigration, return migration, and transit migration between all pairs of countries. PNAS, 116(1), 116–122.
Azose, J. J., Ševčíková, H., & Raftery, A. E. (2016). Probabilistic population projections with migration uncertainty. PNAS, 113(23), 6460–6465.
Bell, M., Blake, M., Boyle, P., Duke-Williams, O., Rees, P., Stillwell, J., & Hugo, G. (2002). Cross-national comparison of internal migration. JRSS-A, 165(3), 435–464.
Blumenstock, J. E. (2012). Inferring patterns of internal migration from mobile phone call records. Information Technology for Development, 18(2), 107–125.
De Haas, H. (2021). A theory of migration: The aspirations-capabilities framework. Comparative Migration Studies, 9, Article 8.
Deville, P., et al. (2014). Dynamic population mapping using mobile phone data. PNAS, 111(45), 15888–15893.
段成荣, 吕利丹, 王宗萍, 谢东虹. (2019). 从乡土中国到迁徙中国. 人口研究, 43(2), 19–30.
Fiorio, L., Zagheni, E., Abel, G., Hill, J., Pestre, G., Letouzé, E., & Cai, J. (2021). Analyzing the effect of time in migration measurement using georeferenced digital trace data. Demography, 58(1), 51–74.
Flowerdew, R., & Aitkin, M. (1982). A method of fitting the gravity model based on the Poisson distribution. Journal of Regional Science, 22(2), 191–202.
Massey, D. S., et al. (1993). Theories of international migration: A review and appraisal. Population and Development Review, 19(3), 431–466.
国家统计局. (2021). 第七次全国人口普查主要数据. 中国统计出版社.
乔晓春. (2023). 中国流动人口概念与数据的有效性及国际可比性. Journal of Geographical Sciences, 33(7), 1423–1440.
Ravenstein, E. G. (1885). The laws of migration. Journal of the Statistical Society of London, 48(2), 167–235.
Ravenstein, E. G. (1889). The laws of migration: Second paper. Journal of the Royal Statistical Society, 52(2), 241–305.
Rogers, A. (1975). Introduction to multiregional mathematical demography. John Wiley & Sons.
Rogers, A., & Castro, L. J. (1981). Model migration schedules (RR-81-30). IIASA.
Stewart, J. Q. (1941). An inverse distance variation for certain social influences. Science, 93, 89–90.
Tobler, W. (1995). Migration: Ravenstein, Thornthwaite, and beyond. Urban Geography, 16(4), 327–343.
United Nations. (1970). Methods of measuring internal migration (Manual VI). UN.
United Nations. (2024). World Population Prospects 2024: Methodology report. Population Division.
Wilson, A. G. (1967). A statistical theory of spatial distribution models. Transportation Research, 1(3), 253–269.
Wilson, T., & Rees, P. (2005). Recent developments in population projection methodology. Population, Space and Place, 11(5), 337–360.
Yeung, J., Alexander, M., & Riffe, T. (2023). Bayesian implementation of Rogers–Castro model migration schedules. Demographic Research, 49(42), 1201–1228.
Zagheni, E., Weber, I., & Gummadi, K. (2017). Leveraging Facebook's advertising platform to monitor stocks of migrants. Population and Development Review, 43(4), 721–734.
Zelinsky, W. (1971). The hypothesis of the mobility transition. Geographical Review, 61(2), 219–249.
Zipf, G. K. (1946). The