北京师范大学地理学部陈子悦团队提出基于空间截面数据的通用地学归因模型

发布日期:2023-10-09   |  浏览次数:

掌握事物的因果关系是人类改造世界实现可持续发展的前提也是人类世代好奇探索的主题在大尺度地球科学系统研究中,由于控制实验难以开展,基于观测的时空数据表象推断内在因果关系(即因果推断)成为主要方式目前主流的因果推断方法包括结构因果模型潜在结果框架格兰杰因果检验,这些方法主要针对随机系统假设变量随机分布且变量间信息可分离。然而在地球系统中,许多变量具有确定性趋势且相互交织耦合,给因果推断带来了困难。为解决地球科学动态系统的归因问题,国际学者基于复杂动态科学的Takens理论,研发了基于时间序列的因果推断方法——收敛交叉映射方法Convergent Cross-mapping CCM,于2012年发表于Science期刊Detecting Causality in Complex Ecosystems),并得到了广泛的应用。CCM方法运行需要至少15期以上的时间序列数据,在许多地球科学研究中,要么时间序列数据缺乏,要么在观测期内地学现象并未呈现显著的变化使得CCM方法应用受到很大局限。相比时间序列数据,地球系统的各类空间截面数据更加丰富如何丰富的空间截面数据中推断因果关系更为重要。

面对需求中国农业大学高秉博副教授与北京师范大学陈子悦副教授组织联合团队开展空间归因方法研究研发了能够基于空间截面数据识别因果关系并估计因果效应的地理交叉收敛映射方法(Geographical Convergent Cross Mapping,GCCM)。并于2023年9月21日在Nature Communications期刊发表题为《基于地理交叉收敛映射方法地球系统空间截面数据中推断因果关系Causal inference from cross-sectional earth system data with geographical convergent cross mapping》的论文。中国农业大学高秉博副教授为第一作者,中国农业大学杨建宇教授为共同第一作者, 北京师范大学陈子悦副教授和中国科学院地理科学与资源研究所王劲峰研究员为共通讯作者美国加利福尼亚大学George Sugihara教授(著名的CCM模型( Sugihara et al. 2012. Science)的主要贡献者),南京大学李满春教授、香港中文大学关美宝教授、和荷兰国际航天测量与地球学学院(ITCAlfred Stein教授共同作者。

研究创新性提出基于空间滞后重建状态空间(图1),证明了重建方法的正确性,建立了基于状态空间交叉映射预测的空间因果推断方法结果的显著性检验方法(图2。GCCM方法主要用于复杂非线性系统的因果推断,能够在耦合关系中识别因果方向并估计因果效应,在强耦合关系中识别主导因果方向并估计因果效应,有效破解了空间统计方法难以识别因果方向的镜面效应难题研究分别采用土壤重金属含量与工业和居民生活污染源(栅格数据)(图3、中国县级人口密度与自然地理条件(多边形矢量数据)两个案例(图4),证明了方法弱耦合关系和强耦合关系不同空间数据类型中的因果推断能力;并采用中国耕地植被净初级生产力与气温和降水数据(图5),证明在时间序列因果推断方法失效时,基于空间差异的GCCM方法能够正确推断出因果关系。而基于统计学的相关性分析和先进的结构因果模型LiNGAMLinear Non-Gaussian Acyclic Model)不能有效识别案例中的因果关系及因果方向。

GCCM的理论设定适合众多具有确定性趋势和多个相互交织耦合变量的地球系统,且GCCM没有先验分布假设和预设模型结构,简单易用,为地学归因分析提供了一个值得尝试新选择。





(a)栅格数据 (b)矢量多边形数据

图1.空间滞后



(a)可靠预测



(b)不可靠预测

图2. 状态空间交叉映射预测



(a)Cu (b)工业污染 c)夜间灯光



d)Cu-状态空间 e)工业污染-状态空间 f)夜间灯光-状态空间


 


g)工业污染与Cu因果关系   h夜间灯光与Cu因果关系

图3. 土壤重金属污染因果推断案例(弱耦合、栅格数据)



(a)人口密度与降水因果关系     (b)人口密度与气温因果关系


 


(c)人口密度与海拔因果关系      (d)人口密度与坡度因果关系

图4. 县级人口密度案例(强耦合、多边形数据)


 

(a)农田NPP与降水因果关系 (b)农田NPP与气温因果关系

图5. 农田NPP因果关系案例

论文研究进一步指出,可以将GCCM与CCM结合,充分利用地学时空大数据同时从时间变化和空间差异角度出发进行因果推断,并可以将复杂动态系统方法与因果图结合,利用复杂动态系统方法识别因果方向的优势生成可信的因果关系网络,消减马尔科夫等价因果图数量,提升结构因果模型识别因果关系的稳健性。

论文链接:

https://www.nature.com/articles/s41467-023-41619-6

引用格式:

Gao, B., Yang, J., Chen, Z. et al. Causal inference from cross-sectional earth system data with geographical convergent cross mapping. Nat Commun 14, 5875 (2023).