快速檢索        
  農業資源與環境學報  2021, Vol. 38 Issue (6): 967-979  DOI: 10.13254/j.jare.2021.0504
0

引用本文  

任向寧, 王璐, 林賦英, 等. 基于分層多元復合模型的廣東省農田土壤有機碳高精度制圖[J]. 農業資源與環境學報, 2021, 38(6): 967-979.
REN Xiangning, WANG Lu, LIN Fuying, et al. High precision mapping of soil organic carbon based on multivariate composite model in Guangdong Province[J]. Journal of Agricultural Resources and Environment, 2021, 38(6): 967-979.

基金項目

國家重點研發計劃課題(2020YFD1100205);國家自然科學基金項目(U1901601)

Project supported

The National Key R & D Program of China(2020YFD1100205); The National Natural Science Foundation of China(U1901601)

通信作者

王璐??E-mail: selinapple@163.com

作者簡介

任向寧(1978-), 男, 河北正定人, 講師, 研究方向為土地資源開發利用與保護。E-mail: xnren@scau.edu.cn

文章歷史

收稿日期: 2021-08-10
錄用日期: 2021-10-26
基于分層多元復合模型的廣東省農田土壤有機碳高精度制圖
任向寧1,2 , 王璐1,3,4 , 林賦英1 , 陳淑瑩1 , 胡月明1,2,3,4,5     
1. 華南農業大學資源環境學院, 廣州 510642;
2. 廣東省土地利用與整治重點實驗室, 廣州 510642;
3. 廣東省土地信息工程技術研究中心, 廣州 510642;
4. 自然資源部建設用地再開發重點實驗室, 廣州 510642;
5. 青海-廣東自然資源監測與評價重點實驗室, 西寧 810016
摘要: 農田有機碳庫是唯一可在較短時間尺度上通過合理利用而進行適度調節的碳庫,農田土壤有機碳高精度制圖對進一步明析地理環境背景,提升區域土壤固碳潛力,促進碳交易、碳中和等具有重要的意義。本研究以廣東省為研究區,在中大空間尺度區域綜合特征分區的基礎上,基于地理探測器確定農田土壤有機碳空間分異的變量結構,分區構建分層多元復合模型,根據208 503個土壤采樣點數據編制研究區高精度農田土壤有機碳密度空間分布圖。結果表明:耦合自然地理特征和社會經濟特征,引入多距離空間聚類進行中大空間尺度綜合特征分區,能夠顯著收斂樣本離散程度,土壤有機碳樣本標準偏差均值、方差均值較未分區前分別下降0.55、3.53,Moran's I指數上升0.08。受自然環境與人為擾動雙重影響,農田土壤有機碳空間變異的變量眾多,且不同綜合特征分區內變量結構差異較大,年均降水量、海拔高度、地形坡度等變量在不同特征分區的影響力存在顯著差異,土地利用方式及土壤理化性質等變量對不同特征分區均存在較大的影響力?;诘乩硖綔y器構建的分層多元復合模型,較好地解決了中大尺度和復雜情景下土壤有機碳空間分異規律與空間突變的同步表達矛盾,抑制了多變量插值噪聲增加,其綜合精度較地理加權回歸模型(GWRK)、徑向基函數神經網絡(RBFNN)和普通克里格(OK)分別提升6.45%、10.45%和7.50%。在大密度樣本集支持下,綜合區域綜合特征分區、地理探測器、分層多元復合模型等技術手段編制的廣東省高精度農田土壤有機碳空間分布圖,預測結果準確,空間細節表達清晰,為編制大空間尺度的土壤有機碳分布圖探索了有效路徑。
關鍵詞: 農田    土壤有機碳    地理探測器    分層多元復合模型    高精度制圖    廣東省    
High precision mapping of soil organic carbon based on multivariate composite model in Guangdong Province
REN Xiangning1,2 , WANG Lu1,3,4 , LIN Fuying1 , CHEN Shuying1 , HU Yueming1,2,3,4,5     
1. College of Natural Resources and Environment, South China Agricultural University, Guangzhou 510642, China;
2. Guangdong Provincial Key Laboratory of Land Use and Consolidation, Guangzhou 510642, China;
3. Guangdong Province Engineering Research Center for Land Information Technology, Guangzhou 510642, China;
4. Key Laboratory of the Ministry of Natural Resources for Construction Land Transformation, Guangzhou 510642, China;
5. Qinghai-Guangdong Joint Key Laboratory of Natural Resource Monitoring and Evaluation, Xining 810016, China
Abstract: The soil organic carbon pool of farmland is the only carbon pool that can be appropriately adjusted by rational utilization in a short time scale. High precision mapping of soil organic carbon is helpful to further enhance the potential of regional soil carbon sequestration, analyze the geographical environment background, and promote carbon trading and carbon neutralization. This study, The study took Guangdong Province as the study area, which was divided into 13 comprehensive characteristic zones on medium and large spatial scale. The variable structure of soil organic carbon spatial differentiation in farmland was determined by Geodetector, and hierarchical multivariate composite models(MCM) was constructed. According to the data of 208 503 soil sampling points, we chart a highprecision spatial distribution map of soil organic carbon density in the study area. The results show that comprehensive feature zoning on a medium and large spatial scale, which was carried out by coupling natural geographical characteristics with socio-economic characteristics, and introducing multidistance spatial clustering, can significantly converge the degree of sample dispersion.The mean standard deviation and mean variance of soil organic carbon samples decrease by 0.55 and 3.53 respectively, and Moran's I index increase by 0.08. Under the dual influence of natural environment and human disturbance, there are many variables of spatial variation of soil organic carbon in farmland, and the variable structure in different comprehensive characteristic zones is quite different. Average annual precipitation, altitude, terrain slope and other variables play a significant role in mountainous and hilly areas, but not in plain and hilly areas. However, variables such as land use modes and soil physical and chemical properties have extensive and significant influence on different characteristic zoning. The hierarchical multivariate composite model based on Geodetector better solves the contradiction between the synchronous expression of spatial differentiation law and spatial mutation of soil organic carbon in medium and large-scale and complex scenarios, and suppresses the increase of multivariable interpolation noise. Its comprehensive accuracy is 6.45%, 10.45% and 7.50% higher than geographically weighted regression model-Kriging(GWRK), radial basis function neural network(RBFNN), ordinary Kriging (OK)respectively. With the support of high-density sample set, the high precision soil organic carbon map of Guangdong Province integrates the methods of regional comprehensive feature zoning, Geodetector and hierarchical multivariate composite models. Its prediction results are accurate and the spatial details are clearly expressed, which explores an effective path for compiling the large-scale spatial soil organic carbon distribution map.
Keywords: farmland    soil organic carbon    Geodetector    hierarchical multivariate composite model    high precision mapping    Guangdong Province    

高精度土壤有機碳(Soil organic carbon,SOC)制圖是準確測度土壤固碳能力和土壤碳儲量的基礎,對研究SOC時空變異規律具有重要意義。目前,受樣本數量與制圖方法制約,高精度SOC制圖研究主要集中在空間小尺度上。而對區域碳管理、碳交易等宏觀需求更迫切的國家級、省級中大尺度SOC制圖精度總體不高[1]。為此,中大尺度高精度SOC制圖方法的研究顯得至關重要。

農田土壤作為自然土壤的衍生物,其發生發育過程必然符合地理第一定律。同時在長期農耕過程下,農田土壤發生發育過程中受到更為頻繁的人工干預與擾動,導致其強空間變異度[2]。因此,農田SOC高精度制圖難度遠遠大于自然土壤。當前,國內外對于土壤有機碳制圖的方法主要分為4類:第一類為基于土壤屬性的土壤類型連接法[3];第二類方法為地統計學法[4];第三類為多元線性回歸方法、空間地理回歸等相關關系統計法[5];第四類方法為人工神經網絡模型、分類回歸樹、隨機森林、支持向量機等機器學習算法模型[6]。其中土壤類型連接法適用于空間尺度較大且土壤類型比較單一的區域[7],但對土壤類型的多樣性反映不足[8]。地統計學法與相關關系統計法則較為依賴空間關聯性[9-10],在情景復雜、局部變異較強的地區,其空間特征表達能力和預測精度較差[9-13]。機器學習算法模型的預測精度對空間尺度和采樣密度的依賴性較強,大尺度復雜情景下測算誤差較大[14]。因此,有關學者針對大尺度復雜農田土壤環境,作出了非插值算法的探索,如構建基于因子自組織映射聚類的土壤有機質與相關因子之間的非線性關系[15],通過Cubist模型引入了相對坡位、高程等變量的貢獻率等,以此避免輔助因素增加后插值測算模型復雜化和結果偏離度的增加,降低插值噪聲強度等[16]?;诜遣逯邓惴ǖ乃悸?,通過測定區域SOC空間變異的變量結構,協同不同變量分層進行克里格插值,依據變量貢獻力大小通過構建分層多元復合模型[17]編制SOC空間分布圖。該方法突破了一般插值預測方法對協同變量的數量限制,能夠充分體現大尺度環境中多維復雜變量的影響,提升了擬合精度。同時,通過引入變量貢獻力與分層協同克里格插值,降低了復雜變量相互干擾導致的插值噪聲,具有更好的制圖精度和空間表達效果。

本研究以廣東省為研究區,協同區域綜合特征分區及大密度樣本數據集,采用地理探測器確定農田SOC的變量結構,構建分層多元復合模型(Hierarchical multivariate composite model,MCM),編制研究區農田SOC高精度分布圖,為理清復雜情景下中大尺度農田SOC空間分布,探究提升區域農田固碳潛力提供了科學基礎。

1 材料與方法 1.1 研究區域

研究區位于中國大陸南部廣東省,瀕臨中國南海,地處20°13′ ~25°31′ N、109°39′ ~117°19′ E之間,北回歸線橫穿研究區,陸地面積約1.8×105 km2。研究區地勢總體為北高南低,最高海拔1 902 m,最低為-52 m[18]。地貌類型復雜多樣,包括山地、丘陵、臺地和平原等,其中山地和丘陵占研究區總面積的50% 以上。研究區屬南亞熱帶季風氣候,常年平均氣溫21.9 ℃,日照時間1 755 h,年均降雨量1 790 mm。受地勢變化與距海遠近影響,研究區北部山區和南部臨海平原區的年平均氣溫相差4.5 ℃(19.6~24.1 ℃),日照時間相差1 108 h(1 316~2 424 h),降水量相差2 084 mm(1 099~3 183 mm)。研究區天然水系發育旺盛,河渠縱橫,水網稠密。2018年研究區地表水資源量1.885× 1011 m3,集雨面積在100 km2以上的干支流543條,河流總長2.86×104 km。根據第二次土壤普查結果,研究區陸地農田土壤包括水稻土、赤紅壤、潮土等16個土類,212個土種。在復雜氣候、地形、水文、植被、成土母質及人工活動耦合作用下,研究區土壤類型的空間分布具有顯著的空間地帶性和復合區域性,由北向南水平地帶分布紅壤、赤紅壤、磚紅壤的鐵鋁土土綱系列,以及平原地區、紅巖盆地和石灰巖山地3種復合區域土壤組合類型。2018年末研究區常住人口1.14億,其中珠三角核心區、沿海經濟帶(東西兩翼)和北部生態發展區分別占研究區總人口的55.53%、29.60% 和14.87%。研究區主要包括北部山地農業、中部南亞熱帶農業、西南部熱帶農業3個農業空間帶,農田面積2.259 ×105 hm2,其中水田占61.89%,水澆地占28.24%,旱地占9.87%。

研究區具有顯著的南北氣候差異,復雜的地貌、水文、土壤等地理環境背景及不同人口壓力下的農田利用方式及擾動頻率,是復雜情景下農田SOC高精度制圖極具代表性的研究區域。

1.2 數據來源

本研究數據來源主要包括區域地理環境數據和農田實地采樣數據,其中區域地理環境數據中土地利用/覆被數據、河流溝渠及行政區劃界線主要根據研究區2018年土地利用現狀變更調查成果分離、解析取得。DEM數據采用ASTER GDEM數據(國家基礎數據中心),用于研究區海拔高度、地形坡度、坡向等信息提取,空間分辨率30 m。農田樣點土壤有機質含量(Soil organic matter, SOM)、土壤類型、表土質地、土壤容重、礫石含量、土壤pH等土壤理化屬性及當地降水量等數據則采集于2010—2018年廣東省耕地地力評價調查與耕地質量年度更新調查數據集,共采集208 768個樣點數據。樣點布設密度按照大田每6.67×105 m2(1 000畝)、蔬菜地每3.33×105 m2(500畝)~6.67×105 m2(1 000畝)布設一個,并根據地貌類型、土壤類型、利用方式及質量等級等條件適當增加樣點密度,采樣深度約20 cm。

經分析,剔除離群無效樣點265個,根據篩選出的樣點構建研究區208 503個有效農田土壤有機碳高精度制圖樣本集(表 1圖 1)。從樣本集中隨機抽取70% 的樣本(145 952個,不含最高值和最低值)作為空間插值集,剩余的30%(62 551個,空間不連續)作為驗證集,驗證制圖精度。

表 1 研究區農田土壤有機質含量樣本統計表 Table 1 Statistical table of SOM samples of typical paddy fields in the study area
圖 1 研究區農田土壤有機碳樣點分布圖 Figure 1 Distribution map of field survey sample points of SOC in the study area
1.3 研究方法 1.3.1 土壤有機碳的測度

農田土壤有機碳包括土壤耕層有機碳含量(Soil organic carbon content, SOCC)和土壤耕層有機碳密度(SOCD),其中SOCC在國際上普遍采用58% 作為SOM中碳含量的轉換系數,因此本研究中采用公式(1)測算SOCC。樣本數據集中樣本采樣深度基本為20 cm,故統一選取耕層厚度為20 cm,本研究中采用公式(2)測算SOCD。

(1)
(2)

式中:SOCD20為農田耕層(20 cm)土壤有機碳密度,kg·m-2;SOCC為土壤有機碳含量,g·kg-1;BD為土壤容重,g·cm-3;H為耕層土壤厚度,本研究取20 cm;g為>2 mm石礫含量,%。

1.3.2 區域綜合特征分區方法

由于人類長期頻繁擾動與自然地理要素的耦合作用,形成了研究區農田土壤復雜的系統環境。綜合區劃通過耦合自然、經濟、社會系統要素,疊加上區域劃分方法[19],有利于收斂研究區內農田SOC空間差異,為構建穩定的研究模型奠定基礎。目前,空間分區方法主要分為定性、定量和GIS空間模型三大類。其中定性方法有特爾斐法、主導因素法等,其精度主要取決于專家知識與經驗判斷,指標及其重要性的判斷離散度較大。定量方法有空間疊置法、矩陣判斷法[20]、狀態空間法[21]、聚類分析法[22]等,其對分區影響要素的空間表達細微、準確,但分區結果的空間連續性較差。GIS空間模型法則融合了各分區要素的空間統計、分析與處理,具有優秀的空間數據處理和分析能力,逐漸成為綜合分區發展的重要方向。

本研究采用定量分析與GIS空間模型相結合的方法,通過分析比較生態、經濟、社會各子系統中主要影響因素的關系及其重要性,構建綜合區劃的多層次結構體系[23]。繼而采用變異系數法和熵值法測算綜合區劃主導因子影響權重,引入基于加權Ripley′s K函數的多距離空間聚類進行分區??臻g聚類中空間約束選擇“Contiguity_Edges_Corners”,距離算法選擇“Eucludean”,分組分析使用K均值算法。

1.3.3 地理探測器

地理探測器[24]是研究某現象空間分布不一,即空間變異性的統計學理論方法。該模型假設自變量對因變量產生了影響,在空間上的分布就會相應產生一定的相關性;主要包括分異及因子探測、交互作用探測、風險區探測和生態探測4個探測器,其中分異及因子探測器即是探測地理屬性Y的空間變異性和探測因子X1、X2……對Y空間變異的解釋力(即貢獻力),用q值度量。其分異及因子探測的表達式為:

(3)

式中:L表示因子X的分層,即自變量分類分級;NhN分別為層h和全區的單元數;σ2 hσ2分別為層h和全區Y值的方差。SSW和SST分別為層內方差之和和全區總方差。q∈[0, 1],q值越大表示自變量X對屬性Y的解釋力越強,反之則越弱。

地理探測器現已被廣泛應用于地理空間相似性與分異性研究中,如地理空間影響因素識別[25]、區域分異與空間優化[26]、生態環境與公共健康[27]等。地理探測器擅長分析類型變量,可用于測度地理環境、土壤類型、土壤理化性質及農田利用方式等類型變量對農田SOC空間變異的貢獻力,較主成分分析、多元回歸等傳統線性統計分析方法更為直觀和快捷。

1.3.4 區域土壤有機碳空間測算方法

(1)基于地理探測器的多元復合模型

區域農田土壤類型復雜、農田利用方式多樣性和多變性強[28],導致SOC空間分異的變量眾多,且各變量對SOC空間分異的貢獻力不同。為實現區域農田SOC高精度制圖的目標,以協同克里格[29]為基礎構建分層多元復合模型。選擇高程、坡度、降水量、土壤類型、農田利用方式等因子[30-32]作為協同變量,分別進行協同克里格插值。同時,采用地理探測器探測不同變量貢獻力大小,并根據影響力大小確定各綜合特征分區主導變量及其權重系數。采用加權求和法,綜合各變量協同克里格插值結果測算出SOCC[17]。其公式表達為:

(4)

式中:Z0, ck (x0)為x0處最終的SOCC估算值;Zi (x0)為x0處第i個協同變量(影響因子)克里格插值的SOCC估算值;λi為第i個協同變量的權重系數。

(2)傳統區域插值預測方法

普通克里格(Ordinary Kriging, OK)、地理加權回歸模型插值(Geographically weighted regression model? Kriging, GWRK)和徑向基函數神經網絡(Radial basis function neural network, RBFNN)是目前應用頻率最高和精度較高的3種傳統區域插值預測方法。其中,OK利用區域化變量的原始數據和變異函數的結構特點,能夠實現空間預測值的線性無偏最優估計[33]。本研究采用ArcGIS 10.4空間分析模塊直接進行OK空間插值預測制圖。GWRK是對地理加權回歸模型[34]的延伸與擴展,本研究通過將SOCC不同結構變量代入地理加權模型,以鄰近樣本的值和距離預測SOCC,重構插值集后進行空間插值預測制圖。RBFNN同樣是一種較為有效且精確的空間插值方法[35],與BP神經網絡相比,結構簡單、訓練簡潔,具有較快的學習速度和逼近能力。RBFNN不僅能處理數值型變量,也能有效處理類型變量,同時能夠避免過擬合,正逐漸被應用到土壤空間信息等研究中。本研究采用SPSS 22.0中的RBFNN模型分析,輸入SOCC及其結構變量,選擇自組織學習方法作為徑向基函數(RBF)中心的確定方法,選擇一般徑向基函數(即高斯函數模型)作為隱含層激活函數,模型輸出預測SOCC值后繪制預測結果圖。

2 結果與分析 2.1 農田土壤有機碳高精度制圖的區域綜合特征分區

面向農田SOC高精度制圖的綜合特征分區主要由主題層、目標層、指標層三級構成。其中主題層包括自然地理特征和社會經濟特征;目標層中自然地理特征主要包括氣候狀況、地形、土壤狀況和水文條件等4個因素;社會經濟特征主要包括人口聚集度、土地資源狀況、區位狀況、交通狀況、社會發展水平和經濟發展水平等6個影響因素。為避免因素間,尤其是社會經濟要素之間的多重線性干擾,對指標因素進行降維收斂處理。指標層主要確定為海拔高度、土壤類型、水網密度、人口密度和耕地占比5個主導分區因子。根據變異系數法和熵值法測算分區因子貢獻度,繼而采用算數平均法測算出最終的分區因子綜合權重,海拔高度、土壤類型、水網密度、人口密度、耕地占比的綜合權重分別為0.19、0.07、0.20、0.38、0.16(表 2)。

表 2 研究區綜合特征分區因子綜合權重(貢獻力)測算表 Table 2 Calculation table of index comprehensive weight of comprehensive characteristic zoning in the study area

以研究區內1 624個行政鄉鎮(街道)為綜合特征分區的基本單元,采用基于加權Ripley′s K函數的多距離空間聚類進行分區。通過對農田SOC高精度制圖樣本集比較,分析不同分區策略(7~15個區)的SOC樣本集統計特征,結果顯示:當研究區劃分為13個區時,樣本標準偏差均值為5.17,小于其他分區策略。樣本方差均值27.91,小于大部分分區策略,Moran′ s I指數0.29,大于其他分區策略(表 3)。綜合比較結果,確定13個分區策略為最終綜合特征分區結果,其SOC標準偏差均值、方差均值較未分區前分別下降0.55、3.53,Moran′ s I指數上升0.08。13個綜合特征分區中,各分區面積在0.27×104~3.36×104 km2之間,占研究區總面積的1.50%~18.66%(圖 2)。

表 3 不同聚類分區策略中土壤有機質含量樣本統計特征表 Table 3 Statistical characteristics of SOM samples in different clustering zoning strategies
圖 2 研究區農田綜合特征分區結果 Figure 2 The result of comprehensive characteristic zoning of farmland in the study area
2.2 基于地理探測器的農田土壤有機碳結構變量影響力探測

農田SOC空間變異受自然和人為因素的耦合影響,其結構變量(影響因子)復雜多樣,采用文獻法遴選中大空間尺度SOC空間分異影響因子。其中氣候因素中主要選取區域降雨量因子,地形條件選取海拔高度、地形坡度、坡向3個影響因子,土壤屬性選取土壤類型、表土質地、土壤pH 3個影響因子,人類活動則主要選取土地利用方式因子。地理探測器擅長分析類別變量,將以上8個變量進行分類分級(表 4)。

表 4 研究區農田土壤有機碳結構變量(影響因子)分級分類表 Table 4 Classification table of SOC structure variables(influencing factors)in the study area

以農田SOCC樣本為因變量(Y),采用地理探測器進行探測。結果顯示,8個影響因子之間的相關性在0.001~0.095之間,各因子間都呈增強型非線性弱質邊緣相關,排除共線可能性。13個綜合特征分區內8個因子的SOC影響力(q值)在0.000~0.186之間。各分區內同一因子的影響力差異較大,剔除各分區內影響力較小的干擾因子,每個分區保留5~7個具有顯示度的影響因子作為該區內農田SOC的結構變量(表 5)。

表 5 不同分區內農田土壤有機碳影響因子影響力匯總表 Table 5 Influences of soil organic carbon structure variables in different zones
2.3 基于分層多元復合模型的農田土壤有機碳高精度制圖

根據地理探測器探測結果,綜合遴選出的SOC空間變異結構變量構建不同綜合特征分區內農田SOC的多元復合模型(MCM)(表 6)。在研究區內劃分230 m×230 m柵格單元3.33×106個,根據13個分區的MCM及208 503個SOC樣本數據,繪制農田SOCD高精度空間分布圖(圖 3)。結果顯示研究區農田SOCD最小值為1.56 kg·m-2,最大值為6.19 kg·m-2,平均值為3.64 kg·m-2?;洷鼻暹h市、梅州市的山地丘陵區農田SOCD較高,均值在4.20 kg·m-2以上;南部濱海平原臺地區農田SOCD較低,均值在3.00 kg·m-2以下(表 7)。采用自然斷點法將研究區農田SOCD劃分為高(≥4.08 kg · m-2)、中(3.33 kg · m-2≤SOCD < 4.08 kg · m-2)、低(< 3.33 kg·m-2)三個等級。其中低等級農田面積1.155 5 × 106 hm2,占研究區農田總面積的33.86%,具有較大的農田SOC儲存提升潛力。

表 6 分區農田土壤有機碳樣本及分層多元復合模型 Table 6 Sample status of SOC and multivarible composite model in different zones
圖 3 廣東省農田土壤有機碳密度高精度分布圖 Figure 3 High precision distribution map of SOCD in Guangdong Province
表 7 基于高精度空間分布圖的農田土壤有機碳密度統計分析表 Table 7 Statistical analysis of SOCD based on high-precision spatial distribution map
2.4 與傳統方法制圖結果的對比分析

采用MCM和傳統方法分別進行區域SOC預測制圖,基于地理探測器構建的MCM與OK的區域農田SOCC預測圖的預測細節較豐富;GWRK得到的空間分布模擬結果更為平滑,而RBFNN預測圖的細節表達不夠清晰(圖 4)。同時根據樣本驗證集的驗證結果,以OK插值結果為基準進行比較(表 8)。其中GWRK、RBFNN、OK的綜合誤差較MCM增大了6.07%、9.04% 和4.77%,Pearson相關系數(r)降低了6.78%、11.86% 和10.17%,MCM的綜合精度相對GWRK、RBFNN和OK分別提升了6.45%、10.45% 和7.50%。在中大空間尺度上MCM的區域農田SOC預測結果的綜合相對精度較GWRK、RBFNN和OK都有較大幅度的提升。

圖 4 研究區農田土壤有機碳不同方法的預測結果 Figure 4 Prediction results of different methods of farmland SOC in the study area
表 8 分層多元復合模型與傳統方法對比驗證 Table 8 Comparison and verification between multivarible composite model and traditional methods

同時,觀察驗證集樣本實測值與預測值的普通Q-Q圖,MCM與OK、GWRK的實測值與預測值較為接近直線,表達農田SOC空間分異特征的穩定性更強。RBFNN則與直線偏離較大,說明其實測值與預測值的空間線性相關性低于其他三種方法,空間表達的隨機性較強。MCM尾部更接近直線,其預測誤差相對更為準確(圖 5)。OK與GWRK均存在“翹尾”現象,尾部預測值誤差較大。RBFNN預測結果誤差也相對較大,且預測高值和低值數據時偏差較大,預測值偏向于實測值的平均值和中位值。

圖 5 驗證集中樣本實測值與預測值的普通Q-Q圖 Figure 5 General Q-Q diagram of measured and predicted values of samples in the verification set
3 討論

綜合可操作性、預測精度及空間表達力,MCM有效體現了農田SOC空間變異的多因性及不同變量的影響力差異,可以作為大尺度復雜地理情景下區域SOC預測的優先模型。

農田SOC空間變異的影響變量眾多[17],如海拔高度和地形坡度影響不同地貌部位SOC的累積和流失速度[36],不同利用方式驅動下土壤改良、施肥策略、耕耙等人為擾動,及由其導致的土壤理化性質變化對農田SOC時空變化的影響等[37]。目前研究多是通過加大采樣密度[38]、復雜化預測模型與強化模型訓練[11, 39]等途徑,實現農田SOC制圖的精度要求。但是,受地理環境與人為利用方式影響,大尺度復雜情景下農田SOC空間變異更加劇烈,單一線性模型或小尺度機器學習訓練模型難以滿足精度要求。通過區域綜合特征分區進一步聚合區內相似性與區間差異性,降低了農田SOC空間預測的難度。同時,通過地理探測器對各影響變量的有效測度,在不同特征分區的測算模型中建立了變量貢獻力序列,避免了因素間的相互干擾,抑制了插值噪聲[19]。經對比,RBFNN對環境特征和訓練樣本依賴性較強,空間移植性較差[39]。在大空間尺度下,OK插值預測結果較GWRK和RBFNN具有更好的內在空間關聯性和精確性[40]。MCM則清晰地將分層單變量協同克里格插值結果與基于變量影響力序列融入統一的模型,相比OK、GWRK和RBFNN傳統方法,其測算結果綜合誤差最小,精度提升最顯著。MCM能夠在農田SOC空間預測過程中協同更多易獲取的輔助變量,同時體現不同變量對空間變異的貢獻力,兼顧了測算過程中的秩序與協同,降低了預測結果的不確定性。

對于大尺度復雜情景下的農田SOC空間預測,通過集合區域綜合特征分區、地理探測器、分層多元復合模型等技術手段,輔助大數據樣本集[41],可以取得較好的農田SOC制圖精度。但在構建面向農田土壤有機碳高精度制圖的綜合特征分區指標體系、識別SOC結構變量及其分類分級中仍有進一步改善的空間。廣東省農田SOC高精度制圖,為編制更大空間尺度的農田SOC分布圖探索了有效路徑,為提升區域土壤固碳潛力,促進碳交易、碳中和奠定了基礎。

4 結論

(1)通過構建綜合區劃的多層次結構體系,引入基于加權Ripley′ s K函數的多距離空間聚類進行中大空間尺度綜合特征分區,能夠更加突顯分區之間SOC空間差異性,收斂分區內部SOC樣本的離散程度。分區后SOC樣本的標準偏差均值、方差均值較未分區前分別下降0.55、3.53,Moran′s I指數上升0.08。

(2)地理探測器探測結果表明導致農田SOC空間變異的變量眾多,且不同綜合特征分區內結構差異較大。年均降水量、海拔高度、坡度等變量對山地丘陵區SOC空間分異作用顯著,對平原崗地區作用不顯著,土地利用方式及土壤理化性質等變量對不同特征分區均具有較大的影響力。

(3)在大密度樣本集支持下,協同區域綜合特征分區與基于地理探測器構建的分層多元復合模型編制的高精度農田SOC空間分布圖,較好地解決了中大尺度和復雜情景下SOC空間分異規律與空間突變的同步表達矛盾,抑制了多變量插值噪聲增加,其綜合精度較GWRK、RBFNN和OK分別提升6.45%、10.45% 和7.50%,預測結果更為準確,空間細節表達更為清晰。

參考文獻
[1]
周銀, 劉麗雅, 盧艷麗, 等. 星地多源數據的區域土壤有機質數字制圖[J]. 遙感學報, 2015, 19(6): 998-1006.
ZHOU Y, LIU L Y, LU Y L, et al. Regional scale mapping of soil organic matter using remote sensing and visible-near infrared spectroscopy[J]. Journal of Remote Sensing, 2015, 19(6): 998-1006.
[2]
趙彥鋒, 李豪杰, 陳杰, 等. 基于土壤變異解釋力的幾種土壤制圖方法的對比研究——以南陽市1 m土體土壤有機碳密度制圖為例[J]. 土壤學報, 2018, 55(1): 43-53.
ZHAO Y F, LI H J, CHEN J, et al. Comparison between soil mapping approaches based on their ability explaining soil variability: A case of mapping soil organic carbon density of soil(0~1 m) in Nanyang District[J]. Acta Pedologica Sinica, 2018, 55(1): 43-53.
[3]
吳子豪, 劉艷芳, 陳奕云, 等. 綜合土地利用及空間異質性的土壤有機碳空間插值模型[J]. 應用生態學報, 2018, 29(1): 238-246.
WU Z H, LIU Y F, CHEN Y Y, et al. Spatial interpolation model of soil organic carbon density considering land-use and spatial heterogeneity[J]. Chinese Journal of Applied Ecology, 2018, 29(1): 238-246.
[4]
吳才武, 張月叢, 夏建新. 基于地統計與遙感反演相結合的有機質預測制圖研究[J]. 土壤學報, 2016, 53(6): 1568-1575.
WU C W, ZHANG Y C, XIA J X. Prediction and mapping of soil organic matter based on geostatistics and remote sensing inversion[J]. Acta Pedologica Sinica, 2016, 53(6): 1568-1575.
[5]
黃安, 楊聯安, 杜挺, 等. 基于多元成土因素的土壤有機質空間分布分析[J]. 干旱區地理, 2015, 38(5): 994-1003.
HUANG A, YANG L A, DU T, et al. Spatial distribution of the soil organic matter based on multiple soil factors[J]. Arid Land Geography, 2015, 38(5): 994-1003.
[6]
張振華, 丁建麗, 王敬哲, 等. 集成土壤-環境關系與機器學習的干旱區土壤屬性數字制圖[J]. 中國農業科學, 2020, 53(3): 563-573.
ZHANG Z H, DING J L, WANG J Z, et al. Digital soil properties mapping by ensembling soil-environment relationship and machine learning in arid regions[J]. Scientia Agricultura Sinica, 2020, 53(3): 563-573.
[7]
張勇, 史學正, 于東升, 等. 屬性數據與空間數據連接對土壤有機碳儲量估算的影響[J]. 地球科學進展, 2008, 4(8): 840-847.
ZHANG Y, SHI X Z, YU D S, et al. Effect of the linkage between spatial data on esimates of soil organic carbon[J]. Advance in Earth Science, 2008, 4(8): 840-847. DOI:10.3321/j.issn:1001-8166.2008.08.007
[8]
周濤, 史培軍, 王紹強. 氣候變化及人類活動對中國土壤有機碳儲量的影響[J]. 地理學報, 2003, 58(5): 727-734.
ZHOU T, SHI P J, WANG S Q. Impacts of climate change and human activities on soil carbon storage in China[J]. Acta Geographica Sinica, 2003, 58(5): 727-734. DOI:10.3321/j.issn:0375-5444.2003.05.011
[9]
SONAM R S, DAVID W W, HAROLD M E. Sampling and data analysis optimization for estimating soil organic carbon stocks in agroecosystems[J]. Soil Science Society of America Journal, 2016, 80(5): 1377-1392. DOI:10.2136/sssaj2016.04.0113
[10]
GOURI S B, PRAVAT K S, RAMKRISHNA M. Comparison of GISbased interpolation methods for spatial distribution of soil organic carbon(SOC)[J]. Journal of the Saudi Society of Agricultural Sciences, 2018, 17(2): 114-126. DOI:10.1016/j.jssas.2016.02.001
[11]
任必武, 陳瀚閱, 張黎明, 等. 機器學習用于耕地土壤有機碳空間預測對比研究——以亞熱帶復雜地貌區為例[J]. 中國生態農業學報(中英文), 2021, 29(6): 1042-1050.
REN B W, CHEN H Y, ZHANG L M, et al. Comparison of machine learning for predicting and mapping soil organic carbon in cultivated land in a subtropical complex geomorphic region[J]. Chinese Journal of Eco-Agriculture, 2021, 29(6): 1042-1050.
[12]
邵月紅, 潘劍君, 許信旺, 等. 淺談土壤有機碳密度及儲量的估算方法[J]. 土壤通報, 2006, 4(5): 1007-1011.
SHAO Y H, PAN J J, XU X W, et al. Discussion on the methods for estimating soil organic carbon density and storage[J]. Chinese Journal of Soil Science, 2006, 4(5): 1007-1011. DOI:10.3321/j.issn:0564-3945.2006.05.039
[13]
趙廣帥, 李發東, 李運生, 等. GIS空間插值模擬法與土壤類型法估算比較土壤碳儲[J]. 農業工程學報, 2014, 30(20): 155-162.
ZHAO G S, LI F D, LI Y S, et al. GIS spatial interpolation compared with soil type method for estimating soil carbon storage[J]. Transactions of the Chinese Society of Agricultural Engineering, 2014, 30(20): 155-162. DOI:10.3969/j.issn.1002-6819.2014.20.019
[14]
EMAMGHOLIZADEH S, SHAHSAVANI S, ESLAMI M A. Comparison of artificial neural networks, geographically weighted regression and Cokriging methods for predicting the spatial distribution of soil macronutrients(N, P, and K)[J]. Chinese Geographical Science, 2017, 27(5): 747-759. DOI:10.1007/s11769-017-0906-6
[15]
HUANG Y J, YE H C, ZHANG L P, et al. Prediction of soil organic matter using ordinary Kriging combined with the clustering of self-organizing map: A case study in Pinggu District, Beijing, China[J]. Soil Science, 2017, 182(2): 52-62. DOI:10.1097/SS.0000000000000196
[16]
郭治興, 袁宇志, 郭穎, 等. 基于地形因子的土壤有機碳最優估算模型[J]. 土壤學報, 2017, 54(2): 331-343.
GUO Z X, YUAN Y Z, GUO Y, et al. Optimal estimation model of soil organic carbon based on the terrain factor[J]. Acta Pedologica Sinica, 2017, 54(2): 331-343.
[17]
任向寧, 董玉祥. 基于地理探測器的區域土壤耕層有機碳含量多元復合模型構建——以珠三角核心區為例[J]. 熱帶地理, 2018, 38(4): 546-556.
REN X N, DONG Y X. Construction of multivariate composite calculation model of soil organic carbon content in Plough Horizon based on Geodetector[J]. Tropical Geography, 2018, 38(4): 546-556.
[18]
李見賢. 廣東省的地貌類型[J]. 中山大學學報(自然科學版), 1961, 4(4): 70-81.
LI J X. The types of landforms in Guangdong Province[J]. Acta Scientiarum Naturalium Universitatis Sunyatseni, 1961, 4(4): 70-81.
[19]
黃秉維. 中國綜合自然區劃的初步草案[J]. 地理學報, 1958(4): 348-365.
HUANG B W. Preliminary draft of comprehensive natural zoning in China[J]. Acta Geographica Sinica, 1958(4): 348-365.
[20]
陳雯, 段學軍, 陳江龍, 等. 空間開發功能區劃的方法[J]. 地理學報, 2004(S1): 53-58.
CHEN W, DUAN X J, CHEN J L, et al. The methods of spatial development function regionalization[J]. Acta Geographica Sinica, 2004(S1): 53-58.
[21]
張廣海, 李雪. 山東省主體功能區劃分研究[J]. 地理與地理信息科學, 2007(4): 57-61.
ZHANG G H, LI X. A study on the division of main-functional zones in Shandong Province[J]. Geography and GeoInformation Science, 2007(4): 57-61. DOI:10.3969/j.issn.1672-0504.2007.04.015
[22]
趙榮欽, 黃賢金, 鐘太洋, 等. 聚類分析在江蘇沿海地區土地利用分區中的應用[J]. 農業工程學報, 2010, 26(6): 310-314.
ZHAO R Q, HUANG X J, ZHONG T Y, et al. Application of clustering analysis to land use zoning of coastal region in Jiangsu Province[J]. Transactions of the CSAE, 2010, 26(6): 310-314. DOI:10.3969/j.issn.1002-6819.2010.06.054
[23]
侯雪, 米文寶. 西北地區主體功能區劃方法研究[J]. 經濟地理, 2009, 29(10): 1640-1643.
HOU X, MI W B. A study on method of principal function regions planning in northwest of China[J]. Economic Geography, 2009, 29(10): 1640-1643.
[24]
王勁峰, 徐成東. 地理探測器: 原理與展望[J]. 地理學報, 2017, 72(1): 116-134.
WANG J F, XU C D. Geodetector: Principle and prospective[J]. Acta Geographica Sinica, 2017, 72(1): 116-134.
[25]
WANG J F, LI X H, CHRISTAKOS G, et al. Geographical detectorsbased health risk assessment and its application in the neural tube defects study of the Heshun region, China[J]. International Journal of Geographical Information Science, 2017, 24(1): 107-127.
[26]
董玉祥, 徐茜, 楊忍, 等. 基于地理探測器的中國陸地熱帶北界探討[J]. 地理學報, 2017, 72(1): 135-147.
DONG Y X, XU Q, YANG R, et al. Delineation of the northern border of the tropical zone of China's mainland using Geodetector[J]. Acta Geographica Sinica, 2017, 72(1): 135-147.
[27]
SHEN J, ZHANG N, GEXIGEDUREN, et al. Construction of a GeogDetector-based model system to indicate the potential occurrence of grasshoppers in Inner Mongolia steppe habitats[J]. Bulletin of Entomological Research, 2015, 105(3): 135-147.
[28]
劉紅宜, 陳沖, 盧瑛, 等. 珠江三角洲平原農田土壤有機碳組分及剖面分布特征[J]. 土壤通報, 2017, 48(2): 399-405.
LIU H Y, CHEN C, LU Y, et al. Characteristics of organic carbon fractions and its distribution in soil profiles of cultivated land in Pearl River Delta Plain[J]. Chinese Journal of Soil Science, 2017, 48(2): 399-405.
[29]
張仁鐸. 空間變異理論及應用[M]. 北京: 科學出版社, 2005: 57-58.
ZHANG R D. Theory and application of spatial variation[M]. Beijing: Science Press, 2005: 57-58.
[30]
ANDERSON D W, COLEMAN D C. The dynamics of organic matter in grassland soils[J]. Journal of Soil and Water Conservation, 1985, 40: 211-216.
[31]
BAYER C, LOVATO T, DIECKOW J, et al. A method for estimating coefficients of soil organic matter dynamics based on long-term experiments[J]. Soil & Tillage Research, 2006, 91: 217-226.
[32]
LI X J, ZHANG X Z, ZHANG Y J. Modeling the effects of climate change and elevated CO2 on soil organic carbon in an alpine steppe[J]. Journal of Resources and Ecology, 2011, 2(2): 168-174.
[33]
湯國安, 楊昕. ArcGIS地理信息系統空間分析實驗教程[M]. 2版. 北京: 科學出版社, 2015.
TANG G A, YANG X. Spatial analysis experimental course of geography information system based on ArcGIS[M]. 2nd edition. Beijing: Science Press, 2015.
[34]
BRUNSDON C, FOTHERINGHAM A S, CHARLTON M E. Geographically weighted regression: A method for exploring spatial nonstationarity[J]. Geographical Analysis, 2010, 28(4): 281-298. DOI:10.1111/j.1538-4632.1996.tb00936.x
[35]
GHOSH-DASTIDAR S, ADELI H, DADMEHR N. Principal component analysis-enhanced cosine radial basis function neural network for robust epilepsy and seizure detection[J]. IEEE Transactions on Bio-medical Engineering, 2008, 55: 512-518. DOI:10.1109/TBME.2007.905490
[36]
李珊, 李啟權, 王昌全, 等. 鹽源縣耕層土壤有機碳時空變化及影響因素顯著性變化分析[J]. 土壤通報, 2015, 46(5): 1063-1070.
LI S, LI Q Q, WANG C Q, et al. Spatio-temporal variation of soil organic carbon and significant changes in its impact factors: A case study in Yanyuan County, southwest Sichuan[J]. Chinese Journal of Soil Science, 2015, 46(5): 1063-1070.
[37]
易亞男, 尹力初, 張蕾, 等. 施肥對不同地下水位水稻土團聚體組成及有機碳分布的影響[J]. 水土保持學報, 2013, 27(5): 144-153.
YI Y N, YIN L C, ZHANG L, et al. Effects of fertilization on aggregate composition and organic carbon distribution in paddy soil under different groundwater level[J]. Journal of Soil and Water Conservation, 2013, 27(5): 144-153.
[38]
巫振富, 趙彥鋒, 程道全, 等. 樣點數量與空間分布對縣域尺度土壤屬性空間預測效果的影響[J]. 土壤學報, 2019, 56(6): 1321-1335.
WU Z F, ZHAO Y F, CHENG D Q, et al. Influences of sample size and spatial distribution on accuracy of predictive soil mapping on a county scale[J]. Acta Pedologica Sinica, 2019, 56(6): 1321-1335.
[39]
胡貴貴, 楊粉莉, 楊聯安, 等. 基于主成分和機器學習的土壤有機質含量空間預測建模[J]. 干旱區地理, 2021, 44(4): 1114-1124.
HU G G, YANG F L, YANG L A, et al. Spatial prediction modeling of soil organic matter content based on principal components and machine learning[J]. Arid Land Geography, 2021, 44(4): 1114-1124.
[40]
GOURI S B, PRAVAT K S, RAMKRISHNA M. Comparison of GISbased interpolation methods for spatial distribution of soil organic carbon(SOC)[J]. Journal of the Saudi Society of Agricultural Sciences, 2018, 17(2): 114-126. DOI:10.1016/j.jssas.2016.02.001
[41]
ZHANG P F, LI S H, HE Z, et al. Collaborative mapping rice planting areas using multisource remote sensing data[C]. 2021 IEEE International Geoscience and Remote Sensing Symposium IGARSS, 2021, 5969-5972.