谭敏
广州市城市规划设计有限公司 广东广州 510030
摘要:建成区规模是衡量城市化水平的重要测度指标,是国土空间规划实施评估、城市体检的重要基础。目前建成区面积统计工作中存在各城市统计标准不统一、数据可比性差、统计结果可能不符合实际发展情况、缺乏自上而下的监督管理等问题。因此,需要一套准确客观的建成区提取方法,作为国土空间规划监督管理的参考依据。本文以广州市为例,提出一套基于GEE平台进行土地覆盖信息解译,再利用随机森林算法结合夜间灯光数据、POI数据和人口密度数据等多源数据提取建成区范围的方法。提取结果与统计结果空间形态一致,面积精度99.39%,可用于辅助城镇开发边界划定及作为自上而下国土空间规划实施评估与监督的技术手段,提升城市精细化管理水平。
关键词:国土空间规划监督管理,建成区,随机森林,大数据,广州
1 引言
根据国家住建部、统计局印发的《城市(县城)和村镇建设统计调查制度》(2018年2月版),建成区的定义是指城区(县城)内实际已成片开发建设、市政公用设施和公共设施基本具备的区域。建成区规模是衡量城市化水平的重要测度指标[1],是国土空间规划实施评估、城市体检的重要基础。目前建成区面积统计工作中,存在以下问题:(1)各城市未有统一、明确的方法界定城市建成区范围,各城市有自己的操作标准,由此得到的数据缺乏可比性、准确性[2]。(2)统计结果可能不符合实际发展情况,出现例如武汉2007-2009年建成区面积年均增长2km2[3]等可能不合实际的现象。(3)统计形式为自下而上地统计上报,动态性、时效性较差且缺乏自上而下的监督管理。
本文以广州市为例,基于GEE平台对Sentinel-2A影像进行土地覆盖类型分类,提出一种利用机器学习算法随机森林模型结合土地覆盖类型、夜间灯光强度、人口密度、各类设施密度变量因子进行建成区提取的方法,可快速准确地提取建成区。
2 数据源
本文使用的数据包括:①Sentinel-2A遥感影像,空间分辨率为10m。②NPP_VIIRS灯光数据,本文采用的是2019年度合成产品,来源于Google Earth Engine平台;③WorldPop2019年人口密度数据,来源于WorldPop项目(http://www.worldpop.org.uk),空间分辨率为100m。④POI数据,利用百度API开放接口抓取的广州市各类POI,整合分为公共服务设施、交通设施、工业、商服、住宅五类。
3 技术路线
本文基于前人关于提取建成区的研究[4-6]并结合住建部对于建成区的定义,选取土地覆盖类型、夜间灯光强度、人口密度、公服设施密度、交通设施密度、工业密度、商服密度、住宅密度作为建成区提取的变量因子,随机生成了122个样本点,采用随机森林算法探寻是否为建成区与8个特征变量的关系,再将此关系应用于全市范围,进行建成区范围初步提取,最后叠加土地变更调查数据的道路用地以串联建成区图斑,得到最终建成区提取结果。
4 结果分析与讨论
4.1 提取结果分析
基于GEE平台,结合NDVI、MNDWI、IBI指数对Sentinel-2A遥感影像进行解译得到广州市2019年土地覆盖类型结果(图1),样本点估算的模型精度为98.2%。
基于土地覆盖类型解译结果和其他多源数据,采用随机森林模型得到建成区初步结果,再叠加土地利用变更调查的道路用地用于串联各建成区图斑,得到广州市2019年建成区提取结果(图2左),面积为1332.30km2。
图2广州市2019年建成区提取结果(左)与广州市2018年建成区统计图(右)对比
根据《广州市2019年城市建成区面积统计情况解读》,广州市2019年建成区面积为1324.17km2[7],本文提取精度为99.39%。与广州市2018年建成区统计图(图2右)对比,空间形态基本一致。提取结果在中心城区连片明显,外围地区存在若干个由道路串联的连片图斑,符合住建部关于建成区的定义。说明本文的随机森林模型对中心城区、外围地区不同发展程度的建成区都具备较好的提取效果。
4.2 变量重要性分析
基于随机森林模型的OOB数据得到变量因子重要性,变量因子重要性的值越大,表明该变量因子对是否为建成区的解释性越大。
土地覆盖类型的重要性最高,说明它在判断是否为建成区时具有最重要的指示性作用。商服密度对是否为建成区的判断也有重要的指示性,从POI原始的标签分类来看,商服的POI包括美食、购物、酒店、金融、生活服务、汽车服务、旅游景点、商圈、写字楼、休闲娱乐、运动健身、丽人,均为满足居民的日常生活及高层次需求的服务。这和刘凌波等[8]利用便利店、银行POI能有效提取建成区边界的研究结论相符合。
5 结论与展望
本文基于随机森林模型,结合土地覆盖类型数据、夜间灯光数据、人口分布数据、POI数据提取建成区空间范围的方法是切实可行高效的,而且本文所用的变量数据更新周期较短,可推广用于动态的规划实施监测评估。
研究还存在一些方面可继续深化:(1)优化边界信息,可尝试采用面向对象的土地覆盖类型分类方法。(2)将本文的方法推广到不同城市形态、不同发展程度的城市进行实验,验证本文方法的普适性。(3)将本文的方法推广到不同研究对象,服务国土空间规划监督管理,如现状评估中的森林覆盖率等,使城市规划实施评估更加客观准确,提升国土空间治理能力。
参考文献
[1] 牟凤云,张增祥,迟耀斌,等. 基于多源遥感数据的北京市1973—2005年间城市建成区的动态监测与驱动力分析[J]. 遥感学报. 2007(02): 257-268.
[2] 徐强,华晨. 城市建成区面积统计口径亟待统一——以杭州中心城区为例[J]. 规划师. 2005(04): 88-91.
[3] 胡忆东,吴志华,熊伟,等. 城市建成区界定方法研究——以武汉市为例[J]. 城市规划. 2008(04): 88-91.
[4] 宋金超,李新虎,吝涛,等. 基于夜晚灯光数据和Google Earth的城市建成区提取分析[J]. 地球信息科学学报. 2015, 17(06): 750-756.
[5] 许泽宁,高晓路. 基于电子地图兴趣点的城市建成区边界识别方法[J]. 地理学报. 2016, 71(06): 928-939.
[6] 郑洪晗,桂志鹏,栗法,等. 夜间灯光数据和兴趣点数据结合的建成区提取方法[J]. 地理与地理信息科学. 2019, 35(02): 25-32.
[7] 广州市规划和自然资源局官网,http://ghzyj.gz.gov.cn/zwgk/xxgkml3/qt/tjsj/qt/content/post_6463318.html, 2019.
[8] 刘凌波,吴昊,赵捷,等. 基于服务区划型兴趣点划定城市建成区边界方法: 2018中国城市规划年会[Z]. 中国浙江杭州: 201811.