GeoAI算子支撑人工智能GIS应用

  • 2020-06-25 10:00:00
  • 作者: 送你一朵小红花
  • 来源: 知乎

人工智能是GIS发展的重要方向,是影响未来GIS发展的重要技术驱动力。GIS与AI结合,将进一步推动地理智慧的深度进化,满足更加广泛和深层次的应用需求。SuperMap GIS 10i产品中新增多种GeoAI算子,以丰富的空间统计方法为基础支撑,在空间机器学习、空间深度学习两个方面开展GeoAI功能研发,支持人工智能GIS应用,服务于GIS空间数据的处理、分析与挖掘。

空间机器学习

机器学习技术是人工智能研究的核心,聚类、分类、回归是机器学习领域的三类典型方面。在地理空间领域,我们也主要面向这三类基本问题,展开空间机器学习的研究和功能实现。

空间密度聚类

空间密度聚类是指对点集合进行空间位置的聚类,将有足够高密度的区域划分为簇,通过空间位置信息发掘数据中的关联性。
以北京住宅小区集聚情况为例,将住宅小区位置点划分为多个密度簇,从划分结果可以看出,北京市三环内区域(含部分三环外区域)整体住宅分布较为密集,是住宅分布的核心区;三环外区域大多分散为多个大型组团,如中关村、望京、朝青等住宅板块。
在SuperMap GIS 10i产品中,我们将传统的空间密度聚类算法与分布式计算进行有效结合,使得用户可以基于分布式计算架构实现大规模数据计算的性能提升。

 

                                                                                                                                                                                                                  住宅小区密度聚类

   

基于森林的分类

分类是基于训练数据集判断目标对象应该归属于哪一类的过程。基于森林的分类结果是依赖于多棵决策树的结果综合,每棵树会生成自己的预测,然后集成所有投票进行最终预测。该算法具有便捷快速处理大样本数据、无过拟合、抗噪音能力强的特点,而且能够得到模型中特征变量的重要性评价。
这种实现分类预测的机器学习算法在结合地理空间特征之后,可以帮助使用者回答某地是否适合动植物生存这样的定性化判断问题。
我们利用该方法对中华按蚊适生区地理分布进行预测,将平均气温日较差、最冷月最低温度、最热季节平均温度等气候条件作为解释变量,将是否适合按蚊生长繁殖作为因变量进行建模,可以基于该模型对其它位置进行适宜性预测。得到预测结果的部分地区展示如下图。

 

                                                                                                                                                                                      中华按蚊适生区地理分布预测结果

   

基于森林的回归

同基于森林的分类方法类似,基于森林的回归也包括模型训练和模型预测两过程,但回归算法主要针对数值型连续随机变量进行预测,产生的结果也是数值型的。与传统的多元线性回归模型或参数回归模型相比,基于森林的回归算法无需预先设定函数形式,且预测精度较高。因此这种方法被广泛应用于生态学、经济管理、生物医学、信用评价等领域中。
回归模型的典型应用就是对于不同地区的房屋价格进行建模预测,我们利用已售出的二手房交易数据,基于空间进行交通、教育、医疗等基础设施情况的建模计算。建模过程中,将距离基础设施远近、一定距离内的基础设施数量等作为解释变量进行回归建模,基于模型可以对其他区域房产进行价格评估。

 

                                                                                                                                                                                                                  房产价格空间回归


 

空间深度学习

从遥感影像中对指定地物进行识别,并进行空间统计和分析,以从影像中获取兴趣目标的信息,一直是GIS和RS领域所关注的问题。我们将深度学习和GIS技术结合,提供了一系列影像分析功能,并提供相关流程工具支撑。

目标检测

目标检测可以对遥感图像中的一个或多个目标的类别和位置进行自动化判定与识别,并以矢量框的形式作为标记,确定其类别和位置。目标检测功能有着检测速度快、准确率较高等特点,通常用来快速确定影像中不同类别目标的数量和位置等空间信息。
SuperMap以适用于图像领域的CNN网络为基础,使用Faster-RCNN模型,并对该模型进行优化,针对遥感影像上常见的同类目标大小不一的情况,优化对小目标的识别能力,以达到更好的检测效果。整个过程只需要输入一幅影像和确定识别目标类别,就能快速获得兴趣目标的矢量数据。下图为某区域的大棚目标检测结果,黄色框为检测出来的大棚,可以快速准确定位大棚分布、位置及数量,为大棚管理、耕地管控等领域提供基本的数据支撑。

 

                                                                                                                                                                                                                  大棚目标检测结果

 

二元分类

二元分类使用深度学习算法对遥感图像中的某一类地物要素进行分类提取,生成值为0、1的二值栅格数据,0为非目标类别,1为目标类别。该功能通常用来提取道路、河流和建筑物等特征明显的单一地类。

 

                                                                                                                                                                                                                     影像建筑物提取

 

地物分类

地物分类是一个传统的遥感影像分析任务,该功能使用深度学习算法对遥感图像中的土地覆盖和使用类型进行计算,判定影像像元的类别,是一种多分类模型的应用。地物分类通常可被用于与土地覆盖信息相关的多种应用,如监测区域的森林砍伐和城市化进程,以及与交通管理、城市规划和道路监测相关的道路与建筑物检测等。

                                                                                                                                                                                                                          影像地物分类

 

场景分类

场景分类将整幅影像按照特定大小切分为均匀网格,并对这些网格进行分类,为每一幅图像赋予场景类别标签,是一种高于像元级别的粗粒度分类方法。场景分类一般用于较大尺度的分类任务,如城市气候区分类等。
局部气候分区(Local Climate Zone, LCZ)是一种新兴的城市热岛研究标准理论方法,可广泛应用于城市规划、气象建模等领域,可以使用场景分类功能,将整个城市划分为大量规则网格。通过AI模型,对每个网格的类型进行推理,区分出密集建筑、开阔建筑、植被、裸地、水域等。

 

                                                                                                                                                                                                                          影像场景分类
 

AI流程工具
为了更好地满足不同用户场景的AI应用需求,简化深度学习工作流程的复杂性,超图AI GIS技术体系提供了相对完整的AI模型构建流程工具,从数据准备、模型构建到最终的模型发布与应用,都可以在SuperMap GIS产品中完成,帮助用户便捷使用。该部分内容将会在后续进行详细介绍。
小结
超图从空间机器学习、空间深度学习两个方面探索了GeoAI的应用,提供了包括基于森林的分类与回归、二元分类、地物分类、场景分类等GeoAI新增算子,优化了空间密度聚类的分布式计算支持,并提供了较为完整的AI模型构建流程工具,支撑GeoAI的便捷化应用。