GIS多源空间数据集成

  • 2020-01-07 10:00:00
  • 作者: 图新小助手
  • 来源: 图新云GIS

1.多源数据的特点

多源空间数据由于获取手段、获取方法、数据记录格式等不同,之间存在明显的差异,表现在如下几个方面:

(1)多语义性

地理系统的研究对象的多种类特点决定了地理信息的多语义性。同一个地理信息单元, 在现实世界中其几何特征是一致的,但却对应着多种语义。它们因解决问题的侧重点不同,产生了不同的解释,造成了语义分异问题。

(2)多时间尺度

时间尺度指数据表示的时间周期及数据形成周期的长短。时间尺度是表达地理特征变化和过程内在规律所必需的条件。多源数据存在这种多时间尺度问题。根据时间周期的长短,地学数据的时间尺度可分为季节尺度数据、年尺度数据、时段尺度数据、人类历史尺度数据和地质历史尺度数据。不同尺度的地学数据在处理上应区别对待,如地质历史尺度、大区域的数据在处理上可以作为常量使用。因为地理过程的连续性,在数据中可以用细小时刻的瞬时状况表示时段的平均状况(闾国年,2003)。

(3)多分辨率

地理空间数据由于多数据源特性,会产生多空间分辨率、多光谱分辨率等问题。

(4)多比例尺

多比例尺是由地图测绘的特点决定的。人们为了反映相同地理区域地形特征的细节程

度,采用了不同的测图比例尺。在计算机还没能对数据进行有效的自动综合处理之前,多比例尺数据库的建设是必要的。

(5)多数据格式

多数据格式是由GIS软件和数据生产软件不同的记录或交换格式决定的。是当前无缝集成的主要障碍。

(6)多空间维数

GIS当前主要表达的是二维几何信息,但随着GIS的发展,2.5维数据、3维数据也将成为GIS管理分析的数据内容。

(7)多精度水平

    由于数据获取手段、方法、目的的不同,数据的精度会存在差别。

(8)多参考系统

 由于数据生产来源不同,不同的部门和应用领域可能提供不同的投影方法和坐标参考系统。GIS的数据分析需要在同一的投影和坐标系统中进行。

(9)多表达形式

在GIS中,矢量数据、栅格数据是常见的形式,随着GIS的发展,DEM数据、正射影像数据、电子扫描数据、多媒体数据等也会成为GIS的重要数据内容。

2.多源数据的集成模式

多源空间数据的集成主要是针对多种底层数据和考虑与越来越多的GIS的数据的集成。主要有三种模式:

(1)数据格式转换模式

这是一种传统的GIS数据集成方式。主要问题是各GIS数据文件之间缺乏同一的语义和结构描述,转换不能完全表达源数据的信息,存在信息丢失问题。数据转换的过程复杂,多数只能通过导入/导出模式进行,往往转换后还要进行编辑,不利于在线数据的处理和分析。另外,这种将数据统一起来的做法,也违背了数据分布和独立性原则。

(2)数据互操作模式

互操作是数据集成的新型模式。它也存在一些局限性。为了真正实现各种数据格式的互操作,需要每种格式的宿主软件都按照同一的规范实现数据访问接口,这在短期内很难实现。而且软件之间的互操作是通过服务器实现的,这两个数据服务器实际就是被访问数据格式的宿主软件,它们需要同时运行才能实现互操作过程。

(3)直接数据访问模式

指一个GIS软件实现对其他软件支持的数据格式的直接访问、存取和空间分析,用户可以使用一个GIS软件存取多种数据格式,其原理是利用空间数据引擎的方法实现数据的无缝集成。它是数据格式转换的理想方式,但构建成本高。

为了解决数据格式转换带来的种种问题,理想的方案是在一个软件中实现对多种数据的直接访问。多源空间数据的无缝集成(Seamless Intergration of Multi-Source Spatial-Data,SIMS) 就是这样一种技术。

    ①格式无关数据集成。GIS用户在使用数据时,可以不必关心数据存储于何种格式,真正实现格式无关数据集成。

    ②位置无关数据集成。如果使用大型关系数据库(如Oracle和SQL Server)存储空间数据,这些数据可以存放在网络服务器甚至Web服务器中,如果使用文件存储空间数据,这些数据一般是本地的。通过SIMS技术访问数据,不仅不必关心数据的存储格式,也不必关心数据的存放位置。用户可以像操作本地数据一样去操作网络数据。

    ③多源数据复合分析。SIMS技术还允许使用来自不同格式的数据直接进行复合空间

分析。SIMS技术的核心不是分析、破解和转换其它GIS软件的二进制文件格式,SIMS提出了一种内置于GIS软件中的特殊数据访问体系结构。它需要实现不同格式数据的管理、调度、缓存(Cache),并提供不同格式数据之间的互操作能力。

SIMS的访问机制是:提供了访问多种格式数据的能力,对每一种数据格式的访问最终通过空间数据引擎(Spatial-data Engine)实现。数据提供者由一组空间数据引擎组成,每个引擎负责访问一种数据格式。比如,SQL Server引擎访问存储在SQL Server中的空间数据,oracle引擎访问Oracle Spatial数据库,SDE引擎访问ESRI SDE支持的各种数据库,Arc/Info引擎存取Arc/Info Coverage,等等。为方便引擎的管理和调度,每个引擎具有统一的接口,封装成一个动态连接库-DLL(Dynamic Linking Library)。类似于一些软件的插件(Plug-in或Add-in)机制,引擎DLL存放在特定目录下,程序启动时自动搜索该目录,动态调入并注册。

3.多源数据的融合

一个GIS平台系统要与多种信息管理系统建立数据连接,对各种信息源而言,其数据采集手段、数据模型、物体分类分级标准、属性信息编码及几何位置精度等各不相同,所以当GIS平台系统在引用这些数据时必须经历一个识别、筛选、整合、存储等加工过程——即多源数据融合过程。多源数据融合要解决的主要问题是对数据,特别是空间数据在各种数据库中存在的模型差异、精度差异、几何位置差异和属性定义差异等进行加工处理,在最大限度上实现多种数据源的完全转换或信息共享。

多源数据融合需要做的主要工作是目标编码体系的统一,几何位置、形状的统一,数据模型或结构的统一。融合的算法包括检测层融合、时空层融合、属性层融合和符号层融合等。

4.空间数据的概括(地图综合)

如果要建立现实世界模型,不管是否满意,不进行空间数据的概括是不可能的。在传统的地图绘制方法中,概括用于地图比例尺缩小过程中减少地图表示内容的复杂度,强调精华,摒弃糟粕,维护地图对象间的逻辑关系与唯一关系,以保留地图的审美质量。概括会造成地图目标之间的空间竞争。数字系统(如GIS和数字制图系统)中的空间数据概括可理解为一个在减少特定应用的细节时又最大化了特定应用的信息方面,实现了代表现实世界不同部分模型间的转换处理。

大多数具有制图功能的数据库都对应于一定的比例尺,称之为主导比例尺,其它比例尺(从属比例尺)都小于主导比例尺。理论上,从属比例尺的数据可以从主导比例尺数据经过抽取、整合、重组等产生。这个过程称为地图概括(或地图综合)。如果这个过程在数据分析、显示时,由程序自动完成,则称自动概括(综合)。地图自动综合的目的就是建立从多尺度表示到不依(无)比例尺的无缝的空间数据库。

地图的自动概括虽然不是新的研究课题,但存在着许多难度。人们提出了多种算法,如:面向信息的综合方法,面向滤波的综合方法,启发式的综合方法,专家系统的综合方法,神经元网络的综合方法,分形的综合方法,数学形态学的综合方法,小波分析的综合方法等。但它们并没有完全解决地图综合的所有问题。