GIS软件数据工程包括哪几个阶段?叙述各阶段的重要工作大学本科阶段专业文章 二维码
2
来源:原创
GIS软件数据工程包括数据的预处理、数据采集、数据处理与数据库建立几个主要的阶段,不同的阶段分别有以下的工作重点: 一、数据预处理阶段 包括了选择数据源、选择比例尺、制定图层、数据转换、制作预处理图、处理图幅数据以及压缩空间数据、转换空间数据类型等内容。 1)选择数据源. 数据源是建立GIS数据库所需要的各种数据的来源.数据源有多种形式,如各种比例尺地形图、专题地图、资料文档、统计报表、野外测量数据、遥感影像和统计数据等等。不同城市,不同应用领域对数据源的要求差别很大,数据源本身的质量也参差不齐,应对他们进行分析和筛选。 数据源的选择主要考虑以下几个方面:(1)数据源的内容(2)数据源精度,质量(3)数据源现势性(4)数据源加工难易程度(5)数据源介质(6)数据源形式 2)选择比例尺 一般情况下,视信息系统数据管理规模大小及详细程度,适用范围等因素,所选用的地形要素亦有所不同,根据经验,作为系统数据的地形图比例尺选择一般以下表为准:
选择的原则应以图面表示的内容能够满足系统对信息的需求为准。适量,合理的地形要素内容选择,避免冗余数据,可以使系统的信息数据管理速度达到最佳水平。 3)制定图层 根据软件系统的约定,进行数据图层分层设计。一般情况下,在满足系统功能需求时应尽量以最少的数据分层进行数据组织,这点对建立专题信息系统尤为重要.各类数据库或数据子库的数据,应根据具体情况和用户需求,采用分层的办法存放.分层存放有利于数据管理和对数据的多途径快速检索与分析。 4)预处理 所选择的数据源资料,一般要经过预处理才能用于数字化,或转换成GIS数据库可用的数据。预处理工作的内容视所选数据源本身的情况而定。主要内容包括: (a)现势更新。作为数据源的图形资料,特别是各种比例尺地形图,应在数字化前对其进行现势更新,使之尽可能好地反映城市现势情况。 (b)专题地图转绘。用作数据源的各种专题地图,应在数字化前以地形图为基础将专题内容进行转绘,使之能与地形图基础协调,为数据的精确配准奠定基础。 (c)图面处理。用作数据源的地形图或专题地图,在数字化前还需进行必要的图面处理,以减少数字化和数据编辑处理的工作量。 (d)统计报表整理。用作数据源的各种专题数据和统计报表,在录入前应进行整理,包括数据项名称、度量单位的统一。统计单元与空间图形匹配、公共项设计等。 (e)数据转换。用作数据源的现有数据或数据库,需要根据GIS设计,对现有数据(库)的数据项进行选择,对数据项项名、类型、字长等定义进行调整,数据记录格式进行转换等。对于图形数据有时可能还需要做投影转换。 (f)制作预处理图。对于地形图或专题地图上需采集的要素,按规定的分类编码,进行选取和标绘,制作预处理图,以便于数字化作业。预处理工作的质量高低,完善与否,对下一步数字化作业或数据录入工作有直接影响,应当重视预处理工作。 5) 处理图幅数据 图幅数据处理的目的是获得与地图直角坐标一致的数据,并且使得不同地图的投影坐标取得统一.图幅数据的处理就是图幅内X,Y坐标数据的变换,它包括数字化坐标数据比例尺的变换,变形误差的消除,投影类型的转换,以及人材的旋转和平移。 6)空间数据的压缩处理 在处理多比例尺或多分辨率的空间数据时,需要进行数据压缩处理。 (a)栅格数据的压缩是GIS中一种常用的数据类型。由于栅格数据的数据量庞大,因此么考虑数据存储容量的压缩,而且还要考虑GIS的数据访问效率。常用的方法有流程长度压缩编码法和四叉树压缩编码法。 (b)图形数据的综合:它是由于数据属性的重新分类和空间图形的化简而伴随需要的一种数据压缩形式,当对属性性质相似的相邻两个面域合成一类相同的代码,或者当从多重属性数据库中,只需要建立单要素的数据文件时,常采用这种压缩法来处理。 7)空间数据类型的转换 GIS的空间数据有矢量数据和栅格数据两种,特别是图形数据和图像数据的混合处理和应用,已成为当前GIS发展的主要趋势,这涉及到适量数据与栅格数据之间的互相转换,表示和运算。 (a)适量向栅格的转换。根据转换处理,基于弧段数据文件和多边形数据文件的不同,分别采用不同的算法。 (b)栅格向适量的转换.栅格向矢量转换处理的主要目的是为了能将扫描仪获取的栅格数据加入矢量形式的数据库中。 二、数据采集阶段 GIS的核心是地理数据库,所以,建立GIS的第一步就是将空间实体的图形数据和属性数据输入到地理数据库中,这就是GIS的数据采集。 GIS的数据采集需要进行四方面的工作,即野外数据的采集、图形数据的采集、属性数据的采集和图形数据与属性数据的连接。 1)野外数据的采集方法:GPS方法、摄影测量方法、测量数据方法 (a)GPS方法:GPS技术是依靠导航卫星来决定地球上某一位置坐标的技术,它已经成为目前既便宜又精确的一种数据采集技术。 (b)影测量方法:影测量方法是一种传统而又较成熟的数据采集方法。它精度高,但在考虑是否使用摄影测量方法时,主要应当考虑下列几个方面:控制点,比例尺,提取的特征,数字正射影像数据,多边形数据的提取等。目前主要摄影测量方法 (c)量数据方法:此类数据通常系统性好,而且精度高。 2)地图数据的采集方法 地图数据是GIS主要的信息源,对它的采集主要是指对地图进行数字化。目前地图数字化主要有两种方式,即手扶跟踪数字化和扫描数字化。 数据采集主要有以下几种方法:工方法:用于录入栅格和矢量地图以及统计和实测数据;手扶跟踪数字化:它是一种用鼠标的方式手扶跟踪地图上的各种地理特征,以获得X,Y坐标。实现这个过程它需要的工具是手扶跟踪数字化仪和数字化过程;动扫面数字化。 3)属性数据的采集方法 属性数据在GIS是空间实体不可分割的组成部分。属性数据可以通过给予一个公共标识符与空间实体联系起来。属性数据即空间实体的特征数据,一般包括名称,等级,数量,代码等多种属性。属性数据常常包括统计数据、遥感影像数据、实测数据、和其它系统的数据。属性数据的采集方法通常有六种:入法;用光学的字符识别技术;在数字化或矢量化的过程中赋值;人工编辑:使用一些分析方法进行自动赋值;影像处理和信息提取:由遥感影像上直接提取专题信息,影像处理技术包括几何纠正、光谱纠正、影像增强、图像变换、结构信息提取、影像分类等。 数据通信:在联网方式下,获得有关的其他信息系统的信息,经过变换,进入系统数据库,是系统信息共享的一种方式。 4)空间数据的检查 (A)空间数据输入的误差 数据空间输入的误差通常可归结为以下几类:几何数据的不完整或重复;几何数据的位置不正确;比例尺不正确;变形;几何数据与属性数据的连接有误;属性数据错误。 (B)空间数据的检查,方法: 1> 通过图形实体与其属性的联合显示,发现数字化中的遗漏、重复、不匹配等错误。2> 在屏幕上用地图要素对应的符号显示数字化的结果,对照原图检查错误。3> 把数字化的结果绘图输出在透明材料上,然后与原图叠加以发现错漏。4> 对的等高线,通过确定最高和最低等高线的高程及等高距,编制软件来检查高程的赋值是否正确。5> 对于面状要素,可在建立拓扑关系时,根据多边形是否闭合来检查,或根据多边形与多边形内点的匹配来检查。6> 对于属性数据,通常是在屏幕上逐表、逐行检查,也可打印出来检查。7> 对于属性数据还可编写检核程序,如有无字符代替了数字,数字是否超出了范围,等等。8> 对于图纸变形引起的误差,应使用几何纠正进行处理。 (C)图形显示,为了对GIS所输入的数据进行显示和检查,GIS应提供下列功能:1> 符号设计与符号库设计功能2> 符号设置功能3> 注记配置功能4> 图形显示功能5> 查询功能6> 绘图输出功能 三、数据数据数据处理与数据库建立 1)格式转换. 格式转换分为二大类:不同数据介质之间的转换,即它是将各种不同的源材料信息转换为计算机兼容的格式;第二类是数据结构间的转换。而数据结构间的转换又包括同一数据结构不同组织形式间的转换和不同数据结构间的转换。 2)图形单元的修改 无论是采用任何方式输入数据,都会出现误差,因此在如何信息系统中,均要具有检查数据库误差的设备。当相邻的多边形的共同边界要数字化时,便会出现重叠和裂口,这便要在数字化以后进行修工和编辑,目前一些GIS软件采用弧结点数据库结构时便能避免这类错误,因为这种结构形式公共点和线只记录一次。 3)图幅拼接 要将分图幅的数字化数据连接在一起,组成连续统一的图幅数据,需要进行图幅数据边缘匹配的处理.进行该步处理的前提条件是各图幅要统一坐标系统和编码方法。 a>通过图幅编号,识别和检索相邻图幅的数据。b>采用追踪拼接法进行相邻图幅边界点坐标数据的匹配。c>删除相同属性多边形的公共界线。 4)坐标转换 在GIS中要对各不同投影进行坐标转换的原因是多方面的,最常见的情况有两种:一种是输入的地图是一种投影,而要求输出的地图产物是另一种投影;另一种是输入的底图是照片底图,而输出则要按一定比例的矢量方式。一般可通过原始影像坐标和订正后坐标之间的数字坐标转换来完成订正处理。目前一些GIS软件均有多种地图投影输入变换与输出变换的功能。 5)几何纠正 图形数据在进入地理数据库之前还需进行几何纠正。这是为了纠正由纸张变形所引起的数字化数据的误差,直接关系到GIS数据的质量。几何纠正要以控制点的理念坐标和数字化坐标为依据来进行,最后应显示平差结果。 6)数据编辑处理 由于数据采集和录入过程中,不可避免地会产生错误,进入系统的图形数据或多或少存在一些问题。所以数据采集,录入完成后,要对其进行必要的编辑处理以保证数据符合技术要求.数据编辑处理工作是按检查,编辑修改,再检查,再编辑修改再检查,…..,循环进行,直到没有问题和错误为止。在数据编辑处理阶段,还应该建立和完善图形数据与属性数据或专题统计数据之部的对应连接关系。 7)拓扑结构及拓扑关系的自动生成 在矢量结构表示方法中,任何地理实体均可以用点,线,面来表示其我特征,进而可根据各牲间的空间关系,解译出更多的信息,为此可用确定区域定义,连通性和邻接性的方法来达到上述目的.这能识别出各地理信息实体的相对位置,从而解译出多种信息。 8)数据库建立 利用所选GIS基础软件提供的数据库管理功能,将经过编辑处理的图形数据进行入库处理,建成数据库实体。考虑到图形数据的复杂性和使用方便,图形数据在库中一般应按总体设计和子系统设计规定的数据分层方案存放。专题统计数据和属性数据经过编辑处理后,亦需按照所先用的关系数据库来之不易软件的要求,进行入库处理建立各种链接关系,索引表等,以便对数据进行有效的管理和快速查询检索. 为保证数据的安全和保密,在建立数据库实体时,应当同时建立密码和庙宇权限,控制对数据库的读,写,修改等操作.
文章分类:
其他成果
|