向量数据库和图数据库都是现代数据库系统中的新兴技术。
1.数据结构:
-向量数据库:向量数据库中的数据结构是向量,它采用向量化存储和查询技术,将数据以向量形式存储和处理。向量数据库适用于大规模数据和高维数据的存储和查询,例如图像、音频、文本等。
-图数据库:图数据库中的数据结构是图,它使用节点和边的关系来表示和存储数据。图数据库适用于复杂的关联查询和网络拓扑的存储,如社交网络、知识图谱等。
2.数据查询:
-向量数据库:向量数据库主要用于向量化数据的相似度查询,如基于距离度量的最近邻查询和相似性搜索。
-图数据库:图数据库主要用于复杂的关联查询,可以快速找到节点之间的关系和路径。
3.性能和扩展性:
-向量数据库:向量数据库在大规模向量数据的存储和查询方面具有优势,可以高效地进行向量化计算和嵌入式索引,支持高并发和分布式部署。
-图数据库:图数据库在处理复杂的关联查询和图算法方面具有优势,可以利用图的顶点和边的关系来提高查询性能和扩展性。
4.应用场景:
-向量数据库:向量数据库适用于图像识别、音频和视频处理、自然语言处理等领域,例如人脸识别、语义搜索、推荐系统等。
-图数据库:图数据库适用于社交网络分析、知识图谱构建、路径规划等领域,例如社交关系分析、网络安全监控、推荐系统等。
图4-1数据库建库流程图
(一)建库流程
分等数据库的建立包括图形数据库的建立和属性数据库的建立以及空间数据与属性数据的联接(图4-1)。其具体内容包括原始数据的收集整理与入库要素的选择、图纸的扫描矢量化、图形坐标系变换与数据编辑、属性数据整理编码和输入、图形数据与属性数据的联接等过程。
(二)图形数据库的建立
1.图形预处理
图形资料的预处理包括检查、修改、清绘、坐标格网调整、制图综合等。图形预处理是为简化图形数字化工作而进行的图层要素整理与删选过程。采用扫描数字化时,对每个专题要素都必须加工数字化原稿,并且确保原稿的质量,要求线划均匀、墨色深浅一致、交接关系清楚、相邻线段间距清晰、图面干净无污点。
2.图件的扫描与纠正
对农用地分等基础图件进行扫描,对于扫描后发生旋转和扭曲变形的地方,使用专业软件进行纠正。
3.坐标配准
在矢量化之前对分等基础图件进行坐标配准。使用GIS软件多元图像分析系统,完成土壤图向土地利用现状电子图件坐标系的配准。土地利用现状图为参照文件,土壤图为校正文件,校正文件以参照文件为标准进行处理。校正文件仅包括MSI图像文件,因此必须把TIF格式的土壤图图像文件转换为MSI文件。
校正文件中的控制点信息是系统处理的主要对象,因此需要在校正文件和参照文件中分别选择一定数量的控制点。在MSI图像中加入了几何控制点后,MSI图像具有了地理坐标的概念,就能完成各种操作,包括图像之间的配准。
4.屏幕矢量化
地图的矢量化是把配准后的栅格图像转换为矢量文件的过程。在GIS软件图形编辑子系统下使用交互式矢量化,完成县级农用地分等基础图件的矢量化工作。
5.图形编辑、修改与拓扑关系建立
对于矢量化好的线文件(*.wl),在GIS软件图形编辑子系统下进行拓扑处理。其步骤为:数据准备——自动剪短线——清除微短线——清除重叠坐标与自相交——检查重叠线——节点平差——线拓扑错误检查——线转弧段——拓扑重建。完成拓扑重建后的文件为区文件(*.wp)。
(三)属性数据库的建立
属性数据的输入可以在GIS软件平台下逐单元手工输入,但操作较慢,而且会造成重复性输入,比如同样土种的土壤属性就要输入多次。属性数据的录入是一项繁琐易错的工作,可选择简单易用的Excel平台进行属性数据的录入,录入后进行1~2次的检查。
GIS软件图形数据的属性字段中有个标识码字段(ID),可以用来作为图形数据与属性数据的公用字段,通过GIS软件属性库管理子系统,可完成图形数据和属性数据的联接。
属性数据主要来源有两方面:第二次土壤普查成果资料,包括土壤类型、土壤表层质地、土体剖面构型、土壤有机质、土壤pH值等原始属性资料;野外实地调查资料,包括投入产出数据、地下水位、灌溉保证率、排水条件等。
(四)图形数据库与属性数据库的联接
在GIS软件属性库管理子系统中完成图形数据与属性数据的联接。GIS软件能够联接的数据库文件有DBASE、FoxPro、VisualFoxPro、Text、Access、Excel等数据库软件生成的文件。通过选择联接文件和被联接文件以及关键字段,使空间数据和属性数据两种数据模型联为一体,由此实现空间数据和属性数据之间的相互查询与检索。
(五)DTM分析与空间分析
在GIS软件数字地面模型(DTM)子系统中,以通过矢量化等高线生成的数字高程模型DEM为分析数据,通过“高程点坡度、坡向”分析,把坡度值写入到已经过图斑统一编码的县级土地利用现状图属性库中。
在空间分析子系统中,把土地利用现状图、土壤图、土壤养分分布图等进行空间合并分析。要求不打破土地利用现状图图斑。空间合并后的单元就具有了土地利用现状图、土壤图、土壤养分分布图上的属性,从而形成了县级分等单元的空间与属性数据库。
(六)分等公式的编辑与计算
在MapGIS属性数据库管理子系统中,把雷州市农用地分等单元的属性数据导出为Excel文件。根据《农用地分等规程》、《广东省农用地分等定级与估价技术方案》中的计算方法,在导出的Excel表格中编辑公式,计算各分等单元的自然质量等指数、农用地利用等指数和农用地经济等指数。以200分为间距划分等级,然后把划分好的等级写入到相应属性字段的属性中。
管相荣
(河南省国土资源厅信息中心郑州450016)
摘要:为了满足大区域控制点综合管理时针对多领域的需求,实现数据的共享所面临的坐标系统、属性结构、投影带、行政辖区、影像重叠区等问题,采用省域控制点图形图像数据库建立的案例分析,省域控制点图形图像数据库存储了控制点的属性、空间位置、图形图像等多项信息,叠合了行政辖区、原始影像、接合图表、投影带等信息,为第二次全国土地调查工作的开展提供了宝贵的资料和经验。
关键词:省域控制点GPS控制点图形图像数据库
0引言
为确保“2010年全国耕地面积不少于18亿亩(1.2亿hm2)的红线”,国家已经启动第二次全国土地调查,利用先进的技术和方法,力求建立“四级联动、上下互通”、“高保真”的土地利用数据库,实现土地管理的信息化、网络化。河南省作为全国人口和农业大省,土地总面积约16.7万km2,2007年人均耕地面积813.4m2,低于全国平均水平,在国家严控耕地面积的严峻形势下,如何摸清土地家底、有效集约管理土地资源尤为重要。近年来,河南省运用先进的“3S”技术和通信技术,已经开展了多项土地资源监测、地籍调查方面的研究。全国高分辨率影像数据处理及数据库建设项目(以下简称“遥感项目”)是第二次全国土地调查的先导,旨在为其提供宝贵的经验。河南省作为项目试点之一,2005年以GPS实测点为控制数据,影像数据均采用SPOT5遥感影像,对平顶山、许昌、漯河、安阳四个地市的遥感影像进行处理,精度满足要求。2007年项目在全省铺开,布设控制点数达上千个,按照《SPOT5_2.5m数字正射影像图制作技术规定》及《第二次全国土地调查底图生产技术规定》的要求,对影像处理必须精确,影像纠正控制点是土地信息提取的关键所在,如何综合管理这些控制点数据十分必要;同时,就我国GPS控制网而言,GPSABC级点布设达上万个,而以此为基准的下一级GPS控制点将更多,对其进行分板机统筹管理也势在必行。
影像纠正控制点的获取途径有两种:一种是GPS实测,另一种是从大于等于调查底图比例尺的已有图件上采集。遥感项目河南试点控制数据均为GPS实测点,省域控制点管理包括GPS实测点和图形图像控制点,涉及跨省域、投影带、属性结构设定、编号、叠加分析、条件查询、图形查询、精度评定、点位分布联测略图等问题,有必要根据实际的工作底图情况,建立控制点图形图像数据库,实现控制点位置信息、属性信息、图形图像信息的统一管理,力图为同类研究提供参考。
1控制点基础信息获取
1.1控制点的布设与测量
项目控制点布设的工作底图是SPOT5_2.5m遥感影像,河南省域涉及80多景SPOT5影像,受卫星数据获取周期的影响,影像是分批次提供的,为保证项目进度,控制点的布设采用先来先选的原则分批次进行。选取要求有:
(1)选取影像清晰、易于判别、交通便利的明显特征点,如影像特征明显的农村道路交叉路口,并读取概略经纬度;
(2)均匀分布,控制区域大于工作区范围,每景控制点数不少于25个,山区适当增加;
(3)边缘选点,相邻影像重叠区不少于2个同名公共点;
(4)模糊定位、圈定范围,为便于精确定位点的灵活性,采用800像素×800像素的正方形选框,外业测量时可以在此选框内灵活定点,一般要求选框中间点位优先选用;
(5)内业选点难以测量时,可适当在该点附近重新选点,外业要作详细记录。
项目区覆盖多景影像,为的是选点均匀,公共点布局合理,在选取某景影像控制点时应同时参照相邻景,单景保证四角有点,其间三角形布点。控制点编号采用××××××_××××××_××,第一个“_”前为控制点所在景号,第一、第二个“_”之间为控制点所在影像的时相,共6位,采用年月日格式,第二个“_”后为控制点所在影像内序号,如273280_061101_10,表示景号为273280、时相为2006年11月1日的影像上的第10个控制点,另外在测量成果表中增加测量编号和标准编号,测量编号是控制点布设实时编号,对应外业测量表中的序号,标准编号则按1∶1万标准图幅为基准,自上而下、自左而右的编号,如I49G030050,以求更好地管理和应用控制点基础资料,为此我们设计了控制点测量成果表。
考虑到项目区山区、丘陵、平原均有分布,不同地形都选取检查点,在布点时类同控制点选取,只是在影像正射纠正时根据参与运算与否才设定其是控制点或是检查点。三种地形特征检查点可以从不同地形下分析控制点精度,对于布点较为困难的山区,可以打破单景的局限,采用区域布点检查法。
以国家C级GPS大地控制点为基准,采用静态方式同步进行观测,3套GPS接收机为一组,观测时段长度为45min,卫星高度角≥15°,有效卫星总数≥4个,作业员现场填写外业测量记录表,测队队员定时进行业内汇合,整个省域全部控制点测量耗时近1年,共完成1454个控制点的测量。
项目共布设13个测区,外业实地测量均采用环形布点形成一个整体的GPS控制网,各测区以不同的颜色表示,控制点间平均距离约13km,点位序号是项目区需要测量的纠正控制点测量编号,不足4位的前加“P”表示,前面加“C”的点则表示已有的C级GPS控制点。
1.2控制点坐标及投影带的设置
控制点有4套坐标系统:西安1980坐标、北京1954坐标、WGS84坐标、概略经纬度及高程。
项目采用高斯-克吕格投影3度分带、1985国家高程基准、北京1954坐标系。河南省域跨越37、38、39带,测量的坐标数据存在3套数据,通常构建数据库时坐标系统的中央经线为114°,即38带。为确保整个省域建库数据为统一的坐标系统,就应把37带、39带内的控制点进行换算,一般采用高斯投影、反算公式间接换带计算。现在把37带、39带的控制点坐标换算成38带,见表1。实测测量时,可通过仪器设置或基于坐标换带公式原理开发的专用软件换算。
表1GPS控制点3度分带相邻带坐标换算对应表(河南省)
续表
1.3属性结构设定
为便于管理控制点图形图像数据库,并为后续国土研究提供基础资料,因此尽可能详述控制点的属性信息。表2是设定的控制点库表结构。
表2控制点文件属性结构一览表
属性结构设定的特色:
(1)3套编号系统(标准编号、景内编号、测量编号)。标准编号是所有GPS实测控制点选取完毕后,为便于管理,以1∶1万标准图幅为底图采用“自上而下、自左而右”原则重新编号,命名采用“1∶1万标准图幅号_图幅内序号”;景内编号则是就单景而言,景号_时相_景内序号命名;测量编号则是在项目实施中实际工作选点编号,作为控制点成果表整理及入库的依据。
(2)4套坐标数据(北京1954坐标、西安1980坐标、WGS84、概略经纬度)。概略经纬度可以对控制点在实地测量前进行模糊定位,此外也为了后期插叙的需要,例如,对一景现实性影像,通过幅宽经纬度可查询到其间大致所覆盖的控制点信息,减少了选点、测点等重复性工作。
(3)挂接点位影像、图形及实地信息。控制点影像库不仅有点的属性描述,也有点位图形和实测信息,使控制点信息更加丰富。
(4)与权属库、接合图表、影像范围图叠合,便于查看控制点的区域型分布、与影像及图幅间的关系。
1.4与遥感影像的套合
控制点是遥感影像定位的基本参照信息,已知工作区的DEM和影像控制点坐标信息,就可以对影像进行几何纠正和投影差改正,制作数字正射影像图(DOM),提取土地利用现状信息,构建土地利用数据库,此亦第二次全国土地调查的前期业内工作。通常,我们是先在原始影像上布设控制点,测量其坐标信息,然后影像处理,即影像选取点、点定位影像的工作模式。但建立河南省控制点图形图像数据库后,对省域内任意工作区的影像,即没有投影和平面坐标信息的现时性影像,可以通过影像头文件找其所包含的控制点信息,避免了重复选点、测点。
控制点影像数据与遥感影像的套合、叠加查询分析,需要两者间存在恒定的某种信息。控制点是地球上的固定点,SPOT5遥感影像的头文件里显示影像获取时间及影像的经纬度坐标(大地坐标),为避免大地坐标与高斯平面坐标转换时的误差影响影像处理精度,目前只能通过两者的经纬度坐标,对影像包括的控制点信息进行模糊查询,然后再准确定位点。在MapGIS平台中,可以通过影像的经纬度坐标将其范围框直接定位到控制点图形图像数据库的平面坐标工程上,很直观地查看三者间的关系,如图1所示。
图1控制点、影像、行政区空间关系图
2控制点图形图像数据库构建
经过“布点、测点”后,在ERDAS软件的LPS模块里对控制点进行严格的精度检查,只有满足精度要求后才可入库,具体流程如图2所示。同时设定了数据库文件的组织(表3)。基于上述数据库建设思路,在MapGIS平台上构建了控制点图形图像数据库,如图3所示。
图2GPS控制点图形图像数据库建库流程
图3河南省GPS控制点图形图像数据库
表3GPS控制点图形图像数据库文件
3结论
控制点作为基础地理数据,其重要性不言而喻,河南省域共布设1000多个实测控制点,历时近1年,耗费了相当的人力物力,控制点图形图像数据库的建立旨在实现信息共享,避免资源浪费,为国土及其他领域的研究提供了宝贵的基础资料,尤其是在第二次全国土地调查河南工作区,控制点图形图像数据库对调查底图制作起到了十分重要的作用。另外,省域型控制点图形图像的建立也为大区域多数量控制点数据的综合管理提供了点滴参照。当然也有未涉及的内容,如不同等级控制点的管理、控制点的三维布局再现等。
参考文献
GB/T18314—200《1全球定位系统(GPS)测量规范》[S]
苏小霞,李英成.2006.全国多级多分辨率图形图像控制点数据库的建立与应用展望[J].遥感技术与应用,21(3):265~230
王之卓.1990.摄影测量原理(英文版)[M].武汉:武汉测绘科技大学出版社
曾福年,赵翠玲.2006.图像控制点库的建立及应用方法探讨[C].2006年中国土地学会学术年会论文集
张继贤,马瑞金.2000.图形图像控制点库及应用[J].测绘通报(1):15~17
(原载《郑州大学学报(工学版)》2008年第2期)