时间:2016-01-11 11:12 文章来源:http://www.lunwenbuluo.com 作者:韩红旗 点击次数:
水利工程的建设和管理与其所在地的地形、地质、社会、经济以及河流的水文等空间要素有关,而GIS善于处理和分析空间信息,因此大多水利工程在信息系统中采用了GIS技术。GIS是空间数据库发展的主体。GIS中含有大量的空间和属性数据,有着比一般关系数据库和事务企业管理信息化数据库更加丰富和复杂的语义信息,隐藏着丰富的知识。
空间数据挖掘和知识发现技术,一方面可使GIS查询和分析技术提高到发现知识的新阶段,另一方面从中发现的知识可构成知识库用于建立智能化的GIS系统,同时也将促进3S(GIS/RS/GPS)的智能化集成,因此很有必要探讨GIS系统与数据挖掘系统的结合方式。当数据挖掘系统工作在一个需要与其他信息系统成分通信的环境下,可以采用不耦合、松散耦合、半紧密耦合和紧密耦合4种方案。不耦合方案虽然简单,但缺点不少,是一种非常糟糕的设计。雷宝龙和李春梅提出了GIS与空间数据挖掘集成的3种模式:松散耦合式、嵌入式和混合型空间模型法。
在此基础上对上述3种模式进行了改进,以适合于水利工程GIS系统和空间数据挖掘系统的集成。
4.1嵌入式
嵌入式是将数据挖掘系统融入到GIS中,也就是说系统既是一个GIS系统,又是一个数据挖掘系统。嵌入式的优点是可以充分利用GIS系统所提供的空间数据处理和分析功能来开发数据挖掘系统,减少了开发的工作量,降低了开发的难度;其缺点是数据挖掘功能被限制在特定的GIS系统中,难以移植到其他的GIS系统上,而且这种方式会因为考虑到一种用户的需求,而限制另一部分用户的需求,从而使系统功能的开发受到限制。
4.2松散耦合式
在松散耦合式下,数据挖掘系统和GIS系统实际上是两个独立的系统,数据挖掘系统从GIS中获取空间数据和属性数据,经过清洗、过滤和变换后存入自身的数据库或数据仓库中,数据挖掘所进行的其他工作与GIS系统没有任何联系。这种模式的优点是数据挖掘系统不依赖于特殊的GIS系统,可以开发出独立的、相对通用的空间数据挖掘系统;缺点是在数据挖掘系统中要融入复杂的空间数据的处理,系统开发的难度很高。
4.3紧密耦合式
紧密耦合式克服了嵌入式和松散耦合式的缺点,既充分利用了原有GIS的处理空间数据的强大功能,降低了开发的难度,又不受制于原有GIS系统的用户需求的制约,具有较大的灵活性,提供了相对独立的数据挖掘功能。其缺点是和原来系统联系密切,开发的数据挖掘系统往往依赖于GIS系统。在这3种结合方式中,紧密耦合式有着明显的优点,是建立水利工程数据挖掘系统优先考虑的方式。
5、水利工程数据挖掘系统模型
文献介绍了国外几个相对比较成熟的空间数据挖掘系统:GeoMiner、MultiMediaMiner、SKICAT等,然后提出了作者领导的空间数据挖掘团队研究和开发的两种空间数据挖掘原形系统GISDBMiner和RSImageMiner,并提出了GIS空间数据挖掘系统的体系结构。文献介绍了现有的数据挖掘模型:OLAM模型和影响域模型,以及GeoMiner原型系统的体系结构,最后提出了一个基于空间立方体的数据挖掘模型。文献提到了Han提出的通用数据采掘原型DBLEARN/DBMINER、Holsheimer等人提出的并行体系结构,以及Matheus等人提出的多组件体系结构,并重点介绍了Matheus等人的多组件体系结构。
水利工程管理决策大多是复杂的非结构化决策,需要进行探查性或查询驱动型的数据挖掘,以方便不同的决策者和专家从不同的领域或角度进行数据探查和分析。一般情况下,在挖掘过程中需要进行人机的多次对话,然后结合人类专家的隐性知识,才能够发现有价值的知识。因此自动化的挖掘方法不适合于水利工程数据挖掘。
6、空间挖掘可以采用的方法与发现的知识类型
数据挖掘在水利工程管理上的应用,不仅可以建设智能型的GIS系统,促进遥感技术和GIS技术的深入应用,还可以从数据中发现潜在的、有价值的知识或规则,用于指导水利工程的建设和管理。一般来说,传统的数据挖掘方法如统计、分类、聚类等都可用于空间数据挖掘,但我们不能简单地把这些方法直接应用在空间数据的挖掘上。
一方面,因为空间数据除了具备一般非空间数据的特征外,还具备拓扑、方位、距离等空间特征;另一方面,传统的数据挖掘算法一般假定数据对象统计不相关、相邻的数据对象是独立产生的,而空间数据的相邻对象间存在着关联和相互影响,因此需要对原有的方法进行改进,使得数据挖掘方法适合于地理空间数据的挖掘。在空间数据挖掘与知识发现中可采用的方法主要有:统计方法、归纳方法、聚类方法、空间分析方法、探测性的数据分析、Rough集方法、云理论、图像分析和模式识别等。能发现的知识类型有:(1)普遍的几何知识,如计算和统计出空间目标几何特征量的最小值、最大值、均值、方差、众数等;(2)空间分布规律,如机井、水库的分布规律。能发现的规则有:(1)空间关联规则,如地下水与降雨量的关系,河水质量与污染企业分布的关系;(2)空间的聚类规则;(3)空间演变规则,如水库泥沙淤积的演变规律,河道周围生态的演变规律。
需要注意的是,为了便于理解空间数据、发现空间联系、发现空间数据与非空间数据之间的关系,应重视可视化的方法在水利工程数据挖掘过程和挖掘结果的使用。
7、结语
利用空间数据挖掘技术,对具有空间特征的水利工程数据进行分析,能够发现潜在有价值的知识,利用这些知识,能够降低工程管理的成本,有效利用建设和维护资金,更好地发挥水利工程的效益,为水利工程的管理决策提供依据。要实现数据挖掘技术在水利工程中的应用,必须研究和解决数据仓库和数据立方体的应用、数据挖掘与GIS集成和水利工程数据挖掘系统模型3个核心问题。本文对这3个问题进行了探讨,认为数据仓库是水利工程数据挖掘的基础,宜采用紧密耦合式结构与GIS系统进行集成,在挖掘模型上可以采用基于OLAP和OLAM的4层框架。
参考文献:
联系方式
随机阅读
热门排行