索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。可视数据索引是指将数据索引结果通过图形化手段,清晰有效地传达给人们,助于人们理解数据之间的关系和数据自身的变化。可视数据索引在很多领域都有应用,如空间数据索引和时态数据索引

简介

人类的创造性不仅取决于逻辑思维,还与形象思维密切相关。人类利用形象思维将数据映射为形象视觉符号,从中发现规律,进而获得科学发现。期间,可视化关键技术对重大科学发现起到重要作用。数据可视化是关于数据之视觉表现形式的研究;其中,这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。可视数据索引是指通过数据可视化技术来呈现数据索引结果。可视数据索引具有以下特点:交互性。用户可以方便地以交互的方式管理和开发数据。多维性。对象或事件的数据具有多维变量或属性,而数据可以按其每一维的值分类、排序、组合和显示。可视性。数据可以用图像、曲线、二维图形、三维体和动画来显示,用户可对其模式和相互关系进行可视化分析。

空间数据索引

空间数据索引是指依据空间对象的位置和形状或空间对象之间的某种空间关系,按一定的顺序排列的一种数据结构。其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针等。其中包含空间对象的概要信息如对象的标识、外接矩形及指向空间对象实体的指针。作为一种辅助性的空间数据结构,空间索引介于空间操作算法和空间对象之间,通过它的筛选,大量与特定空间操作无关的空间对象被排除,从而提高空间操作的效率。高效的空间索引必须满足以下特殊要求:动态性:由于空间数据趋于大量增长,空间数据的存储通常都以关系数据库为基础,要满足在数据库中可以以任意顺序删除或添加数据对象, 空间索引应不断跟上其变换速度。二级和三级存储管理:空间索引机制需要有效的整合二级、 三级存储。支持多空间算子:空间索引不应只关注一种空间操作的效率(如搜索), 而忽视了其他操作的效率。输入数据和插入顺序的独立:空间索引的效率不应依赖于输入数据的类型和插入的顺序。简单性:复杂的空间索引方法往往会导致实现的错误,对大规模的应用就不能保证充分的强壮。可伸缩性: 空间索引方法应能很好地适应数据库的发展。时间和空间有效性: 空间索引方法的操作应当快速,同时一个索引所占的空间应尽量小。最小的影响: 空间索引方法与数据库系统的融合应对现存系统产生最小的影响1。

时态数据索引

支持事务时间和有效时间的一种索引技术。传 统索引(例如B+-树)采用单值数据、线性的索引技 术,时态数据索引则是非线性的、多维的索引技术。 在建立数据的线性索引的同时,需要建立相应的事 务时间和有效时间维索引。时间是分区段的、非单值的,采用传统的索引技 术存储时态数据,会导致元组的时间区间要被分割 成几块,并映射到不同的索引页上,这会产生重叠 问题,降低检索效率。时态索引除了需要考虑其分 页和数据聚簇之外,还需要考虑其他问题,如数据 的查询方式对时态索引的影响,例如对时间的点切 片查询很有效率的索引,可能降低对数据值的点查 询效率。随着时间的推移,数据增量巨大,可能需 要迁移到其他存取介质上,存取介质的变化也会导 致索引结构的变化。支持事务时间的索引技术:根据不同的数据聚簇方式,事务数据库索引技 术可以分成三种类型: 按键索引、按时间索引和按 键-时间索引。1982年,Ben-Zvi等人提出了反向链(reverse chaining),并由Lum等人于1984年改进了该方法,这是一种按键索引技术,它将当前状态的数据跟历史数据分开存储。因为当前状态下的数据被查询的 多,因此能缩小查找结构,提高查找速度。每个键 的所有版本按照其事务时间的降序排列成一条链,按不同的键形成了多条时间链。在此方法中当前状 态的数据用传统的B+树做索引。历史数据可以从当 前键开始回溯而得到。Gunadhi和Segev提出的AP-树(appended-only tree)是一种按时间索引方法。AP是树是一种ISAM 索引和B+-树相结合的多路搜索树。每一个元组被赋 予一个[起始时间,结束时间]的时间区间,并在起始 时间上作索引。每个叶子结点用(t,b)表示,其中t 表示时间,b是指针,指向其对应的桶,桶内是一些 元组的集合: 它们的起始时间比其前一个元素的起 始时间晚的,而且比t早或跟t相等;每个非叶子结 点的则指向下一层。其更新操作的复杂度为O(1)。支持有效时间的索引技术:历史数据库必须维护数据时间属性的动态变 化。Kanellakis等人提出了Metablock树,实现了对 数据有效时间动态变化的管理。Metablock树是B维 的索引方法,它把二维时间空间的上半部分划分为 多个小块,每个小块有B2数据点。但是Metablock 树是个半动态的结构,因为只支持时间区间的增添 而不支持删除。

本词条内容贡献者为:

宋春霖 - 副教授 - 江南大学

可视数据索引

图文简介

索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。可视数据索引是指将数据索引结果通过图形化手段,清晰有效地传达给人们,助于人们理解数据之间的关系和数据自身的变化。可视数据索引在很多领域都有应用,如空间数据索引和时态数据索引