随着多媒体技术的迅速普及,我们将大量接触和处理多媒体信息,而每一种媒体数据都具有难以用符号化的方法描述的信息线索,例如,图像中的颜色、对象分布,视频中的运动、事件,音频中的音调等。当用户希望利用这些信息线索对数据进行检索时,由于传统的数据库检索采用基于关键词的检索方式,一方面,在许多情况下媒体内容难以用仅仅几个关键词来充分描述,而且作为关键词的图像特征的选取也有很大的主观性,另一方面,用户很难将这些信息线索转化为某种符号的形式。因此,要求数据库系统能够对多媒体数据进行内容语义分析,以达到更深的检索层次,即所谓的基于内容的检索(content-based retrieval),它具有如下特点:
  1. 基于内容的检索的特点:
  ·从媒体内容中提取信息线索。基于内容的检索突破了传统的基于关键词检索的局限,直接对图像、视频、音频进行分析,抽取特征,使得检索更加接近媒体对象。
  ·提取特征的方法多种多样。以图像的特征提取为例,可以提取形状特征、颜色特征、纹理特征、轮廓特征等。
  ·人机交互进行。一般来讲,人对于特征比较敏感,能迅速分辨出目标的轮廓、音乐的旋律等,但对于大量的对象,一方面难以记住这些特征,另一方面人工从大量数据中查找目标效率非常低,而这正是计算机的长处,因此,使用基于内容检索的系统时,人与计算机相互分工配合进行检索。
  ·基于内容的检索是一种近似匹配。在检索过程中,采用逐步求精的办法,每一层的中间结果是一个集合,不断减小集合的范围,直到定位到目标。这一点与数据库检索的精确匹配算法有明显不同。
  基于内容的检索可以利用图像处理、语音信号处理、模式识别、计算机视觉等学科中的一些方法作为部分基础技术。因为基于内容的检索不仅仅是基于内容,而且从应用的关键技术上看,其本质上是一门信息检索技术。它利用认知科学、用户模型、图像处理、模式识别、知识库系统、计算机图形学、数据库管理系统、信息检索等领域的研究成果和方法,研究新的媒体数据的表示和数据模型、有效和可靠的查询处理算法、智能查询接口以及与应用领域无关的系统结构。基于内容的检索与模式识别、图像理解、计算机视觉等学科的重要区别是,基于内容的检索是一种信息检索技术,要能够从大型分布式数据库中以用户可以接受的响应时间查询到要求的信息,它不一定需要去理解和识别媒体中的目标,关注的是以基于内容或特征的方法快速发现信息。

  1.基于内容检索的体系结构
  基于内容的检索作为一种信息检索技术,接入或嵌入到其他多媒体系统中,如超媒体(浏览器)系统、会议系统、多媒体信息系统、关系数据库系统等,提供基于多媒体数据内容的信息查询和检索。因此,将基于内容的检索设计为多媒体数据库的检索引擎结构,在体系结构上划分为两个子系统:特征抽取子系统和查询子系统,如图7.5 所示。
  2.基于内容的检索体系结构
  在体系结构上划分为两个子系统:特征抽取子系统和查询子系统,如图6.5 所示。
   6.5 基于内容检索的体系结构
  
  各个模块的主要功能是:
  (1)目标标识
  目标标识为用户提供一种工具,以全自动或半自动(需要用户干预)的方式标识静态图像、视频镜头的代表帧等媒体中用户感兴趣的区域,以及视频序列中的动态目标,以便针对目标进行特征提取并查询。当进行整体内容检索时,利用全局特征,这时不用目标标识功能。目标标识是可选的。
  (2)特征提取
  对多媒体数据进行特征提取,提取用户感兴趣的、适合检索要求的特征。特征提取可以是全局性的,如整幅图像的视频镜头,也可以是针对某个目标的,如图像中的子区域,视频中的镜头和运动对象等。
  (3)数据库
  生成的数据库由媒体库(集)、特征库(文件)和知识库组成。媒体库包含多媒体数据,如图像、视频、音频、文本等。特征库包含用户输入的特征和预处理自动提取的内容特征。知识库中知识表达可以更换以使用各种不同的应用领域。
  (4)查询接口
  友好的人机交互界面是一个成功检索系统不可缺少的条件,它可以大大提高检索的效率。在基于内容检索中,由于特征值为高维向量,不具有直观性,因此必须为其提供一个可视化的输入手段。可采用的方式有三种:操纵交互输入方式、模板选择输入方式和用户提交特征样板的输入方式。同时应支持多种特征的组合。另外,查询返回的结果需要浏览,应在用户界面提供浏览功能。
  (5)检索引擎
  检索是利用特征之间的距离函数来进行相似性检索。模仿人类的认知过程,近似得到数据库的认知排队,对于不同类型的媒体数据有各自不同的相似性测度算法,检索引擎中包括一个较为有效可靠的相似性测度函数集。
  (6)索引/过滤器
  检索引擎通过索引/过滤模块达到快速搜索的目的,从而可以应用到数据库中的大型多媒体数据集中。过滤器作用于全部数据,过滤出的数据集合再用高维特征匹配来检索。索引用于低维特征,可以用R*树索引来加快检索。
  3.基于内容检索的处理过程
  (1)提交查询要求
  用户查找一个数据对象时,利用系统人机界面提供的输入方式(可视化的输入界面或查询语言)形成一个查询条件。与传统的文本查询不同的是,在将查询条件传递给搜索引擎之前,一般要对所提交的数据进行预处理,在分布式应用中这一点尤为重要。
   6.6 基于内容检索的处理过程
  
  (2)相似性匹配
  将查询特征与数据库中的特征按照一定的匹配算法进行匹配。
  (3)返回候选结果
  满足一定相似性的一组候选结果按相似度大小排列返回给用户。
  (4)特征调整
  对系统返回的一组初始特征的查询结果,用户可以通过遍历(浏览)挑选到满意的结果,也可以从候选结果中选择一个示例,进行特征调整,最后形成一个新的查询。
  如此逐步缩小查询范围,直到用户对查询结果满意为止。