可以从以下几方面改进和完善查找、分析和检索的性能: 3.7.4.1 附加的分析特性 开发用于基于内容的分类和检索引擎进行音频的声学特性分析,并把它们缩减为几个统计值。分析得到的这些特性应是很简单的,它足以描述大量的相关的声音。应该加入更多的分析,以处理特殊领域的问题。 3.7.4.2 通用短语层次的基于内容的检索 当前的声学特性是针对短的或个完整的声音。作为时间轨迹匹配这些特性集或匹配已切分的独立声音序列,应允许基于短语层次的音频内容的存储和检索。例如,音频到MIDI转换系统就用于匹配的音乐的旅律。 3.7.4.3 音源分离 在当前的系统中,把同时出现的音源看成一个合奏。我们不试图分离它们,因为这是个很困难的工作。分离同时出现的声音涉及到完形心理学(Gestalt psychology)和非感知的信号处理技术。在音乐应用中,心理音高轨迹已研究了多年,但在般情况下,还是很难处理的。 3.7.4.4 声音合成 声音合成可以协助用户完成基于内容的查询。当用户不能确定用什么值时,合成特性将建立与当前一组值匹配的一个声音原型,用户可以改善合成的实例,直到与所期望的那种声音足够类似。 我们的例子表明模糊查找的功能和用处。有时查找的结果在语义世界上令人惊奇的,但实际结果是有道理的。这些工作仍在进行。进一步实现的系统将展现如何选择声学特性是有效的。 |