Untitled Document

　　可以从以下几方面改进和完善查找、分析和检索的性能：
　　3.7.4.1 附加的分析特性
　　开发用于基于内容的分类和检索引擎进行音频的声学特性分析，并把它们缩减为几个统计值。分析得到的这些特性应是很简单的，它足以描述大量的相关的声音。应该加入更多的分析，以处理特殊领域的问题。
　　3.7.4.2 通用短语层次的基于内容的检索
　　当前的声学特性是针对短的或个完整的声音。作为时间轨迹匹配这些特性集或匹配已切分的独立声音序列，应允许基于短语层次的音频内容的存储和检索。例如，音频到MIDI转换系统就用于匹配的音乐的旅律。
　　3.7.4.3 音源分离
　　在当前的系统中，把同时出现的音源看成一个合奏。我们不试图分离它们，因为这是个很困难的工作。分离同时出现的声音涉及到完形心理学(Gestalt psychology)和非感知的信号处理技术。在音乐应用中，心理音高轨迹已研究了多年，但在般情况下，还是很难处理的。
　　3.7.4.4 声音合成
　　声音合成可以协助用户完成基于内容的查询。当用户不能确定用什么值时，合成特性将建立与当前一组值匹配的一个声音原型，用户可以改善合成的实例，直到与所期望的那种声音足够类似。
　　我们的例子表明模糊查找的功能和用处。有时查找的结果在语义世界上令人惊奇的，但实际结果是有道理的。这些工作仍在进行。进一步实现的系统将展现如何选择声学特性是有效的。