在线刊号(2320-9801)印刷刊号(2320-9798)
音频分类检索系统综述
在当今的环境下,大多数的检索算法都是基于文本的算法,因此我们无法对乐器进行分类。在大多数检索系统中,分类可以根据任何文档中的术语频率和使用片段来完成。现有的搜索引擎(如Yahoo,谷歌,AltaVista等)基于关键词和片段进行相似度搜索,但有时用户可能无法用文字表达查询,因此我们不得不切换到音频检索系统。在现有的音像检索系统中,基于内容的检索系统用户可以从某段视频短片中输入任意的查询,从画草图到唱一首歌,再到某段视频片段或一组图像,进行视频检索。从[11]可以看出,基于内容的检索系统对错误查询有更大的容忍度,因为在这些系统中查询包含更多的错误;因此,基于近似匹配的相似度搜索结果比精确匹配的相似度搜索结果更好。在现有的系统中,系统分类是基于音频对象表示、索引结构和所使用的检索技术。在我们提出的系统中,我们通过识别声音的音色来提取声音。在现有的音频检索系统中,提取特征的方法有两种,一种是线性预测编码,另一种是感知线性预测。在本文提出的音频信息提取系统中,我们使用了音乐信息检索工具箱(MIR工具箱),利用混合选择方法提取音频描述符。 After finding audio descriptor we identify the musical instruments with the help of vector quantization
Priyanka S. Jadhav。, Saurabh . Deshmukh