专利摘要
专利摘要
弦乐音乐颤音自动检测方法,它涉及一种在自动音乐标注过程中对弦乐音乐实时检测的方法,以解决在弦乐音乐自动标注过程中,颤音对于自动音乐标注的影响较大以及传统的自动音乐标注方法不能对音乐中的颤音进行自动检测的问题。根据弦乐常用音域的音符数将颤音分为N类,通过音频识别的方法将N类颤音模型训练为匹配对象库;将输入待检测的音乐的音频信号,对音频信号进行特征提取得到特征矢量序列;以统计出来的颤音平均周期为长度对特征矢量序列进行分段;通过音频识别的方法对每一段矢量序列进行识别;连续M或M以上段被识别为同一类颤音的矢量序列所对应的时间段即检测为颤音的时间段。本发明自动检测颤音,去除颤音对于自动音乐标注的影响。
权利要求
1、弦乐音乐颤音自动检测方法,其特征在于它包括以下步骤:
步骤A1、根据弦乐常用音域的音符数N,将颤音分为N类,N表示自然数,通过音频识别的方法将N类颤音模型训练为匹配对象库;
步骤A2、将输入待检测的音乐的音频信号记为s(n),对音频信号s(n)进行特征提取得到特征矢量序列X={x1,x2,...,xs),S代表自然数;
步骤A3、在分帧的基础上,以统计出来的颤音平均周期T为长度对特征矢量序列X进行分段,T代表大于0的实数;
步骤A4、通过音频识别的方法对每一段矢量序列进行识别;
步骤A5、对于设定的参数M,连续M或M以上段被识别为同一类颤音的矢量序列所对应的时间段即检测为颤音的时间段。
2、根据权利要求1所述的弦乐音乐颤音自动检测方法,其特征在于步骤A1和步骤A4中所述的音频识别的方法为矢量量化方法、神经网络方法或隐马尔科夫模型方法。
3、根据权利要求1或2所述的弦乐音乐颤音自动检测方法,其特征在于步骤A5中所述的检测包括以下步骤:
步骤B1、将计数器的值n清零,n为自然数;
步骤B2、从特征矢量序列X中取一段长度为T的矢量序列;
步骤B3、通过音频识别的方法判断长度为T的矢量序列是否为颤音且同时与上一个记录的颤音类别相同,判断结果为是,则进入步骤B4,判断结果为否,则进入步骤B5;
步骤B4、记录该颤音的类别,计数器的值n加1并返回步骤B2;
步骤B5、判断计数器的值n是否大于或等于M,判断结果为是,则进入步骤B6,判断结果为否,则返回步骤B1继续检测;
步骤B6,检测到一段颤音并输出结果;
步骤B7、判断音频流是否结束,判断结果为是,则结束检测过程,判断结果为否,则返回步骤B1继续检测。
说明书
技术领域技术领域
本发明涉及一种音频识别技术和自动音乐标注领域的检测方法,具体涉及一种在自动音乐标注过程中对弦乐音乐实时检测的方法。
技术背景背景技术
自动音乐标注是多媒体技术的一项重要应用,它是指通过对音乐音频信号的分析和处理,自动将其乐谱通过某种形式记录下来,以应用于辅助音乐教学、辅助音乐创作等许多音乐相关领域。虽然近年来自动音乐标注技术已经取得了长足的进步,但是至今仍有许多问题没有得到很好的解决,目前大部分研究成果都是在单个乐器独奏、主调音乐、无特殊技巧演奏等条件之上取得的,多乐器合奏的标注、复调音乐的自动标注、和旋和声的识别、颤音等特殊音效识别等复杂条件下的自动音乐标注进展缓慢。在许多弦乐器演奏的音乐中存在着大量用于修饰或表现乐曲情感、风格的颤音(在乐谱中用“tr”标记)。在针对这类乐器的自动音乐标注研究中,如果不进行颤音检测而直接进行标注是很容易出现错误的,甚至在旋律上让自动音乐标注系统摸不着头脑。一般情况下,颤音在声音效果上是两个连续的音阶快速交替出现,然而恰恰有很多音乐的片段却有非颤音的连续音阶快速交替出现的正常音符,如不加区分则会造成音乐标注上的错误(如误标注成十六分音符或三十二分音符等)。此外,又由于颤音音符出现速率的不确定性,即颤音本身只要求出现快速交替音符而并没有规定具体速率,其速率完全由乐曲需要及演奏者习惯、技术而定,因此如不予以专门检测则会在旋律上使自动音乐标注系统产生错误,目前还没有一种专门针对弦乐音乐颤音的自动检测方法。
发明内容发明内容
本发明为解决在弦乐音乐自动标注过程中,颤音对于自动音乐标注的影响较大以及传统的自动音乐标注方法不能对音乐中的颤音进行自动检测的问题,提供一种弦乐音乐颤音自动检测方法。本发明由以下步骤实现:
步骤A1、根据弦乐常用音域的音符数N,将颤音分为N类,N表示自然数,通过音频识别的方法将N类颤音模型训练为匹配对象库;
步骤A2、将输入待检测的音乐的音频信号记为s(n),对音频信号s(n)进行特征提取得到特征矢量序列X={x1,x2,...,xs},S代表自然数;
步骤A3、在分帧的基础上,以统计出来的颤音平均周期T为长度对特征矢量序列X进行分段,T代表大于0的实数;
步骤A4、通过音频识别的方法对每一段矢量序列进行识别;
步骤A5、对于设定的参数M,连续M或M以上段被识别为同一类颤音的矢量序列所对应的时间段即检测为颤音的时间段。
有益效果:本发明通过在分帧基础上以统计出来的颤音平均周期为长度对特征矢量序列进行分段,并逐段识别,检测出弦乐音乐中的颤音片段,从而实现了对音乐中的颤音的自动检测,以达到去除颤音对于自动音乐标注的影响的目的。
附图说明附图说明
图1是步骤A5中所述的检测的方法流程图;图2是一段测试用的待检测带颤音的弦乐音乐片段的频谱图,从图2中可以看到其中大约0.200秒至2.609秒为颤音,6.889秒至7.969秒为颤音;图3是步骤A5中所述的检测的方法对图2所示的音乐片段进行检测得到的结果(示例程序在步骤A1和步骤A4的对音乐段的识别中使用了基于矢量量化的识别方法),其中横坐标为端点名称,纵坐标表示实际和检测出的颤音端点所对应的时刻,单位为秒, 表示实际颤音端点, 表示检测颤音端点。
具体实施方式具体实施方式
具体实施方式一:本实施方式由以下步骤组成:
步骤A1、根据弦乐常用音域的音符数N,将颤音分为N类,N表示自然数,通过音频识别的方法将N类颤音模型训练为匹配对象库;
步骤A2、将输入待检测的音乐的音频信号记为s(n),对音频信号s(n)进行特征提取得到特征矢量序列X={x1,x2,...,xs},S代表自然数;
步骤A3、在分帧的基础上,以统计出来的颤音平均周期T为长度对特征矢量序列X进行分段,T代表大于0的实数;
步骤A4、通过音频识别的方法对每一段矢量序列进行识别;
步骤A5、对于设定的参数M,连续M或M以上段被识别为同一类颤音的矢量序列所对应的时间段即检测为颤音的时间段。
本实施方式的步骤A1和步骤A4中采用的音频识别的方法为矢量量化方法,另外神经网络方法和隐马尔科夫模型方法也同样适用于本实施方式。在本实施方式的步骤A2中所述的特征提取的过程为:对音频信号s(n)进行采样量化和预加重处理,假设说话人信号是短时平稳的,所以说话人信号可以进行分帧处理,具体分帧方法是采用可移动的有限长度窗口进行加权的方法来实现的,对加权后的音频信号sw(n)计算Mel倒谱系数(MFCC),从而得到特征矢量序列X={x1,x2,...,xs},
MFCC参数的提取过程如下:
(1)对输入的音频信号进行分帧、加窗,然后作离散傅立叶变换,获得频谱分布信息。
设音频信号的DFT为
式中x(n)为输入的音频信号,N表示傅立叶变换的点数;
(2)再求频谱幅度的平方,得到能量谱;
(3)将能量谱通过一组Mel尺度的三角形滤波器组;
对于步骤A5中所述的参数M,定义一个有M个滤波器的滤波器组(滤波器的个数和临界带的个数相近),采用的滤波器为三角滤波器,中心频率为f(m),m=1,2,...M,在本实施方式中令M=24;滤波器组中每个三角滤波器的跨度在Mel标度上是相等的,在本实施方式中取150Mel;三角滤波器的频率响应定义为:
其中
(4)计算每个滤波器组输出的对数能量为:
(5)经离散余弦变换(DCT)得到MFCC系数:
具体实施方式二:参见图1~图3,本实施方式在具体实施方式一的基础上进一步限定了步骤A5中所述的检测由以下步骤组成:
步骤B1、将计数器的值n清零,n为自然数;
步骤B2、从特征矢量序列X中取一段长度为T的矢量序列;
步骤B3、通过音频识别的方法判断长度为T的矢量序列是否为颤音且同时与上一个记录的颤音类别相同,判断结果为是,则进入步骤B4,判断结果为否,则进入步骤B5;
步骤B4、记录该颤音的类别,计数器的值n加1并返回步骤B2;
步骤B5、判断计数器的值n是否大于或等于M(可令M等于3),判断结果为是,则进入步骤B6,判断结果为否,则返回步骤B1继续检测;
步骤B6,检测到一段颤音并输出结果;
步骤B7、判断音频流是否结束,判断结果为是,则结束检测过程,判断结果为否,则返回步骤B1继续检测。
弦乐音乐颤音自动检测方法专利购买费用说明
Q:办理专利转让的流程及所需资料
A:专利权人变更需要办理著录项目变更手续,有代理机构的,变更手续应当由代理机构办理。
1:专利变更应当使用专利局统一制作的“著录项目变更申报书”提出。
2:按规定缴纳著录项目变更手续费。
3:同时提交相关证明文件原件。
4:专利权转移的,变更后的专利权人委托新专利代理机构的,应当提交变更后的全体专利申请人签字或者盖章的委托书。
Q:专利著录项目变更费用如何缴交
A:(1)直接到国家知识产权局受理大厅收费窗口缴纳,(2)通过代办处缴纳,(3)通过邮局或者银行汇款,更多缴纳方式
Q:专利转让变更,多久能出结果
A:著录项目变更请求书递交后,一般1-2个月左右就会收到通知,国家知识产权局会下达《转让手续合格通知书》。
动态评分
0.0