您好,欢迎来到小侦探旅游网。
搜索
您的当前位置:首页基于多音轨MIDI主旋律提取的音乐可视化表达

基于多音轨MIDI主旋律提取的音乐可视化表达

来源:小侦探旅游网
软件2012年第33卷第3期 S0FTWARE 国际IT传媒品牌 基于多音轨MIDI主旋律提取的音乐可视化表达 孙博文 张艳鹏 赵振国 高超 孟繁博 (1.哈尔滨理工大学计算中心,哈尔滨150080I 2.哈尔滨理工大学计算机科学与技术学院,哈尔滨150080l 3.哈尔滨理工大学应用科学学院,哈尔滨150080;4.哈尔滨理工大学电气学院,哈尔滨150080) 摘要:本文以MIDI音乐为研究对象,以表达音乐主旨为前提,提出了一种基于主旋律提取的音乐可视化表达方法。通过对 MIDI文件的特征识别,构造音乐主旋律的提取方法,并将提取出来的主旋律作为音乐视觉表现的主要对象,而其他非主旋律的音乐 元素淡化辅助表示,从而实现更加准确表达音乐核心之目的,以达到更好的视听效果。 关键词:音乐可视化;MIDI音乐;音乐特征提取;主旋律提取 中图分类号:TP391 文献标识码:A DOI:10.3969 ̄.issn.1003—6970.2012.03.019 Music Automatic Classification Approach Based on Fractal Dimension SUN Bo—wen ,ZHANG Yan.peng ,ZHAO Zhen.guo ,GAO Chao ,MENG Fan.bo (1.Computing Center,Harbin University ofScience and Technology,Harbin 150080; 2.Computer Science and Technology,Harbin University ofScience and Technology,Harbin 1 50080; 3.AppliedScience,Harbin Universiyt ofScience and Technology,Harbin 150080;4.Electric,Harbin Universiyt ofScience and Technology,Harbin 150080) [Abstract]This article takes MIni music as research object,on the premise ofexpressing music hetme and then put forward a meth- od which is based on the extraction of melody to express music visualization.Through the characteristics identification of MIDI,create a method of melody extraction.And the melody extracted from music represent as a visual object of music visualization.The other element will be represented lightly ̄So as to achieve a more accurate expression music core purposes and better audio-visual effects. [Key words]Music visualization;MIDI music;MIDI’S music feature extraction;melody extraction 0 引 言 音乐可视化(Music Visualization)是对音乐表达的一种 非主观的解释和判断,是为理解、分析、比较音乐的表现力和内 部结构提供的一种呈现技术…。它是跨音乐 数字音频、图形 学、图像处理、虚拟现实等领域的又一新的研究方向,在娱乐、 教育、艺术和商业中具有广阔的应用前景。作为一种全新的视 为研究的数据源。 1 多音轨MIni文本文档的创建 1.1 MIDI的基本格式 MIDI结构如下图1所示 。具体说明如下: 一个文件头块 多个音轨 听技术,近年来,音乐可视化也引起了科研人员的密切关注。 但是现今的音乐可视化方法多将各音乐元素看成整体进 行统一展示,未能将主旋律与辅旋律区分开来,以至于无法突 出音乐所要表现的主体内容。如:一些音乐中的激烈背景鼓点 块标识 MTrk) 块长度 块标识{MTrd) 块长度 格式信息 音乐头 MIDI事伺 可能会掩盖同时出现的主旋律所要表达的可视化内容。 鉴于此,本文提出了一种基于主旋律提取的音乐可视化表 达方法,将音乐主旋律提取并进行突出可视化显示,同时辅以 音乐的辅助旋律进行背景淡化显示。 金毅等人通过研究指出 :从自然声音文件中提取旋律特 征的处理过程复杂、难度高,精确度差。而结构化声音MIDI, 其构造方式是以音乐元素的组织结构为基础的,所以为音乐特 征的自动识别提供了极大的方便,因此本文选取MIDI乐曲作 通道信息 系统信息 通道模 通道声 系统一 系统实 系统专 式信息 音信息 般信息 用信息 用信息 图l MIDI音乐格式 (1)文件头: 十六进制代码为:4d 54 68 64l 00 o0 o0 06I ff ff nn nnI dd dd,其中: 基金项目:全国大学生创新实验资助编号:(101021434) 作者简介:孙博文(1963-),男,哈尔滨理工大学计算中心,副教授,音乐可视化及分形理论,sunbowen@hrbust.edu.CDI张艳鹏(1987-),男,哈尔滨 理工大学计算机学院研究生,音乐可视化,yanpeng873@163.corn。 软件杂志欢迎推荐投稿:http://www.ccomsof1.corn/ ・64 软件 (您的文章得到院士的关注) 孙博文等:基于多音轨MIDI主旋律提取的音乐可视化表达 (4)再下一行为音乐具体特征:如第二个字符1.220为音符 开始时间,第三个字符E2代表音高,第四个字符V127代表音 符力度值,第五个字符代表音符持续时间,第六个字符代表音 色。 ・4d 54 68 64:前四个是ASCII字符“MThd”是用来 鉴别是否MIDI文件。 ・00 00 00 06:指明文件头描述部分的字节数,它一定是6。 ・ff ff:文件的格式,有3种格式:0——单轨;1——多轨, 同步;2——多轨,异步。 ・nn nn:MIDI文件中的轨道数。(注:MIDI的数据是由 若干个格式相同的子数据构成的,这些子数据在多音轨的格式 中记录了一个轨道的所有信息。多加一个音轨,就把数据追加 在前一音轨的后面就可以了,同时更改此数据)。 ・dd dd:每个4分音符delta-time节奏数。 (2)轨道块(数据描述) 全局音轨:包括歌曲的附加信息(比如标题和版权)、歌曲 速度和系统码(Sysx)等内容。音符音轨:包含音符信息的音轨。 ・4D 54 72 6B:不管是全局音轨还是含有音符的音轨, 它其实是ASCII字符“MTrk”。 ・XX XX XX XX:其后跟着一个4个字节的整数,它标志 图3 MIDI音乐特征文本 了该轨道的字节数,这不包括前面的4个字节和本身的4个字节。 ・数据:接着是记录数据的地方了,每一个数据有着相同 的结构:时间差+事件。 3多音轨MIDI的主旋律提取 采用MIDI音乐文件作为数据源,但MIDI文件几乎都是 多音轨的,而且主旋律通常就隐藏在其中的某些音轨或音轨片 段中 ,所以必须先对MIDI文件进行音轨分解,得出主旋律音 轨才能为其所用。 1.2文本文档创建 为了便于提取MIDI的音乐特征,需要根据MIDI基本格 式将二进制MIDI文件编译成为十进制文本文件(不破坏MIDI 结构)。其基本原理是:将每8位二进制位对应一个十进制数, 逐个翻译。图2为乐曲((Canon}}的十进制文本文件: 本文采用文献[6]提出的基于H—K算法的MIDI音乐主 旋律提取方法来提取MIDI主旋律。H—K算法针对两类或多 类分类问题,在特征空间中寻找一个最优的超平面作为两类的 分割平面川。此方法具有有效性及可行性,并且计算简单,易于 实现,对于主旋律分布于一个音轨上的MIDI音乐有很高的准 确性。具体做法如下: (1)根据文献[6]提供的公式从MIDI文件中计算并提取 相应特征,包括:左右声道平衡度,音量,音长,力度,音高,音 程。 (2)H—K算法的主旋律提取: ①应用文献[8】中提到的一些基本的主旋律判别方法排除 一下明显不是主旋律的音轨,这样做可以提高算法的准确性。 ②由左右声道平衡度、音量、音长、力度、音高和音程构 成一个6维特征空间,音乐特征矢量x--(xl, 2, , 4, 5,x6) 2多音轨MIDI特征提取 基于上节所述MIDI音乐结构特征规则标记,从已经转译 的十进制文本文件中提取出各个音轨信息,包括:节拍,开始时 间,音高,力度,持续时间,音色。构建MIDI音乐特征文本。图 3为MIDI音乐特征文本。说明如下: (1)第一行为这首音乐每节的单元数。 (2)第二行为第一音轨开始标记。 对应于特征空间中的一个点,运用已知的样本进行学习产生 一个最优超平面d(x)--WoX+W -0,将特征空间划分成两个子 区域,使不同模式类分布在不同的子区域中并将特征量符号 规范化得到特征量增广矩阵X,引入N维余矢量b>O,于是 不等式方程组变为:w ≥b>O。使用平方误差标准函数: . 2 J(w,b) Ilwo’ —bI ∑( 薯一 )==>minH—K算法将准则 l 函数 十)视作W和b的函数,在迭代过程中不断修正w并调整 6,最终求得准则函数J关于W和b的极小值点,作为判断主旋 律音轨的依据。 (3)第三行开始分节拍显示,M001代表第一节拍,后边的 1/2代表1/2拍。 软件杂志欢迎推荐投稿:http://www.ccomsoft.com/ 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- xiaozhentang.com 版权所有 湘ICP备2023022495号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务