公務員期刊網(wǎng) 論文中心 正文

分形理論下時間序列音樂識別探析

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了分形理論下時間序列音樂識別探析范文,希望能給你帶來靈感和參考,敬請閱讀。

分形理論下時間序列音樂識別探析

摘要:將分形理論時間序列(混沌序)運用與音樂信號識別,為音樂領域的智能發(fā)展提供實驗依據(jù).首先對分形理論進行質(zhì)性分析,并且提出關(guān)聯(lián)維數(shù)算法,判斷音樂分形程度.接著提出音樂中混沌現(xiàn)象的特征.最后進行實際音樂的實驗分析,以鋼琴曲目《致愛麗絲》、流行音樂《Disco-theque》和哀樂為例,對3種曲目進行材料性質(zhì)分析,分析不同曲目的Lyapunov指數(shù)(判斷時間序列)和關(guān)聯(lián)維數(shù)(判斷分形程度).結(jié)果表明:3種曲目在不同階數(shù)下的關(guān)聯(lián)維數(shù)基本沒有改變,說明不同曲目信號內(nèi)的分形程度具有穩(wěn)定性.

關(guān)鍵詞:分形理論;時間序列;音樂;Lyapunov指數(shù);關(guān)聯(lián)維數(shù)

音樂存在于人們生活中的各個地方,人們可以用音樂表達內(nèi)心的情感,同時也可以用音樂進行人與人之間的溝通交流[1].音樂以及其它語言類學科,都屬于具有顯著代表性的認知模式.隨著科學技術(shù)的發(fā)展,對于音樂的研究不僅僅局限于對音樂的欣賞和分類,更多則是傾向與音樂信號的識別,當前關(guān)于音樂信號識別的研究包括很多方向,如音樂搜索查詢、音樂生理學和自動生成曲目等[2].音樂信號的識別不僅可以運用于心理學和生理學[3],也可以運用于音樂數(shù)據(jù)庫的搜索查詢以及自動作曲.互聯(lián)網(wǎng)信息時代的飛速發(fā)展,音樂信號的信息量非常大,音樂的搜索和數(shù)據(jù)信息的分類非常復雜且困難,要對音樂搜索系統(tǒng)進行智能化升級和高效管理,就需要對音樂信號的特征進行研究,從而對音樂進行正確的分類[4].當前比較通用的歌曲檢索方式就是在網(wǎng)站內(nèi)輸入歌曲的名字或者歌詞的內(nèi)容,但是在實際情況中,人們總是會忘記歌曲的名字或者歌詞,但是不會忘記曲目的旋律,因此在該種情形下就要對自己能哼出的音樂旋律進行特征分析,從而得到信號特征進而在系統(tǒng)庫內(nèi)進行目標匹配.基于此,本研究基于分形理論和混沌特性,分析不同音樂曲目的Lyapunov指數(shù)和關(guān)聯(lián)維數(shù),從而判斷不同音樂信號的時間序列特征和分形程度,為音樂信號識別的智能化發(fā)展提供現(xiàn)實依據(jù).

1分形理論

1.1分形理論的質(zhì)性分析

分形指的是在規(guī)定的意義下部分與整體自相似的部分[5].而在相關(guān)文獻中定義“分形”屬于M維空間內(nèi)的某個點集的集合,在不一樣的方向上含有自相似性,而且含有一個不完整位數(shù)(小于M)[6].也有學者表明“自相似性”跟“分形”的結(jié)構(gòu)相似,指的是整體同部分的相似之處,在直觀方向存在一種構(gòu)造圖,前后2部分僅僅是標度不一樣,其余部分的構(gòu)造方式都相同.觀察的部位不管是近處還是遠處,得到的結(jié)果都一致,學者們就把這種圖稱作含有自相似的框架.如果在改變圖形的尺寸過程中,其余部分的結(jié)構(gòu)并沒有改變,此時該圖形就叫做分形[7].整體上來說,分形的特性包含3個部分:部分和整體具有相似特質(zhì)、構(gòu)造細致和非整數(shù)性(關(guān)聯(lián)維數(shù)).音樂則可以在空間序列上產(chǎn)生整體同部分的自相似性,而且逐漸地發(fā)展成為細致精確的結(jié)構(gòu),該種含有自相似性構(gòu)造的現(xiàn)象就叫音樂分形.關(guān)聯(lián)維數(shù)算法把一維序列中的數(shù)據(jù)組合成為相空間內(nèi)的n維向量a=(a1,a2,…,An),把向量往后挪動h(h為整數(shù)而且是取樣間隔),從而形成n維空間內(nèi)的不同向量a'=(a1,a2,…,An+h)[8].根據(jù)穩(wěn)定的間隔h向右依次挪動就能夠獲得相空間內(nèi)的點集合{ax}x=1,2,…,K,而集合內(nèi)點的個數(shù)可以由K=k-h(huán)+1計算得來.于點集合內(nèi)隨機取一個點當作參考點,以這個點為中心畫圓(半徑為r),再統(tǒng)計該圓內(nèi)除了中心點以外點集合內(nèi)的其他點數(shù),從而獲得關(guān)聯(lián)函數(shù)F,如下式所示:F=1K2∑x≠yGr-Ax-A()y.(1)其中G代表Heaviside函數(shù).如果K趨近于無窮大,那么關(guān)聯(lián)函數(shù)W是集合內(nèi)點間距離的概率函數(shù),設此時吸引子伸展量的最大值為D,此時W的表示公式為:W=r()DL2(n,r),r≤D.(2)其中,L2(n,r)屬于根n和r相關(guān)的常數(shù),L2屬于關(guān)聯(lián)函數(shù)曲線的斜率.如果r1和r2之間的相對距離非常小,則L2(n,r)的計算方法如下式所示:L2(n,r)=dlnDdlnr.(3)其中,d為吸引子中的伸展量,如果r非常小,就可以計算出關(guān)聯(lián)維數(shù).若曲線的斜率隨著嵌入維數(shù)的增大而增大,則說明沒有分形的特征.如果曲線的斜率隨著嵌入維數(shù)的增加而慢慢形成一個穩(wěn)定值,則表明含有分形的特征.時間延遲h的規(guī)定條件有2個:一個是與數(shù)據(jù)采集時間間隔成倍數(shù)關(guān)系;另一個是取值要適當,過小會導致獲取信息會很困難,過大會導致測量存在較大誤差,根據(jù)相關(guān)文獻,h的取值在接近15時,獲得的關(guān)聯(lián)維數(shù)最合適.

1.2音樂中混沌現(xiàn)象的特征

音樂屬于非線性動態(tài)系統(tǒng)[9],其非線性動態(tài)特性內(nèi)部存在著一定的深層次規(guī)律,對其內(nèi)部規(guī)律進行研究可以分成2種序列:時間序列和空間序列.在時間序列上,音樂表現(xiàn)出的形式是由有序慢慢轉(zhuǎn)變成無序,由有序轉(zhuǎn)變成無序的運動序列叫做混沌序[10].關(guān)于音樂的非線性解釋,一般都是音樂線條的非旋律化,而分形理論的核心特征是:無序性、不平衡性以及不確定性.在創(chuàng)作音樂作品時,多種音樂現(xiàn)象能組成某種確定的比例關(guān)系,如果把某個主題當作作品的起始條件,那么在時間序列以及空間序列軌跡上都會產(chǎn)生一定程度的改變,比如:某段旋律不斷重復、逆行和倒影等,接著以特定比例進行擴大和縮小,這些音樂現(xiàn)象都包括在音樂線性過程內(nèi).音樂的存在形式很多,包括音樂的基本屬性、音樂的一般變現(xiàn)方式、音樂的制作以及演奏,這些都有著復雜的時間序列和空間序列,其時空痕跡的擴散也非常復雜.所以,利用非線性的思維和方式進行音樂的特性分析,能夠反應音樂最本質(zhì)的特征[11].時間序列(混沌序)的特征包括:1)邊界性混沌含有吸引域,它的活動范圍一般情況下都是特定的,且不會因為混沌內(nèi)部結(jié)構(gòu)的改變而改變.2)普遍性不同的非線性系統(tǒng)內(nèi),混沌序都會含有相同的特質(zhì),而且不會因為外界環(huán)境的的改變而改變,這就是混沌的基本屬性.3)分形維度在同一個空間里的混沌序,其運動軌跡的重合可以表示成分形維度,該分形維度能夠分為數(shù)個種類,本文使用的分形維度是關(guān)聯(lián)維數(shù)[12].4)量化特質(zhì)對于混沌序,能夠運用Lyapunov指數(shù)[13]研究其穩(wěn)定性,如果該指數(shù)比零大,就表明該混沌序不穩(wěn)定,運動軌跡會根據(jù)指數(shù)產(chǎn)生分離.該指數(shù)的絕對值可以表明序列的混沌程度,距離靠近的點之間,點內(nèi)部的信息丟失量會因為該指數(shù)絕對值的增大而提高,序列或者系統(tǒng)的混沌特性就能夠易于被發(fā)現(xiàn).

2音樂分形實驗及分析

2.1實驗準備

1)實驗設備本研究運用Matlab構(gòu)建一個快速數(shù)字化樂音仿真模型,該模型基于1組正弦波,經(jīng)過音色修飾后合成音樂進行播放,其中音色修飾分為音強隨時間的自然衰減包絡和各諧波成分的能量分配兩個部分.運用格式工廠把將MP3格式的音頻轉(zhuǎn)換成Matlab可以直接讀取的WAV格式,同時利用其截取的功能對音樂片段進行時長截?。?)音樂材料選擇3種不同類型的音樂進行分析,分別是鋼琴曲、流行樂和哀樂,如下表1所示:3)音樂信號提取第1,運用格式工廠把MP3格式的音樂轉(zhuǎn)換成WAV格式,接著進行小節(jié)劃分和A/D轉(zhuǎn)換.第2,分析混沌特性,根據(jù)Lyapunov指數(shù)的大小判斷信號是不是含有混沌特性,也就是時間序列.第3,基于關(guān)聯(lián)維數(shù)算法判斷關(guān)聯(lián)維數(shù),從而分析音樂分形的復雜程度.

2.2音樂信號劃分本研究選擇

3首不同的音樂信號進行劃分,結(jié)果如圖1所示.由圖1可以看出,鋼琴曲《致愛麗絲》的總時長是190s,分成106個小節(jié),每節(jié)1.79s.流行音樂《Discotheque》的總時長是74s,分成35個小節(jié),每節(jié)2.11s.哀樂的總時長是70s,分成32個小節(jié),每節(jié)2.19s.

2.3混沌特性和分形程度分析結(jié)果

首先,對鋼琴曲《致愛麗絲》的混沌特性和分形程度進行分析,結(jié)果如圖2所示.由圖2可以看出,鋼琴曲《致愛麗絲》的Lya-punov指數(shù)上下浮動區(qū)間是在[0.02,0.25]之間,而關(guān)聯(lián)維數(shù)在[13,17.8]之間.經(jīng)典鋼琴曲的維數(shù)起伏非常顯著,表明其分形程度比較強烈.鋼琴曲的創(chuàng)作難度非常大,同時其創(chuàng)作的過程非常繁瑣,這就表示作曲家的能力要很強,特別是針對是經(jīng)典的鋼琴曲.其次,對《Discotheque》的混沌特性和分形程度進行分析,結(jié)果如圖3所示.由圖3可以看出,《Discotheque》的Lyapunov指數(shù)上下浮動區(qū)間是在[0.006,0.0081]之間,而關(guān)聯(lián)維數(shù)在[9.901,15.001]之間.《Discotheque》屬于流行曲風,其創(chuàng)作過程相對來說比較簡單,但是該曲種的節(jié)拍非常強烈,也由非常強的動感,在演奏時音符的改變會充滿了隨機性,這就導致《Discotheque》的關(guān)聯(lián)維數(shù)改變不及鋼琴曲顯著.最后,對哀樂的混沌特性和分形程度進行分析,結(jié)果如圖4所示.由圖4可以看出,哀樂的Lyapunov指數(shù)上下浮動區(qū)間是在[0.052,0.159]之間,而關(guān)聯(lián)維數(shù)在[9.997,16.987]之間.哀樂一般是表示對逝者的思念和沉痛心情,其節(jié)奏的改變都是在相應的范圍之內(nèi),主題的表達非常簡單,主要就是為哀痛和不舍,所以哀樂的關(guān)聯(lián)維數(shù)改變程度最低.

2.4不同差分后的關(guān)聯(lián)維數(shù)

為了保證關(guān)聯(lián)維數(shù)的穩(wěn)定性,對3種曲目的音樂信號進行差分求解,結(jié)果如圖5所示.由圖5可以看出,在進行不同階數(shù)的差分以后,不同曲目信號的關(guān)聯(lián)維數(shù)都在不同階數(shù)下的波動非常微弱,因為試驗過程存在一定的誤差,因此可以認為,不同階數(shù)下關(guān)聯(lián)維數(shù)基本沒有改變,說明不同曲目信號內(nèi)的分形程度具有穩(wěn)定性.

3結(jié)語

本研究為了對不同性質(zhì)的曲目音樂分形的復雜程度進行分析,通過對鋼琴曲、流行樂和哀樂進行音樂信號分析,根據(jù)Lyapunov指數(shù)的大小判斷信號是不是含有混沌特性(時間序列),并根據(jù)關(guān)聯(lián)維數(shù)算法判斷關(guān)聯(lián)維數(shù),從而分析音樂分形的復雜程度.從結(jié)果來看,鋼琴曲的分形程度最高,流行樂次之,哀樂的分形程度最低,而不同曲目內(nèi)的信號分形程度具有穩(wěn)定性.本研究也存在一定的不足之處,選擇曲目的種類比較少,這會對文章結(jié)果的普適性產(chǎn)生一定的影響,這也是文章下一步研究需要改進的地方.

作者:高莉 單位:湖北仙桃職業(yè)學院教育學院

精選范文推薦