Sistem Pengenalan Chord Pada File Musik Digital Dengan

advertisement
.\'JSTE/..1 PEN<;ENALAN CHORD PADA Ffi_E ll!USJK IJJUITAL IJENU4N
JlrJENOliUNAKAN PITCH CJAS.\' PROFILES JJAN HIDDEN M4RKOV MODE'JA
Ivanna K. llmolins. Adhi Prayogo
SISTEM PENGENALAN CHORD PADA FILE MUSIK DIGITAL
DENGAN I\1ENGGlJNAKAN PITCH CLASS PROFILES DAN
HIDDElV il1ARKOV MODEL
Ivanna k.. Timotius, Adhi Prayogo
I
Fakultas Teknik Elektronika dan Komputer, Program Studi Teknik Elektro,
Universitas Kristen Satya Wacana, Salatiga, Indonesia
[email protected], [email protected]
Chord adalah salah satu elemen utama musik yang dapat memberikan gambaran
sederhana dari suatu karya musik Sebuah sistem yang dapat mengenali chord dari suatu
rekaman musik secara otomatis akan sangat menarik dan bermanfaat. Tulisan ini
mengimplementasikan
sebuah
algoritma
pengenalan
chord
otomatis
dengan
menggunakan pitch class pn!files dan hidden A4arkm• model. Algoritma yang
diimplementasikan menunju kkan tingkat akurasi pengenalan sebesar I 00% untuk file
lagu progresi chord murni dari MIDI, 97,97% untuk file lagu progresi chord murni dari
rekaman gitar, 8\35% untuk file lagu kompleks dari MIDI, dan 59,80% untuk tile lagu
kompleks yang mengandung vokalmanusia.
Kata hmci: chord, pitch class pn?files, hiddeu A1arkov model.
1. Pendahuluan
Sistem pendengaran manusta mempunyai kemampuan untuk menyarikan data
yang kaya dari sinyal audio yang kompleks. Misalnya manusia dapat memahami
percakapan dan menikmati musik. Musik maupun percakapan termasuk sinyal audio
;/
i
yang kompleks Salah satu elemen utama musik adalah chord Rangkaian chord dapat
memberikan gambaran sederhana dari sebuah karya musik.
Transkripsi musik didefinisikan sebagai kegiatan mendengarkan sebuah karya
musik dan menulis notasi musik untuk setiap nada yang menyusun karya musik tersebut.
133
Technc Jurnal Ilnuah Ekktrotcknika Vol.
<J
No.
·~ Oktob~..:r
10 I 0 Hal
L~J
J.f3
,\'/STEM PElWiENALAN L110RIJ PAlM FILE JUUSJK DIGITAL J>ENGAA
AfENOOUNAKAN PITCH ClASS PROFILES DAN HIDDEN JYJARKOV lifOJJEL
lvwma K. Jimotius, Adhi Prayogo
Transkripsi musik dapat juga diartikan sebagai kegiatan mentransformasi unsur - unsur
dari sebuah karya musik ke dalam representasi simboliknya. Transkripsi chord adalah
sebuah lagu yang berpindah - pindah setiap wak1t1 tertentu berdasarkan probabilitas
bagian dari transkripsi musik yang bertujuan mendapatkan representasi simbolik dari
tertenttl. Suatu chord dalam sebuah lagu akan mempunyai kecenderungan lebih kuat
unsur hannoni sebuah karya musik, yaitu nama - nama chord dari karya musik tersebut.
untuk berpindah ke suatu chord tet1entu daripada ke chord lainnya.
Transkripsi chord ini penting dan bermanfaat misalnya bagi pemain musik yang ingin
Terdapat beberapa kesulitan yang dihadapi suatu sistem pengenalan chord
;.)to malls tit anlaran ya aual<tll oun yah.H.Yd JClus aiaL
Metode yang digunakan hingga kini dalam melakukan transkripsi chord adalah
lllU:>Jh.
y aHg u1guuah.aH
u~ug<1H \\do "d
suara yang berbeda-beda, adanya alat musik perkusi, adanya chord yang nada-nadanya
dengan transkripsi secara manual. Caranya adalah seseorang mendengarkan suatu
tidak dimainkan secara simultan (broken chord atau ai]Jeggio), dan adanya melodi lagu.
rekaman musik lalu menuliskan chord-nya dengan mengandalkan kepekaan pendengaran
2. Cllord
dan perasaannya. Tetapi orang yang dapat melak:ukan ini adalah orang - orang tertentu
dengan kepekaan telinga yang baik dan memiliki Jatar belakang musik yang kuat serta
( 'hord Dlt~rupakan sekumpulan nada dengan pnla tertentu Sinyal dari sehuah nada
sudah terlatih secara khusus dalam jangka wakiu lama. Karena itu sebuah sistem yang
yang berbeda memiliki frek. .uensi yang berbeda. Karena itu, sinyal dari dua buah chord
dapat melakukan transkripsi chord secara otomatis akan sangat bermanfaat untuk
yang berbeda, yang disusun oleh nada yang berbeda, akan memiliki karakteristik
membantu orang -
orang yang bam belajar musik atau pemusik pemula untuk
mendapatkan label chord yang benar dari suatu rekaman musik yang dipunyai.
Sistem yang dikembangkan menggunakan Pitch Class Pr<?files· (PCP) sebagai
metode ekstraksi fitur. PCP dipilih karena dapat menampilkan intensitas nada - nada
musikal dari suatu sinyal dengan baik. Hal ini penting karena yang membedakan suatu
chord dari chord yang lain adalah nada- nada penyusunnya. Selain itu, PCP memetakan
nada - nada yang sama dari ok:taf yang berlainan ke dalam satu kelas nada, hal ini juga
akan sangat berb'lma karena chord akan tetap sama jika nada
nada penyusunnya sama,
tidak bergantung pada urutan penyusunannya atau jangkauan okiafnya
Chord dahlm sebuah rekaman musik berubah mengikuti wak'1U, sebagaimana
•
I
I;
•
frekuensi yang berbeda pula.
Chord dalam musik adalah tiga atau lebih nada
nada yang dibunyik:an
bersama - sama (3]. ( 'hord diklasifikasikan berdasarkan interval di antara nada - nada
pembentuknya. Interval dalam musik berarti jarak di antara dua nada musikal. Jenis
chord yang paling umum dan paling sederhana adalah triad, yaitu yang terdiri dari tiga
buah nada. Dua jenis triad yang paling umum adalah major triad dan minor triad. Bila
't
sebuah interval ditambahkan lagi pada sebuah triad, maka akan membentuk se\•e/1111
chord yang terdiri dari empat nada. Sevemh chord yang paling umum adalah dominaut
.•;eve11th chord Contoh major triad, minor triad, dominant sevemh chord dengan root C
yang dituliskan dalam notasi balok ditunjukkan pada Gambar I
halnya kata - kata dalam rekaman percakapan berubah mengikuti wak:tu, karena itu
banyak kerangka kerja dalam pengenalan wicara yang dapat digunakan dengan
modifikasi [ 1]. Sistem yang dikembangkan menggunakan Hiddenlvfarkov Models (HMM)
sebagai klasiiikator yang populer digunakan dalam pengenalan wicara [2].
HMTvf dapat dipandang sebagai pernyataan
.\'late
machiue yang \'IOff'-nya
(a)
(b)
(c)
Gambar 1. Notasi Balok untuk (a) C Major Triad (b) C Minor Triad (c) C Dominant
Seventh.
berpindah - pindah setiap waktu tertentu. Perpindahan antar starr.> dalam sebuah HMM
berdasarkan probabilitas tertentu Hal ini juga bersesuaian dengan sifat chord dalam
134
135
Technc Jurnal Ilnuah Ekktrotcknika Vol.
<J
No.
·~ Oktob~..:r
10 I 0 Hal
L~J
J.f3
,\'/STEM PElWiENALAN L110RIJ PAlM FILE JUUSJK DIGITAL J>ENGAA
AfENOOUNAKAN PITCH ClASS PROFILES DAN HIDDEN JYJARKOV lifOJJEL
lvwma K. Jimotius, Adhi Prayogo
Transkripsi musik dapat juga diartikan sebagai kegiatan mentransformasi unsur - unsur
dari sebuah karya musik ke dalam representasi simboliknya. Transkripsi chord adalah
sebuah lagu yang berpindah - pindah setiap wak1t1 tertentu berdasarkan probabilitas
bagian dari transkripsi musik yang bertujuan mendapatkan representasi simbolik dari
tertenttl. Suatu chord dalam sebuah lagu akan mempunyai kecenderungan lebih kuat
unsur hannoni sebuah karya musik, yaitu nama - nama chord dari karya musik tersebut.
untuk berpindah ke suatu chord tet1entu daripada ke chord lainnya.
Transkripsi chord ini penting dan bermanfaat misalnya bagi pemain musik yang ingin
Terdapat beberapa kesulitan yang dihadapi suatu sistem pengenalan chord
;.)to malls tit anlaran ya aual<tll oun yah.H.Yd JClus aiaL
Metode yang digunakan hingga kini dalam melakukan transkripsi chord adalah
lllU:>Jh.
y aHg u1guuah.aH
u~ug<1H \\do "d
suara yang berbeda-beda, adanya alat musik perkusi, adanya chord yang nada-nadanya
dengan transkripsi secara manual. Caranya adalah seseorang mendengarkan suatu
tidak dimainkan secara simultan (broken chord atau ai]Jeggio), dan adanya melodi lagu.
rekaman musik lalu menuliskan chord-nya dengan mengandalkan kepekaan pendengaran
2. Cllord
dan perasaannya. Tetapi orang yang dapat melak:ukan ini adalah orang - orang tertentu
dengan kepekaan telinga yang baik dan memiliki Jatar belakang musik yang kuat serta
( 'hord Dlt~rupakan sekumpulan nada dengan pnla tertentu Sinyal dari sehuah nada
sudah terlatih secara khusus dalam jangka wakiu lama. Karena itu sebuah sistem yang
yang berbeda memiliki frek. .uensi yang berbeda. Karena itu, sinyal dari dua buah chord
dapat melakukan transkripsi chord secara otomatis akan sangat bermanfaat untuk
yang berbeda, yang disusun oleh nada yang berbeda, akan memiliki karakteristik
membantu orang -
orang yang bam belajar musik atau pemusik pemula untuk
mendapatkan label chord yang benar dari suatu rekaman musik yang dipunyai.
Sistem yang dikembangkan menggunakan Pitch Class Pr<?files· (PCP) sebagai
metode ekstraksi fitur. PCP dipilih karena dapat menampilkan intensitas nada - nada
musikal dari suatu sinyal dengan baik. Hal ini penting karena yang membedakan suatu
chord dari chord yang lain adalah nada- nada penyusunnya. Selain itu, PCP memetakan
nada - nada yang sama dari ok:taf yang berlainan ke dalam satu kelas nada, hal ini juga
akan sangat berb'lma karena chord akan tetap sama jika nada
nada penyusunnya sama,
tidak bergantung pada urutan penyusunannya atau jangkauan okiafnya
Chord dahlm sebuah rekaman musik berubah mengikuti wak'1U, sebagaimana
•
I
I;
•
frekuensi yang berbeda pula.
Chord dalam musik adalah tiga atau lebih nada
nada yang dibunyik:an
bersama - sama (3]. ( 'hord diklasifikasikan berdasarkan interval di antara nada - nada
pembentuknya. Interval dalam musik berarti jarak di antara dua nada musikal. Jenis
chord yang paling umum dan paling sederhana adalah triad, yaitu yang terdiri dari tiga
buah nada. Dua jenis triad yang paling umum adalah major triad dan minor triad. Bila
't
sebuah interval ditambahkan lagi pada sebuah triad, maka akan membentuk se\•e/1111
chord yang terdiri dari empat nada. Sevemh chord yang paling umum adalah dominaut
.•;eve11th chord Contoh major triad, minor triad, dominant sevemh chord dengan root C
yang dituliskan dalam notasi balok ditunjukkan pada Gambar I
halnya kata - kata dalam rekaman percakapan berubah mengikuti wak:tu, karena itu
banyak kerangka kerja dalam pengenalan wicara yang dapat digunakan dengan
modifikasi [ 1]. Sistem yang dikembangkan menggunakan Hiddenlvfarkov Models (HMM)
sebagai klasiiikator yang populer digunakan dalam pengenalan wicara [2].
HMTvf dapat dipandang sebagai pernyataan
.\'late
machiue yang \'IOff'-nya
(a)
(b)
(c)
Gambar 1. Notasi Balok untuk (a) C Major Triad (b) C Minor Triad (c) C Dominant
Seventh.
berpindah - pindah setiap waktu tertentu. Perpindahan antar starr.> dalam sebuah HMM
berdasarkan probabilitas tertentu Hal ini juga bersesuaian dengan sifat chord dalam
134
135
ft:chnc Jurnal Jlmiah Ekktrott:ktuka Vol.
lJ
No 2
Oktob~;:r
.2010 Hal l33
14.3
SISTEM PEN(iENALAN CHORD PADA FILE AJUSIK DIGITAl- DEN(iAJ\
ll1ENGOUNAKAN PITCH CLASS PROFILES DAN JJIDDEN MARKOV ll10DEL
/vmma K. 1/morins. Adln Prayogo
3. Pitcll Class Profiles (PCP)
Nilai elemen-elemen pada vektor PCP
Metode PCP bertujuan untuk membentuk sebuah vektor PCP yang memiliki
Xpcp(it
0
s
1 .:;
lvc - 1, didapatkan dengan
merata-ratakan magnitudo dari sinyal di ranah frek-uensi .{'[k] yang memiliki kelas nada
beberapa elemen pada setiap region waktu tertentu [4]. Tiap elemen pada vekior ini
yang sama:
mewakili intensitas sinyal dari region-region frekuensi yang telah ditetapkan. Apabila
tiap nada pada tangga nada kromatis direpresentasikan oleh sebuah elemen di vektor PCP.
rn--.--
maka vektor PCP ini akan memiliki 12 elemen.
""
Metode PCP dimulai dengan membagi )ile lagu menjadi beberapa .fiwne dengan
4. Hidden
. \1 'll' J
Y lxrkll;
. /1
14)
f'l'·) '
~fttrkov 1l1otlel (HJ\tiM)
uk-uran N Data-data pada tiap frame tersebut x[n] ditransformasikan ke ranah frekuensi
dengan menggunakan Short Time Fourier
Trall.~form
HMM mempakan sebuah sistem pemodelan yang bem1juan unhJk mengenali
(STFT) dengan menggunakan suatu
suatu pola dengan menggunakan proses pembelajaran terlebih dahulu. Sebuah HMM
j endela w[n]:
adalah sebuah proses acak ganda (douh~1· stoc/wslic emces.q [5][6] dengan satu proses
S-1
XsrFT[k,n]== ,Lx[u-m].w[m].e-,::Jrtm .\
acak pokok yang tidak dapat diobservasi (hidden), tetapi hanya dapat diobservasi melalui
(l)
m=O
himpunan proses acak lainnya yang menghasilkan urutan simbol yang terobservasi.
Jenis jendela yang digunakan pada sistem ini adalah jendela Hanning Jenis
jendela ini dipilih karena mempunyai resolusi amplih1do yang bagus dan resolusi
frekuensi yang cukup baik Jendela Hanning dengan orde N diberikan oleh persamaan
berikut:
)lj
. 2mu
ll•[m]=0.5 [ 1-cos ( N- _
1
0
m.:;N
1
(2)
'
I
I
HMM juga dapal dipandang sebagai sebuah automaton acak terbatas dimana setiap sratenya menghasilkan suatu observasi. Transisi antar slate mematuhi properti Markov, yaitu
perpindahan antar state pada HMM orde 11 hanya berganhmg pada 11 swle sebelumnya
Salah satu tipe HMM adalah ergodic HMM dimana setiap state dapat dicapai dari
setiap state lainnya dalam sejumlah langkah tertentu. Pada penerapan konsep HMM
untuk membane,Jtm aplikasi pengenalan chord, setiap chord diwakili oleh sebuah state
Setiap data pada sinyal hasil STFT terjendela kemudian dipetakan ke dalam kelas
dalam proses acak utama. Proses acak utama adalah proses transisi antar chord, yang
nada (pitch class) Kelas nada dari masing-masing data dipetakan dengan menggunakan
mematuh.i properti Markov. Proses acak utama ini tersembunyi. Pada setiap saat t, state
persamaan.
aktif akan menghasilkan sebuah vektor PCP, vektor PCP inilah yang merupakan umtan
p[k]
I
lN.
(k
I\]
log~ j-;:-;-· · .".. .I mod N
1
\lV .ret)
simbol yang dapat diobservasi
1•
(3)
Sebuah HMM A. terdiri dari parameter - parameter A. B, dan
1r.
Pernyataan
1111
sering ditulis dengan
dengan p[k] = 0, I. 2, . . , N1· - l merupakan kelas nada dari sam pel k pad a sinyal hasil
J
'A
(A, B, li)
STFT terjer{dela, N1 merupakan jumlah kelas nada, N merupakan resolusi dari STFT
(5)
yang sama dengan ukuran.fi·ame,t;, mempakan frekuensi cuplik dari sinyal masukan. dan
Parameter A adalah matriks transisi dari hidd<!n :•;talus, dengan A = {o,J dan a 11 adalah
f,,i merupakan frekuensi referensi, misalnya untuk nada A.frer= 440Hz.
peluang nexr sraw q 1 jika prese111 .ware y,
(6)
136
137
ft:chnc Jurnal Jlmiah Ekktrott:ktuka Vol.
lJ
No 2
Oktob~;:r
.2010 Hal l33
14.3
SISTEM PEN(iENALAN CHORD PADA FILE AJUSIK DIGITAl- DEN(iAJ\
ll1ENGOUNAKAN PITCH CLASS PROFILES DAN JJIDDEN MARKOV ll10DEL
/vmma K. 1/morins. Adln Prayogo
3. Pitcll Class Profiles (PCP)
Nilai elemen-elemen pada vektor PCP
Metode PCP bertujuan untuk membentuk sebuah vektor PCP yang memiliki
Xpcp(it
0
s
1 .:;
lvc - 1, didapatkan dengan
merata-ratakan magnitudo dari sinyal di ranah frek-uensi .{'[k] yang memiliki kelas nada
beberapa elemen pada setiap region waktu tertentu [4]. Tiap elemen pada vekior ini
yang sama:
mewakili intensitas sinyal dari region-region frekuensi yang telah ditetapkan. Apabila
tiap nada pada tangga nada kromatis direpresentasikan oleh sebuah elemen di vektor PCP.
rn--.--
maka vektor PCP ini akan memiliki 12 elemen.
""
Metode PCP dimulai dengan membagi )ile lagu menjadi beberapa .fiwne dengan
4. Hidden
. \1 'll' J
Y lxrkll;
. /1
14)
f'l'·) '
~fttrkov 1l1otlel (HJ\tiM)
uk-uran N Data-data pada tiap frame tersebut x[n] ditransformasikan ke ranah frekuensi
dengan menggunakan Short Time Fourier
Trall.~form
HMM mempakan sebuah sistem pemodelan yang bem1juan unhJk mengenali
(STFT) dengan menggunakan suatu
suatu pola dengan menggunakan proses pembelajaran terlebih dahulu. Sebuah HMM
j endela w[n]:
adalah sebuah proses acak ganda (douh~1· stoc/wslic emces.q [5][6] dengan satu proses
S-1
XsrFT[k,n]== ,Lx[u-m].w[m].e-,::Jrtm .\
acak pokok yang tidak dapat diobservasi (hidden), tetapi hanya dapat diobservasi melalui
(l)
m=O
himpunan proses acak lainnya yang menghasilkan urutan simbol yang terobservasi.
Jenis jendela yang digunakan pada sistem ini adalah jendela Hanning Jenis
jendela ini dipilih karena mempunyai resolusi amplih1do yang bagus dan resolusi
frekuensi yang cukup baik Jendela Hanning dengan orde N diberikan oleh persamaan
berikut:
)lj
. 2mu
ll•[m]=0.5 [ 1-cos ( N- _
1
0
m.:;N
1
(2)
'
I
I
HMM juga dapal dipandang sebagai sebuah automaton acak terbatas dimana setiap sratenya menghasilkan suatu observasi. Transisi antar slate mematuhi properti Markov, yaitu
perpindahan antar state pada HMM orde 11 hanya berganhmg pada 11 swle sebelumnya
Salah satu tipe HMM adalah ergodic HMM dimana setiap state dapat dicapai dari
setiap state lainnya dalam sejumlah langkah tertentu. Pada penerapan konsep HMM
untuk membane,Jtm aplikasi pengenalan chord, setiap chord diwakili oleh sebuah state
Setiap data pada sinyal hasil STFT terjendela kemudian dipetakan ke dalam kelas
dalam proses acak utama. Proses acak utama adalah proses transisi antar chord, yang
nada (pitch class) Kelas nada dari masing-masing data dipetakan dengan menggunakan
mematuh.i properti Markov. Proses acak utama ini tersembunyi. Pada setiap saat t, state
persamaan.
aktif akan menghasilkan sebuah vektor PCP, vektor PCP inilah yang merupakan umtan
p[k]
I
lN.
(k
I\]
log~ j-;:-;-· · .".. .I mod N
1
\lV .ret)
simbol yang dapat diobservasi
1•
(3)
Sebuah HMM A. terdiri dari parameter - parameter A. B, dan
1r.
Pernyataan
1111
sering ditulis dengan
dengan p[k] = 0, I. 2, . . , N1· - l merupakan kelas nada dari sam pel k pad a sinyal hasil
J
'A
(A, B, li)
STFT terjer{dela, N1 merupakan jumlah kelas nada, N merupakan resolusi dari STFT
(5)
yang sama dengan ukuran.fi·ame,t;, mempakan frekuensi cuplik dari sinyal masukan. dan
Parameter A adalah matriks transisi dari hidd<!n :•;talus, dengan A = {o,J dan a 11 adalah
f,,i merupakan frekuensi referensi, misalnya untuk nada A.frer= 440Hz.
peluang nexr sraw q 1 jika prese111 .ware y,
(6)
136
137
T-:dmc Jumal llmiah Ekktrot.:knika Vol.
q
Nu . .., Oktob.:r 20 l 0 Hal l :n
Sl\'TF:lif PFlV(,'ENALAN CHORD PATJA FILE MU.\'IK J)JGITAL IJENGAN
ilfENGGUNAKAN PITCH ClASS PROFILES DAN HIDDEN MARKOV ~~ODEL
14::
!1'0111/U
q adalah elemen dari himpunan hidden state {}
K. fhnolilt••. Adhi Prayogo
{qt, q2, q3, ... ,qy} dengan N adalah
jumlah selumh hhkle11 state. Parameter B sering disebut dengan coltfilsiou matrix memuat
dipilih sedemikian sehingga dapat mewakili seluruh jenis chord yang ingin
distribusi probabilitas dari simbol keluaran yang terobservasi. Parameter B memberikan
diklasifikasikan.
2.
informasi peluang munculnya keluaran terobservasi tet1entu pada saat state tertentu:
B
dengan progresi chord yang sama dengan kelompok sebelumnya.
(7)
!bul
l 4 file lagu berisi rekaman progresi chord murni yang direkam dari pennainan gitar
1
(8)
1.:i
file lagu herisi lagu kompleks yang direkam dari MIDI. Lagu kompleks adalah Iagu
umum yang sudah mengandung melodi dan diiringi oleh beberapa alat musik,
h, 1 adalah peluang munculnya r 1 jika sedang berada pada state q,. Parameter ff adalah
lengkap dengan alat musik perkusi. Lagu didapatkan dari file
vektor probabilitas state awal. Jadi maksudnya adalah peluang state pet1ama adalah .\'late
suaranya direkam menjadi.fi/e berfonuat wav.
tertentu:
;rr, = l'[S,
(9),
= q,]
t
I
.file MIDI yang
4. 3 tile lagu berisi lagu kompleks komersial yang mengandung suara vokal manusia
dan diiringi oleh beberapa alat musik.
Pada sistem yang dikembangkan ini dipak:ai fi·ame yang sating overlap dengan
S1 merupakan state pertama. Dalam sistem pengenalan chord,
:tr berarti
peluang sebuah
lagu dimulai dengan chord tertentu.
5. Implementasi dan Pengujian
File musik digital yang digunakan sebagai masukan sistem diubah menjadi .file
musik mono dalam format wav dengan frek'Uensi cuplik 11025 Hz dan kuantisasi 8 bit
Frekuensi cuplik sebesar 11025 Hz dipilih untuk mendapatkan Iebar pita sinyal sekitar
5500 Hz yang sudah cukup untuk mendapatkan informasi hannoni dari nada
nada
musik Selain itu Iebar pita sekitar 5500 Hz dapat menghilangkan pengaruh bunyi pada
frekuensi tinggi seperti bunyi simbal. Penggunaan .file masukan mono dengan frekuensi
cuplik sebesar 11025 Hz, k'Uantisasi 8 bit dipilih untuk mempercepat proses komputasi
I
I
II
I
I
panjangji·ame N
4096 dan data ter-overlap 50%. Dengan frekuensi cuplik dari sinyal
masukan sebesar 11025 Hz, akan menghasilkan.fi·ame sinyal dengan kerapatan sekitar :;
.kame per detik. Panjang_ji-ame ini dipilih karena lagu
lagu pada umumnya, chord baru
akan berganti setelah beberapa ketukan. Jika sebuah sinyal lagu masukan mempunyai
tempo 120 ketukan per menit dan ada bagian lagu yang chord-nya berganti setiap
ketukan, maka dibutuhkanji·ame sinyal untuk setiap ketukan, yang dapat dicapai cukup
dengan kerapatan 120/60 = 2 jimne per detik saja. Karena itu kerapatan 5 frame per detik
yang diimplementasikan sudah memadai untuk menangani lagu - lagu pada umumnya.
Jumlah kelas nada Ne pada PCP adalah 24 ditentukan secara empirik sehingga
menghasilkan akurasi yang terbesar. Gambar 2 menunjukkan hasil vek1or PCP terhadap
sumbu waktu dalam detik.
Sistem chdesain untuk dapat mengenali 3 jenis clwrdji.Jwilies yaitu major chord,
minor chord dan dominant seve11th chord pada l 2 roots yaitu A Bb. B, C C#, D. Eb, E,
F., F#, G, G#. File musik yang digunakan melatih sistem dan yang diuji berjumlah 36 .file
musjk yang terdiri dari 4 kelompok, yaitu
i:
i
I.
14 .file musik berisi rekaman progresi chord murni yang direkam dari MIDI. File
musik yang dimaksudkan pada kelompok ini adalahfile lagu yang mengandung suara
dari satu alat musik yang memainkan suatu umtan chord saja
File ini tidak
mengandung melodi dan atau iringan alat musik perkusi Urutan chord yang direkam
.138
139
T-:dmc Jumal llmiah Ekktrot.:knika Vol.
q
Nu . .., Oktob.:r 20 l 0 Hal l :n
Sl\'TF:lif PFlV(,'ENALAN CHORD PATJA FILE MU.\'IK J)JGITAL IJENGAN
ilfENGGUNAKAN PITCH ClASS PROFILES DAN HIDDEN MARKOV ~~ODEL
14::
!1'0111/U
q adalah elemen dari himpunan hidden state {}
K. fhnolilt••. Adhi Prayogo
{qt, q2, q3, ... ,qy} dengan N adalah
jumlah selumh hhkle11 state. Parameter B sering disebut dengan coltfilsiou matrix memuat
dipilih sedemikian sehingga dapat mewakili seluruh jenis chord yang ingin
distribusi probabilitas dari simbol keluaran yang terobservasi. Parameter B memberikan
diklasifikasikan.
2.
informasi peluang munculnya keluaran terobservasi tet1entu pada saat state tertentu:
B
dengan progresi chord yang sama dengan kelompok sebelumnya.
(7)
!bul
l 4 file lagu berisi rekaman progresi chord murni yang direkam dari pennainan gitar
1
(8)
1.:i
file lagu herisi lagu kompleks yang direkam dari MIDI. Lagu kompleks adalah Iagu
umum yang sudah mengandung melodi dan diiringi oleh beberapa alat musik,
h, 1 adalah peluang munculnya r 1 jika sedang berada pada state q,. Parameter ff adalah
lengkap dengan alat musik perkusi. Lagu didapatkan dari file
vektor probabilitas state awal. Jadi maksudnya adalah peluang state pet1ama adalah .\'late
suaranya direkam menjadi.fi/e berfonuat wav.
tertentu:
;rr, = l'[S,
(9),
= q,]
t
I
.file MIDI yang
4. 3 tile lagu berisi lagu kompleks komersial yang mengandung suara vokal manusia
dan diiringi oleh beberapa alat musik.
Pada sistem yang dikembangkan ini dipak:ai fi·ame yang sating overlap dengan
S1 merupakan state pertama. Dalam sistem pengenalan chord,
:tr berarti
peluang sebuah
lagu dimulai dengan chord tertentu.
5. Implementasi dan Pengujian
File musik digital yang digunakan sebagai masukan sistem diubah menjadi .file
musik mono dalam format wav dengan frek'Uensi cuplik 11025 Hz dan kuantisasi 8 bit
Frekuensi cuplik sebesar 11025 Hz dipilih untuk mendapatkan Iebar pita sinyal sekitar
5500 Hz yang sudah cukup untuk mendapatkan informasi hannoni dari nada
nada
musik Selain itu Iebar pita sekitar 5500 Hz dapat menghilangkan pengaruh bunyi pada
frekuensi tinggi seperti bunyi simbal. Penggunaan .file masukan mono dengan frekuensi
cuplik sebesar 11025 Hz, k'Uantisasi 8 bit dipilih untuk mempercepat proses komputasi
I
I
II
I
I
panjangji·ame N
4096 dan data ter-overlap 50%. Dengan frekuensi cuplik dari sinyal
masukan sebesar 11025 Hz, akan menghasilkan.fi·ame sinyal dengan kerapatan sekitar :;
.kame per detik. Panjang_ji-ame ini dipilih karena lagu
lagu pada umumnya, chord baru
akan berganti setelah beberapa ketukan. Jika sebuah sinyal lagu masukan mempunyai
tempo 120 ketukan per menit dan ada bagian lagu yang chord-nya berganti setiap
ketukan, maka dibutuhkanji·ame sinyal untuk setiap ketukan, yang dapat dicapai cukup
dengan kerapatan 120/60 = 2 jimne per detik saja. Karena itu kerapatan 5 frame per detik
yang diimplementasikan sudah memadai untuk menangani lagu - lagu pada umumnya.
Jumlah kelas nada Ne pada PCP adalah 24 ditentukan secara empirik sehingga
menghasilkan akurasi yang terbesar. Gambar 2 menunjukkan hasil vek1or PCP terhadap
sumbu waktu dalam detik.
Sistem chdesain untuk dapat mengenali 3 jenis clwrdji.Jwilies yaitu major chord,
minor chord dan dominant seve11th chord pada l 2 roots yaitu A Bb. B, C C#, D. Eb, E,
F., F#, G, G#. File musik yang digunakan melatih sistem dan yang diuji berjumlah 36 .file
musjk yang terdiri dari 4 kelompok, yaitu
i:
i
I.
14 .file musik berisi rekaman progresi chord murni yang direkam dari MIDI. File
musik yang dimaksudkan pada kelompok ini adalahfile lagu yang mengandung suara
dari satu alat musik yang memainkan suatu umtan chord saja
File ini tidak
mengandung melodi dan atau iringan alat musik perkusi Urutan chord yang direkam
.138
139
1
llll
urna.l Iltnlah Eh:ktr
t
knikn Vol. 9 o 2 Ok bcr 2ll0 HnJ 133 - 1-'3
PCP Sequence
SJSTEAf PENGENALAN CHORD PAD FILE MU. 'IK Dl 1TAL IJENG
ftfENGGUNAKAN PITCH L"LASS PROFILES DAN Hn>DEN MARKOV MODEL
Ivarma K. Timotht . . Adhi Prayogo
MIDI dan 3 lagu yang mengandung suara vokal manusia. Kepada peserta tes lagu
diperdengarkan sebanyak dua kaJi, haJ ini dilakukan untuk memberi kesempatan berpikir
dan menulis. Nada dasar dari lagu yang diujikan juga diberitahukan terlebih dahulu
kepada para peserta tes. Hal ini dilakukan karena orang yang mampu mengenal i chord
ri I gu t npa ib ri
talenta istimewa dan
r Ia
t rle ih d hulu a alah
ngat j rang ditemui. Tes diberikan kepada I
rang an memiliki
orang yan terdiri
dari 4 orang baru berlatih musik di bawab 5 tahun, 3 orang sudah berlatih musik antara 5
·ngga...kurang_.dar.i i
dab bedatih musik.selama 10 tahun atau lebib.
ambar 3 menunj ukkan grafik perbandingan tingkat akurasi rata - rata pengenalan chnrd
oleh manusia dari tiap kelompok orang dengan pengenalan chord otomatis yang berbasis
HMM.
2
3
4
5
6
7
8
9
10
tlme
Gambar 2. Contoh Vektor PCP.
Proses ekstraksi frtur dari sinyallagu masukan menghasilkan sekuen vektor PCP.
Frame - frame PCP tersebut digunakan untuk membangun sebuah HMM yang memiliki
satu state untuk setiap chord. Sistem yang diimplementasikan dirancang untuk dapat
Dari grafik dapat dilihat bahwa tingkat akurasi sistem dalam mengenali chord
kira - kira se anding dengan orang yang berlatih musik selama l
demikian sistem pengenalan chord otomatis yang telah direalisasikan dapat bermanfaat
untuk membantu orang - orang yang belu m begitu terlatih musik untuk mendapatkan
chord yang benar dari suatu rekaman musik.
Tabel I. Akurasi Sistem Pengenalan Chord.
mengenali 36 jenis chord, oleh karena itu dibentuk sebuah HMM dengan 36 buah state.
Sesuai Persamaan 5, parameter A disimpan dalam sebuah matriks 36 .-. 36 yang
tiap elemennya au berisi peluang tate berikut q1 jika state sekarang adalah q,. Parameter
B untuk tiap stare dari 36 slate diwakiJj oleh sebuah ektor yang berisi mea11 dari tiap
tahun. Dengan
La
JOO
97,97%
85 35%
59,80%
pitch cla.fi.\' untuk .wate tersebut, dan se uah vektor yang berisi standar deviasinya.
Parameter :r disimpan dalam ebuah ektor dengan 36 buah elemen. Masing -- masing
elemen berisikan eJuan state awaJ yang muncul pada pr ses pengenalan.
Hasil pengujian sistem yang telah dibangun ditunjukkan oleh Tabel 1. Hasil
tersebut dibapdingkan dengan kemampuan manusia dalam mengenali chord. Orang yang
I
diuji adalah orang yaug sudah terlatih musik selama jangka waktu yang bervariasi Cara
melakukan tes adalah dengan mend ngar
sejumlal Jagu kepada para peserta, lalu
peserta tes diminta Jan un menuliskan chord dari lagu tersebut. Lagu yang diujikan
berjumlal1 8 buah da i jenis Lagu k mpleks yang terdiri dari 5 lagu dari basil rekaman
140
141
1
llll
urna.l Iltnlah Eh:ktr
t
knikn Vol. 9 o 2 Ok bcr 2ll0 HnJ 133 - 1-'3
PCP Sequence
SJSTEAf PENGENALAN CHORD PAD FILE MU. 'IK Dl 1TAL IJENG
ftfENGGUNAKAN PITCH L"LASS PROFILES DAN Hn>DEN MARKOV MODEL
Ivarma K. Timotht . . Adhi Prayogo
MIDI dan 3 lagu yang mengandung suara vokal manusia. Kepada peserta tes lagu
diperdengarkan sebanyak dua kaJi, haJ ini dilakukan untuk memberi kesempatan berpikir
dan menulis. Nada dasar dari lagu yang diujikan juga diberitahukan terlebih dahulu
kepada para peserta tes. Hal ini dilakukan karena orang yang mampu mengenal i chord
ri I gu t npa ib ri
talenta istimewa dan
r Ia
t rle ih d hulu a alah
ngat j rang ditemui. Tes diberikan kepada I
rang an memiliki
orang yan terdiri
dari 4 orang baru berlatih musik di bawab 5 tahun, 3 orang sudah berlatih musik antara 5
·ngga...kurang_.dar.i i
dab bedatih musik.selama 10 tahun atau lebib.
ambar 3 menunj ukkan grafik perbandingan tingkat akurasi rata - rata pengenalan chnrd
oleh manusia dari tiap kelompok orang dengan pengenalan chord otomatis yang berbasis
HMM.
2
3
4
5
6
7
8
9
10
tlme
Gambar 2. Contoh Vektor PCP.
Proses ekstraksi frtur dari sinyallagu masukan menghasilkan sekuen vektor PCP.
Frame - frame PCP tersebut digunakan untuk membangun sebuah HMM yang memiliki
satu state untuk setiap chord. Sistem yang diimplementasikan dirancang untuk dapat
Dari grafik dapat dilihat bahwa tingkat akurasi sistem dalam mengenali chord
kira - kira se anding dengan orang yang berlatih musik selama l
demikian sistem pengenalan chord otomatis yang telah direalisasikan dapat bermanfaat
untuk membantu orang - orang yang belu m begitu terlatih musik untuk mendapatkan
chord yang benar dari suatu rekaman musik.
Tabel I. Akurasi Sistem Pengenalan Chord.
mengenali 36 jenis chord, oleh karena itu dibentuk sebuah HMM dengan 36 buah state.
Sesuai Persamaan 5, parameter A disimpan dalam sebuah matriks 36 .-. 36 yang
tiap elemennya au berisi peluang tate berikut q1 jika state sekarang adalah q,. Parameter
B untuk tiap stare dari 36 slate diwakiJj oleh sebuah ektor yang berisi mea11 dari tiap
tahun. Dengan
La
JOO
97,97%
85 35%
59,80%
pitch cla.fi.\' untuk .wate tersebut, dan se uah vektor yang berisi standar deviasinya.
Parameter :r disimpan dalam ebuah ektor dengan 36 buah elemen. Masing -- masing
elemen berisikan eJuan state awaJ yang muncul pada pr ses pengenalan.
Hasil pengujian sistem yang telah dibangun ditunjukkan oleh Tabel 1. Hasil
tersebut dibapdingkan dengan kemampuan manusia dalam mengenali chord. Orang yang
I
diuji adalah orang yaug sudah terlatih musik selama jangka waktu yang bervariasi Cara
melakukan tes adalah dengan mend ngar
sejumlal Jagu kepada para peserta, lalu
peserta tes diminta Jan un menuliskan chord dari lagu tersebut. Lagu yang diujikan
berjumlal1 8 buah da i jenis Lagu k mpleks yang terdiri dari 5 lagu dari basil rekaman
140
141
·rechne Jurnal Ihniah Ekk-troteknika Vol. 9 No. 2
Oktob~.:r
2010 Hal 133
143
..\'JSTEJ\.1 PENGENALAlV CHORD PAlM FILE f\-fUSJK DlfilTAL DEN(,:-tv
MEN(I(iUNAKAN PITCH CLASS PROFILES DAN HIDDEN MARKOV MODEL
hwma K. Timotius, Adhi Prayogo
100.~o~-~-----·-·----------·----------------,
00.00%+-------------~~------~~-;
6. L. R. Rabiner. "A Tutorial on Hidden Markov Models and Selected Applications in
Speech Recognition," Proceediug olfEJ:..E, vol. 77, no. 2, pp 257-286, Febntari 1989.
60,00% _,______
40,00% _,___ __
2J,OCW.,
33,88%,
64,21~/{l
76.21%
Gam bar 3. Grafik perbandingan tingkat akurasi rata-rata pengenalan chord oleh manusia
dan sistem pengenalan chord otomatis.
6. Kesimpulan
Chord dari sebuah file musik dapat dikenali secara otomatis dengan menggunakan
ekstraksi fitur PCP dan HM.M. Hasil penb'lljian terbaik memberikan tingkat akurasi I 00%
untuk file lagu progresi chord murni dari MIDI, 97,97%) untuk file lagu progresi chord
murni dari rekarnan gitar, 85,35% untuk file lagu kompleks dari MIDI, dan 59,80% untuk
file lagu kompleks yang mengandung vokal manusia.
Daftar Pustaka
l. A.
Sheh dan D. P W. Ellis, Chord Segmellfafiou and Recognition usiiiX E/11-li·ailled
Hidden Markov Models, LabROSA, Dept. of Electrical Engineering, Columbia
University.
2. B. Gold and N. Morgan, Speech and Audio Sig11al Processing: Proc:essi11g am/
Percepliou ofSpec:ch aud AJ11sie, John Wiley & Sons. Inc. 1999.
3. Encarta Encyclopedia. Microsoft ® Encarta
@
2006. © 1993-2005, Microsoft
Corporation.
4. G. Cabral, J P. Briot dan F. Pachet, Impact (?l Distauce in Pitch ( '/m;,, Profile
Computali<J"· Laboratoire d'Infonnatique de Paris, Universite Pierre et Marie Currie,
J
dan Sony Computer Science Lab Paris.
'\ L R Rabiner dan B. H Juang, ··An Introduction to Hidden 1vlarkov Jlvlodels '' IEEE
ASSP /1.1aga::inc: Januari 1986
142
143
·rechne Jurnal Ihniah Ekk-troteknika Vol. 9 No. 2
Oktob~.:r
2010 Hal 133
143
..\'JSTEJ\.1 PENGENALAlV CHORD PAlM FILE f\-fUSJK DlfilTAL DEN(,:-tv
MEN(I(iUNAKAN PITCH CLASS PROFILES DAN HIDDEN MARKOV MODEL
hwma K. Timotius, Adhi Prayogo
100.~o~-~-----·-·----------·----------------,
00.00%+-------------~~------~~-;
6. L. R. Rabiner. "A Tutorial on Hidden Markov Models and Selected Applications in
Speech Recognition," Proceediug olfEJ:..E, vol. 77, no. 2, pp 257-286, Febntari 1989.
60,00% _,______
40,00% _,___ __
2J,OCW.,
33,88%,
64,21~/{l
76.21%
Gam bar 3. Grafik perbandingan tingkat akurasi rata-rata pengenalan chord oleh manusia
dan sistem pengenalan chord otomatis.
6. Kesimpulan
Chord dari sebuah file musik dapat dikenali secara otomatis dengan menggunakan
ekstraksi fitur PCP dan HM.M. Hasil penb'lljian terbaik memberikan tingkat akurasi I 00%
untuk file lagu progresi chord murni dari MIDI, 97,97%) untuk file lagu progresi chord
murni dari rekarnan gitar, 85,35% untuk file lagu kompleks dari MIDI, dan 59,80% untuk
file lagu kompleks yang mengandung vokal manusia.
Daftar Pustaka
l. A.
Sheh dan D. P W. Ellis, Chord Segmellfafiou and Recognition usiiiX E/11-li·ailled
Hidden Markov Models, LabROSA, Dept. of Electrical Engineering, Columbia
University.
2. B. Gold and N. Morgan, Speech and Audio Sig11al Processing: Proc:essi11g am/
Percepliou ofSpec:ch aud AJ11sie, John Wiley & Sons. Inc. 1999.
3. Encarta Encyclopedia. Microsoft ® Encarta
@
2006. © 1993-2005, Microsoft
Corporation.
4. G. Cabral, J P. Briot dan F. Pachet, Impact (?l Distauce in Pitch ( '/m;,, Profile
Computali<J"· Laboratoire d'Infonnatique de Paris, Universite Pierre et Marie Currie,
J
dan Sony Computer Science Lab Paris.
'\ L R Rabiner dan B. H Juang, ··An Introduction to Hidden 1vlarkov Jlvlodels '' IEEE
ASSP /1.1aga::inc: Januari 1986
142
143
Download