bab i pendahuluan

advertisement
BAB I
PENDAHULUAN
1.1. Latar Belakang
Kata “genre” berasal dari bahasa Perancis yang artinya jenis atau kelas
(Chandler, 1997). Genre dalam musik dapat diartikan sebagai suatu terminologi
untuk menyebutkan gaya, jenis atau aliran musik yang ada dan berkembang di
masyarakat (Djohan, 2006).
Kaminskas dan Ricci (2012) menyatakan karakteristik dari suatu genre musik
masih belum jelas atau bersifat ambigu. Sampai saat ini, tidak ada definisi
taksonomi secara umum dari genre pada musik. Genre pada musik juga selalu
berkembang sehingga pada umumnya setiap library musik populer memiliki
hirarki genrenya sendiri. Fenomena ini menyebabkan para peneliti cenderung
menggunakan taksonomi genre yang disederhanakan yaitu mencakup kurang lebih
10 genre.
Penggunaan genre pada musik sudah sangat umum digunakan bagi para
pengguna musik. Suatu genre pada musik akan mengacu pada suatu style musik
tertentu dan setiap orang memiliki kecenderungan untuk hanya menyukai musik
dengan style tertentu pula. Hal ini menunjukkan pentingnya pemberian label genre
pada koleksi musik. Pemberian label genre pada musik akan sangat memudahkan
para pengguna musik dalam pencarian koleksi
musik yang diinginkan atau
disukai. Lee dan Downie (2004) menyebutkan bahwa pengguna musik saat ini
memiliki kecenderungan untuk mencari musik yang disukai berdasarkan genre
daripada berdasarkan rekomendasi ataupun kesamaan artis.
Penggunaan genre pada musik sangat mudah ditemukan dalam kehidupan
sehari-hari, salah satunya adalah pembuatan play list musik berdasarkan genre.
Setiap orang akan membuat play list musik berdasarkan apa yang disukai atau apa
yang ingin didengar, oleh karena itu seseorang akan memilih musik-musik
tertentu saja sesuai dengan genre yang diinginkan untuk dimasukkan ke
1
2
dalam play list-nya. Kesukaan tiap orang akan genre tertentu juga membuat
banyak stasiun radio menyediakan program acara musik yang khusus
memperdengarkan satu genre tertentu saja pada segmen acaranya. Pelabelan genre
terhadap koleksi musik yang dimiliki akan mempermudah dalam pemilihan lagu
atau musik yang diinginkan dalam play list.
Genre musik juga digunakan dalam bidang terapi musik. Djohan (2006)
menyatakan terapi musik dapat dilakukan dengan berbagai strategi menggunakan
aneka macam alat musik dan genre musik. Selera dan rasa suka atau tidak suka
seseorang terhadap musik tertentu membuat efek yang dihasilkan menjadi
bervariasi. Prosedur pelaksanaan terapi musik diawali dengan melakukan survei
musik terhadap pasien. Hal ini dilakukan salah satunya adalah untuk mengetahui
genre musik yang disukai pasien sehingga dapat ditentukan genre musik apa yang
nantinya akan diperdengarkan kepada pasien saat terapi dilakukan.
Pelabelan genre pada file musik juga merupakan hal yang penting dalam
bidang Music Information Retrieval (MIR). Fu dkk. (2011) menyatakan bahwa
kunci utama dalam membangun MIR adalah klasifikasi, yaitu bagaimana
memberikan label kepada suatu file musik berdasarkan genre, mood ataupun nama
artis yang menampilkan musik tersebut. Kemudahan dalam menambah jumlah
koleksi file musik digital khususnya melalui melalui internet menyebabkan
pelabelan genre terhadap koleksi musik dalam jumlah besar secara manual sangat
tidak efisien, oleh karena itu perlu dibangun suatu sistem yang dapat melakukan
pelabelan atau klasifikasi genre pada file musik secara otomatis. Klasifikasi atau
pemberian label pada suatu file musik ini diharapkan akan mempercepat temu
kembali suatu file musik karena dapat mempersempit ruang pencarian hanya pada
label tertentu, misalnya pada genre tertentu.
Menurut Scaringella (2005), terdapat tiga pendekatan yang mungkin
diterapkan untuk membangun sistem klasifikasi genre otomatis, yaitu sistem
pakar, klasifikasi tidak terbimbing (unsupervised) dan klasifikasi terbimbing
(supervised). Kontribusi yang paling signifikan untuk penelitian klasifikasi genre
pada musik diberikan oleh teknik yang mengggunakan pendekatan klasifikasi
secara supervised (Kaminskas dan Ricci, 2012).
3
Sistem pakar didasarkan pada seperangkat aturan yang didefinisikan oleh
pakar untuk meklasifikasikan musik ke dalam genre yang sesuai. Sistem
klasifikasi otomatis dengan pendekatan menggunakan sistem pakar kurang
realistis untuk digunakan karena sangat sulit untuk membuat aturan tanpa adanya
taksonomi dan definisi karakteristik genre yang jelas.
Pendekatan klasifikasi genre musik secara unsupervised atau metode
clustering salah satunya digunakan oleh de Leon dan Inesta (2002). Dewi dan
Harjoko
(2010)
serta
Yanuarti
(2012)
juga
menggunakan
pendekatan
unsupervised untuk mengklasifikasi mood dari musik. Pendekatan klasifikasi
menggunakan teknik clustering bertujuan mengelompokkan data sedemikian
hingga klasifikasi akan tercipta dengan sendirinya berdasarkan pada pengukuran
kemiripan (similarity measure) pada data. Keuntungan dari pendekatan ini adalah
tidak diperlukannya batasan yang pasti dari taksonomi yang diinginkan, sehingga
taksonomi dari genre atau mood dari musik tidak diperlukan.
Kelemahan utama dari pendekatan secara unsupervised adalah hasil
clustering yang tidak memiliki label kelas. Klasifikasi menggunakan pendekatan
unsupervised, misalnya menggunakan Self Organizing Map (SOM), memerlukan
langkah lebih lanjut untuk menganalisis atau mendeskripsikan cluster yang
terbentuk untuk diberikan label yang sesuai (Kohonen, 1990; de Leon dan Inesta,
2002).
Pendekatan klasifikasi secara supervised adalah yang paling sering digunakan
(Tzanetakis dan Cook, 2002; Li dkk., 2003; Nopthaisong dan Hasan 2007;
Fansuri, 2011; Goulart dkk., 2012). Pendekatan secara supervised memetakan data
ke dalam taksonomi klasifikasi yang telah diberikan menggunakan algoritma
machine learning. Proses klasifikasi diawali dengan melakukan proses pelatihan
menggunakan sejumlah data yang telah dilabeli secara manual, kemudian
dilanjutkan dengan mengklasifikasikan data yang belum terlabeli berdasarkan
hasil dari proses pelatihan.
Perbedaan dari sistem pakar dan pendekatan supervised adalah pada
taksonomi kelas dalam hal ini genre musik, tidak harus digambarkan secara
eksplisit. Classifier akan berusaha menemukan keterkaitan antara fitur yang
4
digunakan dalam data pelatihan dengan taksonomi kelas yang diberikan secara
otomatis.
Learning Vector Quantization (LVQ) merupakan salah satu bagian dari
model Jaringan Syaraf Tiruan dengan algoritma pembelajaran kompetitif yang
bersifat supervised. Penelitian untuk klasifikasi genre musik menggunakan
metode LVQ masih sangat terbatas, antara lain adalah (Nopthaisong dan Hasan,
2007) dan (Fansuri, 2011), dengan jumlah genre yang masih sedikit yaitu 5 dan 4
genre.
Keserderhanaan, fleksibilitas dan efisiensi merupakan beberapa alasan
mengapa LVQ yang telah diperkenalkan oleh Kohonen digunakan di berbagai
bidang (Ghosh dkk., 2006). Kelemahan dari metode ini adalah sangat bergantung
atau sensitif terhadap pemilihan vektor acuan (reference vector) yang juga
digunakan sebagai bobot awal jaringan dalam proses pelatihan LVQ. Vektor
acuan merupakan perwakilan dari masing-masing kelas yang dianggap sebagai
representasi dari suatu kelas dalam jaringan LVQ.
Penentuan vektor acuan yang paling mudah dan umum digunakan adalah
dengan memilih langsung sejumlah vektor input sebagai perwakilan dari masingmasing kelas pada proses pelatihan (Fausett, 1994). Inisialisasi vektor acuan
(bobot awal) dengan cara ini sangat sensitif terhadap tingkat akurasi karena
ketidaktepatan dalam pemilihannya dapat menghasilkan akurasi yang buruk.
Alternatif lain untuk penentuan vektor acuan adalah dengan menggunakan
SOM (Kohonen, 1990; Fausett, 1994). Penentuan label kelas dari bobot jaringan
dilakukan setelah proses pelatihan yaitu berdasarkan label kelas terbanyak
(majority voting) dari vektor input yang menjadi anggota cluster (vektor bobot)
tersebut. Penelitian ini akan mencoba mengkombinasikan LVQ dengan SOM
dalam menentukan vektor acuan untuk klasifikasi genre musik sehingga dapat
diketahui pengaruhnya terhadap akurasi yang dihasilkan.
Penelitian untuk klasifikasi genre pada musik mulai banyak diperhatikan
sejak penelitian yang dilakukan oleh Tzanetakis dan Cook (2002). Fitur audio
yang digunakan pada penelitian tersebut cukup beragam mencakup fitur dari
domain waktu maupun domain frekuensi, namun akurasi yang dihasilkan belum
5
memuaskan. Tzanetakis dan Cook (2002) melakukan klasifikasi genre pada musik
ke dalam 10 jenis genre dan menghasilkan akurasi sebesar 61%. Penelitian di
bidang ini kemudian mulai berkembang dengan mengkombinasikan berbagai fitur
yang telah digunakan pada penelitian sebelumnya ataupun dengan mengusulkan
fitur-fitur baru.
Fu dkk. (2011) menyatakan industri musik saat ini berkembang dengan pesat,
oleh karena itu diperlukan sistem klasifikasi genre musik yang mampu menangani
kumpulan data dalam skala besar. Skalabilitas merupakan isu yang penting untuk
diperhatikan terkait dengan waktu pemrosesan dan penyimpanan. Salah satu cara
yang dapat digunakan untuk mempercepat proses klasifikasi dan mereduksi ruang
penyimpanan pada data dalam jumlah besar adalah menemukan fitur yang cukup
ringkas
dengan
proses
ekstraksi
fitur
yang
sederhana
namun
dapat
merepresentasikan data dengan baik.
Goulart dkk. (2012) melakukan klasifikasi genre musik berdasarkan fitur
entropi. Ekstraksi fitur diawali dengan melakukan proses framing terhadap file
musik, kemudian dilanjutkan dengan mentransformasi tiap frame ke domain
frekuensi dengan Discrete Wavelet Transform (DWT) untuk kemudian dihitung
nilai entropi dari koefisien wavelet yang dihasilkan. Vektor fitur yang terbentuk
memiliki dimensi cukup ringkas. Komponennya diperoleh berdasarkan statistik
dari entropi frame yang terdiri atas nilai mean, nilai standard deviasi, nilai
maksimum, nilai minimum serta beda maksimum dari entropi frame yang
bersebelahan. Vektor fitur ini kemudian digunakan sebagai dasar untuk
mengklasifikasikan file musik ke dalam 3 buah genre. Tingkat akurasi yang
dihasilkan cukup baik, yaitu mencapai 85% untuk masing-masing kelas.
Penelitian ini akan menggunakan fitur entropi seperti yang diusulkan oleh
(Goulart dkk., 2012) sebagai dasar untuk melakukan klasifikasi genre musik. Fitur
ini digunakan karena dimensinya yang ringkas dan proses ekstraksi fitur yang
sederhana. Penelitian ini akan mencoba menggunakan fitur entropi ini untuk
melakukan klasifikasi ke dalam jumlah kelas yang lebih besar, yaitu 10 genre
musik dengan menggunakan kombinasi metode LVQ dan SOM sebagai classifiernya.
6
1.2. Rumusan Masalah
Rumusan permasalahan dalam penelitian ini adalah apakah penggunaan fitur
entropi serta kombinasi classifier Learning Vector Quantization (LVQ) dan Self
Organizing Map (SOM) dapat meningkatkan akurasi dalam melakukan klasifikasi
genre musik.
1.3. Batasan Masalah
1) Data yang dipakai sebagai data pelatihan adalah data set GTZAN. Data set
terdiri atas 1000 potongan file musik berdurasi ±30 detik dalam format AU
dengan sampling rate 22050 Hz yang terbagi ke dalam10 macam genre.
2) Data uji yang digunakan dalam penelitian adalah file musik digital dalam
format MP3 dengan sampling rate 44100 Hz dan channel stereo.
3) Sebelum digunakan data uji akan dikonversi terlebih dahulu ke dalam format
data set GTZAN, yaitu dikonversi menjadi format AU menggunakan aplikasi
LAME, serta di-resampling menggunakan aplikasi SoX.
1.4. Tujuan dan Manfaat Penelitian
Penelitian ini bertujuan untuk mengetahui kinerja (akurasi) yang dihasilkan
oleh penggunaan fitur entropi serta kombinasi classifier Learning Vector
Quantization (LVQ) dan Self Organizing Map (SOM) dalam melakukan
klasifikasi genre musik.
Hasil dari penelitian ini diharapkan dapat bermanfaat bagi pengguna musik
untuk dapat memberikan pelabelan genre terhadap file musik digital yang dimiliki
secara otomatis sehingga memudahkan dalam mengorganisir koleksi file musik
dan mempercepat proses pencarian file musik. Selain itu hasil penelitian ini juga
diharapkan dapat digunakan lebih lanjut untuk pembangunan sistem Music
Information Retrieval (MIR).
1.5. Keaslian Penelitian
Penelitian untuk mengklasifikasikan genre musik yang telah banyak
dilakukan. Perbedaan penelitian ini dengan penelitian-penelitian sebelumnya
terletak pada classifier yang digunakan, yaitu kombinasi Learning Vector
7
Quatization (LVQ) dan Self Organizing Map (SOM). Fitur yang digunakan adalah
fitur entropi koefisien wavelet. Fitur entropi sudah pernah digunakan pada
penelitian klasifikasi genre musik sebelumnya, namun pada jumlah kelas yang
lebih sedikit dan classifier yang berbeda dari penelitian ini.
1.6. Metodologi Penelitian
Tahapan-tahapan yang dilakukan dalam penelitian ini adalah sebagai berikut:
1. Studi pustaka dan literatur
Tahapan ini dilakukan dengan mengumpulkan, membaca dan memahami
berbagai pustaka dan literatur yang berkaitan dengan penelitian ini, antara lain
mengenai klasifikasi genre musik, ekstraksi fitur entropi, Learning Vector
Quantization dan Self Organizing Map.
2. Pengumpulan data
Tahapan ini dilakukan dengan mengumpulkan data yang digunakan dalam
penelitian ini, yaitu data set GTZAN. Penggunaan data set GTZAN dalam
penelitian ini bertujuan agar kinerja klasifikasi genre musik yang dihasilkan
dalam penelitian ini dapat dibandingkan dengan penelitian-penelitian
sebelumnya yang juga menggunakan data set ini.
3. Analisis dan perancangan
Tahapan ini merupakan tahap perancangan proses yang akan digunakan untuk
mengklasifikasikan genre musik beserta langkah-langkah dari masing-masing
proses. Proses-proses tersebut antara lain preprocessing, proses ekstraksi fitur,
proses klasifikasi menggunakan LVQ dan SOM serta proses evaluasi.
4. Implementasi
Tahapan ini merupakan tahap implementasi dari rancangan yang telah
dihasilkan pada tahap sebelumnya, yaitu untuk melakukan klasifikasi genre
musik menggunakan metode LVQ dan SOM dengan bahasa pemograman
MATLAB.
5. Evaluasi dan pembahasan
Hasil implementasi proses ekstraksi fitur dan proses klasifikasi genre musik
dievaluasi menggunakan k-fold cross validation sehingga dapat diketahui
8
akurasinya. Hasil evaluasi kemudian dibandingkan untuk mengetahui nilai
parameter terbaik dalam melakukan proses ekstaksi fitur dan pembangunan
classifier. Proses evaluasi juga dilakukan untuk membandingkan kinerja
classifier hasil penelitian dengan classifier lainnya serta pengaruh penggunaan
fitur entropi terhadap hasil klasifikasi genre-genre tertentu dari 10 jenis genre
musik dalam data set.
1.7. Sistematika Penelitian
Sistematika penulisan dalam penelitian ini adalah sebagai berikut:
BAB I
PENDAHULUAN
Bab ini berisi latar belakang, rumusan masalah, batasan masalah,
tujuan
dan
manfaat
penelitian,
metodologi
penelitian
dan
sistematika penulisan dalam penelitian ini.
BAB II
TINJAUAN PUSTAKA
Bab ini berisi kajian terhadap penelitian-penelitian sebelumnya
yang berkaitan dengan klasifikasi genre musik sebagai bahan acuan
dan perbandingan dalam penelitian ini.
BAB III
LANDASAN TEORI
Bab ini berisi uraian dasar teori yang berkaitan dengan ekstraksi
fitur dan classifier yang digunakan untuk klasifikasi genre musik.
Teori-teori ini digunakan sebagai referensi untuk menyelesaikan
permasalahan dalam penelitian ini.
BAB IV
ANALISIS DAN PERANCANGAN SISTEM
Bab ini menjabarkan perancangan proses yang akan digunakan
untuk mengklasifikasikan genre musik serta proses evaluasi yang
akan dilakukan. Rancangan dari masing-masing proses dijelaskan
secara terperinci langkah demi langkah disertai contoh perhitungan
untuk proses-proses tertentu.
BAB V
IMPLEMENTASI
Bab ini berisi implementasi dari rancangan yang telah dihasilkan
pada bab sebelumnya.
9
BAB VI
HASIL DAN PEMBAHASAN
Bab ini menjabarkan hasil dari penelitian dan pembahasannya, yaitu
hasil evaluasi yang diperoleh terhadap implementasi yang telah
dilakukan.
BAB VII
KESIMPULAN DAN SARAN
Bab ini berisi kesimpulan yang memuat hasil penelitian yang
diperoleh disesuaikan dengan tujuan penelitian dan saran untuk
penelitian selanjutnya.
Download