analisis music mining information retrieval untuk klasifikasi jenis

advertisement
p. ISSN: 2777-888
e. ISSN: 2502-2148
Jurnal Elektronik Sistem Informasi Dan Komputer
VOL 1 No.2 Juli-Desember 2015
ANALISIS MUSIC MINING INFORMATION RETRIEVAL UNTUK
KLASIFIKASI JENIS MUSIC BERGENRE MENGGUNAKAN
ALGORITMA NAIVE BAYES
Andi Imrah Dewi, 2Andi Nurul Hidayat
1
Ilmu Pendidikan Seni,Ilmu Komputer
Stmik-Bina Mulia Palu
Website kampus:stmik-binamulia.ac.id
ABSTRAK
Seiring dengan perkembangan dunia musik dari dulu sampai sekarang ini jauh lebih baik dan
memudahkan pencinta musik seolah-olah di manjakan dengan sebuah alat musik audio yang mampu
merekam suara musik.Pada masa sekarang ini masyarakat seiring pengklasifikasikan berbagai jenis
musik berdasarkan genre musik yang ada, genre musik pada klasifikasi genre yang untuk mengetahui
informasi sound yang berekstensi mp3 dll yang akan di klasifikasikan khususnya genre musik atau
Fungsi dari musik information retrieval adalah memberikan kemudahan untuk melakukan pencarian
musik, dengan demikian pendengar musik dapat dengan nudah menentukan musik genre yang di
iginkan terutama musik dan di dengarkan serta musik yang diminatinya.metode algoritma yang di
gunakan dalam pengklasifikasian algoritma Naive Bayes merukapakan algoritma pengklasifikasian
data, sedangkan tools untuk mengujinya menggunakan rapidminer 5.0 dan mengevaluasi klasifkasi data
genre musik dengan akurasi, precision dan recall sebagai pengukuran performa dataset yang di
klasifikasikan dalam musik information retrieval.
Kata Kunci: Analisis Musik Mining Bergenre, Music Mining Information Retrieval, Naive Bayes.
1.
berdasarkan genre musik menjadi sangat di
butuhkan. fungsi dari musik information retrieval
adalah memberikan kemudahan untuk melakukan
pencarian musik, dengan demikian pendengar
musik dapat dengan nudah menentukan musik
genre yang diiginkan terutama musik dan di
dengarkan serta musik yang diminatinya[1].
Pendahuluan
Seiring dengan perkembangan dunia musik dari
dulu sampai sekarang ini jauh lebih baik dan
memudahkan pencinta musik seolah-olah di
manjakan dengan sebuah alat musik audio yang
mampu merekam suara musik. Pada masa
sekarang ini masyarakat seiring pengklasifikasian
data genre dengan berbagai jenis-jenis musik
berdasarkan genre musik yang ada, genre musik
pada klasifikasi genre yang untuk mengetahui
informasi sound musik yang berekstensi mp3 dan
lain-lain yang akan di klasifikasikan khususnya
genre musik. Genre musik sering juga di artikan
ke dalam sebuah bentuk dasar pengelompokkan
jenis musik dengan teknik memperhatikan
kemiripan pada jenis alat musik, gitar, piano,
suling dll. Karakter arangsemen musik berbedabeda yakni ada timral, frekuensi, nada, serta
tempo alunang musik yang ada pada musik
tersebut, lyric dan lagu dapat juga di kategorikan
ke dalam penerapan klasifikasi jenis musik genre,
musik merupakan hal yang dapat di tentukan
secara melalui pendengaran manusia. Hal itu
mengakibatkan genre musik dapat menjadi aspek
penting dari kalangan seni musik dan praktisi
pengelola audio, di bidang musik digital khusus
bagi pecinta msuik atau dalam medeskripsikan
sebuah musik. Jumlah musik yang terus
bertambah menyebabkan para peneliti di bidang
musik mining information retrieval tertarik
menggali lebih dalam dan mengklasifikasikan
Berdasarkan pada suatu elemen terkecil dari
musik adalah nada. Nada adalah suara yang
memilkik nilai yang frekuensinya tertentu.
Dalam musik, nada berada suatu ruang dimensi,
dimensi vertikal dan horizontal[2].
Kenyataan bahwa musik dapat di kaitkan dengan
genre musik tertentu adalah fakta yang umum
diketahui dan tidak dapat dibantah [3]. Penelitian
eksperimental di bidang komputer dan era
globalisasi dan digitalisasi perangkat software
dan hardware musik dapat memperkuat
kenyataan ini [4]. Melihat dari sudut pandang
seniman musik, genre ini salah satu cara
penggolongan musik yang paling penting yakni
penggolangan musik dengan gaya style, emosi,
dan similarity[5].
Selanjutnya, pada analisa genre musik tersebut,
mengambil dalam suatu bahasa bidang music
information retrieval. Penangkapan data genre
dalam musik bersifat subjektif. Pada pendekatan
yang dapat dilakukan untuk mengklasifikasikan
musik kedalam kategori genre adalah dengan
36
37
p. ISSN: 2777-888
e. ISSN: 2502-2148
Jurnal Elektronik Sistem Informasi Dan Komputer
VOL.1 No.2 Juni-Desember 2015
bergantung pada suatu pembelajaran terhadap
penilaian subjektif oleh manusia[6].
menjadi ukuran kosakata. Kemudian MNB
menetapkan dokumen tes ti untuk kelas yang
memiliki probabilitas tertinggi Pr(c|ti), yang
Klasifikasi musik berdasarkan genre dapat dengan menggunakan aturan Bayes, ditentukan
dengan Prioritas kelas Pr(c) dapat diperkirakan
dengan membagi jumlah dokumen milik kelas c
dengan jumlah total dokumen. Pr(ti|c) adalah
probabilitas untuk mendapatkan dokumen
dilakukan secara manual dan subjektif oleh seperti ti di kelas c dan dihitung sebagai:
manusia, seperti pada pemilihan musik untuk latar Dimana fni adalah jumlah dari kata n dalam
belakang suatu film, Biasanya pada tim pembuat dokumen uji ti dan Pr(wn|c) adalah probabilitas kata
film tersebut terdapat tim kecil yang khusus n yang diberikan oleh kelas c. Probabilitas terakhir
bertugas untuk menangani masalah pemilihan diestimasi dari dokumen latih sebagai:
sountrack lagu film layar lebar, bahkan pembuatan,
musik latar belakang. Dapat dilihat pada film-film
yang telah dibuat bahwa emosi serta
mengkombinasikan di dalam genre lagu yang
digerakkan oleh musik latar tersebut. seringkali
benar-benar mengena sesuai dengan suasana tema Perhatikan bahwa istilah komputasi (∑ ) dan ∏
film dan musik yang digunakan untuk mempertegas dalam persamaan (2.2) dapat dihapus tanpa ada
suasana pada scene-scene tertentu musik yang rock
digunakan untuk melatar belakangi scene film horor
yang menegangkan, demikian musik dengan genre
slow untuk suasana film yang menyedihkan yang
diinginkan pada scene-scene tertentu pada film
tersebut. [7].
perubahan dalam hasil, karena tidak tergantung
pada kelas c, dan persamaan (2.2) dapat ditulis
Pada tahap ini algoritma yang di guanakan untuk sebagai:
pengklasifikasian musik mining bergenre adalah
algoritma naives bayes tersebut banyak digunakan
dalam kategorisasi genre music informasi
dimana α adalah sebuah variabel konstan yang
pencarian jenis genre musik (MIR) Music dibuang karena langkah normalisasi.[2]
Information Retrieval. Pada hasil eksperimen.[8].
2. Penelitian Terkait
Penelitian mengenai klasifikasi analisis music
mining information retrieval untuk klasifikasi jenis
music bergenre[10].
2.1 Naive Bayes
Naïve Bayes merupakan salah satu metode machine
learning
yang
menggunakan
perhitungan
probabilitas. Metode ini memanfaatkan teori yang
dikemukakan oleh ilmuwan Inggris Thomas Bayes3.
8, yaitu memprediksi probabilitas di masa depan
berdasarkan pengalaman di masa sebelumnya.
Dengan teori Teorema Bayes adalah teorema yang
digunakan dalam statistika untuk menghitung
peluang untuk suatu hipotesis, Bayes Optimal
Classifier menghitung peluang dari suatu kelas dari
masing-masing kelompok atribut yang ada, dan
menentukan kelas mana yang paling optimal.[9]
Multinomial Naive Bayes
Dalam model multinomial diberikan permisalan
seperti satu set kelas dilambangkan dengan C, N
Berdasarkan beberapa penelitian klasifikasi genre
musik klasifikasi dan mengcomparasikan dengan
metode klasifikasi yang digunakan yakni
algoritma SVM, NBC, KNN dan C45 hasilnya
pada data 3713 feature dan 360 instance. 360
instance sebagai data latih dan 120 instance.
2.2 Precision, Recall dan F-measure
Sistem temu kembali informasi mengembalikan
sekumpulan dokumen sebagai jawaban dari query
pengguna. Terdapat dua kategori dokumen yang
dihasilkan oleh sistem temu kembali informasi
terkait pemrosesan sebuah query, yaitu relevant
documents (dokumen yang relevan dengan query)
dan retrieved documents (dokumen yang diterima.
pengguna). Teknik pengukuran umum yang
digunakan untuk mengukur kualitas dari data
retrieval adalah kombinasi precision dan recall.
Precision mengevaluasi kemampuan sistem temu
38
p. ISSN: 2777-888
e. ISSN: 2502-2148
Jurnal Elektronik Sistem Informasi Dan Komputer
kembali informasi untuk menemukan kembali
data top-ranked yang paling relevan, dan
didefinisikan sebagai persentase data yang di
kembalikan yang benar-benar relevan terhadap
query pengguna. Precision merupakan proporsi
dari suatu set yang diperoleh yang relevan.
Relevant adalah jumlah dokumen yang relevan.
Retrieved adalah jumlah dokumen atu record data
yang dikembalikan atau diperoleh oleh dari sistem
kepada pengguna. Sedangkan pada performance
Recall mengevaluasi kemampuan system temu
kembali informasi untuk menemukan semua item
yang relevan dari dalam koleksi sebuah data dan
didefinisikan sebagai persentase data-data yang
relevan terhadap query pengguna dan yang
diterima. Recall merupakan proporsi dari semua
hasil data yang relevan di koleksi termasuk . hasil
yang diperoleh atau dikembalikan. Berikut
rumunya:
Tabel 2 Pengukuran Actual Class
Predicted
aktual class (expectation)
Class
+
(observation) +
TP
FP
FN
TN
Berdasarkan pada tabel 2 diatas pengukuran actual
class TP adalah true positive yaitu jumlah
dokumen yang di hasilkan aplikasi sesuai
dengan jumlah dokumen yang diberi olehpakar.
FP adalah false positive yaitu jumlah dokumen
yang bagi pakar dianggap salah akan tetapi oleh
aplikasi dianggap benar (hasil yang tidak
diinginkan). FN adalah false negative yaitu
jumlah dokumen yang bagi pakar dianggap
benar akan tetapi oleh aplikasi dianggap salah
(missing result). Dalam sebuah Kombinasi
performance precision dan recall
biasa
dikombinasikan sebagai harmonic mean, biasa
disebut F-measure. [11].
4.
METODE PENELITIAN
Metode penilitian yang akan di gunakan untuk
mengklasifikasikan dataset genre musik algoritma
klasifikasi yakni (naive bayes classifier dokumen
dataset genre musik yang di bentuk dengan dengan
data latih dan data testing yang di kumpulkan
VOL.1 No.2 Juni-Desember 2015
secara online dari situs music information retrieval
untuk menganalisa hasil performa suatu metode
dalam klasifikasi genre musik dan meghasilkan
masing-masing tingkat akurasi algoritma Naive
Bayes.
Data yang akan di gunakan sekumpula dataset
teks diatanra judul lagu genre musik,artist,album.
5.
Hasil Penelitian
Hasil penelitian yang dilakukan menggunakan
spesifikasi komputer AMD E- 450 APU dan sistem
operasi windows 7-Ultimate 32–bit. Aplikasi yang
di gunakan adalah rapidminer 5.3.
Tabel.1 Uji Performance Klasifikasi Genre Musik
Class Atribut Genre Musik
Class
Precision
Class
Recall
Classaretha_franklin
Classbackstreet_boys
Class basement_jaxx
Class beach_boys
Class beatles
Class beck
Class bee_gees
100.00%
75.00%
77.78%
100.00%
100.00%
100.00%
75.00%
83.33%
85.71%
100.00%
85.71%
28.57%
71.43%
85.71%
Berdasarkan pada tabel 1 Uji performance data
klasifikasi atribut genre musik diatas di kelompok
atribut genre distribusi model for label attribute
aretha_franklin sebagai target untuk klasifikasi genre
musik. Pada kolom nama atribut class grenre terlihat
pada kolom tersebut menunjukkan class presentase
pengukuran precision mulai 75% s/d 100% serta
pengukuran class recall memperlihat presentase di
mulai persentase 28.57% s/d 100.00% serta total
performance data akurasi: 89.79%. berdasarkan pada
tabel 1 performance diatas juga dibuatkan sebuah
model performance grafik atribut klasifikasi genre
musik yang terdiri dari pengukuran performance
akurasi, precision, recall. berikut model gambar dapat
dilihat pada gambar 2 uji data klasifikasi genre musik:
39
p. ISSN: 2777-888
e. ISSN: 2502-2148
Jurnal Elektronik Sistem Informasi Dan Komputer
Grafik Uji Atribut spesial
Performance Klasifikasi Genre
Musik
100%
50%
0%
Class Recall
VOL.1 No.2 Juni-Desember 2015
dataset/data yang berekstensi.csv dengan
melakukan processing data diataranya dataset
genre musik,dataset berektensi.csv dan role
sebagai teknik untuk menggunakan data
atribut kemudian menyiapkan dataset genre
musik data training dan data testing dan
menghasilkan sebuah model classifier
algoritma Naive bayes dan mengevaluasi
performance data genre musik yakni di hitung
performa sebuah data genre musik dengan
hasilAkurasi:89.79%,CoffusionMatrix:75.00
% Recall, Precision 100.00%.
6.
Kesimpulan
Class Precision
Class Atribut Genre Musik
Dari hasil penelitian ini menunjukkan bahwa
penggunaan metode algoritma Naive Bayes dapat
Gambar 2 Grafik uji data klasifikasi genre musik
mengimplementasikan hasil dari pengujian data
genre musik klasifikasi dan dari penggunaan
Naive Bayes dapat kesimpulan bahwa penerapan
algoritma Naive Bayes menunjukkan akurasi
89.79%. dalam hasil klasifikasi genre musik serta
dengan adanya hasil analisis tersebut dapat
memperoleh klasifikasi genre musik yang baik.
Di harapkan serta pengembangan dalam tingkat
klasiifkasi sebuah musik genre musik.
Daftar Pustaka
[1] Djohan. 2009. Psikologi Musik. Yogyakarta:
Penerbit Best Publisher.
[2] B.Klein. (2007). Music Definition.
http://www.bklein.de/music_definition.htm...
Diakses: Desember 2012
[3] CTV News. (2002).Study explains link
between music and genre. Diakses:
Desember 2012
[4] D.Huron. (2000). Perceptual and Cognitive
Applications
in
Music Information
Retrieval. International
Gambar.1Desain Eksperimen Genre Musik
Berdasarkan pada gambar1 model desain
eksperimen Genre musik diatas bahwa data
genre musik yang di gunakan adalah
[5] Symposium on Music Information
Retrieval (ISMIR) 2000Y.-H. Yang, Y.-F.
Su, Y.-C. Lin, H.-H.
[6] Chen.(2007).Musicemotionrecognition:
The role of individuality. Proc. ACM
40
p. ISSN: 2777-888
e. ISSN: 2502-2148
Jurnal Elektronik Sistem Informasi Dan Komputer
SIGMM Int. Workshop on Humancentered
Multimedia 2007, in conjunction with
ACM Multimedia (ACMMM/HCM'07),
Augsburg, Germany, pp. 13-21.
[7] J.Skowronek, M.E. McKinney, S. van
de Par. (2006). Ground Truth for
Automatic Music Genre Classification.
International.Symposium on Music
Information Retrieval (ISMIR) 2006.
[8] Kibriya Ashraf M., Frank Eibe,
Pfahringer
Bernhard,
Holmes
Geoffrey.2004.
[9] Multinomial Naïve Bayes forText
CategorizationRevisited.
Australian
joint conference on artificial intelligence
No.17. Music Genre Classification: A
Semi supervised Approach Soujanya
VOL.1 No.2 Juni-Desember 2015
Poria, 1Alexandar Gelbukh, 2 Amir
Hussain,3 Sivaji Bandy opadhy ay,
1Newton Howard McCallum, A. and
Nigam, K., 1998, A comparison of event
models for Naïve Bayes text
classification.
[10] ZA,Agus.Bramantoro,Arif.SoftwareApli
kasiPengolahKata(WordProcessor)deng
anFasilitasPemeriksaEjaandanThesaurus
BerbahasaIndonesia”,JurusanTeknikInfo
rmatika,FakultasTeknologiInformasiInst
itut Teknologi Sepuluh Nopember,
Surabaya.
[11] Rijsbergen C J V. 1979. Information
Retrieval.Butterworths: University of
Glasgow.
Download