Seminar Nasional Cendekiawan 2016 ISSN (E) : 2540-7589 ISSN (P) : 2460-8696 ANALISIS AUDIO WATERMARKING MENGGUNAKAN METODE DISCRETE COSINE TRANSFORM DENGAN PENGKODEAN BCH Irfan Dwi Pratama1), GelarBudiman2), I NyomanAprazRamatryana3) 1.2.3 ) Jurusan S1 Teknik Telekomunikasi, Fakultas TeknikElektro, Universitas Telkom E-mail: [email protected] E-mail: [email protected] E-mail: [email protected] Abstrak Produk digital seperti audio, image ataupun film merupakan karya intelektual yang dilindungi dan memiliki hak cipta. Banyaknya penggandaan dan klaim atas produk digital tersebut mengakibatkan pemegang hak cipta yang sebenarnya akan dirugikan. Salah satu cara untuk melindungi kepemilikan produk digital adalah dengan menyisipkan atau menyembunyikan suatu informasi, misal data pemilik hak cipta, kedalam produk digital tersebut atau yang disebut dengan digitalwatermarking. AudioWatermarking adalah suatu teknik menyisipkan atau menyembunyikan suatu informasikedalam suatu file audio. Pada penelitian ini menerapkan metode Discrete Cosine TransformsertaBCH code sebagai pengoreksi error. Sistem menghasilkan capacity yang besar yaitu 700 bps-2 kbps, perceptual quality yang cukup baik (SDG> 3.85 dan 25 dB < SNR < 56 dB) sertarobustness yang baik terhadap beberapa serangan yang umumseperti kompresi MP3, Noise, Echo dll. Kata kunci: Audio Watermarking, Discrete Cosine Transform (DCT), BCH Code Pendahuluan Sering berkembang pesatnya teknologi informasi, masalah pembajakan pada data digital semakin marak dilakukan. Hal inidikarenakan mudahnya cara pembajakan terhadap data digital. Oleh karena itu, diperlukan suatu cara yang mampu melindungi hak cipta dan kepemilikan data digital. DigitalWatermarking menjadi sebuah solusi yang tepat untuk masalah tersebut. Digital watermarking adalah sebuah teknik dimana sebuah informasi disisipkan atau disembunyikan kedalam sebuat set host-data digitalseperti audio, imageatauvideo. Pemberian watermark ini dilakukan sedemikian sehingga watermark yang disisipkan tidak merusak data digital yang dilindungi (Rinaldi, 2004). Watermarking pada audio memiliki tantangan tersendiri dibandingkan dengan gambar atau video, ini karena HumanAuditorySystem (HAS) bekerja pada range frekuensi yang lebar (W. Bender, 1996). Dalam menyembunyikan sebuah informasi, ada beberapa kriteria yang harus dipenuhi antara lain : a) Payload b) c) Robustness Imperceptibility :Banyaknya data yangdapat disisipkan, direpresentasikan dalamsatuanbit per second (bps) : Ketahanan watermarkterhadap serangan :Tidak terasa oleh indera manusia Ketiga kriteria tersebut tidak saling berbanding lurus sehingga hal ini menjadi tantangan tersendiri bagi para peneliti untuk menghasilkan watermarked audio yang baik. Akan tetapi masalah utama yang dihadapi adalah ketika selesai melakukan proses penyisipan. Audio yang dihasilkan dari proses penyisipan atau disebut juga sebagai watermarked audio atau watermark signal diberi berbagai macam serangan untuk menguji ketahanan data yang disisipkan. Sehingga ketika sinyal hasil serangan tersebut dimasukkan kedalam proses ekstraksi, data yang disisipkan sebelumnya bisa berbeda dari data awal yang disisipkan. 13.1 Seminar Nasional Cendekiawan 2016 ISSN (E) : 2540-7589 ISSN (P) : 2460-8696 Studi Pustaka a) Discrete Cosine Transform(DCT) DCTmerupakan suatu teknik yang digunakan untuk melakukan konversi sinyal ke dalam komponen frekuensi pembentuknya. DCT merupakan transformasi yang berhubungan dengan transformasi Fourier, sama seperti Discrete Fourier Transform (DFT) tetapi DCT hanya memperhitungkan nilai real dari hasil transformasinya. Penggunaan metode transformasi sendirimenghasilkan imperceptibility yang lebih baik dan tahan terhadap serangan (Mehdi, 2015). Berikut ini adalah persamaan DCT yang digunakan pada penelitian ini : ∑ )݇( ݓ = )݇(ݕேୀଵ )݊(ݔcos Dimana w(k) : ଵ √ே ට ଶ ே గ(ଶିଵ)(ିଵ) , ଶே ݇ = 1, … , ܰ (1) ,݇ = 1 (2) ,݇ = 2 ≤ ݇≤ ܰ (3) Sedangkan Inverse Discrete Cosine Transform (IDCT) mengonstruksikan kembali bilangan dari koefisien DCT. Fungsi IDCT merupakan fungsi inverse dari fungsi DCT. ∑ = )݊(ݔேୀଵ )݇(ݕ)݇( ݓcos గ(ଶିଵ)(ିଵ) , ଶே ݊ = 1, … , ܰ (4) b) BCH Code BCH Code merupakan salah satu metode pendeteksi dan pengoreksi error yang terjadi secara acak yang mampu mengoreksi beberapa kesalahan (multiple error) sekaligus dan merupakan pengembangan dari metode Hamming Code. BCH Code adalah suatu contoh binary code, yang diperkenalkan oleh dua orang ilmuwan, R. C. Bose dan D. V. Ray-Chaudhuri mengacu pada penemuan A. Hocquenghem. Misalkan suatu BCH code adalah linier (n,k) code, maka berikut ini diberikan hubungan antara panjang code (n), panjang pesan (k) dan kemampuan koreksi error maksimum (t) yang dimiliki oleh BCH code tersebut (Achmad, 2012). Tabel 1. Hubungan n, k dan t pada BCH (n,k) Code n k t n k t 7 4 1 63 57 1 15 11 1 51 2 7 2 45 3 5 3 39 4 26 1 36 5 21 2 30 6 16 3 24 7 11 5 18 10 6 7 16 11 10 13 7 15 31 13.2 Seminar Nasional Cendekiawan 2016 ISSN (E) : 2540-7589 ISSN (P) : 2460-8696 Metodologi Penelitian Pada watermarking terdapat dua tahapan penting, yaitu proses penyisipan (embedding) dan proses pengambilan informasi (extracting). Tahapan-tahapan yang dilalui tersebut secara umum dapat dilihat pada diagram blok berikut : Gambar 1. Diagram blok sistem Pada gambar di atas, sinyal audiodisisipkaninformasi (watermark) dengancaratertentusehinggadihasilkan sebuah watermark signal atau watermarked audio.Selanjutnya adalah tahap serangan, dimanasinyal watermark diserangatau mengalamiberbagaipengolahan sinyalsepertikompresi MP3, noise dll. Hal ini untuk menguji ketahanan watermark terhadap serangan yang ada. Kemudian melalui proses ekstraksi sehingga didapat informasi yang disisipkan. Selanjutnya informasi hasil ekstraksi dibandingkan dengan informasi awal untuk mengetahui tingkat akurasi sistem. a) Proses Penyisipan Proses penyisipan dengan menggunakan teknik Discrete Cosine Transform melalui beberapa tahapan. Tahapan-tahapan tersebut adalah sebagaiberikut: Pemilihanaudio sebagai host untuk disisipkan informasi. Sinyalaudio ini kemudian dibagi-bagi menjadi M frame dengan ukuran masing-masing frame N sample. Kemudian melalui proses DCT, yaitu proses pengubahan domain waktu ke domain frekuensi. Pada domain inilah informasi akan disisipkan. Di sisi lain, informasi yang akan disisipkan terlebih dahulu dijadikan biner. Setelah itu melalui proses BCH encoding dengan parameter yang sudah ditentukan. Hasil encoding inilah yang akan disisipkan pada host. Selanjutnya untuk proses penyisipan memanfaatkan deret Fibonacci. Jumlah deret Fibonacci yang digunakan tergantung jumlah N sample, dengan nilai awal di N/2 + 1 karena bagian frame yang akan disisipkan di frekuensi tinggi. Hal ini dikarenakan sensitivitas pendengaran manusia kurang peka pada frekuensi tinggi. Sebagai contoh, misal N = 256, maka deret yang digunakan : Tabel 2. Deret Fibonacci dan Implementasinya pada Sistem Fibonacci 1 1 2 3 5 8 13 21 34 Implementasi 129 130 132 135 140 148 161 182 216 Setelah itu, bit disisipkan di antara bilangan Fibonacci. Sebagai contoh, misal sample Fibonacci 130 dan 132. o Untuk bit 0, nilaiamplitudepadasample diantara deret Fibonacci diubah menjadi nilai amplitudepada sample Fibonacci 130 (bawah). 13.3 Seminar Nasional Cendekiawan 2016 ISSN (E) : 2540-7589 ISSN (P) : 2460-8696 Untuk bit 1, nilaiamplitudepadasamplediantara deret Fibonacci diubah menjadi nilaiamplitude pada sample Fibonacci 132 (atas). Dengan cara seperti ini maka dalam satu frame dapat disisipkan lebih dari satu bit (xbit) sehingga kapasitas sistem meningkat x kali lipat. Watermarkdisisipkan di sepanjang host. Selanjutnya adalah Inverse DCT, yaitu proses pengubahan domain frekuensi ke domain waktu. Kemudian masing-masing frame digabung kembali menjadi satu sinyal utuh dengan watermark yang sudah disisipkan atau disebut sinyal watermark. Kemudiansinyalwatermarkdiserangdenganberbagaipengolahansinyaluntukmeng ujiketahananwatermark. o b) Proses Ekstraksi Pada tahap ini, sinyal watermarkyang telahdiserang selanjutnya diproses untuk mendapatkankembaliinformasi yang disisipkanuntukkemudiandianalisis. Berikutadalahtahapan-tahapan proses ekstraksi : Sinyal dibagi-bagi menjadi M frame dengan ukuran masing-masing frame N sample, kemudian melalui proses DCT. Setelah itu, proses ekstraksi dengan memanfaatkan deret Fibonacci yang telahdijelaskan sebelumnya Misal menggunakan sample Fibonacci 130 dan 132, kemudianhitung rata-rata nilai sampledi antara deret Fibonacci tersebut : d1 = absolut(nilai rata-rata – nilai pada sample Fibonacci 130) d2 = absolut(nilai rata-rata – nilai pada sample Fibonacci 132) Jika d1 < d2, maka bit 0 Jika d1 > d2, maka bit 1 Setelah bit hasil ekstraksi didapat, selanjutnya bit-bit tersebut melalui proses decoding BCH. Hasil decoding inilah yang dibandingkan dengan bit informasi awal yang disisipkan sehingga dapat diketahui nilai BER dan akurasi sistem. Sementaraitu, parameter–parameter yang diujikan pada penelitianini antara lain : a) Bit Error Rate (BER) BER dihitung dengan membandingkan jumlah bit yang salah atau errorhasil ekstraksi dengan bit informasi awal. ௨ ௧ = ܴܧܤቀ௨ ௧௦௨௨ቁ× 100% (5) b) Signal to Noise Ratio (SNR) SNR adalahperbedaannilaiantarasinyal audio aslidengansinyalwatermark. ܴܵܰ = 10. logଵ ∑ (6) ∑ [௦()]మ [௦ೢ ()ି௦ ()] మ Dimana so(n) adalah sinyal audio asli sedangkan sw(n) adalah sinyal watermark. c) Perceptual Evaluation of Audio Quality (PEAQ) PEAQ adalahpenilaianterhadapkualitas audio secaraobjektif / Objective Difference Grade (ODG) berdasarkanrekomendasi ITU-R BS.1387 d) Mean Opinion Score (MOS) 13.4 Seminar Nasional Cendekiawan 2016 ISSN (E) : 2540-7589 ISSN (P) : 2460-8696 MOSadalahpenilaianterhadapkualitas audio secarasubjektif / Subjective Difference Grade (SDG) berdasarkanrekomendasi ITU-R BS.562.Berikutadalahrangenilaidari ODG danSDG : Tabel 3. Parameter ODG dan SDG ODG SDG Imperceptibility 0 5 Watermarktidakterasa -1 -2 -3 4 3 2 Watermarksedikitterasatapitidakmengganggu Watermarkterasadansedikitmengganggu Watermarkmengganggu, audiodapatterdengar -4 1 Watermarksangatmengganggu, audiotidakdapatterdengar Hasil dan Pembahasan Pengujian yang dilakukan pada penelitian ini menggunakan enam jenis audio yang berbeda(sample rate 44.100 Hz) sebagai host yang akan disisipkan informasi berupa teks (‘telkom university’) dan menggunakan tiga nilai BCH(n,k) yaitu BCH (7,4), BCH (31,16) dan BCH (63,16). Enam audio tersebut dapat dilihat pada tabel 4 berikut. Tabel 4. File Audio dan Jenisnya File Jenis Audio Durasi (s) Conversation.wav Voice 4 Bola.wav Voice 15 Diskusi.wav Voice 15 Klasik.wav Instrumental 15 Pop.wav Musik Pop 14 Rock.wav Musik Rock 15 Watermarked audio yang dihasilkan akan diuji mengenaipengaruh ukuran frame, perceptual quality dan berbagaiserangan terhadap watermarked audio. a) Pengaruh ukuran frame terhadap parameterwatermarking Berdasarkan hasil pengujian sistem terhadap sebuah file audio (conversation.wav) dengan menggunakan tiga ukuran frame yang berbeda, maka didapatkan hasil sebagai berikut : Tabel 5. Hasil Pengaruh Ukuran Frame PadaBCH (7,4) Parameter 128 256 512 BER 0 0 0 ODG -1.07 -0.91 -1.19 SNR (dB) 43.58 43.14 42.75 Bit per Frame 6 7 9 Rate (bps) 2067 1205 775 Tabel 6. Hasil Pengaruh Ukuran Frame Pada BCH (31,16) Parameter 128 256 512 BER 0 0 0 ODG -1.03 -0.88 -1.22 SNR (dB) 43.52 43.12 42.28 Bit per Frame 6 7 9 Rate (bps) 2067 1205 775 13.5 Seminar Nasional Cendekiawan 2016 ISSN (E) : 2540-7589 ISSN (P) : 2460-8696 Tabel 7. Hasil Pengaruh Ukuran Frame Pada BCH (63,16) Parameter 128 256 512 BER 0 0 0 ODG -1.05 -0.91 -1.12 SNR (dB) 43.4 43.49 42.69 Bit per Frame 6 7 9 Rate (bps) 2067 1205 775 Pada tabel di atas dapat dilihat bahwa ukuran frame 256 menghasilkan nilai ODG paling baik dibandingukuranframe lain untuk semua nilai BCH (n,k). Sehingga untuk pengujian berikutnya menggunakan ukuran frame 256. b) Perceptual Quality Pengujian dilakukan terhadap 5 file audio yang berbeda-beda jenisnya untuk mengetahui perceptual quality masing-masing file. Untuk pengujian SDG diujikan kepada 30 orang responden untuk memberikan penilaian terhadap kualitas masingmasing watermarked audio. Berikut adalah hasil selengkapnya : Tabel 8. Hasil Perceptual Quality File ODG SDG SNR (dB) Rate (bps) Bola -2.615 4.12 48.307 1205 Diskusi -3.392 4.19 56.099 1206 Klasik -3.137 4.15 53.961 1206 Pop -1.052 3.85 25.466 1205 Rock -2.2 4.42 30.947 1206 Pada tabel di atas dapat dilihat bahwa nilai SNR dan SDG menunjukan hasil yang berbanding lurus tetapi tidak pada hasil ODG. Nilai ODG pada hasil percobaan di atas tidak teratur karena informasi disisipkan di sepanjang lagu untuk keperluan robustness. Akan tetapi, nilai SDG yang paling dipertimbangkan karena pada akhirnya persepsi manusia yang menentukan. Sehingga untuk hasil perceptual quality pada sistem ini dapat dikatakan cukup baik (SDG> 3,85 dan 25,4 dB < SNR < 56 dB). c) Hasil Serangan terhadap watermarked audio a. Kompresi MP3 Berdasarkan hasil pengujian sistem ketika diserang dengan kompresi MP3 dengan mengubah nilai bit rate nya, maka didapatkan hasil sebagai berikut : 13.6 BER Seminar Nasional Cendekiawan 2016 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 ISSN (E) : 2540-7589 ISSN (P) : 2460-8696 BCH (63,16) BCH (31,16) 64k 96k 128k 160k 192k 320k BCH (63,16) 0,406 0,286 0,234 0,182 0,142 0,07 BCH (31,16) 0,39 0,268 0,22 0,174 0,164 0,098 BCH (7,4) 0,38 0,298 0,228 0,18 0,172 0,088 BCH (7,4) Bit Rate MP3 Gambar 2. Hasil pengujian perubahan Bit Rate MP3 terhadap BER Berdasarkan grafik di atas, dapat dilihat bahwa saat bit rate semakin besar, maka BER semakin baik. Hal ini karena nilai bit rate yang digunakan berhubungan dengan nilai frekuensi cut-offLowPass Filter (LPF) yang digunakan untuk proses kompresi. Semakin besar nilai bit rate, frekuensi cut-off semakin besar.Karena informasidisisipkan pada frekuensi tinggi sehingga nilai BER semakin baik. BER Penambahan noise Sinyaldiberinoisejeniswhitedanpinkdimana level noise di bawahdaya rata-rata sinyal.Berdasarkan hasil pengujian sistem ketika diserang dengan noise dengan mengubah levelnoise-nya, maka didapatkan hasil sebagai berikut : 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 BCH (63,16) BCH (31,16) BCH (7,4) 10 dB 15 dB 20 dB BCH (63,16) 0,386 0,342 0,296 BCH (31,16) 0,37 0,338 0,28 BCH (7,4) 0,356 0,328 0,282 Level Noise Gambar 3. Hasil pengujian perubahan level noise terhadap BER Berdasarkan grafik di atas, dapat dilihat bahwa saat level noisesemakin besar maka perubahan yang terjadi pada sinyal tidak terlalu besar, sehingga BER semakin baik. 13.7 Seminar Nasional Cendekiawan 2016 ISSN (E) : 2540-7589 ISSN (P) : 2460-8696 Hasil Serangan lainnya Berikut hasil pengujian untuk jenis serangan lainnya : Tabel 9. Hasil Pengujian Pada BCH (7,4) JenisSerangan Bola Diskusi Klasik Pop Rock Stereo to Mono 0 0 0 0 0 Resample 0.42 0.46 0.46 0.42 0.43 Change Speed 0 0.01 0 0 0 Echo 0.03 0.04 0.03 0 0 Tabel 10. Hasil Pengujian Pada BCH (31,16) JenisSerangan Bola Diskusi Klasik Pop Rock Stereo to Mono 0 0 0 0 0 Resample 0.43 0.42 0.4 0.43 0.43 Change Speed 0 0 0 0 0 Echo 0.02 0.04 0.02 0 0 Tabel 11. Hasil Pengujian Pada BCH (63,16) JenisSerangan Bola Diskusi Klasik Pop Rock Stereo to Mono 0 0 0 0 0 Resample 0.49 0.49 0.5 0.44 0.48 Change Speed 0 0 0 0 0 Echo 0 0 0 0 0 Berdasarkan hasil diatas dapat dilihat bahwa jenis serangan Resample adalah serangan yang paling merusak. Hal ini dikarenakan, sample rate berubah sedangkan ukuran frame N tetap sehingga pengambilan nilai untuk proses ekstraksi menjadi berantakan, akibatnya informasimenjadi rusak. Selain itu, nilai BCH (63,16) mampu mengurangi nilai error pada BCH (7,4) dan BCH (31,16) untuk nilai-nilai error yang kecil sehingga menjadi tidak ada error (BER = 0). Hal inikarenakemampuankoreksierror BCH (63,16) lebihbanyakdibanding BCH (7,4) dan BCH (31,16). Kesimpulan Berdasarkanhasil pengujiandanpembahasan pada bagian sebelumnya, maka dapat ditarik kesimpulan sebagai berikut : a) Pengaruh ukuran frame terhadap ODG menunjukan bahwa ukuran frame 256 menghasilkan nilai ODG yang lebih baik dibandingkan dengan ukuran frame 128 dan 512 untuk semua nilai BCH (n,k). b) Perceptual Quality untuk sistem ini menunjukkan hasil yang cukup baik ( SDG > 3.85 dan 25,4 dB < SNR < 56 dB). c) Serangan yang paling merusak watermark adalah serangan Resample. d) Nilai BCH (63,16) mampu mengurangi nilai error pada BCH (7,4) dan BCH (31,16) untuk nilai-nilai error yang kecil sehingga menjadi tidak ada error (BER = 0). 13.8 Seminar Nasional Cendekiawan 2016 ISSN (E) : 2540-7589 ISSN (P) : 2460-8696 Daftar pustaka AchmadFahrurozi&Sri Mardiyati, 2012, Analisis Kontruksi Dan Sifat BCH Code, Universitas Padjadjaran, Jatinangor. Mehdi Fallahpour &David Megias, 2015, Audio Watermarking Based on Fibonacci Numbers, Audio, Speech, Lang. Process. IEEE/ACM Trans. (Volume23 , Issue 8 ), vol. 23, no. 8, pp. 1273–1282. RinaldiMunir, 2004, Steganography dan Watermarking, Bandung : Institut Teknologi Bandung. W. Bender, D. Gruhl, N. Morimoto & A. Lu, 1996,Techniques for Data Hiding, IBM Systems Journal vol.35 (3-4), 313-336. 13.9