analisis audio watermarking menggunakan metode discrete cosine

advertisement
Seminar Nasional Cendekiawan 2016
ISSN (E) : 2540-7589
ISSN (P) : 2460-8696
ANALISIS AUDIO WATERMARKING MENGGUNAKAN METODE DISCRETE
COSINE TRANSFORM DENGAN PENGKODEAN BCH
Irfan Dwi Pratama1), GelarBudiman2), I NyomanAprazRamatryana3)
1.2.3 ) Jurusan S1 Teknik Telekomunikasi, Fakultas TeknikElektro, Universitas Telkom
E-mail: [email protected]
E-mail: [email protected]
E-mail: [email protected]
Abstrak
Produk digital seperti audio, image ataupun film merupakan karya intelektual yang
dilindungi dan memiliki hak cipta. Banyaknya penggandaan dan klaim atas produk digital
tersebut mengakibatkan pemegang hak cipta yang sebenarnya akan dirugikan. Salah
satu cara untuk melindungi kepemilikan produk digital adalah dengan menyisipkan atau
menyembunyikan suatu informasi, misal data pemilik hak cipta, kedalam produk digital
tersebut atau yang disebut dengan digitalwatermarking. AudioWatermarking adalah suatu
teknik menyisipkan atau menyembunyikan suatu informasikedalam suatu file audio. Pada
penelitian ini menerapkan metode Discrete Cosine TransformsertaBCH code sebagai
pengoreksi error. Sistem menghasilkan capacity yang besar yaitu 700 bps-2 kbps,
perceptual quality yang cukup baik (SDG> 3.85 dan 25 dB < SNR < 56 dB)
sertarobustness yang baik terhadap beberapa serangan yang umumseperti kompresi
MP3, Noise, Echo dll.
Kata kunci: Audio Watermarking, Discrete Cosine Transform (DCT), BCH Code
Pendahuluan
Sering berkembang pesatnya teknologi informasi, masalah pembajakan pada data
digital semakin marak dilakukan. Hal inidikarenakan mudahnya cara pembajakan
terhadap data digital. Oleh karena itu, diperlukan suatu cara yang mampu melindungi hak
cipta dan kepemilikan data digital. DigitalWatermarking menjadi sebuah solusi yang tepat
untuk masalah tersebut. Digital watermarking adalah sebuah teknik dimana sebuah
informasi disisipkan atau disembunyikan kedalam sebuat set host-data digitalseperti
audio, imageatauvideo. Pemberian watermark ini dilakukan sedemikian sehingga
watermark yang disisipkan tidak merusak data digital yang dilindungi (Rinaldi, 2004).
Watermarking pada audio memiliki tantangan tersendiri dibandingkan dengan
gambar atau video, ini karena HumanAuditorySystem (HAS) bekerja pada range frekuensi
yang lebar (W. Bender, 1996). Dalam menyembunyikan sebuah informasi, ada beberapa
kriteria yang harus dipenuhi antara lain :
a)
Payload
b)
c)
Robustness
Imperceptibility
:Banyaknya data yangdapat disisipkan, direpresentasikan
dalamsatuanbit per second (bps)
: Ketahanan watermarkterhadap serangan
:Tidak terasa oleh indera manusia
Ketiga kriteria tersebut tidak saling berbanding lurus sehingga hal ini
menjadi tantangan tersendiri bagi para peneliti untuk menghasilkan watermarked
audio yang baik. Akan tetapi masalah utama yang dihadapi adalah ketika selesai
melakukan proses penyisipan. Audio yang dihasilkan dari proses penyisipan atau
disebut juga sebagai watermarked audio atau watermark signal diberi berbagai
macam serangan untuk menguji ketahanan data yang disisipkan. Sehingga ketika
sinyal hasil serangan tersebut dimasukkan kedalam proses ekstraksi, data yang
disisipkan sebelumnya bisa berbeda dari data awal yang disisipkan.
13.1
Seminar Nasional Cendekiawan 2016
ISSN (E) : 2540-7589
ISSN (P) : 2460-8696
Studi Pustaka
a) Discrete Cosine Transform(DCT)
DCTmerupakan suatu teknik yang digunakan untuk melakukan konversi sinyal ke
dalam komponen frekuensi pembentuknya. DCT merupakan transformasi yang
berhubungan dengan transformasi Fourier, sama seperti Discrete Fourier Transform
(DFT) tetapi DCT hanya memperhitungkan nilai real dari hasil transformasinya.
Penggunaan metode transformasi sendirimenghasilkan imperceptibility yang lebih baik
dan tahan terhadap serangan (Mehdi, 2015). Berikut ini adalah persamaan DCT yang
digunakan pada penelitian ini :
‫∑ )݇( ݓ = )݇(ݕ‬ே௡ୀଵ ‫ )݊(ݔ‬cos
Dimana w(k) :
ଵ
√ே
ට
ଶ
ே
గ(ଶ௡ିଵ)(௞ିଵ)
,
ଶே
݇ = 1, … , ܰ
(1)
,݇ = 1
(2)
,݇ = 2 ≤ ݇≤ ܰ
(3)
Sedangkan Inverse Discrete Cosine Transform (IDCT) mengonstruksikan kembali
bilangan dari koefisien DCT. Fungsi IDCT merupakan fungsi inverse dari fungsi DCT.
‫∑ = )݊(ݔ‬ே௞ୀଵ ‫ )݇(ݕ)݇( ݓ‬cos
గ(ଶ௡ିଵ)(௞ିଵ)
,
ଶே
݊ = 1, … , ܰ
(4)
b)
BCH Code
BCH Code merupakan salah satu metode pendeteksi dan pengoreksi error yang
terjadi secara acak yang mampu mengoreksi beberapa kesalahan (multiple error)
sekaligus dan merupakan pengembangan dari metode Hamming Code. BCH Code
adalah suatu contoh binary code, yang diperkenalkan oleh dua orang ilmuwan, R. C.
Bose dan D. V. Ray-Chaudhuri mengacu pada penemuan A. Hocquenghem.
Misalkan suatu BCH code adalah linier (n,k) code, maka berikut ini diberikan
hubungan antara panjang code (n), panjang pesan (k) dan kemampuan koreksi error
maksimum (t) yang dimiliki oleh BCH code tersebut (Achmad, 2012).
Tabel 1. Hubungan n, k dan t pada BCH (n,k) Code
n
k
t
n
k
t
7
4
1
63
57
1
15
11
1
51
2
7
2
45
3
5
3
39
4
26
1
36
5
21
2
30
6
16
3
24
7
11
5
18
10
6
7
16
11
10
13
7
15
31
13.2
Seminar Nasional Cendekiawan 2016
ISSN (E) : 2540-7589
ISSN (P) : 2460-8696
Metodologi Penelitian
Pada watermarking terdapat dua tahapan penting, yaitu proses penyisipan
(embedding) dan proses pengambilan informasi (extracting). Tahapan-tahapan yang
dilalui tersebut secara umum dapat dilihat pada diagram blok berikut :
Gambar 1. Diagram blok sistem
Pada gambar di atas, sinyal audiodisisipkaninformasi (watermark)
dengancaratertentusehinggadihasilkan sebuah watermark signal atau watermarked
audio.Selanjutnya adalah tahap serangan, dimanasinyal watermark diserangatau
mengalamiberbagaipengolahan sinyalsepertikompresi MP3, noise dll. Hal ini untuk
menguji ketahanan watermark terhadap serangan yang ada. Kemudian melalui proses
ekstraksi sehingga didapat informasi yang disisipkan. Selanjutnya informasi hasil
ekstraksi dibandingkan dengan informasi awal untuk mengetahui tingkat akurasi sistem.
a) Proses Penyisipan
Proses penyisipan dengan menggunakan teknik Discrete Cosine Transform
melalui beberapa tahapan. Tahapan-tahapan tersebut adalah sebagaiberikut:




Pemilihanaudio sebagai host untuk disisipkan informasi. Sinyalaudio ini
kemudian dibagi-bagi menjadi M frame dengan ukuran masing-masing frame N
sample.
Kemudian melalui proses DCT, yaitu proses pengubahan domain waktu ke
domain frekuensi. Pada domain inilah informasi akan disisipkan.
Di sisi lain, informasi yang akan disisipkan terlebih dahulu dijadikan biner.
Setelah itu melalui proses BCH encoding dengan parameter yang sudah
ditentukan. Hasil encoding inilah yang akan disisipkan pada host.
Selanjutnya untuk proses penyisipan memanfaatkan deret Fibonacci. Jumlah
deret Fibonacci yang digunakan tergantung jumlah N sample, dengan nilai awal
di N/2 + 1 karena bagian frame yang akan disisipkan di frekuensi tinggi. Hal ini
dikarenakan sensitivitas pendengaran manusia kurang peka pada frekuensi
tinggi. Sebagai contoh, misal N = 256, maka deret yang digunakan :
Tabel 2. Deret Fibonacci dan Implementasinya pada Sistem
Fibonacci
1
1
2
3
5
8
13
21
34
Implementasi
129
130
132
135
140
148
161
182
216

Setelah itu, bit disisipkan di antara bilangan Fibonacci. Sebagai contoh, misal
sample Fibonacci 130 dan 132.
o Untuk bit 0, nilaiamplitudepadasample diantara deret Fibonacci diubah
menjadi nilai amplitudepada sample Fibonacci 130 (bawah).
13.3
Seminar Nasional Cendekiawan 2016
ISSN (E) : 2540-7589
ISSN (P) : 2460-8696
Untuk bit 1, nilaiamplitudepadasamplediantara deret Fibonacci diubah
menjadi nilaiamplitude pada sample Fibonacci 132 (atas).
Dengan cara seperti ini maka dalam satu frame dapat disisipkan lebih dari satu
bit (xbit) sehingga kapasitas sistem meningkat x kali lipat.
Watermarkdisisipkan di sepanjang host.
Selanjutnya adalah Inverse DCT, yaitu proses pengubahan domain frekuensi ke
domain waktu. Kemudian masing-masing frame digabung kembali menjadi satu
sinyal utuh dengan watermark yang sudah disisipkan atau disebut sinyal
watermark.
Kemudiansinyalwatermarkdiserangdenganberbagaipengolahansinyaluntukmeng
ujiketahananwatermark.
o




b) Proses Ekstraksi
Pada tahap ini, sinyal watermarkyang telahdiserang selanjutnya diproses untuk
mendapatkankembaliinformasi yang disisipkanuntukkemudiandianalisis.
Berikutadalahtahapan-tahapan proses ekstraksi :




Sinyal dibagi-bagi menjadi M frame dengan ukuran masing-masing frame N
sample, kemudian melalui proses DCT.
Setelah itu, proses ekstraksi dengan memanfaatkan deret Fibonacci yang
telahdijelaskan sebelumnya
Misal menggunakan sample Fibonacci 130 dan 132, kemudianhitung rata-rata
nilai sampledi antara deret Fibonacci tersebut :
 d1 = absolut(nilai rata-rata – nilai pada sample Fibonacci 130)
 d2 = absolut(nilai rata-rata – nilai pada sample Fibonacci 132)
 Jika d1 < d2, maka bit 0
 Jika d1 > d2, maka bit 1
Setelah bit hasil ekstraksi didapat, selanjutnya bit-bit tersebut melalui proses
decoding BCH. Hasil decoding inilah yang dibandingkan dengan bit informasi awal
yang disisipkan sehingga dapat diketahui nilai BER dan akurasi sistem.
Sementaraitu, parameter–parameter yang diujikan pada penelitianini antara lain :
a) Bit Error Rate (BER)
BER dihitung dengan membandingkan jumlah bit yang salah atau errorhasil ekstraksi
dengan bit informasi awal.
௃௨௠ ௟௔௛௕௜௧௘௥௥௢௥
‫ = ܴܧܤ‬ቀ௃௨௠ ௟௔௛௕௜௧௞௘௦௘௟௨௥௨௛௔௡ቁ× 100%
(5)
b) Signal to Noise Ratio (SNR)
SNR adalahperbedaannilaiantarasinyal audio aslidengansinyalwatermark.
ܴܵܰ = 10. logଵ଴ ∑
(6)
∑೙ [௦೚(௡)]మ
೙ [௦ೢ (௡)ି௦೚ (௡)]
మ
Dimana so(n) adalah sinyal audio asli sedangkan sw(n) adalah sinyal watermark.
c) Perceptual Evaluation of Audio Quality (PEAQ)
PEAQ adalahpenilaianterhadapkualitas audio secaraobjektif / Objective Difference
Grade (ODG) berdasarkanrekomendasi ITU-R BS.1387
d) Mean Opinion Score (MOS)
13.4
Seminar Nasional Cendekiawan 2016
ISSN (E) : 2540-7589
ISSN (P) : 2460-8696
MOSadalahpenilaianterhadapkualitas audio secarasubjektif / Subjective Difference
Grade (SDG) berdasarkanrekomendasi ITU-R BS.562.Berikutadalahrangenilaidari
ODG danSDG :
Tabel 3. Parameter ODG dan SDG
ODG
SDG
Imperceptibility
0
5
Watermarktidakterasa
-1
-2
-3
4
3
2
Watermarksedikitterasatapitidakmengganggu
Watermarkterasadansedikitmengganggu
Watermarkmengganggu, audiodapatterdengar
-4
1
Watermarksangatmengganggu, audiotidakdapatterdengar
Hasil dan Pembahasan
Pengujian yang dilakukan pada penelitian ini menggunakan enam jenis audio yang
berbeda(sample rate 44.100 Hz) sebagai host yang akan disisipkan informasi berupa teks
(‘telkom university’) dan menggunakan tiga nilai BCH(n,k) yaitu BCH (7,4), BCH (31,16)
dan BCH (63,16). Enam audio tersebut dapat dilihat pada tabel 4 berikut.
Tabel 4. File Audio dan Jenisnya
File
Jenis Audio
Durasi (s)
Conversation.wav
Voice
4
Bola.wav
Voice
15
Diskusi.wav
Voice
15
Klasik.wav
Instrumental
15
Pop.wav
Musik Pop
14
Rock.wav
Musik Rock
15
Watermarked audio yang dihasilkan akan diuji mengenaipengaruh ukuran frame,
perceptual quality dan berbagaiserangan terhadap watermarked audio.
a) Pengaruh ukuran frame terhadap parameterwatermarking
Berdasarkan hasil pengujian sistem terhadap sebuah file audio (conversation.wav)
dengan menggunakan tiga ukuran frame yang berbeda, maka didapatkan hasil
sebagai berikut :
Tabel 5. Hasil Pengaruh Ukuran Frame PadaBCH (7,4)
Parameter
128
256
512
BER
0
0
0
ODG
-1.07
-0.91
-1.19
SNR (dB)
43.58
43.14
42.75
Bit per Frame
6
7
9
Rate (bps)
2067
1205
775
Tabel 6. Hasil Pengaruh Ukuran Frame Pada BCH (31,16)
Parameter
128
256
512
BER
0
0
0
ODG
-1.03
-0.88
-1.22
SNR (dB)
43.52
43.12
42.28
Bit per Frame
6
7
9
Rate (bps)
2067
1205
775
13.5
Seminar Nasional Cendekiawan 2016
ISSN (E) : 2540-7589
ISSN (P) : 2460-8696
Tabel 7. Hasil Pengaruh Ukuran Frame Pada BCH (63,16)
Parameter
128
256
512
BER
0
0
0
ODG
-1.05
-0.91
-1.12
SNR (dB)
43.4
43.49
42.69
Bit per Frame
6
7
9
Rate (bps)
2067
1205
775
Pada tabel di atas dapat dilihat bahwa ukuran frame 256 menghasilkan nilai ODG
paling baik dibandingukuranframe lain untuk semua nilai BCH (n,k). Sehingga untuk
pengujian berikutnya menggunakan ukuran frame 256.
b) Perceptual Quality
Pengujian dilakukan terhadap 5 file audio yang berbeda-beda jenisnya untuk
mengetahui perceptual quality masing-masing file. Untuk pengujian SDG diujikan
kepada 30 orang responden untuk memberikan penilaian terhadap kualitas masingmasing watermarked audio. Berikut adalah hasil selengkapnya :
Tabel 8. Hasil Perceptual Quality
File
ODG
SDG
SNR (dB)
Rate (bps)
Bola
-2.615
4.12
48.307
1205
Diskusi
-3.392
4.19
56.099
1206
Klasik
-3.137
4.15
53.961
1206
Pop
-1.052
3.85
25.466
1205
Rock
-2.2
4.42
30.947
1206
Pada tabel di atas dapat dilihat bahwa nilai SNR dan SDG menunjukan hasil yang
berbanding lurus tetapi tidak pada hasil ODG. Nilai ODG pada hasil percobaan di atas
tidak teratur karena informasi disisipkan di sepanjang lagu untuk keperluan
robustness. Akan tetapi, nilai SDG yang paling dipertimbangkan karena pada
akhirnya persepsi manusia yang menentukan. Sehingga untuk hasil perceptual quality
pada sistem ini dapat dikatakan cukup baik (SDG> 3,85 dan 25,4 dB < SNR < 56 dB).
c) Hasil Serangan terhadap watermarked audio
a. Kompresi MP3
Berdasarkan hasil pengujian sistem ketika diserang dengan kompresi MP3
dengan mengubah nilai bit rate nya, maka didapatkan hasil sebagai berikut :
13.6
BER
Seminar Nasional Cendekiawan 2016
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
ISSN (E) : 2540-7589
ISSN (P) : 2460-8696
BCH (63,16)
BCH (31,16)
64k
96k
128k
160k
192k
320k
BCH (63,16)
0,406
0,286
0,234
0,182
0,142
0,07
BCH (31,16)
0,39
0,268
0,22
0,174
0,164
0,098
BCH (7,4)
0,38
0,298
0,228
0,18
0,172
0,088
BCH (7,4)
Bit Rate MP3
Gambar 2. Hasil pengujian perubahan Bit Rate MP3 terhadap BER
Berdasarkan grafik di atas, dapat dilihat bahwa saat bit rate semakin besar, maka
BER semakin baik. Hal ini karena nilai bit rate yang digunakan berhubungan
dengan nilai frekuensi cut-offLowPass Filter (LPF) yang digunakan untuk proses
kompresi. Semakin besar nilai bit rate, frekuensi cut-off semakin besar.Karena
informasidisisipkan pada frekuensi tinggi sehingga nilai BER semakin baik.
BER
 Penambahan noise
Sinyaldiberinoisejeniswhitedanpinkdimana level noise di bawahdaya rata-rata
sinyal.Berdasarkan hasil pengujian sistem ketika diserang dengan noise dengan
mengubah levelnoise-nya, maka didapatkan hasil sebagai berikut :
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
BCH (63,16)
BCH (31,16)
BCH (7,4)
10 dB
15 dB
20 dB
BCH (63,16)
0,386
0,342
0,296
BCH (31,16)
0,37
0,338
0,28
BCH (7,4)
0,356
0,328
0,282
Level Noise
Gambar 3. Hasil pengujian perubahan level noise terhadap BER
Berdasarkan grafik di atas, dapat dilihat bahwa saat level noisesemakin besar
maka perubahan yang terjadi pada sinyal tidak terlalu besar, sehingga BER
semakin baik.
13.7
Seminar Nasional Cendekiawan 2016
ISSN (E) : 2540-7589
ISSN (P) : 2460-8696
 Hasil Serangan lainnya
Berikut hasil pengujian untuk jenis serangan lainnya :
Tabel 9. Hasil Pengujian Pada BCH (7,4)
JenisSerangan
Bola
Diskusi
Klasik
Pop
Rock
Stereo to Mono
0
0
0
0
0
Resample
0.42
0.46
0.46
0.42
0.43
Change Speed
0
0.01
0
0
0
Echo
0.03
0.04
0.03
0
0
Tabel 10. Hasil Pengujian Pada BCH (31,16)
JenisSerangan
Bola
Diskusi
Klasik
Pop
Rock
Stereo to Mono
0
0
0
0
0
Resample
0.43
0.42
0.4
0.43
0.43
Change Speed
0
0
0
0
0
Echo
0.02
0.04
0.02
0
0
Tabel 11. Hasil Pengujian Pada BCH (63,16)
JenisSerangan
Bola
Diskusi
Klasik
Pop
Rock
Stereo to Mono
0
0
0
0
0
Resample
0.49
0.49
0.5
0.44
0.48
Change Speed
0
0
0
0
0
Echo
0
0
0
0
0
Berdasarkan hasil diatas dapat dilihat bahwa jenis serangan Resample adalah
serangan yang paling merusak. Hal ini dikarenakan, sample rate berubah
sedangkan ukuran frame N tetap sehingga pengambilan nilai untuk proses
ekstraksi menjadi berantakan, akibatnya informasimenjadi rusak. Selain itu, nilai
BCH (63,16) mampu mengurangi nilai error pada BCH (7,4) dan BCH (31,16)
untuk nilai-nilai error yang kecil sehingga menjadi tidak ada error (BER = 0). Hal
inikarenakemampuankoreksierror BCH (63,16) lebihbanyakdibanding BCH (7,4)
dan BCH (31,16).
Kesimpulan
Berdasarkanhasil pengujiandanpembahasan pada bagian sebelumnya, maka
dapat ditarik kesimpulan sebagai berikut :
a) Pengaruh ukuran frame terhadap ODG menunjukan bahwa ukuran frame 256
menghasilkan nilai ODG yang lebih baik dibandingkan dengan ukuran frame 128 dan
512 untuk semua nilai BCH (n,k).
b) Perceptual Quality untuk sistem ini menunjukkan hasil yang cukup baik ( SDG > 3.85
dan 25,4 dB < SNR < 56 dB).
c) Serangan yang paling merusak watermark adalah serangan Resample.
d) Nilai BCH (63,16) mampu mengurangi nilai error pada BCH (7,4) dan BCH (31,16)
untuk nilai-nilai error yang kecil sehingga menjadi tidak ada error (BER = 0).
13.8
Seminar Nasional Cendekiawan 2016
ISSN (E) : 2540-7589
ISSN (P) : 2460-8696
Daftar pustaka
AchmadFahrurozi&Sri Mardiyati, 2012, Analisis Kontruksi Dan Sifat BCH Code,
Universitas Padjadjaran, Jatinangor.
Mehdi Fallahpour &David Megias, 2015, Audio Watermarking Based on Fibonacci
Numbers, Audio, Speech, Lang. Process. IEEE/ACM Trans. (Volume23 , Issue 8 ), vol.
23, no. 8, pp. 1273–1282.
RinaldiMunir, 2004, Steganography dan Watermarking, Bandung : Institut Teknologi
Bandung.
W. Bender, D. Gruhl, N. Morimoto & A. Lu, 1996,Techniques for Data Hiding, IBM
Systems Journal vol.35 (3-4), 313-336.
13.9
Download