Bab 1 - Universitas Sumatera Utara

advertisement
Bab 2
LANDASAN TEORI
2.1 Audio
Suara atau bunyi adalah suatu gelombang longitudinal yang merambat melalui suatu
medium, seperti zat cair, padat dan gas. Bunyi dapat terdengar oleh manusia apabila
gelombang tersebut mencapai telinga manusia dengan frekuensi 20Hz – 20kHz , suara ini
disebut dengan audiosonic atau dikenal dengan audio, gelombang suara pada batas
frekuensi tersebut disebut dengan sinyal akustik. Akustik merupakan cabang fisika yang
mempelajari bunyi. Level tekanan suara (volume suara) dihitung dalam desibel (dB),
yaitu perhitungan rasio antara titik referensi yang dipilih dalam skala logaritmik dan level
yang benar-benar dialami. Keras lemahnya bunyi atau tinggi rendahnya gelombang
disebut dengan amplitudo. Bunyi mulai dapat merusak telinga jika tingkat volumenya
lebih besar dari 85 dB dan pada ukuran 130 dB akan mampu membuat hancur gendang
telinga.
Frekuensi adalah banyaknya gelombang yang mempunyai pola yang sama yang
berulang pada interval tertentu selama 1 detik. Berdasarkan frekuensi, suara atau bunyi
dibagi atas :
1. Infrasound yaitu suara pada rentang frekuensi 0Hz-20Hz.
2. Audiosound yaitu suara pada rentang frekuensi 20Hz-20kHz.
3. Ultrasound yaitu suara pada rentang frekuensi 20kHz-1GHz.
4. Hypersound yaitu suara pada rentang frekuensi 1GHz-10THz.
Menurut Yulid dan Fazmah (2006) , sinyal audio dibagi atas 3 bagian berdasarkan
rentang frekuensinya :
1. Kualitas suara telepon yaitu antara 30Hz-3400Hz
Universitas Sumatera Utara
2. Suara Wideband yaitu 50Hz-7000Hz.
3. Wideband audio yaitu 20Hz- 20000Hz.
2.1.1 Audio Digital
Gelombang suara analog tidak dapat langsung direpresentasikan pada komputer.
Komputer mengukur amplitudo pada satuan waktu tertentu untuk menghasilkan sejumlah
angka. Suara dikonversi menjadi arus listrik dengan menggunakan mikrofon. Kemudian
mengkonversikan osilasi tekanan udara menjadi tegangan osilasi terus-menerus dalam
sebuah rangkaian listrik. Perubahan tegangan cepat ini kemudian diubah menjadi
serangkaian angka oleh digitizer. Sebuah digitizer bertindak seperti voltmeter digital yang
sangat cepat Hal ini menjadikan ribuan pengukuran per detik. Setiap hasil pengukuran
dalam jumlah yang dapat disimpan secara digital (hanya jumlah terbatas angka signifikan
dari jumlah yang dicatat) disebut dengan sampel dan seluruh konversi suara ke
serangkaian angka ini disebut sampling.
Gambar 2.1 Sampling sinyal kontinu.
Keterangan Gambar :Garis biru berubah sesuai dengan tegangan (misalnya, dari
mikrofon), segmen merah sesuai dengan sampel.
Sampel suara diambil dan disimpan sebagai informasi digital dalam bit dan byte.
Angka sampling adalah seberapa sering sampel diambil, disebut juga dengan frekuensi
dan ukuran sampel adalah jumlah angka yang digunakan untuk merepresentasikan nilai
dari tiap sampel. Contoh : jika kualitas CD Audio dikatakan memiliki frekuensi sebesar
44100 Hz, berarti jumlah sampel sebesar 44100 per detik, dan ukuran sampel 8-bit ,
Universitas Sumatera Utara
berarti menyediakan 256 unit untuk menggambarkan rentang amplitudo dari potongan
suara yang di tangkap.
Berdasarkan hal-hal yang tersebut diatas, banyak audio yang beredar dengan
berbagai format yang memiliki karakteristik masing-masing, dan salah satunya adalah
MPEG-1 Layer 3 atau dikenal MP3 yaitu berkas audio yang akan dibahas pada skripsi ini.
MP3 dikembangkan oleh seorang insinyur Jerman, Karlheinz Brandenburg. MP3
memakai pengkodean Pulse Code Modulation (PCM). MP3 adalah salah satu format
pengkodean berkas suara yang memiliki kompresi yang baik (meskipun bersifat lossy)
sehingga ukuran berkas bisa memungkinkan menjadi lebih kecil, MP3 mengurangi
jumlah bit yang diperlukan dengan menggunakan model psychoacoustic untuk
menghilangkan komponen-komponen suara yang tidak terdengar oleh manusia.
MP3 yaitu berkas audio dengan karakteristik sebagai berikut :
1.
Merupakan berkas dengan lossy compression.
2. Sering digunakan di internet karena ukurannya yang cukup kecil dibandingkan
ukuran audio berkas yang tidak terkompresi.
3. Terdaftar pada badan standarisasi internasional pada tahun 1991, yaitu ISO / IEC
11172-3 dan ISO / IEC 13818-3.
4.
Kompresi dilakukan dengan menghilangkan bagian-bagian bunyi yang kurang
berguna bagi pendengaran manusia.
5. Kompresi mp3 dengan kualitas 128 bits 44000 Hz biasanya akan menghasilkan
berkas berukuran 3-4 MB, tetapi unsur panjang pendeknya lagu juga akan
berpengaruh.
6. Memiliki Bit Rate yang bervariasi. Bit Rate adalah suatu ukuran kecepatan transfer
data dalam satuan waktu.( Lihat tabel 2.1)
Universitas Sumatera Utara
Tabel 2.1 Nilai Bit Rate pada MPEG
Bit
V1,L1
V1,L2
V1,L3
V2,L1
0000
Bebas
Bebas
Bebas
Bebas
0001
32
32
32
32
0010
64
48
40
48
0011
96
56
48
56
0100
128
64
56
64
0101
160
80
64
80
0110
192
96
80
96
0111
224
112
96
112
1000
256
128
112
128
1001
288
160
128
144
1010
320
192
160
160
1011
352
224
192
176
1100
384
256
224
192
1101
416
320
256
224
1110
448
384
320
256
1111
Buruk
Buruk
Buruk
Buruk
Keterangan Tabel :
V1 : MPEG-1
V2 : MPEG-2 dan MPEG-2.5
L1 : Layer 1
L2 : Layer 2
L3 : Layer 3
Bit Rate juga terbagi atas beberapa kategori yaitu: Variable bit rate (VBR) digunakan
untuk mendapatkan tingkat kualitas yang tetap, Constant bit rate (CBR) digunakan
untuk streaming server yang tidak ingin terganggu oleh Progressive Download (http),
Unspecified bit Rate (UBR), dan Available bit Rate (ABR).
Universitas Sumatera Utara
7. Nilai Sampling MPEG-1 Layer 3 (MP3) adalah 32Kbps, 44.1 Kbps dan 48Kbps.
Table 2.2 Nilai Sampling MPEG
Bits
00
01
10
11
MPEG1
44100
48000
32000
reserv.
MPEG2
22050
24000
16000
reserv.
MPEG2.5
11025
12000
8000
reserv.
2.2 Digital Watermarking
Watermarking adalah suatu teknik dalam membantu pengamanan berkas-berkas digital
dengan memberikan suatu tanda tertentu pada berkas tersebut untuk menunjukkan akan
kepemilikkan dari berkas tersebut. Watermarking merupakan suatu bentuk steganografi
yaitu ilmu yang mempelajari bagaimana menyembunyikan suatu data pada data yang lain.
Menurut Thanuja dan Nagaraj (2008), Digital watermarking adalah teknik
penambahan sinyal kedalam sinyal digital pada dokumen digital, seperti teks, citra, audio
maupun video. Apabila penambahannya pada sinyal audio maka disebut dengan Audio
Watermarking.
Watermarking sudah ada sejak 700 tahun yang lalu. Pada akhir abad 13, pabrik
kertas di Fabriano, Italia, membuat kertas yang diberi watermark atau tanda-air dengan
cara menekan bentuk cetakan gambar atau tulisan pada kertas yang baru setengah jadi.
Ketika kertas dikeringkan terbentuklah suatu kertas yang ber-watermark. Kertas ini
biasanya digunakan oleh seniman atau sastrawan untuk menulis karya mereka. Kertas
yang sudah dibubuhi tanda-air tersebut sekaligus dijadikan identifikasi bahwa karya seni
diatasnya adalah milik mereka.
Ide watermarking ini akhirnya dikembangkan pada tahun 1990 di Jepang dan
Swiss pada tahun 1993, Watermarking ini mulai digunakan sebagai salah satu tindak
Universitas Sumatera Utara
pengamanan pada data yang semakin meluas penyebaran datanya dengan adanya tingkat
penggunaan internet yang semakin tinggi.
Secara garis besar, berdasarkan penangkapan oleh indera manusia terhadap
keberadaan watermark pada suatu berkas, watermarking terbagi atas :
1. Robust watermarking : Jenis watermark ini tahan terhadap serangan (attack), namun
biasanya watermark yang dibubuhi ke dokumen masih dapat ditangkap oleh indera
penglihatan atau pendengaran manusia.
2. Fragile watermarking : Jenis watermark ini akan mudah rusak jika terjadi serangan,
namun kehadirannya tidak terdeteksi oleh indera manusia.
Suatu sistem watermarking yang ideal harus memenuhi karakteristik berikut ini
yaitu :
1. Unobtrusiveness
Watermarking tidak dapat di deteksi secara langsung oleh indera manusia,
karekteristik ini digunakan hanya pada watermark yang bersifat rahasia.
2. Handal / Kuat (Robustness )
Watermarking yang disisipkan tidak berubah walau data mengalami perubahan yang
secara sengaja atau tidak sengaja, contoh kompresi, resampling, penambahan derau,
dan lain-lain.
3. Universal.
Algoritma watermarking harus dapat digunakan untuk multimedia baik citra, audio,
maupun video.
4. Tidak Ambigu.
Tidak menyebabkan
membingungkan.
pengidentifikasian
media
yang
dilindungi
menjadi
Secara umum metode digital watermarking pada audio terbagi dalam dua
kelompok yaitu Domain Data (penyisipan dengan mengubah data audio yang disisipkan
watermark) dan Domain Frekuensi (mengubah bagian dari spektrum sinyal).
Universitas Sumatera Utara
Pembangunan suatu sistem watermarking membutuhkan suatu kunci watermark
untuk dapat membuka kembali watermark yang telah ditambahkan, dan kunci watermark
ini hanya diketahui oleh pihak yang berkepentingan seperti produser label dan
sebagainya.
Derau
Pendeteksi
Watermark
Penambahan Watermark
File
Identitas
Pengkodean
Watermark
+
Kunci
Sinyal induk
Watermark
+
Dekode
Watermark
File
Identitas
Kunci
Watermark
Gambar 2.2 Perancangan Sistem Watermarking
Penerapan Digital Watermarking langsung dapat diterapkan pada data digital
tersebut atau menggunakan tranformasi ke dalam domain yang lain seperti domain waktu
atau domain frekuensi. Berbagai transformasi yang dikenal dalam pengolahan sinyal
digital seperti :
1. Transformasi Fourier
2. DCT (Discrete Cosine Transform)
3. Transformasi Wavelet, dan sebagainya.
Dalam matematika, Transformasi Fourier adalah operasi yang merubah suatu nilai
kompleks fungsi variabel real kedalam bentuk yang lain. Pada pengolahan sinyal,
transformasi ini bekerja pada domain waktu kemudian berkembang menjadi transformasi
Universitas Sumatera Utara
yang merubah fungsi kedalam domain frekuensi. Ada beberapa konvensi umum untuk
menentukan Transformasi Fourier dari suatu integral fungsi f: R → C (Lihat Persamaan
2.1)
untuk setiap bilangan real ξ.
(2.1)
Variabel bebas x merepresentasikan waktu (dengan SI satuan detik), transformasi variabel
ξ mewakili frekuensi (dalam hertz). Untuk kondisi yang sesuai, ƒ dapat direkonstruksi
dari
oleh Perubahan Invers (Persamaan 2.2)
.
untuk setiap bilangan real x.
(2.2)
Dalam studi deret Fourier, fungsi periodik ditulis sebagai jumlah matematis
gelombang sederhana yang diwakilkan oleh sinus dan cosinus. Hal ini dikarenakan sifat
sinus dan kosinus adalah untuk memulihkan jumlah masing-masing gelombang dalam
penjumlahan dengan integral Dalam banyak kasus, diharapkan untuk menggunakan
rumus Euler, yang menyatakan bahwa e2πiθ = cos 2 πθ + i sin 2 πθ ,untuk menulis deret
Fourier dalam bentuk gelombang dasar e2πiθ. Ini memiliki keuntungan untuk
menyederhanakan banyak rumus yang terlibat dan memberikan rumusan untuk deret
Fourier
Tranformasi Fourier terbagi atas beberapa bagian, salah satunya adalah Discrete
Fourier Transform yaitu merubah satu fungsi ke fungsi yang lain, dan merupakan
representasi domain frekuensi dari fungsi asli. Tetapi DFT memerlukan masukan fungsi
diskrit dan nilai selain nol yang memliki keterbatasan durasi. Input digunakan pada
sampling fungsi kontinu, seperti fungsi gelombang suara manusia
Universitas Sumatera Utara
2.2.1 Tujuan Watermarking
Watermarking digunakan untuk beberapa tujuan seperti :
1. Otentikasi.
Watermarking digunakan sebagai alat untuk mengidentifikasi atau menunjukkan
bahwa data digital telah mengalami perubahan dari aslinya.
2. Pengidentifikasi Lokasi.
Watermarking digunakan untuk mengidentifikasi isi dari data digital pada lokasilokasi tertentu.
3. Anotasi.
Watermarking digunakan hanya sebagai keterangan tentang data digital itu sendiri.
4. Perlindungan Hak Cipta, yaitu menyembunyikan label hak cipta pada data.
2.2.2 Audio Watermarking
Audio Watermarking adalah teknik watermarking dengan audio sebagai berkas yang
menjadi tumpangan. Berdasarkan domain penyisipannya, teknik watermarking audio
dapat dibagi menjadi dua kelompok, yaitu temporal watermarking dan spectral
watermarking. Temporal watermarking adalah melakukan penyisipan data pada audio
host dalam domain waktu, sedangkan spectral watermarking terlebih dulu melakukan
proses transformasi dari domain waktu ke dalam domain frekuensi, sehingga
penyisipannya dilakukan pada elemen-elemen frekuensi.
Metode audio watermarking dibagi berdasarkan domain yaitu :
1. Domain waktu
Metode ini bekerja dengan cara mengubah data audio dalam domain waktu yang akan
disisipkan watermark. Contohnya dengan mengubah LSB (Least Significant Bit) dari data
tersebut. Secara umum metode ini rentan terhadap proses kompresi, transmisi dan
encoding.
Universitas Sumatera Utara
Beberapa teknik algoritma yang termasuk dalam metode ini adalah:
a)
Compressed-domain watermarking : Pada teknik ini hanya representasi data yang
terkompresi yang diberi watermark. Saat data di uncompressed maka watermark
tidak lagi tersedia.
b)
Bit dithering : Watermark disisipkan pada tiap LSB, baik pada representasi data
terkompresi atau tidak. Teknik ini membuat derau pada sinyal.
c)
Modulasi Amplitudo : Cara ini membuat setiap puncak sinyal dimodifikasi agar
jatuh ke dalam pita-pita amplitudo yang telah ditentukan
d)
Penyembunyian Echo: Dalam metode ini salinan-salinan terputus-putus dari sinyal
dicampur dengan sinyal asli dengan rentang waktu yang cukup kecil. Rentang
waktu ini cukup kecil sehingga amplitudo salinannya cukup kecil sehingga tidak
terdengar.
2. Domain frekuensi
Metode ini bekerja dengan cara mengubah konten spektral dalam domain frekuensi dari
sinyal seperti membuang komponen frekuensi tertentu atau menambahkan data sebagai
derau dengan amplitudo rendah sehingga tidak terdengar. Beberapa teknik yang bekerja
dengan metode ini:
a)
Phase coding : Bekerja berdasarkan karakteristik sistem pendengaran manusia
(Human Auditory System) yang mengabaikan suara yang lebih lemah jika dua suara
itu datang bersamaan. Secara garis besar data watermark dibuat menjadi derau
dengan amplitudo yang lebih lemah dibandingkan amplitudo data audio lalu
digabungkan
b)
Modifikasi Pita Frekuensi : Informasi watermark ditambahkan dengan cara
membuang atau menyisipkan ke dalam pita-pita (band) spektral tertentu.
c)
Penyebaran spektrum : metode ini diadopsi dari teknik penyebaran spektrum dalam
telekomunikasi.
d)
Frequency masking : metode ini memanfaatkan kelemahan pendengaran manusia
yang tidak dapat mendengar pada frekuensi tertentu.
Universitas Sumatera Utara
2.3 Phase Coding
Metode Phase coding adalah metode menyembunyikan data pada berkas induk yaitu
audio, yang memanfaatkan kelemahan pada pendengaran manusia dengan menggantikan
fase dari segmen awal audio dengan fase referensi yang merepresentasikan label
watermark dan ditambahkan fase diferensial audio asli. Dengan cara ini, diferensial
pengkodean dengan fase biner watermark diseimbangkan. Hal ini untuk membangkitkan
aliran biner secara random yang membentuk gelombang digital (berbentuk bujur
sangkar). Gelombang tersebut memiliki fase π/2 atau –π/2.
Langkah pertama dalam Phase coding adalah membagi urutan suara kedalam
segmen pendek yang ditunjukkan pada gambar 2.1
Gambar 2.3 Sinyal Asli dan Sinyal yang dibagi beberapa segmen
Suatu Transformasi Fourier Diskrit (Discrete Fourier Transform) dihitung pada masingmasing panjang segmen N. Untuk masing-masing elemen hasil fase data dari DFT,
hingga nilai N-1, menghitung susunan diferensial antara elemen fase yang berdekatan.
Fase absolut dari sinyal data watermark ditambahkan pada pada diferensial, atau Fourier
Diskrit pada langkah terakhir.
Langkah selanjutnya adalah dengan memasukkan data, dan mengatur nilainya
sebagai fase absolut, kemudian fase absolut watermark di tambahkan pada Fourier Diskrit
dari sinyal asli. Dan gabungkan kembali segmen-segmen yang telah dimodifikasi fasenya
tersebut menjadi satu.
Setelah proses enkode diatas maka akan dilakukan proses dekode yaitui dengan
melakukan sinkronisasi terhadap proses enkoding. Panjang segmen dan panjang
watermark harus diketahui. Proses dekode memerlukan sinyal suara asli untuk melakukan
Universitas Sumatera Utara
pendeteksian. Langkah-langkah pendeteksian watermark yang dilakukan adalah sebagai
berikut :
1. Ambil n bagian pertama dari sinyal suara dimana n adalah panjang segmen enkode
yang diketahui, s[0] ..s[n-1]. Perhitungan hanya dilakukan terhadap n elemen pertama
sinyal karena data watermark disisipkan hanya di segmen awal sinyal suara asli.
2. Lakukan FFT terhadap n-1 sinyal tersebut, kemudian cari nilai fasenya ( φ ) sesuai
persamaan 2.3
 bk
 ak
φ = tan −1 



(2.3)
ak adalah nilai real dari FFT dan bk adalah nilai imaginer dari sinyal tersebut.
3. Konversi nilai fase yang didapatkan, π/2 menjadi bit 1 dan -π/2 menjadi bit 0
sebanyak panjang bit watermark. Hasil konversi nilai fase dibandingkan dengan nilai
fase sinyal suara asli.
4. Didapatkan data bit-bit watermark sesuai dengan hasil konversi kemudian
dibandingkan dengan bit-bit watermark asli untuk mengetahui kebenarannya.
Universitas Sumatera Utara
Download