Bab 2 LANDASAN TEORI 2.1 Audio Suara atau bunyi adalah suatu gelombang longitudinal yang merambat melalui suatu medium, seperti zat cair, padat dan gas. Bunyi dapat terdengar oleh manusia apabila gelombang tersebut mencapai telinga manusia dengan frekuensi 20Hz – 20kHz , suara ini disebut dengan audiosonic atau dikenal dengan audio, gelombang suara pada batas frekuensi tersebut disebut dengan sinyal akustik. Akustik merupakan cabang fisika yang mempelajari bunyi. Level tekanan suara (volume suara) dihitung dalam desibel (dB), yaitu perhitungan rasio antara titik referensi yang dipilih dalam skala logaritmik dan level yang benar-benar dialami. Keras lemahnya bunyi atau tinggi rendahnya gelombang disebut dengan amplitudo. Bunyi mulai dapat merusak telinga jika tingkat volumenya lebih besar dari 85 dB dan pada ukuran 130 dB akan mampu membuat hancur gendang telinga. Frekuensi adalah banyaknya gelombang yang mempunyai pola yang sama yang berulang pada interval tertentu selama 1 detik. Berdasarkan frekuensi, suara atau bunyi dibagi atas : 1. Infrasound yaitu suara pada rentang frekuensi 0Hz-20Hz. 2. Audiosound yaitu suara pada rentang frekuensi 20Hz-20kHz. 3. Ultrasound yaitu suara pada rentang frekuensi 20kHz-1GHz. 4. Hypersound yaitu suara pada rentang frekuensi 1GHz-10THz. Menurut Yulid dan Fazmah (2006) , sinyal audio dibagi atas 3 bagian berdasarkan rentang frekuensinya : 1. Kualitas suara telepon yaitu antara 30Hz-3400Hz Universitas Sumatera Utara 2. Suara Wideband yaitu 50Hz-7000Hz. 3. Wideband audio yaitu 20Hz- 20000Hz. 2.1.1 Audio Digital Gelombang suara analog tidak dapat langsung direpresentasikan pada komputer. Komputer mengukur amplitudo pada satuan waktu tertentu untuk menghasilkan sejumlah angka. Suara dikonversi menjadi arus listrik dengan menggunakan mikrofon. Kemudian mengkonversikan osilasi tekanan udara menjadi tegangan osilasi terus-menerus dalam sebuah rangkaian listrik. Perubahan tegangan cepat ini kemudian diubah menjadi serangkaian angka oleh digitizer. Sebuah digitizer bertindak seperti voltmeter digital yang sangat cepat Hal ini menjadikan ribuan pengukuran per detik. Setiap hasil pengukuran dalam jumlah yang dapat disimpan secara digital (hanya jumlah terbatas angka signifikan dari jumlah yang dicatat) disebut dengan sampel dan seluruh konversi suara ke serangkaian angka ini disebut sampling. Gambar 2.1 Sampling sinyal kontinu. Keterangan Gambar :Garis biru berubah sesuai dengan tegangan (misalnya, dari mikrofon), segmen merah sesuai dengan sampel. Sampel suara diambil dan disimpan sebagai informasi digital dalam bit dan byte. Angka sampling adalah seberapa sering sampel diambil, disebut juga dengan frekuensi dan ukuran sampel adalah jumlah angka yang digunakan untuk merepresentasikan nilai dari tiap sampel. Contoh : jika kualitas CD Audio dikatakan memiliki frekuensi sebesar 44100 Hz, berarti jumlah sampel sebesar 44100 per detik, dan ukuran sampel 8-bit , Universitas Sumatera Utara berarti menyediakan 256 unit untuk menggambarkan rentang amplitudo dari potongan suara yang di tangkap. Berdasarkan hal-hal yang tersebut diatas, banyak audio yang beredar dengan berbagai format yang memiliki karakteristik masing-masing, dan salah satunya adalah MPEG-1 Layer 3 atau dikenal MP3 yaitu berkas audio yang akan dibahas pada skripsi ini. MP3 dikembangkan oleh seorang insinyur Jerman, Karlheinz Brandenburg. MP3 memakai pengkodean Pulse Code Modulation (PCM). MP3 adalah salah satu format pengkodean berkas suara yang memiliki kompresi yang baik (meskipun bersifat lossy) sehingga ukuran berkas bisa memungkinkan menjadi lebih kecil, MP3 mengurangi jumlah bit yang diperlukan dengan menggunakan model psychoacoustic untuk menghilangkan komponen-komponen suara yang tidak terdengar oleh manusia. MP3 yaitu berkas audio dengan karakteristik sebagai berikut : 1. Merupakan berkas dengan lossy compression. 2. Sering digunakan di internet karena ukurannya yang cukup kecil dibandingkan ukuran audio berkas yang tidak terkompresi. 3. Terdaftar pada badan standarisasi internasional pada tahun 1991, yaitu ISO / IEC 11172-3 dan ISO / IEC 13818-3. 4. Kompresi dilakukan dengan menghilangkan bagian-bagian bunyi yang kurang berguna bagi pendengaran manusia. 5. Kompresi mp3 dengan kualitas 128 bits 44000 Hz biasanya akan menghasilkan berkas berukuran 3-4 MB, tetapi unsur panjang pendeknya lagu juga akan berpengaruh. 6. Memiliki Bit Rate yang bervariasi. Bit Rate adalah suatu ukuran kecepatan transfer data dalam satuan waktu.( Lihat tabel 2.1) Universitas Sumatera Utara Tabel 2.1 Nilai Bit Rate pada MPEG Bit V1,L1 V1,L2 V1,L3 V2,L1 0000 Bebas Bebas Bebas Bebas 0001 32 32 32 32 0010 64 48 40 48 0011 96 56 48 56 0100 128 64 56 64 0101 160 80 64 80 0110 192 96 80 96 0111 224 112 96 112 1000 256 128 112 128 1001 288 160 128 144 1010 320 192 160 160 1011 352 224 192 176 1100 384 256 224 192 1101 416 320 256 224 1110 448 384 320 256 1111 Buruk Buruk Buruk Buruk Keterangan Tabel : V1 : MPEG-1 V2 : MPEG-2 dan MPEG-2.5 L1 : Layer 1 L2 : Layer 2 L3 : Layer 3 Bit Rate juga terbagi atas beberapa kategori yaitu: Variable bit rate (VBR) digunakan untuk mendapatkan tingkat kualitas yang tetap, Constant bit rate (CBR) digunakan untuk streaming server yang tidak ingin terganggu oleh Progressive Download (http), Unspecified bit Rate (UBR), dan Available bit Rate (ABR). Universitas Sumatera Utara 7. Nilai Sampling MPEG-1 Layer 3 (MP3) adalah 32Kbps, 44.1 Kbps dan 48Kbps. Table 2.2 Nilai Sampling MPEG Bits 00 01 10 11 MPEG1 44100 48000 32000 reserv. MPEG2 22050 24000 16000 reserv. MPEG2.5 11025 12000 8000 reserv. 2.2 Digital Watermarking Watermarking adalah suatu teknik dalam membantu pengamanan berkas-berkas digital dengan memberikan suatu tanda tertentu pada berkas tersebut untuk menunjukkan akan kepemilikkan dari berkas tersebut. Watermarking merupakan suatu bentuk steganografi yaitu ilmu yang mempelajari bagaimana menyembunyikan suatu data pada data yang lain. Menurut Thanuja dan Nagaraj (2008), Digital watermarking adalah teknik penambahan sinyal kedalam sinyal digital pada dokumen digital, seperti teks, citra, audio maupun video. Apabila penambahannya pada sinyal audio maka disebut dengan Audio Watermarking. Watermarking sudah ada sejak 700 tahun yang lalu. Pada akhir abad 13, pabrik kertas di Fabriano, Italia, membuat kertas yang diberi watermark atau tanda-air dengan cara menekan bentuk cetakan gambar atau tulisan pada kertas yang baru setengah jadi. Ketika kertas dikeringkan terbentuklah suatu kertas yang ber-watermark. Kertas ini biasanya digunakan oleh seniman atau sastrawan untuk menulis karya mereka. Kertas yang sudah dibubuhi tanda-air tersebut sekaligus dijadikan identifikasi bahwa karya seni diatasnya adalah milik mereka. Ide watermarking ini akhirnya dikembangkan pada tahun 1990 di Jepang dan Swiss pada tahun 1993, Watermarking ini mulai digunakan sebagai salah satu tindak Universitas Sumatera Utara pengamanan pada data yang semakin meluas penyebaran datanya dengan adanya tingkat penggunaan internet yang semakin tinggi. Secara garis besar, berdasarkan penangkapan oleh indera manusia terhadap keberadaan watermark pada suatu berkas, watermarking terbagi atas : 1. Robust watermarking : Jenis watermark ini tahan terhadap serangan (attack), namun biasanya watermark yang dibubuhi ke dokumen masih dapat ditangkap oleh indera penglihatan atau pendengaran manusia. 2. Fragile watermarking : Jenis watermark ini akan mudah rusak jika terjadi serangan, namun kehadirannya tidak terdeteksi oleh indera manusia. Suatu sistem watermarking yang ideal harus memenuhi karakteristik berikut ini yaitu : 1. Unobtrusiveness Watermarking tidak dapat di deteksi secara langsung oleh indera manusia, karekteristik ini digunakan hanya pada watermark yang bersifat rahasia. 2. Handal / Kuat (Robustness ) Watermarking yang disisipkan tidak berubah walau data mengalami perubahan yang secara sengaja atau tidak sengaja, contoh kompresi, resampling, penambahan derau, dan lain-lain. 3. Universal. Algoritma watermarking harus dapat digunakan untuk multimedia baik citra, audio, maupun video. 4. Tidak Ambigu. Tidak menyebabkan membingungkan. pengidentifikasian media yang dilindungi menjadi Secara umum metode digital watermarking pada audio terbagi dalam dua kelompok yaitu Domain Data (penyisipan dengan mengubah data audio yang disisipkan watermark) dan Domain Frekuensi (mengubah bagian dari spektrum sinyal). Universitas Sumatera Utara Pembangunan suatu sistem watermarking membutuhkan suatu kunci watermark untuk dapat membuka kembali watermark yang telah ditambahkan, dan kunci watermark ini hanya diketahui oleh pihak yang berkepentingan seperti produser label dan sebagainya. Derau Pendeteksi Watermark Penambahan Watermark File Identitas Pengkodean Watermark + Kunci Sinyal induk Watermark + Dekode Watermark File Identitas Kunci Watermark Gambar 2.2 Perancangan Sistem Watermarking Penerapan Digital Watermarking langsung dapat diterapkan pada data digital tersebut atau menggunakan tranformasi ke dalam domain yang lain seperti domain waktu atau domain frekuensi. Berbagai transformasi yang dikenal dalam pengolahan sinyal digital seperti : 1. Transformasi Fourier 2. DCT (Discrete Cosine Transform) 3. Transformasi Wavelet, dan sebagainya. Dalam matematika, Transformasi Fourier adalah operasi yang merubah suatu nilai kompleks fungsi variabel real kedalam bentuk yang lain. Pada pengolahan sinyal, transformasi ini bekerja pada domain waktu kemudian berkembang menjadi transformasi Universitas Sumatera Utara yang merubah fungsi kedalam domain frekuensi. Ada beberapa konvensi umum untuk menentukan Transformasi Fourier dari suatu integral fungsi f: R → C (Lihat Persamaan 2.1) untuk setiap bilangan real ξ. (2.1) Variabel bebas x merepresentasikan waktu (dengan SI satuan detik), transformasi variabel ξ mewakili frekuensi (dalam hertz). Untuk kondisi yang sesuai, ƒ dapat direkonstruksi dari oleh Perubahan Invers (Persamaan 2.2) . untuk setiap bilangan real x. (2.2) Dalam studi deret Fourier, fungsi periodik ditulis sebagai jumlah matematis gelombang sederhana yang diwakilkan oleh sinus dan cosinus. Hal ini dikarenakan sifat sinus dan kosinus adalah untuk memulihkan jumlah masing-masing gelombang dalam penjumlahan dengan integral Dalam banyak kasus, diharapkan untuk menggunakan rumus Euler, yang menyatakan bahwa e2πiθ = cos 2 πθ + i sin 2 πθ ,untuk menulis deret Fourier dalam bentuk gelombang dasar e2πiθ. Ini memiliki keuntungan untuk menyederhanakan banyak rumus yang terlibat dan memberikan rumusan untuk deret Fourier Tranformasi Fourier terbagi atas beberapa bagian, salah satunya adalah Discrete Fourier Transform yaitu merubah satu fungsi ke fungsi yang lain, dan merupakan representasi domain frekuensi dari fungsi asli. Tetapi DFT memerlukan masukan fungsi diskrit dan nilai selain nol yang memliki keterbatasan durasi. Input digunakan pada sampling fungsi kontinu, seperti fungsi gelombang suara manusia Universitas Sumatera Utara 2.2.1 Tujuan Watermarking Watermarking digunakan untuk beberapa tujuan seperti : 1. Otentikasi. Watermarking digunakan sebagai alat untuk mengidentifikasi atau menunjukkan bahwa data digital telah mengalami perubahan dari aslinya. 2. Pengidentifikasi Lokasi. Watermarking digunakan untuk mengidentifikasi isi dari data digital pada lokasilokasi tertentu. 3. Anotasi. Watermarking digunakan hanya sebagai keterangan tentang data digital itu sendiri. 4. Perlindungan Hak Cipta, yaitu menyembunyikan label hak cipta pada data. 2.2.2 Audio Watermarking Audio Watermarking adalah teknik watermarking dengan audio sebagai berkas yang menjadi tumpangan. Berdasarkan domain penyisipannya, teknik watermarking audio dapat dibagi menjadi dua kelompok, yaitu temporal watermarking dan spectral watermarking. Temporal watermarking adalah melakukan penyisipan data pada audio host dalam domain waktu, sedangkan spectral watermarking terlebih dulu melakukan proses transformasi dari domain waktu ke dalam domain frekuensi, sehingga penyisipannya dilakukan pada elemen-elemen frekuensi. Metode audio watermarking dibagi berdasarkan domain yaitu : 1. Domain waktu Metode ini bekerja dengan cara mengubah data audio dalam domain waktu yang akan disisipkan watermark. Contohnya dengan mengubah LSB (Least Significant Bit) dari data tersebut. Secara umum metode ini rentan terhadap proses kompresi, transmisi dan encoding. Universitas Sumatera Utara Beberapa teknik algoritma yang termasuk dalam metode ini adalah: a) Compressed-domain watermarking : Pada teknik ini hanya representasi data yang terkompresi yang diberi watermark. Saat data di uncompressed maka watermark tidak lagi tersedia. b) Bit dithering : Watermark disisipkan pada tiap LSB, baik pada representasi data terkompresi atau tidak. Teknik ini membuat derau pada sinyal. c) Modulasi Amplitudo : Cara ini membuat setiap puncak sinyal dimodifikasi agar jatuh ke dalam pita-pita amplitudo yang telah ditentukan d) Penyembunyian Echo: Dalam metode ini salinan-salinan terputus-putus dari sinyal dicampur dengan sinyal asli dengan rentang waktu yang cukup kecil. Rentang waktu ini cukup kecil sehingga amplitudo salinannya cukup kecil sehingga tidak terdengar. 2. Domain frekuensi Metode ini bekerja dengan cara mengubah konten spektral dalam domain frekuensi dari sinyal seperti membuang komponen frekuensi tertentu atau menambahkan data sebagai derau dengan amplitudo rendah sehingga tidak terdengar. Beberapa teknik yang bekerja dengan metode ini: a) Phase coding : Bekerja berdasarkan karakteristik sistem pendengaran manusia (Human Auditory System) yang mengabaikan suara yang lebih lemah jika dua suara itu datang bersamaan. Secara garis besar data watermark dibuat menjadi derau dengan amplitudo yang lebih lemah dibandingkan amplitudo data audio lalu digabungkan b) Modifikasi Pita Frekuensi : Informasi watermark ditambahkan dengan cara membuang atau menyisipkan ke dalam pita-pita (band) spektral tertentu. c) Penyebaran spektrum : metode ini diadopsi dari teknik penyebaran spektrum dalam telekomunikasi. d) Frequency masking : metode ini memanfaatkan kelemahan pendengaran manusia yang tidak dapat mendengar pada frekuensi tertentu. Universitas Sumatera Utara 2.3 Phase Coding Metode Phase coding adalah metode menyembunyikan data pada berkas induk yaitu audio, yang memanfaatkan kelemahan pada pendengaran manusia dengan menggantikan fase dari segmen awal audio dengan fase referensi yang merepresentasikan label watermark dan ditambahkan fase diferensial audio asli. Dengan cara ini, diferensial pengkodean dengan fase biner watermark diseimbangkan. Hal ini untuk membangkitkan aliran biner secara random yang membentuk gelombang digital (berbentuk bujur sangkar). Gelombang tersebut memiliki fase π/2 atau –π/2. Langkah pertama dalam Phase coding adalah membagi urutan suara kedalam segmen pendek yang ditunjukkan pada gambar 2.1 Gambar 2.3 Sinyal Asli dan Sinyal yang dibagi beberapa segmen Suatu Transformasi Fourier Diskrit (Discrete Fourier Transform) dihitung pada masingmasing panjang segmen N. Untuk masing-masing elemen hasil fase data dari DFT, hingga nilai N-1, menghitung susunan diferensial antara elemen fase yang berdekatan. Fase absolut dari sinyal data watermark ditambahkan pada pada diferensial, atau Fourier Diskrit pada langkah terakhir. Langkah selanjutnya adalah dengan memasukkan data, dan mengatur nilainya sebagai fase absolut, kemudian fase absolut watermark di tambahkan pada Fourier Diskrit dari sinyal asli. Dan gabungkan kembali segmen-segmen yang telah dimodifikasi fasenya tersebut menjadi satu. Setelah proses enkode diatas maka akan dilakukan proses dekode yaitui dengan melakukan sinkronisasi terhadap proses enkoding. Panjang segmen dan panjang watermark harus diketahui. Proses dekode memerlukan sinyal suara asli untuk melakukan Universitas Sumatera Utara pendeteksian. Langkah-langkah pendeteksian watermark yang dilakukan adalah sebagai berikut : 1. Ambil n bagian pertama dari sinyal suara dimana n adalah panjang segmen enkode yang diketahui, s[0] ..s[n-1]. Perhitungan hanya dilakukan terhadap n elemen pertama sinyal karena data watermark disisipkan hanya di segmen awal sinyal suara asli. 2. Lakukan FFT terhadap n-1 sinyal tersebut, kemudian cari nilai fasenya ( φ ) sesuai persamaan 2.3 bk ak φ = tan −1 (2.3) ak adalah nilai real dari FFT dan bk adalah nilai imaginer dari sinyal tersebut. 3. Konversi nilai fase yang didapatkan, π/2 menjadi bit 1 dan -π/2 menjadi bit 0 sebanyak panjang bit watermark. Hasil konversi nilai fase dibandingkan dengan nilai fase sinyal suara asli. 4. Didapatkan data bit-bit watermark sesuai dengan hasil konversi kemudian dibandingkan dengan bit-bit watermark asli untuk mengetahui kebenarannya. Universitas Sumatera Utara