steganografi linguistik metode nicetext menggunakan kata dan

advertisement
STEGANOGRAFI LINGUISTIK METODE NICETEXT
MENGGUNAKAN KATA DAN VARIASI POLA KALIMAT
DASAR BAHASA INDONESIA
ARDINI SRI KARTIKA
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa skripsi berjudul Steganografi Linguistik
Metode NICETEXT Menggunakan Kata dan Variasi Pola Kalimat Dasar Bahasa
Indonesia adalah benar karya saya dengan arahan dari komisi pembimbing dan
belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam
Daftar Pustaka di bagian akhir karya tulis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Agustus 2014
Ardini Sri Kartika
NIM G64080112
ABSTRAK
ARDINI SRI KARTIKA. Steganografi Linguistik Metode NICETEXT
Menggunakan Kata dan Variasi Pola Kalimat Dasar Bahasa Indonesia. Dibimbing
oleh SHELVIE NIDYA NEYMAN.
Keamanan informasi penting dalam melindungi isi informasi dari
penyalahgunaan pihak lain yang tidak berhak. Salah satu cara mengamankan
informasi yaitu dengan teknik steganografi. Sistem NICETEXT yang tergolong
steganografi linguistik menyamarkan keberadaan informasi dalam bentuk teks
bahasa alami menggunakan kontrol bahasa yang metodenya dapat diterapkan pada
bahasa alami lain dengan kesesuaian kata dan pola kalimat. Sistem NICETEXT
telah diimplementasikan dalam teks Bahasa Indonesia, namun kalimat hasilnya
masih terbatas satu pola kalimat. Oleh karena itu penelitian ini mencoba
memproses variasi pola kalimat sehingga sistem NICETEXT dapat
membangkitkan teks Bahasa Indonesia dengan pola gramatikal bervariasi. Pada
penelitian ini, susunan kalimat dibangkitkan dari kombinasi seluruh unsur pengisi
pola kalimat dasar. Penelitian ini berhasil menyamarkan informasi dalam teks
Bahasa Indonesia dengan pola kalimat bervariasi. Namun, dari sisi semantik isi
teks belum dapat dipahami dengan baik.
Kata kunci: sentence generation, sistem NICETEXT, steganografi linguistik
ABSTRACT
ARDINI SRI KARTIKA. Linguistic Steganography with NICETEXT Method
using Words and Sentence Variations of Indonesian Language. Supervised by
SHELVIE NIDYA NEYMAN.
Information security is important to protect the content of information from
attacker. One of the way to secure information is by using steganography.
NICETEXT system is included as one of linguistic steganography to conceal the
existence of certain information in a natural language text using language control
which can be applied to other natural language in words and grammar
conformity. NICETEXT system has been implemented in an Indonesian text, but
the resulted text still limited in one style. The objective of this research is to
process various styles in order to conceal information into an Indonesian
Language text with various grammatical patterns. In this research, styles are
generated from a combination of all sentence pattern elements. The result of this
research is information can be concealed in an Indonesian Language text with
various grammatical patterns. However, from the semantic point of view, it is still
difficult to understand the meaning of the text.
Keywords: linguistic steganography, NICETEXT system, sentence generation
STEGANOGRAFI LINGUISTIK METODE NICETEXT
MENGGUNAKAN KATA DAN VARIASI POLA KALIMAT
DASAR BAHASA INDONESIA
ARDINI SRI KARTIKA
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer
DEPARTEMEN ILMU KOMPUTER
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2014
Judul Skripsi : Steganografi Linguistik Metode NICETEXT Menggunakan Kata
dan Variasi Pola Kalimat Dasar Bahasa Indonesia
Nama
: Ardini Sri Kartika
NIM
: G64080112
Disetujui oleh
Shelvie Nidya Neyman, SKom MSi
Pembimbing
Diketahui oleh
Dr Ir Agus Buono, MSi MKom
Ketua Departemen
Tanggal Lulus:
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga penelitian Steganografi Linguistik Metode
NICETEXT Menggunakan Kata dan Variasi Pola Kalimat Dasar Bahasa
Indonesia ini berhasil diselesaikan. Penulis juga ingin mengucapkan terima kasih
yang tulus kepada:
1 Papa dan Mama tercinta, Asep Ardiansyah dan Wahyu Ratna Sri, serta seluruh
keluarga besar atas segala doa, kasih sayang, dan dukungan yang tiada henti.
2 Ibu Shelvie Nidya Neyman, SKom MSi dan Ibu Dra Laksmi Arianti atas
perhatian dan waktu dalam memberi arahan dan motivasi selama penyelesaian
penelitian.
3 Bapak Endang Purnama Giri, SKom MKom dan Bapak Dr Heru Sukoco, SSi
MT selaku dosen penguji atas kesempatan diskusi dan saran dalam
penyempurnaan penelitian ini.
4 Seluruh dosen pengajar dan staf Departemen Ilmu Komputer FMIPA IPB
untuk semua yang telah mereka berikan selama mengikuti proses perkuliahan.
5 Asrori, Uti, Meri, atas motivasi, kritik, saran, dan bantuan dalam
menyelesaikan penelitian ini. Sahabat tersayang Viona, Dita, Wati, Kak
Dimas, Iis, Munjayani, Pita, Fatimah, Tika, Ima, Julia, Ayu, Yosi, Nurul,
senior Ilmu Komputer 44 dan teman-teman Ilmu Komputer 45 IPB, atas segala
kebersamaan, bantuan, dukungan, serta kenangan bagi penulis selama
menjalani masa studi. Semoga kita bisa berjumpa kembali kelak sebagai orangorang sukses.
Penulis juga mengucapkan terima kasih kepada semua pihak yang telah
membantu selama penyelesaian tugas akhir ini yang tidak dapat disebutkan
satu per satu. Semoga dapat bermanfaat bagi pembaca yang ingin menggali
hal-hal terkait tema penelitian ini.
Bogor, Agustus 2014
Ardini Sri Kartika
DAFTAR ISI
DAFTAR TABEL
vi
DAFTAR GAMBAR
vi
DAFTAR LAMPIRAN
vi
PENDAHULUAN
1
Latar Belakang
1
Perumusan Masalah
1
Tujuan Penelitian
1
Manfaat Penelitian
2
Ruang Lingkup Penelitian
2
TINJAUAN PUSTAKA
2
Kriptografi
2
Steganografi
3
Teknik Steganografi
5
Sistem NICETEXT
6
METODE
Implementasi Metode NICETEXT
8
9
Lingkungan Implementasi
13
HASIL DAN PEMBAHASAN
13
Implementasi Pembangunan Kamus dan Style
13
Analisis Hasil sistem NICETEXT - SCRAMBLE
14
SIMPULAN DAN SARAN
18
Simpulan
18
Saran
18
DAFTAR PUSTAKA
19
LAMPIRAN
20
RIWAYAT HIDUP
25
DAFTAR TABEL
1
2
3
4
5
6
Kelas kata pada KBBI tahun 2005
Ilustrasi kombinasi unsur gramatikal dari style berisi pola kalimat S-P
Ilustrasi sederhana isi kamus D
Style yang digunakan dalam penelitian
Hasil penyisipan sistem NICETEXT dengan pesan “rebellion” pada
variasi style berbeda
Hasil penyisipan sistem NICETEXT dengan pesan “dosen mengajar
ilmu komputer” pada variasi style berbeda
10
12
13
14
15
16
DAFTAR GAMBAR
1
2
3
Sistem steganografi (Morkel et al. 2005)
Penyisipan dan ekstraksi pesan (Morkel et al. 2005)
Implementasi steganografi sistem NICETEXT dan SCRAMBLE
(Rohani 2009)
4 Proses NICETEXT (Rohani 2009)
5 Proses SCRAMBLE (Rohani 2009)
6 Metode penelitian
7 Proses pembangunan kamus D
8 Proses pembangkitan style S
9 Hasil survei semantik teks T dari penyisipan pesan “rebellion” (□)
dan “dosen mengajar ilmu komputer” (∎) pada empat model style
dengan variasi berbeda
10 Hasil survei gramatikal teks T dari penyisipan pesan “rebellion” (□)
dan “dosen mengajar ilmu komputer” (∎) pada empat model style
dengan variasi berbeda
4
4
6
7
7
9
10
11
17
17
DAFTAR LAMPIRAN
1
2
3
4
5
Contoh tahap penyisipan pesan pada sistem NICETEXT
Contoh tahap ekstraksi pesan pada sistem SCRAMBLE
Kuisioner survei semantik isi teks dan survei teks dengan gramatikal
yang terlihat alami dari hasil penyisipan pesan “rebellion” sistem
NICETEXT
Kuisioner survei semantik isi teks dan survei teks dengan gramatikal
yang terlihat alami dari hasil penyisipan pesan “dosen mengajar ilmu
komputer” sistem NICETEXT
Hasil perhitungan skor survei semantik teks dari penyisipan pesan
“rebellion”
20
21
22
23
24
6
7
8
Hasil perhitungan skor survei semantik teks dari penyisipan pesan
“dosen mengajar ilmu komputer”
Hasil perhitungan skor survei gramatikal teks dari penyisipan pesan
“rebellion”
Hasil perhitungan skor survei gramatikal teks dari penyisipan pesan
“dosen mengajar ilmu komputer”
24
24
24
PENDAHULUAN
Latar Belakang
Keamanan informasi penting dalam melindungi isi informasi dari
penyalahgunaan pihak lain yang tidak berhak. Beberapa cara untuk mengamankan
informasi yaitu dengan teknik kriptografi dan information hiding. Kriptografi
mengubah pesan rahasia (plaintext), dengan teknik tertentu menjadi pesan
berbentuk acak (ciphertext). Namun ciphertext yang terlihat seperti pesan tak
bermakna akan memunculkan kecurigaan bahwa di dalamnya terdapat pesan
rahasia. Steganografi melengkapi kriptografi sebagai salah satu teknik information
hiding untuk menyamarkan pesan sehingga keberadaannya tidak disadari oleh
pihak lain, dengan menyembunyikan pesan rahasia ke dalam media cover tertentu
seperti file teks, suara, dan citra, sehingga menghasilkan stego-object (media baru
yang telah disisipkan pesan).
Sistem NICETEXT Chapman (1997) tergolong steganografi linguistik
dengan teknik penyisipan menggunakan media cover teks (kalimat-kalimat dalam
bahasa alami) yang dibangkitkan dengan kontrol linguistik (Rohani 2009).
Implementasinya pada teks Bahasa Inggris berhasil membangkitkan kalimat
Bahasa Inggris baru yang tidak mencurigakan (innocuous text). Metode yang
digunakan pada sistem NICETEXT dapat diterapkan pada bahasa alami lain
dengan kesesuaian kata dan pola kalimat (Chapman 1997).
Penelitian metode serupa diterapkan Rohani (2009) dengan memproses
penyisipan pesan pada media cover teks berupa sebuah kalimat contoh tunggal
dalam Bahasa Indonesia. Hasil NICETEXT valid secara sintaksis serta ekstraksi
pesan berhasil dilakukan, meski kalimat yang dihasilkan terbatas pada satu pola
kalimat dan belum cukup baik secara semantik.
Dengan berdasar dua penelitian tersebut, penelitian ini mencoba
mengimplementasikan
sistem
NICETEXT
menggunakan
pendekatan
pembangunan kamus dictionary-based dan variasi pola kalimat Bahasa Indonesia.
Perbedaan dengan penelitian sebelumnya adalah, pada penelitian ini variasi cover
teks yang dibangkitkan dapat diproses untuk memetakan beberapa kalimat dengan
pola berbeda, hingga menghasilkan kalimat yang baik dan terlihat alami secara
gramatikal. Hasil penelitian didapat dari hasil uji sintaksis yang dan semantik. Uji
sintaksis dilakukan dengan percobaan penyisipan pesan dalam variasi pola
berbeda. Uji semantik dilakukan dengan survei untuk menilai semantik isi kalimat.
Perumusan Masalah
Rumusan permasalahan pada penelitian ini adalah bagaimana mendapatkan
kalimat hasil bangkitan steganografi linguistik sistem NICETEXT dengan pola
gramatikal kalimat yang bervariasi dan isi kalimat yang semantik.
Tujuan Penelitian
Penelitian ini bertujuan menerapkan variasi cover teks Bahasa Indonesia
pada sistem NICETEXT untuk dapat membangkitkan hasil kalimat penyisipan
dengan struktur gramatikal dan semantik bahasa yang lebih alami.
2
Manfaat Penelitian
Hasil penelitian ini merupakan penerapan konsep keamanan informasi.
Diharapkan dengan steganografi linguistik pada media teks, suatu informasi
rahasia menggunakan kontrol bahasa dapat tersamarkan dalam media baru yang
dibangkitkan, yaitu teks Bahasa Indonesia yang terlihat alami dengan susunan
pola kalimat yang bervariasi dan isi kalimat yang tidak mencurigakan.
Ruang Lingkup Penelitian
Ruang lingkup pada penelitian ini antara lain:
1 Model pembangunan kamus yang digunakan adalah dictionary-based.
2 Style (berkas pola kalimat) berisi kombinasi unsur pengisi fungsi gramatikal
Subjek, Predikat, Objek, Pelengkap, dan Keterangan yang membentuk pola
kalimat dasar Bahasa Indonesia.
3 Input sistem NICETEXT berupa nilai biner (ciphertext) dari pesan ASCII.
4 Pengujian pada teks Bahasa Indonesia hasil NICETEXT adalah pengujian
sintaksis dan semantik kalimat.
TINJAUAN PUSTAKA
Kriptografi
Kriptografi (cryptography) berasal dari bahasa Yunani, yaitu kata kripto
(menyembunyikan) dan graphia (tulisan). Kriptografi adalah
ilmu yang
mempelajari teknik-teknik matematika terkait aspek keamanan informasi, seperti
kerahasiaan data, keabsahan, integritas, serta autentikasi data (Menezes et al.
1996).
Tujuan utama kriptografi (Neyman 2007) yaitu:
1 Kerahasiaan, sebagai layanan yang menjaga isi informasi dari pihak tak
berwenang.
2 Integritas, berupa jaminan bahwa tidak terjadi pengubahan data dari pihak
tak berwenang.
3 Autentikasi, layanan terkait identitas dan informasi. Informasi yang
disampaikan melalui suatu saluran (channel) seharusnya dapat diidentifikasi
asal (autentikasi entitas), isi (autentikasi data), tanggal, dan waktunya.
4 Non-repudiasi, layanan untuk mencegah terjadinya pelanggaran kesepakatan
yang telah dibuat oleh entitas. Jika entitas mengelak telah melakukan
komitmen tertentu, maka suatu prosedur untuk menangani situasi tersebut
diperlukan.
Istilah umum dalam kriptografi (Neyman 2007) yaitu:
1 Sender, pihak pengirim pesan.
2 Receiver, pihak penerima pesan.
3 Plaintext atau cleartext, pesan asal.
3
4
5
6
7
Encryption, proses transformasi yang mengubah plaintext menjadi bentuk
yang terlihat tak bermakna (ciphertext).
Ciphertext, pesan hasil encryption dari plaintext.
Decryption, proses pengembalian ciphertext menjadi plaintext.
Key, suatu informasi untuk mengamankan plaintext yang hanya dimiliki
pihak sender dan receiver sah.
Steganografi
Istilah steganografi (steganography) berasal dari bahasa Yunani, yaitu kata
steganos (tersembunyi), dan graphein (menulis) sehingga bermakna “menulis
tulisan terselubung”. Steganografi adalah ilmu dan seni menyembunyikan pesan
rahasia sehingga keberadaannya tidak terdeteksi oleh manusia (Qadarisman 2011).
Steganografi melengkapi disiplin ilmu kriptografi. Kriptografi bertujuan
melindungi isi suatu informasi rahasia dengan mengacak isi pesan menjadi sebuah
ciphertext agar tidak bisa dibaca pihak lain yang tidak berhak. Namun, bentuk
acak ciphertext dapat menimbulkan kecurigaan, sehingga pihak lain dapat
berasumsi di dalamnya terdapat pesan rahasia. Steganografi berperan dalam
melindungi keberadaan informasi rahasia dengan cara menyamarkan pesan dalam
media lain yang relatif aman, sehingga tidak menimbulkan kecurigaan pihak yang
tidak berhak (Jajodia dan Johnson 1998).
Munir (2006) menjelaskan istilah dan kriteria pada steganografi. Pada
Steganografi modern, pesan rahasia disisipkan pada media elektronik seperti teks,
suara, dan citra. Tiga istilah utama dalam steganografi yaitu:
1 Embedded message, berupa pesan atau informasi yang akan disembunyikan.
2 Cover-object, media yang digunakan untuk menyembunyikan embedded
message.
3 Stego-object, hasil dari proses penyisipan, berupa media baru yang berisi
embedded message.
Steganografi dikatakan baik bila memenuhi kriteria berikut (Munir 2006):
1 Imperceptible. Keberadaan pesan tidak dapat dipersepsi oleh indrawi. Jika
pesan disisipkan ke dalam suatu media maka media yang telah disisipi pesan
harus tidak dapat dibedakan dengan media asli oleh indera manusia.
2 Fidelity. Penyisipan tidak terlalu mengubah mutu cover (media yang
disisipi). Perubahan yang terjadi harus tidak dapat dipersepsi oleh indrawi.
3 Recovery. Tujuan steganografi adalah menyembunyikan informasi, maka
sewaktu-waktu informasi yang disembunyikan ini harus dapat diambil
kembali untuk dapat digunakan sesuai keperluan.
4 Robustness. Data yang disembunyikan harus tahan terhadap manipulasi pada
cover media.
4
Gambar 1 Sistem steganografi (Morkel et al. 2005)
Gambar 1 menunjukkan sistem umum steganografi (Morkel et al. 2005).
Pada sisi pengirim pesan (sender), terdapat proses embedding (fE). Pesan rahasia
yang akan dikirim (emb), disisipkan ke dalam media cover sebagai tempat
penyimpanannya menggunakan suatu kunci (key). Proses embedding
menghasilkan data yang di dalamnya berisi pesan tersembunyi (stego-object).
Pada bagian penerima pesan (recipient), dilakukan proses ekstraksi stegoobject (fE-1) untuk memisahkan pesan rahasia (emb), dari media cover
menggunakan kunci yang sama seperti pada proses embedding. Proses lebih detail
direpresentasikan bagan pada Gambar 2.
Gambar 2 Penyisipan dan ekstraksi pesan
(Morkel et al. 2005)
5
Teknik Steganografi
Johnson dan Katzenbeisser (2000) mengelompokkan teknik steganografi
berdasarkan metode modifikasi terhadap media cover yang disisipi pesan,
menjadi enam kategori, yaitu:
1 Sistem substitusi, dimana bagian yang tidak terlalu signifikan dari suatu media
cover disubstitusi dengan pesan rahasia. Contohnya adalah teknik Substitusi
Least Significant Bit (LSB) pada media cover citra.
2 Transformasi domain, yaitu pesan rahasia disisipkan dalam sinyal pada
domain frekuensi. Contohnya yaitu metode Discrete Cosine Transform (DCT)
pada media cover video
3 Teknik penyebaran spektrum, yaitu pesan rahasia disisipkan secara terpisah
dan tersebar dalam wide frequency bandwith.
4 Metode statistik, yaitu mengubah sebagian karakteristik statistik dari media
cover dan menggunakan uji hipotesa pada proses ekstraksi untuk mendapatkan
pesan kembali.
5 Teknik distorsi, yaitu menyimpan informasi dengan mengacak sinyal dan
menghitung deviasi dari media cover asal pada tahap decoding.
6 Metode pembangkitan cover (cover generation), yaitu mengkodekan
informasi dengan cara membangkitkan media cover yang dibutuhkan untuk
komunikasi rahasia. Contohnya pembangkitan teks Bahasa Inggris otomatis.
Teknik steganografi berdasarkan tipe media cover (Neyman 2007), terbagi
menjadi Text Steganography dan Technical Steganography. Technical
Steganography menggunakan media cover selain teks, contohnya media citra dan
audio (sinyal suara). Citra dan sinyal suara memiliki daerah noise tak terdeteksi
penglihatan dan pendengaran manusia (Human Visual-Auditory System) yang
dapat digunakan untuk menyembunyikan pesan. Jika nilai pada bagian ini diubah
(disisipi pesan), tidak akan mengubah kenampakan media tersebut secara
signifikan. Teknik yang bisa digunakan pada steganografi citra yaitu Substitusi
LSB, Masking and Filtering, untuk steganografi audio dapat digunakan teknik
spread spectrum dan echo data hiding.
Text-Steganography merupakan steganografi yang menggunakan media
cover berupa file teks, dibedakan menjadi dua kategori, yaitu:
1 Steganografi linguistik, menggunakan bahasa alami untuk menyembunyikan
pesan rahasia. Contoh tekniknya yaitu Semantics dan Syntactic Methods.
2 Metode format-based, menggunakan format fisik teks untuk menyisipkan
pesan rahasia. Contohnya teknik Line Shift Coding, Word Shift Coding,
Feature Coding Open Code Method (Null Cipher).
6
Sistem NICETEXT
NICETEXT merupakan sistem yang dikembangkan Chapman (1997)
sebagai pendekatan untuk menyamarkan ciphertext ke dalam bentuk teks bahasa
alami. Komponen utama NICETEXT yaitu kamus (berisi kata-kata yang
dikelompokkan berdasarkan jenis kata, serta menyimpan informasi nilai bit untuk
mengkodekan pesan) dan style (template susunan kata, agar kalimat yang baik
dapat dibangkitkan).
Implementasi NICETEXT-SCRAMBLE oleh Rohani (2009) secara umum
diilustrasikan pada Gambar 3. Keberhasilan NICETEXT membangkitkan teks,
didukung tingkat kompleksitas kamus (besar dan ‘berisi’), serta pembangkitan
style pembentuk kata-kata dari kamus yang sesuai struktur gramatikal kalimat
bahasa alami. Kombinasi kedua komponen tersebut dapat menghasilkan stegoobject berupa innocuous text (teks tidak mencurigakan) yang mampu mengecoh
manusia sebagai pembacanya.
Kelebihan metode NICETEXT yaitu kalimat yang dibangkitkan mendekati
kalimat dalam bahasa alami sehingga memperkecil kecurigaan attacker (Rohani
2009). Proses penyisipan pesan seiring pembangkitan media cover teks secara
otomatis, memperkecil keberhasilan serangan attacker yang berusaha
mendapatkan pesan dengan membandingkan cover yang telah disisipkan pesan,
dengan cover awal.
Gambar 3 Implementasi steganografi sistem NICETEXT
dan SCRAMBLE (Rohani 2009)
7
Chapman (1997) menyajikan beberapa metode yang dapat digunakan untuk
pembangunan kamus, antara lain:
1 Manual construction, mendaftarkan pasangan kata, kategori kata pada text
editor secara manual.
2 From files of like words, mengelompokkan kata berdasarkan jenisnya pada
file terpisah.
3 Automatic generation, berdasarkan Part-of-Speech (POS) kata. Rohani
(2009) mendefinisikan dua model pembangunan kamus berdasarkan sumber
pengumpulan kata-kata yaitu dictionary-based (dari kamus elektronik) dan
corpus-based (dari korpus teks elektronik).
4 Morphological word parsing, mengelompokkan kata berdasarkan grammar.
5 Word rhyme, mengelompokkan kata-kata berdasarkan kemiripan bunyi.
NICETEXTD,S(C) T yang diilustrasikan pada Gambar 4, adalah fungsi
yang memetakan ciphertext C (string biner) menjadi teks berisi kalimat-kalimat
Bahasa Indonesia tidak mencurigakan (T). Kamus D berisi records pasangan kata,
kategori kata, dan kode biner. Style S merupakan komponen yang berisi aturan
berupa pola kalimat untuk memetakan kata-kata dari kamus D.
SCRAMBLED(T) C yang diilustrasikan pada Gambar 5, adalah fungsi
ekstraksi NICETEXTD,S. SCRAMBLE mengembalikan teks T ke bentuk pesan
asal. SCRAMBLE mengabaikan informasi style pada teks T. SCRAMBLE hanya
memerlukan kamus D yang digunakan pada proses NICETEXT untuk

memperoleh
ciphertext
kembali.
Jika
di
dj,
maka

SCRAMBLEdi(NICETEXTdj,S(C)) C.
Panjang style
Style
Proses
sizer
Rangkaian style
Cipher
Pembangkitan
kalimat
keluaran
Kalimat
Nicetext
Data kamus
Pesan
rahasia
Panjang pesan
Kamus
Gambar 4 Proses NICETEXT (Rohani 2009)
Kalimat
Nicetext
Susunan kata
Susunan kata
Pencarian
kode
c
Pembacaan
c
c
Pencarian
kode
Data kamus
Kamus
Data kamus
c|p DESIZER p
Pesan
rahasia
c : bit yang merepresentasikan panjang
pesan
p : bit yang merepresentasikan pesan
Gambar 5 Proses SCRAMBLE (Rohani 2009)
8
Untuk mengatasi isu panjang pesan yang terbatasi panjang style, Chapman
(1997) menggunakan fungsi SIZERR(C) C + C + R yang memastikan pesan
rahasia dapat disembunyikan seluruhnya. Fungsi SIZER memproses string biner
C dari pesan ASCII yang dimasukkan pada program, menjadi string biner baru c
(ciphertext). Ciphertext yang dihasilkan SIZER terdiri dari string dengan panjang
tertentu yang merepresentasikan panjang C (Cbit), disambung string biner pesan
(C), disambung lagi dengan string acak R. Fungsi DESIZER(SIZERR(C)) = C
adalah inverse dari fungsi SIZER untuk mendapatkan kembali string pesan C dari
ciphertext. Fungsi SIZER dan DESIZER yang diterapkan pada NICETEXT dan
SCRAMBLE
untuk
mendapatkan
pesan
C
menjadi
DESIZER(SCRAMBLED(NICETEXTD,S(SIZERR(C)))) = C.
Rohani (2009) menyebutkan beberapa komponen yang harus diperhatikan
dalam membangkitkan string acak R sebanyak r bit pada proses SIZER, yaitu p
(panjang pesan), s (banyak bit yang dapat disembunyikan ke style), n (panjang bit
yang merepresentasikan panjang pesan, ditentukan yaitu lima belas sehingga n
maksimal merepresentasikan 215 bit pesan biner), dan r (banyaknya bit acak yang
dibangkitkan), maka:
1 Bila p + n s, maka r = (s * x) – (p + n), x merupakan variabel pengulangan
style yang menentukan berapa kali kalimat dengan style yang digunakan
akan dibangkitkan agar seluruh bit pesan dapat ditransformasikan, sehingga:
x=
2 Apabila p + n = s, maka r = 0
METODE
Penelitian dimulai dari studi pustaka mempelajari konsep steganografi
linguistik metode NICETEXT, kemudian dilakukan identifikasi masalah,
penulisan latar belakang, tujuan, dan manfaat penelitian. Pada tahap berikutnya
dilakukan implementasi steganografi metode NICETEXT yang secara garis besar
terdiri dari dua tahap yaitu penyisipan pesan dan ekstraksi pesan.
Pada implementasi metode NICETEXT dipersiapkan pembangunan dua
komponen sistem NICETEXT selain dari pesan rahasia, yaitu kamus dan style.
Kamus, style, dan pesan rahasia akan diproses pada tahap penyisipan pesan.
Penyisipan pesan dengan ketiga masukan tersebut akan diproses sesuai alur
proses NICETEXT pada Gambar 4. Penyisipan pesan dengan sistem NICETEXT
akan menghasilkan stego-object berupa teks T (satu atau beberapa kalimat dalam
Bahasa Indonesia). Pengekstraksian pesan dari stego-object teks T dilakukan
dengan sistem SCRAMBLE untuk mendapatkan kembali pesan rahasia yang
disisipkan pada sistem NICETEXT sebelumnya.
Hasil percobaan penyisipan pesan sistem NICETEXT kemudian diuji
keberhasilan ekstraksinya dengan sistem SCRAMBLE, lalu dianalisis dengan uji
sintaksis dan semantik. Selanjutnya dilakukan penarikan kesimpulan dari hasil
penelitian. Tahap pengerjaan penelitian ini dapat dilihat pada Gambar 6.
9
Gambar 6 Metode penelitian
Implementasi Metode NICETEXT
Pada tahap implementasi, mula-mula dilakukan proses pembentukan dua
komponen masukan sistem NICETEXT yaitu kamus dan style. Komponenkomponen tersebut bersama dengan pesan rahasia akan menjadi masukan sistem
NICETEXT pada tahap penyisipan pesan. Pesan rahasia yang dimasukkan berupa
karakter ASCII yang diketikkan pengguna pada program. Media cover tempat
menyisipkan pesan pada penelitian ini dibangkitkan dari komponen kamus dan
style seiring proses penyisipan (transformasi sistem NICETEXT).
Pembangunan Kamus
Pembangunan kamus dengan pendekatan dictionary-based diilustrasikan
pada Gambar 7. Pasangan (kata, jenis kata) diperoleh dari kamus elektronik yang
telah dibersihkan dari noise berupa record kosong dan record tanpa jenis kata.
Kamus elektronik sumber diproses ulang dengan menghilangkan kategori
keterangan ragam dan konteks bidang kata (yang diasumsikan sebagai noise)
untuk menyesuaikan isi susunan pola kalimat dari berkas style untuk
menyesuaikan isi susunan pola kalimat dari berkas style. Kata-kata pada kamus
elektronik tersebut dikelompokkan berdasarkan jenis kata dari 7 kelas kata
menurut Kamus Besar Bahasa Indonesia 2005 pada Tabel 1.
10
Gambar 7 Proses pembangunan kamus D
Chapman (1997) menjelaskan kondisi kamus yang digunakan sistem
NICETEXT harus memenuhi kriteria berikut:
1 Ada minimal dua kata dalam satu jenis.
2 Jumlah kata pada setiap jenis harus merupakan bilangan perpangkatan dua
(2n) agar tiap jenis bisa direpresentasikan dengan panjang bit yang tetap.
3 Tiap kata harus unik (tidak ambigu).
4 Tiap pasangan (jenis, kode) harus unik.
5 Tidak ada hubungan antara (jenis, kode) dengan urutan alfabet kata.
Tabel 1 Kelas kata pada KBBI tahun 2005
Kelas kata
Adjektiva
Kode
a
Adverbia
adv
Nomina
Numeralia
Partikel
n
num
p
Pronomina
Verba
pron
v
Keterangan
Kelas kata yang menjelaskan nomina atau
pronomina
Kelas kata yang menjelaskan verba, adjektiva,
adverbia lain, atau kalimat
Kata benda
Kata bilangan
Meliputi kata depan, frase preposisional, kata
sambung, kata seru, kata sandang ucapan salam
Meliputi kata ganti, kata tunjuk, dan kata tanya
Kata kerja
11
Setelah praproses, dihitung jumlah kata pada tiap jenis (f) lalu dibatasi
sebanyak bilangan perpangkatan dua (g) dengan perhitungan g = [ 2 | (log f / log 2 ) | ].
Tiap jenis direpresentasikan oleh nilai biner dengan panjang bit yang tetap (d)
sebanyak |(log f / log 2)| bit dengan pembulatan ke bawah. Hal tersebut dilakukan
agar proses pemasukan records terhenti pada titik tertentu (bilangan 2n), sehingga
proses selanjutnya yaitu pembangkitan kode biner dapat dilakukan. Kata yang
telah berpasangan dengan jenis katanya dipasangkan lagi dengan biner yang
dibangkitkan berurutan. Misalkan jumlah kata (f) = 8, maka jumlah kata
dikodekan dengan d = 3 (8 kata dapat direpresentasikan dengan 3 bit, karena 23 =
8). Kata pertama dikodekan dengan 000, kata kedua dikodekan dengan 001, dan
seterusnya kata berpasangan dengan kode terakhir 111. Kamus D yang telah
diproses, akan berisi records pasangan (kata, jenis kata, kode) tiap barisnya.
Pembangkitan Style
Pada sistem NICETEXT dibutuhkan style sebagai penyusun kalimat baru
hasil penyisipan. Pada penelitian ini, pola kalimat yang digunakan merupakan
kombinasi fungsi gramatikal kalimat dalam Bahasa Indonesia yaitu Subjek (S),
Predikat (P), Objek (O), Pelengkap (Pel), dan Keterangan (K). Lima fungsi
gramatikal tersebut membentuk delapan pola kalimat tunggal sederhana (Iswara
2007) yaitu S-P, S-P-K, S-P-O, S-P-O-Pel, S-P-O-Pel-K, S-P-O-K, S-P-Pel, dan
S-P-Pel-K.
Proses pembangkitan style terlihat pada Gambar 8. Mula-mula didefinisikan
fungsi gramatikal. Tiap fungsi tersebut diisi oleh unsur-unsur berupa kategori
gramatikal. Kategori pengisi fungsi gramatikal pada penelitian ini yaitu Part of
Speech (POS) berupa 7 jenis kata dari kelas kata yang digunakan pula untuk
mengelompokkan kata pada kamus D, yaitu adjektiva (kata sifat), adverbia (kata
keterangan), nomina (kata benda), numeralia (kata bilangan), partikel, pronomina
(kata ganti), dan verba (kata kerja).
Unsur pengisi fungsi Subjek dan Predikat antara lain kata-kata yang
dikategorikan sebagai adjektiva, nomina, numeralia, pronomina, dan verba. Unsur
pengisi Objek yaitu nomina dan pronomina. Fungsi gramatikal Pelengkap diisi
oleh nomina, numeralia, pronomina, dan verba, sedangkan fungsi gramatikal
Keterangan dapat diisi dengan adverbia, nomina, pronomina (Tukan 2006).
Gambar 8 Proses pembangkitan style S
12
Tabel 2 Ilustrasi kombinasi unsur gramatikal dari
style berisi pola kalimat S-P
Pola kalimat
POS pada style
Subjek - Predikat
a-a
a-n
.
.
.
n-v
.
.
v-v
Style dibuat dengan mendaftarkan semua kemungkinan kombinasi (cross
product) unsur gramatikal dari 8 pola kalimat dasar. Setiap hasil kombinasi unsur
gramatikal dari masing-masing pola ditempatkan dalam sebuah berkas style.
Ilustrasi hasil kombinasi style terlihat pada Tabel 2.
Tahap Penyisipan Pesan
Tahap penyisipan pesan dimulai dari sistem NICETEXT menganalisis
panjang bit pesan (p) dan total panjang bit dari style yang digunakan (s) memasuki
fungsi SIZER untuk pembentukan string ciphertext. Selanjutnya dilakukan
pembangkitan kalimat. Tiap jenis kata pada style dipanggil secara berurutan
kemudian dilakukan pengambilan kata pada kamus dari jenis kata yang
didefinisikan style dan sesuai kode yang diambil ciphertext. Apabila seluruh jenis
kata pada style yang diinputkan telah diproses, namun bit pesan pada ciphertext
yang harus disembunyikan masih tersisa, maka kalimat dengan style yang sama
kembali dibangkitkan, seterusnya hingga bit pesan pada ciphertext habis.
Banyaknya pengulangan kalimat (variabel x) telah diperhitungkan dalam fungsi
SIZER. Tahap penyisipan pesan secara keseluruhan dapat dilihat pada Lampiran 1.
Berikut ini contoh tahap penyisipan ciphertext menggunakan ilustrasi kamus dan
style sederhana. Jika didefinisikan kamus D pada Tabel 3, style S = pronomina verba,
C = 010. Langkah transformasi pesan C menjadi teks T yaitu:
1 NICETEXTD,S(010) T , sistem membaca jenis pertama dari style S yaitu
pronomina.
2 Jenis pronomina pada kamus D, ada kombinasi 4 kata yang diwakili dua bit
biner, maka NICETEXT memilih 2 bit pertama dari C yaitu 01,
3 NICETEXT menggunakan kamus D untuk memetakan (pronomina, 01)
saya.
4 NICETEXTD,S(010) T membaca jenis selanjutnya dari style S yaitu verba,
5 Jenis verba di kamus D, ada kombinasi 2 kata yang diwakili oleh 1 bit biner,
maka NICETEXT membaca 1 bit selanjutnya dari C, yaitu 0,
6 NICETEXT menggunakan kamus D untuk memetakan (verba, 0) belajar.
7 Sehingga NICETEXTd, pronomina verba(010) sayabelajar.
13
Tabel 3 Ilustrasi sederhana isi kamus D
Kode
Jenis kata
Kata
0
1
0
1
00
01
10
11
nomina
nomina
verba
verba
pronomina
pronomina
pronomina
pronomina
pakaian
baju
belajar
pergi
dia
saya
aku
kamu
Tahap Ekstraksi Pesan
Tahap ekstraksi pesan menggunakan sistem SCRAMBLE. Masukannya
berupa stego-object dari sistem NICETEXT yaitu teks T. Langkah ekstraksi
dimulai dari transformasi teks T menjadi ciphertext untuk mendapatkan pesan
ASCII kembali. Pada proses SCRAMBLE, yang diperlukan hanya komponen
kamus D karena kata-kata telah dipasangkan dengan kode unik. Tahap ekstraksi
pesan secara keseluruhan dapat dilihat pada Lampiran 2. Contoh sederhana jika
didefinisikan hasil teks T = sayabelajar, langkah transformasi untuk mendapatkan
C kembali yaitu:
1 SCRAMBLED(sayabelajar) C membaca kata pertama dari T yaitu saya
2 SCRAMBLE mencari kata saya di kamus, didapatkan saya 01. Langkah 1
dan 2 berulang hingga kata terakhir pada T terbaca, hingga diperoleh
SCRAMBLED(sayabelajar) 010.
Lingkungan Implementasi
Spesifikasi perangkat yang digunakan untuk penelitian ini antara lain
perangkat lunak Sistem Operasi Windows 7 Ultimate, bahasa pemrograman Perl,
Text editor yaitu Notepad++. Perangkat keras yang digunakan yaitu Processor
Intel Dual-Core 2.10 GHz dengan RAM 1 GB dan Hardisk berkapasitas 160 GB.
HASIL DAN PEMBAHASAN
Implementasi Pembangunan Kamus dan Style
Kamus sumber yang digunakan pada penelitian ini yaitu dari kamus
elektronik KBBI (Kamus Besar Bahasa Indonesia) tahun 2005 milik IPB yang
digunakan oleh Rohani (2009) di penelitian sebelumnya. Kamus tersebut berisi
sebanyak 31624 kata yang dikategorikan menggunakan kelas kata, keterangan
ragam dan konteks bidang kata. Untuk keperluan penelitian ini, kategori kata
berupa ragam dan konteks bidang kata dihilangkan, sehingga kata pada kamus
didefinisikan hanya dengan 7 kelas kata KBBI. Hal ini dilakukan untuk
menyesuaikan pola kalimat yang diatur dalam style S. Pembangunan kamus
dengan pendekatan dictionary-based pada penelitian ini menghasilkan 27200 kata.
14
Tabel 4 Style yang digunakan dalam penelitian
Pola kalimat
Isi style a
S-P
n-v
S-P-K
n-v-adv
S-P-O
n-v-pron
S-P-O-K
pron-a-n-adv
S-P-O-Pel
pron-a-pron-num
S-P-O-Pel-K
n-a-pron-v-p
S-P-Pel
n-v-num
S-P-Pel-K
n-a-pron-p
a
Berupa salah satu hasil kombinasi jenis kata yang mengisi
susunan pola kalimat yang dipilih secara acak
Style berisi kombinasi fungsi gramatikal Subjek (S), Predikat (P), Objek
(O), Pelengkap (Pel), Keterangan (K), yang ditempati 7 kategori jenis kata. Jenis
kata pada style harus merupakan kategori yang digunakan untuk mengelompokkan
kata dalam kamus D. Pada penelitian ini, sebuah berkas style berisi 1 dari
kombinasi unsur gramatikal yang mengisi suatu pola kalimat tunggal dasar. Style
yang diambil secara acak dari hasil kombinasi terlihat pada Tabel 4. Penelitian ini
mengambil 8 berkas style, yang akan diproses pada 4 model style dengan variasi
pola kalimat berbeda. Model style ke-1 menggunakan sebuah pola style sederhana,
model style ke-2 mengggunakan variasi 2 pola style, model style ke-3
mengggunakan variasi 4 pola style, dan model style ke-4 menggunakan variasi
style yang kompleks berupa kombinasi 8 pola style.
Analisis Hasil sistem NICETEXT - SCRAMBLE
Percobaan pada sistem NICETEXT dilakukan dengan menyisipkan pesan
dengan berkas kamus KBBI dan berkas style. Pesan yang disisipkan yaitu suatu
kata (“rebellion”) dan suatu kalimat sederhana (“dosen mengajar ilmu komputer”).
Tiap pesan dengan kamus yang sama akan disisipkan menggunakan 4 model style
dengan variasi berbeda. Variasi pada model style 1 menggunakan pola “S-P”.
Variasi model style 2 menggunakan kombinasi pola “S-P-O-K. S-P-PEL-K”.
Variasi model style 3 menggunakan kombinasi pola “S-P-K. S-P-PEL. S-P-O. SP-O-PEL-K”. Variasi model style 4 menggunakan kombinasi pola “S-P-PEL-K.
S-P. S-P-PEL. S-P-O-PEL-K. S-P-K. S-P-O. S-P-O-PEL. S-P-O-K”. Hasil
NICETEXT dengan input pesan “rebellion” dan “dosen mengajar ilmu komputer”
disembunyikan menggunakan variasi 4 model style tersebut dapat dilihat pada
Tabel 5 dan Tabel 6.
15
Tabel 5 Hasil penyisipan sistem NICETEXT dengan pesan “rebellion” pada
variasi style berbeda
Model
style
1
Variasi
style
1 pola
Isi style
Teks (T) yang dibangkitkan NICETEXT
n-v
Landors beraneh-aneh. Jentikan menggantang.
Kelakanji berkemam. Ekspansionisme ganjar.
2
2 pola
pron-a-n-adv.
n-a-pron-v.
3
4 pola
n-v-adv.
n-v-num.
n-v-pron.
n-a-pron-v-p.
Begini rembas kersik jangan-jangan. Pranatal
blirik betapa ala. Manakan keceng mafia
secepatnya. Ikebana gandem manakan
andaikan.
Landors beraneh-aneh jahar. Ilak menggejolak
sepadi. Kreol melambakan bila. Kedayan aktual
lu melengking sementelah.
4
8 pola
n-a-pron-v.
n-v.
n-v-num.
n-a-pron-v-p.
n-v-adv.
n-v-pron.
pron-a-pronnum.
pron-a-n-adv.
Landors kabut dewe syabas. Anteredium kilir.
Pemboros mengambal piko. Pengasramaan
geruh-gerah sendiri berkedal senjak.
Honorarium menjerongkong hanya. Bipolar
mengeramkan kitorang. Begitukan jenggarjenggur beliau-beliau paro. Bukankah keti-keti
loncek beleng.
Proses penyisipan pesan menghasilkan teks T berisi kalimat-kalimat
bahasa alami. Pengujian pengembalian ke pesan awal (kriteria recovery) dapat
dilakukan melalui sistem SCRAMBLE. Proses SCRAMBLE dilakukan sesuai
pada Gambar 4 bab Tinjauan Pustaka. Kata-kata pada teks T dicari dalam kamus
D dan diambil kodenya. Kode dari setiap kata kemudian disusun menjadi
ciphertext c. Dari c tersebut, dilakukan pemisahan bit biner melalui fungsi balikan
DESIZER. Pertama, SCRAMBLE membaca 15 bit pertama (n yaitu asumsi nilai
default yang menyimpan informasi panjang pesan) dari c, sehingga dapat
diketahui panjang asli pesan. Kemudian dilakukan pemotongan kode biner dari c
dimulai dari bit ke-16 sebanyak panjang pesan p, yang diketahui dari pembacaan
pertama. Hasilnya pemotongan mulai dari bit ke-16 disimpan sebagai pesan asli.
Ekstraksi pesan dilakukan pada 8 teks hasil penyisipan NICETEXT dari
Tabel 5 dan Tabel 6. Dari 8 tes ekstraksi tersebut berhasil 100% didapatkan
kembali pesan asli berupa karakter ASCII kata “rebellion” dan kalimat “dosen
mengajar ilmu komputer”.
Pengujian sintaksis dicontohkan pada hasil penyisipan pesan kata “rebellion”
dengan variasi 1 style. Kamus KBBI mendefinisikan style sebagai pola dari
Subyek-Predikat yang diisi jenis kata nomina-verba. Kata yang tergolong nomina
yaitu kata benda, dan verba yaitu kata kerja. Salah satu penggalan kalimat dalam
teks T yang dibangkitkan NICETEXT yaitu “Landors beraneh-aneh”, valid secara
sintaks sesuai susunan gramatikal style berisi nomina (“Landors”) diikuti verba
(“beraneh-aneh”).
16
Tabel 6 Hasil penyisipan sistem NICETEXT dengan pesan “dosen mengajar
ilmu komputer” pada variasi style berbeda
Model
style
1
Variasi
style
1 pola
Isi style
Teks (T) yang dibangkitkan NICETEXT
n-v
Biku mengklasifikasi. Manggala beber. Bija
terkelopak. Bensahara terlentung. Penghasil
berkedip-kedip.
Multivitamin
beradu.
Percepatan
terberanikan.
Humanis
membatinkan. Famili mengubangkan.
2
2 pola
pron-a-nadv.
n-a-pron-v.
Begini khusus bombas awat-awat. Pranatal
berbahagia manakan terhadap. Anda dekoratif
kastel semanis-manisnya. Lidid beloon anda
ganal. Apaan celung efloresensi laun-laun.
Hektoliter abjadiah disini bahwa. Siapa
inheren homogeni sepala-pala. Mukalaf gagah
ngapain bakda.
3
4 pola
n-v-adv.
n-v-num.
n-v-pron.
n-a-pron-v-p.
4
8 pola
n-a-pron-v.
n-v.n-v-num.
n-a-pron-v-p.
n-v-adv.
n-v-pron.
pron-a-pronnum.pron-an-adv.
Biku mengklasifikasi aposteriori. Lajur lalulalang semesta. Alkadir berlanjutan kita.
Artian lorat apakah dengking-mendengking
syabas. Gadon berketuk klandestin. Rumitan
langgar dua. Dulur berleret bukantah.
Numeralia
belus
bukankah
abstain
sementelah.
Biku cemeh kau apabila. Moke berbuai.
Kesahajaan terlanting hepta. Demarkasi
demonstratif engkau kopyok mangkaya.
Pemangsaan menggelesot sepuas-puasnya.
Pemuasan mengocongkan apa. Disini gabuk
disana
gotun.
Daku
terharak-harak
antisiklogenesis kemati-matian.
Pengujian semantik dilakukan dengan survei. Kuisioner diberikan pada 32
orang responden dari bidang ilmu yang berbeda. Responden dengan latar belakang
bidang Ilmu Komputer sebanyak 20 orang dan dengan latar belakang bidang di
luar Ilmu Komputer sebanyak 12 orang. Perbedaan latar belakang bidang ilmu
responden membuat mereka melihat teks hasil percobaan dengan cara pandang
berbeda. Hal tersebut dilakukan untuk mengetahui model variasi style yang
dianggap menghasilkan kalimat yang baik secara semantik dan terlihat alami
secara gramatikal (imperceptible). Survei berupa kuisioner terdiri atas 2 set teks
yang dapat dilihat pada Lampiran 3 dan Lampiran 4. Tiap set terdiri atas 4 teks T
hasil penyisipan sebuah pesan dalam 4 model style dengan variasi pola kalimat
berbeda. Tiap teks dalam tiap set diberi indeks nilai dengan skala 1 hingga 4. Teks
yang dianggap baik secara semantik (mudah dipahami keterkaitan antarkata dan
antarkalimatnya) diberi skor 4. Begitu juga dengan teks yang variasi kalimatkalimatnya terlihat alami secara gramatikal diberi skor 4. Teks yang dianggap
buruk secara semantik dan variasi gramatikalnya tidak alami diberi skor 1. Hasil
survei dapat dlihat pada Gambar 9 dan Gambar 10.
17
Gambar 9 Hasil survei semantik teks T dari penyisipan pesan “rebellion”
(□) dan “dosen mengajar ilmu komputer” (∎) pada empat
model style dengan variasi berbeda
Skor-skor yang diisikan responden pada teks hasil penyisipan dua pesan dari
model style yang sama dijumlahkan, sehingga didapat total nilai semantik dan
gramatikal teks hasil penyisipan 4 model style yang dicobakan. Pada Gambar 9
diketahui untuk pesan “rebellion” dan “dosen mengajar ilmu komputer”, teks T
hasil penyisipan pesan pada model style 1 dengan skor 191, menggunakan style
berisi satu pola paling banyak dipilih menghasilkan kalimat cukup baik secara
semantik. Style dengan pola sederhana mempersempit keterkaitan makna
antarkata yang dibangkitkan sistem. Sementara itu, bervariasinya pola yang
digunakan menyebabkan semakin banyak susunan kata dari kamus yang
dibangkitkan sistem, sehingga keterkaitan makna antarkata yang dibangkitkan
menggunakan kamus D semakin luas. Pada kamus sendiri, kata-kata dari berbagai
bidang dikelompokkan hanya dalam 7 kategori. Hal tersebut menyebabkan
keterkaitan antarkata dan antarkalimat menjadi terabaikan.
Gambar 10 Hasil survei gramatikal teks T dari penyisipan pesan “rebellion”
(□) dan “dosen mengajar ilmu komputer” (∎) pada empat
model style dengan variasi berbeda
18
Dari hasil survei pada Gambar 10, untuk pesan “rebellion” dan “dosen
mengajar ilmu komputer”, teks T hasil penyisipan pesan pada model style 3
dengan skor 181, menggunakan style dengan variasi 4 pola kalimat banyak dipilih
menghasilkan kalimat yang gramatikalnya terlihat alami. Dengan adanya variasi
pola yang diterapkan pada pembangkitan teks, hasil kalimat-kalimat baru terlihat
lebih alami yaitu berisi beberapa kalimat dengan pola berbeda. Sedikitnya variasi
pola yang digunakan menyebabkan teks T membangkitkan kalimat dengan sebuah
pola berulang dan terlihat janggal, tidak seperti teks pada umumnya. Tabel hasil
penilaian semantik dapat dilihat pada Lampiran 5 dan Lampiran 6, sedangkan
tabel hasil penilaian gramatikal dapat dilihat pada Lampiran 7 dan Lampiran 8.
SIMPULAN DAN SARAN
Simpulan
Penelitian ini berhasil membangkitkan kalimat NICETEXT dengan pola
gramatikal bervariasi pada teks T dalam Bahasa Indonesia yang terlihat alami dan
valid secara sintaksis. Pesan awal yang ditransformasikan NICETEXT menjadi
kalimat-kalimat dalam teks baru, dapat diperoleh kembali melalui SCRAMBLE
dengan tingkat keberhasilan 100%. Namun, dari sisi semantik isi teks belum dapat
dipahami dengan baik, karena antarkata maupun antarkalimat tidak ada
pembatasan yang mengatur suatu kata maupun kalimat dengan konteks tertentu
ditempatkan sebelum atau setelah kata maupun kalimat lainnya, serta luasnya
cakupan kata-kata dalam kamus yang tidak dibatasi tema tertentu dan hanya
dikelompokan menurut 7 kategori jenis kata pada kamus KBBI.
Saran
Penelitian ini masih terbatas dan bersifat sederhana, beberapa
pengembangan yang dapat dilakukan yaitu:
1 Pembatasan tema kata-kata pada kamus untuk bidang teks yang ingin
dibangkitkan misalnya pertanian, teknologi dan lainnya.
2 Penerapan kategori lainnya dalam kamus sistem NICETEXT untuk
menghasilkan bentuk teks tidak mencurigakan dengan model seperti puisi.
3 Pembuatan antarmuka dan integrasi sistem yang mampu memproses
pembangunan kamus D dan pembangkitan style agar pengguna lebih mudah
mengoperasikan sistem.
19
DAFTAR PUSTAKA
Chapman MT. 1997. Hiding the hidden: a software system for concealing
ciphertext as innocous text [tesis]. Wisconsin (US): University of WisconsinMilwaukee.
Iswara PD. 2007. Pembelajaran Kalimat Bahasa Indonesia dengan Pola Spiral
pada Program Pendidikan Guru Sekolah Dasar. Jurnal Pendidikan Dasar
[Internet]. 2007 Okt. Bandung (ID): Universitas Pendidikan Indonesia.
[diunduh
2014
Jul
9].
Tersedia
pada:
http://file.upi.edu/Direktori/JURNAL/PENDIDIKAN_DASAR/Nomor_8Oktober_2007/Pembelajaran_Kalimat_Bahasa_Indonesia_Dengan_Pola_Spiral
_Pada_Program_Pendidikan_Guru_Sekolah_Dasar.pdf
Jajodia S, Johnson NF. 1998. Exploring steganography: seeing the unseen. IEEE
Computer. 31(2): 26-34.
Johnson NF, Katzenbeisser SC. 2000. A survey of steganographic techniques. Di
dalam: Katzenbeisser S, Petitcolas FAP, editor. Information Hiding Techniques
for Steganography and Digital Watermarking; London (UK): ArtechHouse.
hlm 43-78.
Menezes, Oorcshot, Vanstone. 1996. Handbook of Applied Cryptography. Florida
(US): CRC Press.
Munir R. 2006. Kriptografi. Bandung (ID): Informatika.
Morkel T, Eloff JHP, Olivier MS. 2005. An overview of image steganography. Di
dalam: Venter HS, Eloff JHP, Labuschagne L, Eloff MM, editor. Proceedings
of the Fifth Annual Information Security South Africa Conference (ISSA2005)
[Internet]. 2005 Jun. Sandton (RSA): University of Pretoria. [diunduh 2014 Jun
7]. Tersedia pada: http://mo.co.za/open/stegoverview.pdf
Neyman S.N. 2007. Perancangan protokol penyembunyian informasi terotentikasi
[tesis]. Bogor (ID): Institut Pertanian Bogor.
Qadarisman AY. 2011. Steganografi video dengan menggunakan metode Discrete
Cosine Transform [skripsi]. Bogor (ID): Institut Pertanian Bogor.
Rohani A. 2009. Implementasi dan analisis steganografi pada media teks dengan
metode NICETEXT [skripsi]. Bogor (ID): Institut Pertanian Bogor.
Tukan P. 2006. Mahir Berbahasa Indonesia 2 untuk SMA kelas XI Program IPA
dan IPS. Jakarta (ID): Yudhistira.
20
Lampiran 1 Contoh tahap penyisipan pesan pada sistem NICETEXT
> Kamus: KBBI
> Style: n - v. n - v – pron.
> Pesan (ASCII): a
Pesan dalam biner (C): 01100001
Panjang pesan (p): 8 bit
Panjang bit default yang merepresentasikan panjang pesan (n): 15 bit
Representasi panjang pesan C dalam 15 bit (Cbit): 000000000001000
Total bit yang dapat disembunyikan style (s):
n (14) + v (13). n (14) + v (13) + pron (6) = 60
Proses SIZER:
p + n s, maka x=
, sehingga r = (s * x) – (p + n)
x=
= 1, sehingga r = (60 * 1) – (8 + 15) = 37
String Random (R): 1000101001100011100000001011111011101
Ciphertext: Cbit | C | R
000000000001000 | 01100001 | 1000101001100011100000001011111011101
Proses transformasi:
NICETEXT membaca isi style S ke-1 yaitu n (nomina),
Jumlah bit nomina yang diambil dari ciphertext= 14 bit yaitu 00000000000100,
NICETEXT menggunakan kamus D untuk mentransformasi 00000000000100
magainin.
NICETEXT membaca isi style S ke-2 yaitu v (verba),
Jumlah bit nomina yang diambil dari ciphertext= 13 bit yaitu 001100001000,
NICETEXT menggunakan kamus D untuk mentransformasi 001100001000
membubuh.
NICETEXT membaca isi style S ke-3 yaitu n (nomina),
Jumlah bit nomina yang diambil dari ciphertext= 14 bit yaitu 10100110001110,
NICETEXT menggunakan kamus D untuk mentransformasi 10100110001110
pemalaman.
NICETEXT membaca isi style S ke-4 yaitu v (verba),
Jumlah bit nomina yang diambil dari ciphertext= 13 bit yaitu 0000001011111,
NICETEXT menggunakan kamus D untuk mentransformasi 0000001011111
menggusah.
NICETEXT membaca isi style S ke-5 yaitu pron (pronomina),
Jumlah bit nomina yang diambil dari ciphertext= 6 bit yaitu 011101,
NICETEXT menggunakan kamus D untuk mentransformasi 011101
situ.
Sehingga NICETEXTD,S
(000000000001000011000011000101001100011100000001011111011101 )
Magainin membubuh.Pemalaman menggusah situ.
21
Lampiran 2 Contoh tahap ekstraksi pesan pada sistem SCRAMBLE
> Kamus: KBBI
>Teks (T): Magainin membubuh. Pemalaman menggusah situ.
Proses transformasi:
SCRAMBLE membaca kata ke-1 dari teks yaitu ‘magainin’
SCRAMBLE menggunakan kamus D untuk mentransformasi kata ‘magainin’
00000000000100
SCRAMBLE membacakata ke-2 dari teks yaitu v (verba),
SCRAMBLE menggunakan kamus D untuk mentransformasi kata ‘membubuh’
001100001000
SCRAMBLE membacakata ke-3 dari teks yaitu n (nomina),
SCRAMBLE menggunakan kamus D untuk mentransformasi kata ‘pemalaman’
10100110001110
SCRAMBLE membacakata ke-4 dari teks yaitu v (verba),
SCRAMBLE menggunakan kamus D untuk mentransformasi kata ‘menggusah’
0000001011111
SCRAMBLE membacakata ke-5 dari teks yaitu pron (pronomina),
SCRAMBLE menggunakan kamus D untuk mentransformasi kata ‘situ’
011101
Sehingga SCRAMBLE D
(Magainin membubuh. Pemalaman menggusah situ.)
000000000001000011000011000101001100011100000001011111011101
Proses DESIZER:
Representasi panjang pesan C dalam 15 bit pertama (Cbit): 000000000001000
Panjang pesan C: 8 bit
Ciphertext: Cbit | C | R
000000000001000 | 01100001 | 1000101001100011100000001011111011101
Pesan biner (C): 01100001
Pesan (C) dalam ASCII: a
22
Lampiran 3 Kuisioner survei semantik isi teks dan survei teks dengan gramatikal
yang terlihat alami dari hasil penyisipan pesan “rebellion” sistem
NICETEXT
Model style
Teks yang dibangkitkan NICETEXT
Style 1
Landors beraneh-aneh. Jentikan menggantang.
Kelakanji berkemam. Ekspansionisme ganjar.
Style 2
Begini rembas kersik jangan-jangan. Pranatal blirik
betapa ala. Manakan keceng mafia secepatnya.
Ikebana gandem manakan andaikan.
Style 3
Landors beraneh-aneh jahar. Ilak menggejolak
sepadi. Kreol melambakan bila. Kedayan aktual lu
melengking sementelah.
Style 4
Landors kabut dewe syabas. Anteredium kilir.
Pemboros mengambal piko. Pengasramaan geruhgerah sendiri berkedal senjak. Honorarium
menjerongkong hanya. Bipolar mengeramkan
kitorang. Begitukan jenggar-jenggur beliau-beliau
paro. Bukankah keti-keti loncek beleng.
Skor
23
Lampiran 4 Kuisioner survei semantik isi teks dan survei teks dengan gramatikal
yang terlihat alami dari hasil penyisipan pesan “dosen mengajar
ilmu komputer” sistem NICETEXT
Model style
Teks yang dibangkitkan NICETEXT
Style 1
Biku mengklasifikasi. Manggala beber. Bija
terkelopak. Bensahara terlentung. Penghasil berkedipkedip. Multivitamin beradu. Percepatan terberanikan.
Humanis membatinkan. Famili mengubangkan.
Style 2
Begini khusus bombas awat-awat. Pranatal berbahagia
manakan terhadap. Anda dekoratif kastel semanismanisnya. Lidid beloon anda ganal. Apaan celung
efloresensi laun-laun. Hektoliter abjadiah disini
bahwa. Siapa inheren homogeni sepala-pala. Mukalaf
gagah ngapain bakda.
Style 3
Biku mengklasifikasi aposteriori. Lajur lalu-lalang
semesta. Alkadir berlanjutan kita. Artian lorat apakah
dengking-mendengking syabas. Gadon berketuk
klandestin. Rumitan langgar dua. Dulur berleret
bukantah. Numeralia belus bukankah abstain
sementelah.
Style 4
Biku cemeh kau apabila. Moke berbuai. Kesahajaan
terlanting hepta. Demarkasi demonstratif engkau
kopyok mangkaya. Pemangsaan menggelesot sepuaspuasnya. Pemuasan mengocongkan apa. Disini gabuk
disana gotun. Daku terharak-harak antisiklogenesis
kemati-matian.
Skor
24
Lampiran 5 Hasil perhitungan skor survei semantik teks dari penyisipan pesan
“rebellion”
Teks hasil
Style 1
Style 2
Style 3
Style 4
Skor 4
60
36
16
16
Skor 3
21
21
48
6
Skor 2
10
24
30
0
Skor 1
4
2
1
25
Total skor
95
83
95
47
Lampiran 6 Hasil perhitungan skor survei semantik teks dari penyisipan pesan
“dosen mengajar ilmu komputer”
Teks hasil
Style 1
Style 2
Style 3
Style 4
Skor 4
68
36
12
12
Skor 3
21
24
48
3
Skor 2
2
28
30
4
Skor 1
5
1
2
24
Total skor
96
89
92
43
Lampiran 7 Hasil perhitungan skor survei gramatikal teks dari penyisipan pesan
“rebellion”
Teks hasil
Style 1
Style 2
Style 3
Style 4
Skor 4
56
12
12
48
Skor 3
6
24
60
6
Skor 2
8
38
14
4
Skor 1
15
1
1
15
Total skor
85
75
87
73
Lampiran 8 Hasil perhitungan skor survei gramatikal teks dari penyisipan pesan
“dosen mengajar ilmu komputer”
Teks hasil
Style 1
Style 2
Style 3
Style 4
Skor 4
32
12
32
52
Skor 3
9
15
54
18
Skor 2
6
46
6
6
Skor 1
21
0
2
9
Total skor
68
73
94
85
25
RIWAYAT HIDUP
Penulis dilahirkan di Bekasi pada tanggal 08 Agustus 1991, anak pertama
dari dua bersaudara, putri dari pasangan Asep Ardiansyah dan Wahyu Ratna Sri.
Penulis lulus dari SMA Negeri 1 Bekasi pada tahun 2008. Pada tahun yang
sama, penulis mengikuti seleksi masuk Institut Pertanian Bogor melalui jalur
SNMPTN. Penulis memulai studinya di Institut Pertanian Bogor dengan Mayor
Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Untuk
memperluas pendidikan terkait program studi Mayor, penulis mengambil mata
kuliah Minor Manajemen Fungsional di bawah pengawasan Fakultas Ekonomi
dan Manajemen. Mata kuliah yang diambil antara lain Pengantar Manajemen,
Manajemen Keuangan, Manajemen Pemasaran, Manajemen Sumberdaya Manusia,
dan Manajemen Produksi dan Operasi. Semasa
kuliah, penulis pernah
melaksanakan Praktek Kerja Lapang selama dua bulan pada tahun 2011 di
Departemen Pertanian, Jakarta.
Download