bab i pendahuluan

advertisement
BAB I
PENDAHULUAN
1.1
Latar Belakang
Kemajuan teknologi saat ini tidak lepas dari kompresi data walaupun
kapasitas penyimpanan semakin meningkat. Berbagai kompresi yang ada saat ini
tidak hanya digunakan pada teks, namun digunakan juga pada gambar,
suara/musik, dan video. Hal ini menunjukkan bahwa kompresi merupakan suatu
hal penting dalam menyimpan media dalam bentuk digital.
Hingga saat ini, berbagai penelitian telah dilakukan untuk menghasilkan
teknik kompresi yang lebih baik. Secara umum, teknik kompresi data dibagi
menjadi dua bagian yaitu lossy dan lossless[1]. Kompresi data lossy memiliki
kelemahan dalam akurasi data karena untuk meningkatkan kompresi tersebut
terdapat beberapa informasi yang hilang ketika data dikompres. Sedangkan pada
kompresi lossless, tidak ada informasi yang hilang ketika kompresi dilakukan.
Kompresi lossy biasanya digunakan pada gambar dan suara digital, sedangkan
kompresi lossless biasanya digunakan ketika menyimpan catatan database,
spreadsheet, dan file pengolah kata.
Terdapat sejumlah aplikasi yang dapat digunakan dalam kompresi file,
seperti WinRAR, WinZip, dan 7-zip. Setiap aplikasi tersebut memiliki beberapa
kelebihan dan kekurangan[2]. Perbandingan ketiga aplikasi tersebut ditunjukkan
pada Gambar 1[3]. 7-zip dapat menghasilkan kompresi yang lebih baik dari
WinRAR dan WinZip akan tetapi memakan waktu yang cukup lama. Selain itu, 7zip juga dapat diperoleh secara gratis. WinZip unggul dalam kecepatannya
mengkompress data, tetapi hasil kompresinya kurang baik. Hasil kompresi
WinRAR sedikit dibawah dari 7-zip, tetapi proses kompresinya jauh lebih cepat
dari 7-zip. Itulah sebabnya format RAR dari aplikasi WinRAR menjadi sangat
terkenal saat ini, terutama untuk mengirim file dalam ukuran besar[2]. Oleh
karena itu, penelitian ini menggunakan WinRAR sebagai pembandingnya.
1
Gambar 1. Perbandingan 7Zip, WinZip dan WinRAR
Pada perkembangan selanjutnya, kompresi data ternyata dapat digunakan
untuk DNA. DNA (deoxyribonucleic acid) atau asam deoksiribonukleat adalah
suatu materi genetik yang merupakan bagian kerja dari kromosom[4]. DNA
merupakan kombinasi huruf a, c, g dan t (singkatan untuk Adenin, Cytosin,
Guanin, dan Thymin). Kompresi pada DNA telah ditemukan sejak tahun 1993 dan
telah
menghasilkan
beberapa
teknik
kompresi
seperti
BioCompress[5],
BioCompress-2[6], GenCompress[7], DNACompress[8], dan DNASequitur[9].
Rantai DNA, yang merupakan kombinasi acak antara a, c, g dan t, dimasukkan ke
dalam suatu file teks lalu dikompres. Hasil kompresi tersebut dapat dikembalikan
lagi (dekompres) tanpa ada informasi yang hilang (lossless compression).
Karena hanya terdiri dari empat jenis basa nitrogen (a, c, g, dan t), maka 2
bit cukup untuk menyimpan setiap basa nitrogen tersebut[7]. Hal ini merupakan
kelebihan dari teknik kompresi DNA. Jika menggunakan teknik kompresi standar
seperti "compress" dan "compact" yang ada di Unix atau program arsip "pkzip"
yang ada di MS-DOS, teknik-teknik kompresi tersebut menyimpan setiap basa
nitrogen kedalam lebih dari 2 bits. Dengan menyimpan setiap basa kedalam lebih
dari 2 bit, artinya teknik kompresi tersebut memakai lebih banyak memori
daripada teknik kompresi DNA.
2
Akan tetapi, teknik-teknik kompresi DNA, misalnya GenCompress, tidak
dapat digunakan untuk media lain, contohnya untuk gambar, karena informasi
pada rantai DNA hanya terdiri dari huruf a, c, g dan t. Oleh sebab itu, kompresi
tersebut hanya dapat digunakan pada file DNA dalam bentuk teks. Pada
kenyataannya, file teks dan gambar disimpan dalam komputer dalam bentuk
binary. Jika dibandingkan dengan tools yang sering digunakan dalam kompresi
file, tools tersebut mampu untuk melakukan kompresi pada berbagai jenis file.
Oleh sebab itu, penelitian ini mencoba agar semua jenis file dapat dikompres
dengan teknik kompresi DNA.
1.2
Perumusan masalah
Kompresi DNA mampu melakukan kompresi pada setiap basa nitrogen
menjadi 2 bit atau kurang dari 2 bit. Akan tetapi, permasalahan yang ditemui
adalah teknik-teknik kompresi pada DNA hanya dapat diterapkan pada file DNA
yang disimpan dalam bentuk teks. Teknik kompresi DNA tersebut tidak dapat
diterapkan pada jenis file yang lain. Hal inilah yang menjadi dasar dilakukannya
penelitian ini. Rumusan masalah dari penelitian ini adalah mencoba untuk
mencari cara agar semua jenis file bisa dikompres dengan menggunakan teknik
kompresi DNA serta membandingkan hasil kompresinya dengan aplikasi
WinRAR.
1.3
Batasan masalah
Batasan masalah dalam penelitian ini adalah:
1.
Penelitian ini hanya menggunakan salah satu teknik kompresi DNA,
yaitu GenCompress.
2.
Pengujian dalam penelitian ini menggunakan dataset Brodatz dan
beberapa jenis file lain seperti avi, bmp, txt, exe, dan wav sebagai
sampel.
3
1.4
Keaslian penelitian
[6]
dalam
penelitiannya
berhasil
menyempurnakan
algoritmanya
terdahulu, BioCompress, dan algoritma yang baru tersebut diberi nama
BioCompress-2. Dalam algoritma ini, pengulangan dan palindrom dalam untaian
DNA sudah dapat dideteksi.
[7] dalam penelitiannya juga mengenai kompresi rantai DNA, berhasil
menemukan suatu algoritma baru yang dinamakan GenCompress. Algoritma ini
mampu untuk mendeteksi perkiraan pengulangan yang terjadi dalam untaian
DNA.
[8] berhasil memanfaatkan mesin pencari PatternHunter dalam mencari
homologi dan palindrom yang ada dalam untaian DNA. Algoritma yang
ditemukannya diberi nama DNACompress.
[9] mencoba dengan menggunakan metode yang berbeda. Dalam
algoritmanya yang diberi nama DNASequitur, Cherniavsky dan Ladner
menggunakan konteks tatabahasa dalam mengkompres suatu untaian DNA.
Tabel 1 menunjukkan penelitian yang berkaitan dengan kompresi pada
DNA.
Tabel 1. Daftar beberapa penelitian mengenai kompresi DNA
No.
Judul Paper
1.
A
New
Challenge
Nama Kompresi
for BioCompress-2
Karakteristik
Penyempurnaan
Compression Algorithms:
BioCompress.
Genetic Sequences[6]
Mendeteksi
pengulangan
dari
dan
palindrom.
2.
A Compression Algorithm GenCompress
Mendeteksi
for DNA Sequences and Its
pengulangan.
Applications in Genome
Comparison[7]
4
perkiraan
3.
DNACompress: fast and DNACompress
Menggunakan
mesin
effective DNA sequence
pencari PatternHunter.
compression[8]
4.
Grammar-based
Compression
DNASequitur
of
DNA
Menggunakan
konteks
tata bahasa.
Sequences[9]
Objek yang digunakan dalam keempat teknik kompresi tersebut adalah
untaian DNA dari gen makhluk hidup yang berupa data teks. Sedangkan,
penelitian ini mencoba melakukan konversi berbagai jenis file, yang disimpan
dalam bentuk binary, ke dalam bentuk DNA agar dapat dikompres dengan teknik
kompresi DNA.
1.5
Tujuan Penelitian
Teknik kompresi DNA hanya dapat diterapkan pada untaian DNA dalam
bentuk teks, maka tujuan dari penelitian ini adalah:
1. Menemukan suatu cara agar semua jenis file dapat dikompres dengan
teknik kompresi DNA. Cara tersebut dicapai dengan mencoba
melakukan konversi data dari binary ke dalam bentuk DNA.
2. Membandingkan hasil kompresi GenCompress dengan hasil kompresi
WinRAR.
1.6
Manfaat Penelitian
Penelitian ini diharapkan dapat memberikan kontribusi dalam ilmu
pengetahuan khususnya di bidang kompresi data yang menggunakan konsep DNA
dan memberikan solusi bagi keterbatasan penyimpanan data serta biaya dan waktu
pengiriman data.
5
Download