BAB I PENDAHULUAN 1.1 Latar Belakang Kemajuan teknologi saat ini tidak lepas dari kompresi data walaupun kapasitas penyimpanan semakin meningkat. Berbagai kompresi yang ada saat ini tidak hanya digunakan pada teks, namun digunakan juga pada gambar, suara/musik, dan video. Hal ini menunjukkan bahwa kompresi merupakan suatu hal penting dalam menyimpan media dalam bentuk digital. Hingga saat ini, berbagai penelitian telah dilakukan untuk menghasilkan teknik kompresi yang lebih baik. Secara umum, teknik kompresi data dibagi menjadi dua bagian yaitu lossy dan lossless[1]. Kompresi data lossy memiliki kelemahan dalam akurasi data karena untuk meningkatkan kompresi tersebut terdapat beberapa informasi yang hilang ketika data dikompres. Sedangkan pada kompresi lossless, tidak ada informasi yang hilang ketika kompresi dilakukan. Kompresi lossy biasanya digunakan pada gambar dan suara digital, sedangkan kompresi lossless biasanya digunakan ketika menyimpan catatan database, spreadsheet, dan file pengolah kata. Terdapat sejumlah aplikasi yang dapat digunakan dalam kompresi file, seperti WinRAR, WinZip, dan 7-zip. Setiap aplikasi tersebut memiliki beberapa kelebihan dan kekurangan[2]. Perbandingan ketiga aplikasi tersebut ditunjukkan pada Gambar 1[3]. 7-zip dapat menghasilkan kompresi yang lebih baik dari WinRAR dan WinZip akan tetapi memakan waktu yang cukup lama. Selain itu, 7zip juga dapat diperoleh secara gratis. WinZip unggul dalam kecepatannya mengkompress data, tetapi hasil kompresinya kurang baik. Hasil kompresi WinRAR sedikit dibawah dari 7-zip, tetapi proses kompresinya jauh lebih cepat dari 7-zip. Itulah sebabnya format RAR dari aplikasi WinRAR menjadi sangat terkenal saat ini, terutama untuk mengirim file dalam ukuran besar[2]. Oleh karena itu, penelitian ini menggunakan WinRAR sebagai pembandingnya. 1 Gambar 1. Perbandingan 7Zip, WinZip dan WinRAR Pada perkembangan selanjutnya, kompresi data ternyata dapat digunakan untuk DNA. DNA (deoxyribonucleic acid) atau asam deoksiribonukleat adalah suatu materi genetik yang merupakan bagian kerja dari kromosom[4]. DNA merupakan kombinasi huruf a, c, g dan t (singkatan untuk Adenin, Cytosin, Guanin, dan Thymin). Kompresi pada DNA telah ditemukan sejak tahun 1993 dan telah menghasilkan beberapa teknik kompresi seperti BioCompress[5], BioCompress-2[6], GenCompress[7], DNACompress[8], dan DNASequitur[9]. Rantai DNA, yang merupakan kombinasi acak antara a, c, g dan t, dimasukkan ke dalam suatu file teks lalu dikompres. Hasil kompresi tersebut dapat dikembalikan lagi (dekompres) tanpa ada informasi yang hilang (lossless compression). Karena hanya terdiri dari empat jenis basa nitrogen (a, c, g, dan t), maka 2 bit cukup untuk menyimpan setiap basa nitrogen tersebut[7]. Hal ini merupakan kelebihan dari teknik kompresi DNA. Jika menggunakan teknik kompresi standar seperti "compress" dan "compact" yang ada di Unix atau program arsip "pkzip" yang ada di MS-DOS, teknik-teknik kompresi tersebut menyimpan setiap basa nitrogen kedalam lebih dari 2 bits. Dengan menyimpan setiap basa kedalam lebih dari 2 bit, artinya teknik kompresi tersebut memakai lebih banyak memori daripada teknik kompresi DNA. 2 Akan tetapi, teknik-teknik kompresi DNA, misalnya GenCompress, tidak dapat digunakan untuk media lain, contohnya untuk gambar, karena informasi pada rantai DNA hanya terdiri dari huruf a, c, g dan t. Oleh sebab itu, kompresi tersebut hanya dapat digunakan pada file DNA dalam bentuk teks. Pada kenyataannya, file teks dan gambar disimpan dalam komputer dalam bentuk binary. Jika dibandingkan dengan tools yang sering digunakan dalam kompresi file, tools tersebut mampu untuk melakukan kompresi pada berbagai jenis file. Oleh sebab itu, penelitian ini mencoba agar semua jenis file dapat dikompres dengan teknik kompresi DNA. 1.2 Perumusan masalah Kompresi DNA mampu melakukan kompresi pada setiap basa nitrogen menjadi 2 bit atau kurang dari 2 bit. Akan tetapi, permasalahan yang ditemui adalah teknik-teknik kompresi pada DNA hanya dapat diterapkan pada file DNA yang disimpan dalam bentuk teks. Teknik kompresi DNA tersebut tidak dapat diterapkan pada jenis file yang lain. Hal inilah yang menjadi dasar dilakukannya penelitian ini. Rumusan masalah dari penelitian ini adalah mencoba untuk mencari cara agar semua jenis file bisa dikompres dengan menggunakan teknik kompresi DNA serta membandingkan hasil kompresinya dengan aplikasi WinRAR. 1.3 Batasan masalah Batasan masalah dalam penelitian ini adalah: 1. Penelitian ini hanya menggunakan salah satu teknik kompresi DNA, yaitu GenCompress. 2. Pengujian dalam penelitian ini menggunakan dataset Brodatz dan beberapa jenis file lain seperti avi, bmp, txt, exe, dan wav sebagai sampel. 3 1.4 Keaslian penelitian [6] dalam penelitiannya berhasil menyempurnakan algoritmanya terdahulu, BioCompress, dan algoritma yang baru tersebut diberi nama BioCompress-2. Dalam algoritma ini, pengulangan dan palindrom dalam untaian DNA sudah dapat dideteksi. [7] dalam penelitiannya juga mengenai kompresi rantai DNA, berhasil menemukan suatu algoritma baru yang dinamakan GenCompress. Algoritma ini mampu untuk mendeteksi perkiraan pengulangan yang terjadi dalam untaian DNA. [8] berhasil memanfaatkan mesin pencari PatternHunter dalam mencari homologi dan palindrom yang ada dalam untaian DNA. Algoritma yang ditemukannya diberi nama DNACompress. [9] mencoba dengan menggunakan metode yang berbeda. Dalam algoritmanya yang diberi nama DNASequitur, Cherniavsky dan Ladner menggunakan konteks tatabahasa dalam mengkompres suatu untaian DNA. Tabel 1 menunjukkan penelitian yang berkaitan dengan kompresi pada DNA. Tabel 1. Daftar beberapa penelitian mengenai kompresi DNA No. Judul Paper 1. A New Challenge Nama Kompresi for BioCompress-2 Karakteristik Penyempurnaan Compression Algorithms: BioCompress. Genetic Sequences[6] Mendeteksi pengulangan dari dan palindrom. 2. A Compression Algorithm GenCompress Mendeteksi for DNA Sequences and Its pengulangan. Applications in Genome Comparison[7] 4 perkiraan 3. DNACompress: fast and DNACompress Menggunakan mesin effective DNA sequence pencari PatternHunter. compression[8] 4. Grammar-based Compression DNASequitur of DNA Menggunakan konteks tata bahasa. Sequences[9] Objek yang digunakan dalam keempat teknik kompresi tersebut adalah untaian DNA dari gen makhluk hidup yang berupa data teks. Sedangkan, penelitian ini mencoba melakukan konversi berbagai jenis file, yang disimpan dalam bentuk binary, ke dalam bentuk DNA agar dapat dikompres dengan teknik kompresi DNA. 1.5 Tujuan Penelitian Teknik kompresi DNA hanya dapat diterapkan pada untaian DNA dalam bentuk teks, maka tujuan dari penelitian ini adalah: 1. Menemukan suatu cara agar semua jenis file dapat dikompres dengan teknik kompresi DNA. Cara tersebut dicapai dengan mencoba melakukan konversi data dari binary ke dalam bentuk DNA. 2. Membandingkan hasil kompresi GenCompress dengan hasil kompresi WinRAR. 1.6 Manfaat Penelitian Penelitian ini diharapkan dapat memberikan kontribusi dalam ilmu pengetahuan khususnya di bidang kompresi data yang menggunakan konsep DNA dan memberikan solusi bagi keterbatasan penyimpanan data serta biaya dan waktu pengiriman data. 5