Tugas I Kriptografi TEORI INFORMASI SHANNON Oleh Muhammad Ghifary (13505023) Program Studi Informatika Sekolah Tinggi Elektro dan Informatika Institut Teknologi Bandung 2008 DAFTAR ISI 1. Pendahuluan : Teori Komunikasi Klasik ............................................................... 3 2. Teori Informasi Shannon ......................................................................................... 3 3. 4. 2.1. Tinjauan Sejarah ................................................................................................. 3 2.2. Sistem-Sistem Komunikasi sebelum Tahun 1948 .............................................. 4 2.3. Sistem Komunikasi Umum ................................................................................. 6 2.4. Entropy dan Redundancy .................................................................................... 7 Hubungan Antara Kriptografi dengan Teori Shannon ...................................... 10 3.1. Kerahasiaan Mutlak (Perfect Secrecy).............................................................. 12 3.2. Perkalian Kriptosistem (Product Cryptosystem) .............................................. 13 Daftar Pustaka ........................................................................................................ 14 2 1. Pendahuluan : Teori Komunikasi Klasik Teori komunikasi digunakan sebagai pendekatan untuk memahami perkara komunikasi. Berdasarkan kurun waktu dan pemahaman makna akan komunikasi, teori komunikasi semakin berkembang dengan adanya kemajuan dari teknologi informasi. Pada awal perkembangannya, lahirlah teori komunikasi klasik. Teori komunikasi klasik yang paling populer dirancang oleh Claude Shannon yang pada akhirnya teori tersebut dikenal dengan teori informasi Shannon melalui papernya yang ditulis pada tahun 1948 berjudul “A Mathematical Theory of Communication”. Sebelum penulisan papernya, Shannon sudah mengajukan rancangan generalisasi protokol sistem komunikasi kepada presiden Bush. Rancangan tersebut dibuat untuk mengatasi permasalahan efek distorsi pada pengiriman sinyal. 2. Teori Informasi Shannon 2.1. Tinjauan Sejarah Secara umum, teori informasi Shannon atau disebut juga teori matematis, memandang komunikasi sebagai fenomena mekanistis, matematis, dan informatif, yaitu komunikasi sebagai transmisi pesan dan bagaimana transmitter menggunakan saluran atau media komunikasi. Teori ini memanfaatkan kode sebagai sarana utama untuk mengonstruksi pesan dan menerjemahkannya (encoding dan decoding). Titik perhatiannya terletak pada akurasi dan efisiensi proses, bukan pada makna pesannya sendiri. Karya Shannon ini berkembang pasca Perang Dunia II pada waktu Shannon melakukan penilitian di Bell Telephone Laboratories di Amerika Serikat. Di sana Shannon berprofesi sebagai insinyur yang bertanggung jawab atas penyampaian yang cermat melalui telepon. Titik kajian utamanya adalah bagaimana menentukan cara bagaimana saluran komunikasi dapat digunakan dengan cara yang efisien. Menurut Shannon, misalnya dalam suatu sistem telepon, faktor yang terpenting dalam komunikasi bukanlah terletak pada makna pesannya, melainkan seberapa banyak sinyal-sinyal yang diterima selama proses penransmisian berlangsung. 3 Karena teori informasi ini dibuat dengan pendekatan matematis, maka teori ini sangat banyak manfaatnya dan digunakan diberbagai disiplin ilmu seperti ilmu komunikasi, ilmu probabilitas dan statistika, ilmu komputer, dan sebagainya. Bagi para ahli dan praktisi komunikasi, teori Shannon dijadikan sebagai inspirasi untuk membangun media komunikasi yang akurat dan efisien walaupun memiliki beberapa kelemahan. Salah satun kelemahannya adalah ia tidak menjelaskan konsep umpan balik (feedback) dalam model teorinya. Padahal dalam konsep analogi pesawat telepon yang ia kemukakan, konsep umpan balik sangat berperan penting dalam menentukan keberhasilan komunikasi. Hal ini dikarenakan teori yang ia kaji hanya melihat komunikasi sebagai fenomena linear satu arah. Sedangkan, di dunia ilmu komputer dan teknologi informasi, teori Shannon menjadi sebuah landasan utama untuk merancang dan membuat mekanisme proses pentransmisian pesan, kompresi pesan, keamanaan pesan, encoding dan decoding pesan, dan sebagainya. Secara umum, teori Shannon dibagi menjadi 2 bagian besar. Yang pertama adalah mengenai konsep informasi beserta pemodelan sumber informasi. Sedangkan, yang kedua adalah mengenai teori yang melingkupi mekanisme pengiriman sinyal melalui saluran komunikasi – apa yang menjadi batasan jumlah informasi yang dapat dikirim dan efek apa yang timbul akibat noise yang terjadi pada komunikasi. 2.2. Sistem-Sistem Komunikasi sebelum Tahun 1948 Sebelum tahun 1948, terdapat beberapa sistem komunikasi yang hadir ke permukaan, diantaranya : Telegraph (Morse, 1830-an) Telephone (Bell, 1876) Wireless Telegraph (Marconi, 1887) AM Radio (awal 1900-an) Single-Sideband Modulation (Carson, 1922) Television (1925 – 1927) 4 Teletype (1931) Frequency Modulation (Amstrong, 1936) Pulse-Code Modulation (PCM) (Reeves, 1937 – 1939) Vocoder (Dudley, 1939) Spread Spectrum (1940-an) Dari sistem-sistem komunikasi tersebut menjadi, Shannon mengambil beberapa inspirasi tentang kelebihan dan kelemahan dari sistem-sistem tersebut dan menjadikannya sebagai ramuan untuk merancang teori informasi. Adapun beberapa hal yang perlu diketahui mengenai sistem-sistem komunikasi tersebut, diantaranya : Sandi morse pada telegraf memberikan mekanisme yang efisien dalam mengenkode pesan dengan memperhatikan frekuensi dari simbol-simbol yang dienkode. Sistem-sistem seperti FM, PCM, dan Spread Spectrum mengilustrasikan bahwa bandwith hanyalah derajat kebebasan yang lain yang tersedia bagi para insinyur dalam rangka membuat sistem komunikasi yang reliable. PCM merupakan sistem komunikasi diskrit atau ‘digital’ pertama yang mentransmisikan sinyal-sinyal ‘analog’ yang kontinyu. Untuk menjaga ketepatan (fidelity), bandwith yang digunakan oleh Vocoder kurang dari bandwith untuk pesan. Dari sekian banyak sistem-sistem komunikasi yang muncul sebelum tahun 1948, belum ada satupun konsep sistem general yang mencakupi semua sistem. Pada tahun 1924, H. Nyquist, dalam papernya yang berjudul “Certain Factors Affecting Telegraph Speed“, mengemukakan bahwa laju transmisi merupakan proporsi terhadap logaritma dari jumlah level sinyal per satuan waktu ( W K log m ). Kemudian, ia merancang kode “optimum” yang menggantikan peran sandi morse agar dapat menghasilkan kinjera transmisi yang optimum pula. 4 tahun kemudian, tahun 1928, R Hartley memaparkan dan memomulerkan beberapa konsep dan terminologi komunikasi seperti “rate of communication”, “intersymbol interference”, “capacity of a system to transmit information”. Hartley juga 5 menyempurnakan persamaan logaritmisnya Nyquist menjadi H log S n dimana S merupakan jumlah simbol-simbol yang mungkin, dan n merupakan jumlah simbolsimbol pada suatu pentransmisian. Kedua pemikiran dari Nyquist dan Hartley inilah yang berpengaruh besar bagi Shannon dalam merumuskan teori informasi yang menggeneralisasi konsep komunikasi. 2.3. Sistem Komunikasi Umum Shannon merumuskan suatu konsep tentang sistem komunikasi umum dalam diagram sebagai berikut. Gambar 1 – Diagram Skema Sistem Informasi Umum Pada diagram diatas, sistem komunikasi umum terdiri dari 5 bagian utama yaitu : 1. Information Source Information Source berfungsi untuk memproduksi sebuah atau sekumpulan pesan terurut yang akan dikomunikasikan ke terminal penerima. Pesan yang dihasilkan memiliki berbagai tipe bentuk, yaitu deretan huruf seperti pada telegraf, fungsi waktu tunggal f (t ) seperti pada radio atau telefon, fungsi dari waktu dan berbagai variabel f ( x, y, t ) seperti pada TV hitam-putih dimana koordinat ( x, y ) menunjukkan intensitas warna, dan sebagainya. 2. Transmitter 6 Transmitter melakukan operasi-operasi tertentu terhadap pesan yang berfungsi untuk menghasilkan sinyal yang cocok untuk pentransmisian melalui suatu saluran komunikasi tertentu. Operasi yang dilakukan transmitter bergantung dengan kebutuhan. Contohnya pada sistem telefon, operasi yang dilakukan adalah mengubah tekanan suara menjadi arus listrik lemah yang proporsional. 3. Channel Channel merupakan media yang digunakan untuk mentransmisikan sinyal dari transmitter ke receiver. Channel dapat berupa sepasang kawat, coaxial cable, frekuensi radio, dsb. 4. Receiver Receiver melakukan operasi-operasi kebalikan dari transmitter, yaitu mengubah sinyal-sinyal yang diterima menjadi pesan asli. 5. Destination Destination merupakan tujuan dari pengiriman pesan. Shannon juga mengklasifikasikan sistem komunikasi menjadi 3 kategori utama : diskrit, kontinyu dan gabungan keduanya. Sistem diskrit yang dimaksud adalah baik pesan maupun sinyal kedua-duanya merupakan deretan dari simbol-simbol diskrit, contohnya sistem telegraf dimana pesannya merupakan deretan huruf-huruf dan sinyalnya adalah deretan titk-titik. Sedangkan, sistem kontinyu adalah baik pesan maupun sinyal diperlakukan sebagai fungsi kontinyu, contohnya sistem TV atau radio. Sistem gabungan merupakan sistem dimana diskrit dan kontinyu muncul di salah satu elemen pesan ataupun sinyalnya, contohnya sistem PCM yang pesannya merupakan suara analog namun sinyalnya berbentuk diskrit. 2.4. Entropy dan Redundancy Entropy dan redundancy merupakan konsep dasar yang dikemumakan pada teori informasi Shannon ini. Ide tersebut diadopsi dari salah satu cabang ilmu fisika yaitu termodinamika. Kedua konsep tersebut saling mempengaruhi dan bersifat sebabakibat (kausalitas) dimana entropy akan sangat berpengaruh terhadap redundancy yang timbul dalam proses komunikasi. 7 Entropy adalah konsep keacakan, di mana terdapat suatu keadaan yang tidak dapat dipastikan kemungkinannya. Entropy timbul jika prediktabilitas/kemungkinan rendah (low predictable) dan informasi yang ada tinggi (high information). Sebagai contoh ada pada penderita penyakit AIDS. Pengidap AIDS atau yang lebih sering disebut OHIDA tidak dapat dipastikan usianya atau kapan ia akan dijemput maut. Ada yang sampai delapan tahun, sepuluh tahun, bahkan sampai dua puluh tahun, masih bisa menjalani hidup sebagaimana orang yang sehat. Hal ini dikarenakan ajal atau kematian adalah sebuah sistem organisasi yang kemungkinannya sangat tidak dapat dipastikan. Informasi adalah sebuah ukuran ketidakpastian, atau entropy, dalam sebuah situasi. Semakin besar ketidakpastian, semakin besar informasi yang tersedia dalam proses komunikasi. Ketika sebuah situasi atau keadaan secara lengkap dapat dipastikan kemungkinannya atau dapat diprediksikan (highly predictable), maka informasi tidak ada sama sekali. Kondisi inilah yang disebut dengan negentropy. Konsep kedua adalah redundancy, yang merupakan kebalikan dari entropy. dudansi adalah sesuatu yang bisa diramalkan atau diprediksikan (predictable). Karena prediktabilitasnya tinggi (high predictable), maka informasi pun rendah (low information). Redundansi apabila dikaitkan dengan masalah teknis, ia dapat membantu untuk mengatasi masalah komunikasi praktis. Masalah ini berhubungan dengan akurasi dan kesalahan, dengan saluran dan gangguan, dengan sifat pesan, atau dengan khalayak. Kekurangan-kekurangan dari saluran (channel) yang mengalami gangguan (noisy channel) juga dapat diatasi oleh bantuan redundancy. Misalnya ketika kita berkomunikasi melalui pesawat telepon dan mengalami gangguan, mungkin sinyal yang lemah, maka kita akan mengeja huruf dengan ejaan yang telah banyak diketahui umum, seperti charlie untuk C, alpa untuk huruf A, dan seterusnya. Dengan memandang informasi sebagai entropy, Shannon mencetuskan ide bahwa sebuah sumber informasi bersifat probabilistik dengan mengajukan pertanyaan seperti 8 ini : jika sebuah sumber informasi memproduksi pesan-pesan dengan cara memilih simbol-simbol dari himpunan simbol terhingga, dan probabilitas simbol-simbol yang muncul bergantung pada pilihan sebelumnya, maka seberapa banyakkah informasi yang terkait dengan sumber tersebut? Shannon menjelaskan hal tersebut dengan sebuah persamaan yang memaparkan hubungan antara entropy dan redundancy. Jika sebuah sumber informasi tidak mempunyai banyak pilihan atau memiliki derajat keacakan yang rendah, maka informasi atau entropy tersebut rendah. 1 (actual _ entropy / max_ entropy) redundancy Dengan mendefinisikan informasi sebagai entropy, terbentuklah 2 buah teorema fundamental dari Shannon. Teori yang pertama berhubungan dengan sistem komunikasi pada channel tanpa noise, sedangkan teori yang kedua berhubungan dengan sistem komunikasi dengan noise. Bunyi dari teorema pertama adalah sebagai berikut. Terdapat sebuah sumber informasi yang memiliki entropy H (bits per symbol) dan sebuah channel dengan kapasitas C (bits per transmit) dengan laju rata-rata C/H – e symbol per second dimana e sangat kecil. Tidak mungkin untuk dapat melakukan transmisi dengan laju rata-rata lebih dari C/H. Ide utama dibalik teorema ini adalah bahwa jumlah informasi yang mungkin untuk ditransmisikan berdasar pada besarnya entropy atau derajat keacakkan. Oleh karena itu, berdasarkan sifat-sifat statistik dari sumber informasi, ini memungkinkan untuk dilakukannya pengkodean informasi sehingga memungkinkannya untuk melakukan pentransmisian informasi pada laju maksimum yang diperbolehkan channel. Ini merupakan ide revolusioner bagi para insinyur komunikasi sebelumnya yang berpikir bahwa jumlah sinyal maksimum yang dapat ditransport dalam suatu mediam bergantung pada berbagai faktor, seperti frequensi, dan sebagainya. 9 Sedangkan, bunyi dari teorema kedua adalah sebagai berikut. Diketahui sebuah channel yang memiliki kapasitas C dan sebuah sumber entropy discrete per second H. Jika H<=C maka akan ada suatu sistem koding dimana output dari sumbernya dapat ditransmisikan melalui channel dengan tingkat kegagalan yang sangat rendah. Jika H-C > C maka akan ada kemungkinan untuk meng-encode pesan sehingga pesan yang ambigu bernilai kurang dari H-C + e dimana e sangat kecil. Tidak ada metode yang mengenkode pesan dimana tingkat keambiguitasnya kurang dari H-C. 3. Hubungan Antara Kriptografi dengan Teori Shannon Selain memberkan kontribusi di bidang ilmu komunikasi, teori informasi Shannon juga memberikan kontribusi besar di bidang kriptografi. Pada tahun 1949, Claude Shannon kembali mempublikasikan papernya yang kali ini berjudul “Communication Theory of Secrecy System” dalam jurnal Bell System Technical dimana memberikan pengaruh yang sangat besar bagi studi ilmiah di bidang kriptografi. Hubungan antara kriptografi dengan teori informasi Shannon sangatlah erat. Berikut ini perkataan dari Shannon sendiri mengenai hubungan antara kriptografi dan teori Shannon. “Bell Labs sedang melakukan pekerjaan terhadap masalah sistem kerahasiaan (secrecy system). Saya bekerja di bidang sistem komunikasi dan ditunjuk oleh beberapa komite untuk mempelajari teknik kriptanalisis. Pekerjaan tentang teori matematis komunikasi dan kriptografi berjalan bersamaan. Saya bekerja di kedua bidang tersebut. Saya tidak mengatakan bahwa yang satu mendahului yang lainnya. Kedua ilmu tersebut sangat berkaitan erat dan tidak dapat dipisahkan.” Sektor besar dari penelitian Shannon melibatkan ide tentang redundancy dalam bahasa –yang telah kita bahas di atas. Sebagai contoh, dalam bahasa Inggris, simbol “q” selalu diikuti dengan “u” dan maka “u” dapat dikatakan redundan karena dengan menghilangkan simbol “u” tidak akan mengurangi makna pesan. Begitu juga dengan kata “the” yang juga redundan sehingga pada sistem telegram kata tersebut dihilangkan. 10 Shannon menunjukkan bahwa jika semua huruf dalam bahasa Inggris dapat digunakan dalam kombinasi apapun maka seluruh permutasi dari 4 huruf cukup untuk menghasilkan 456.976 kata (lebih kurang sama dengan jumlah seluruh kata dalam bahasa Inggris). Seandainya ada bahasa yang memiliki konsep seperti ini, maka akan sulit untuk melakukan pemeriksaan kesalahan karena semua kombinasi dari simbolsimbolnya merupakan kata yang dapat diterima. Hanya konteks dalam sebuah kalimatnyalah yang dapat digunakan untuk memastikan apakah kata tersebut tepat atau tidak. Kesalahan 1 atau 2 huruf saja dapat membentuk kata yang bermakna. Menurut Shannon, redundansi merupakan fondasi utama dalam percobaan kriptanalisis. Semakin tinggi angka redundansi yang terdapat dalam suatu informasi, semakin gampang pula informasi tersebut untuk diketahui. Sebaliknya, jika angka redundansinya rendah, maka informasi tersebut semakin sulit untuk dipecahkan. Mengikuti teori ini, Shannon melakukan operasi pada sebuah pesan teks yang dihilangkan semua redundansinya. Poin penting dari operasi ini adalah dengan menghilangkan semua huruf vocal yang tidak menimbulkan definisi ambigu pada saat mengembalikan hasil enkripsi ke pesan yang sebenarnya. Sisanya terus dikurangi semaksimal mungkin sebelum dilakukan proses enkripsi. Shannon pun mencetuskan ide tentang sistem kerahasiaan umum (general secrecy system) yang mirip dengan sistem komunikasi umum (general communication system) yang memang pada kenyataannya dikerjakan dalam waktu hampir bersamaan. Berikut ini diagram tentang general secrecy system. 11 Gambar 2 – General Secrecy System Beberapa ide dari Shannon yang sangat bermanfaat di dunia kriptografi di antaranya adalah sebagai berikut. 3.1. Kerahasiaan Mutlak (Perfect Secrecy) Ada 2 ukuran mendasar yang digunakan dalam hal keamanan dari kriptosistem. 1. Computational Security Ukuran ini menjelaskan tentang kompleksitas komputasional yang dibutuhkan dalam sebuah percobaan kriptanalisis. Kita dapat mendefinisikan sebuah kriptosistem yang aman secara komputasi jika algoritma terbaik yang digunakan untuk memecahkan sistem tersebut membutuhkan paling tidak sebanyak N operasi, dimana N merupakan bilangan khusus yang sangat besar. Namun, masalahnya adalah tidak ada kriptosistem yang dapat diklaim aman secara komputasi jika menggunakan definisi tersebut. Dalam prakteknya, sebuah kriptosistem dikatakan aman secara komputasi jika metode terbaik yang telah diketahui untuk memecahkan kriptosistem membutuhkan sejumlah banyak waktu komputasi yang tidak rasional. Pendekatan lainnya adalah memunculkan fakta dari keamanan komputasi dengan cara mereduksi definisi dari tingkat keamanan dari kriptosistem untuk beberapa masalah yang sudah lazim yang 12 telah diklaim sebagai masalah rumit. Sebagai contohnya, diberikan sebuah pernyataan yang dapat dibuktikan sebagai berikut : “sebuah kriptosistem dapat dikatakan aman jika ada bilangan bulat n dimana n tidak dapat difaktorkan”. Kriptosistem bertipe seperti ini disebut dengan “provably secure”. Namun demikian, harus dimengerti bahwa metode ini hanya dapat menunjukkan keamanan kriptosistem secara relatif, tidak secara absolut. 2. Unconditional Security Ukuran ini menjelaskan tentang keamanan dari kriptosistem dimana tidak ada batasan yang terdapat pada jumlah komputasi yang diperbolehkan. Sebuah kriptosistem dapat didefinisikan sebagai unconditionally secure jika sistem tersebut tidak dipecahkan, bahkan dengan sumber daya komputasi yang tak terbatas. Shannon pun membuat sebuah teorema mengenai perfect secrecy sebagai berikut. Diberikan sebuah kriptosistem ( P, C , K , E , D) dimana | K || C || P | . Kriptosistem tersebut memiliki perfect secrecy jika dan hanya jika setiap kunci yang digunakan dengan probabilitas yang sama yaitu 1 / | K | , untuk setiap x P , dan untuk setiap y C , ada sebuah kunci unik K dimana ek ( x) y Salah satu contoh kriptosistem perfect secrecy yang berhasil direalisasikan adalah Vernam One-time Pad yang digunakan untuk enkripsi dan dekripsi otomatis terhadap pesan-pesan pada telegraf. Setiap pesan yang dienkrepsi dan didekripsi menggunakan kunci yang berbeda-beda dan kunci yang telah dipakai tidak boleh dipakai kembali. 3.2. Perkalian Kriptosistem (Product Cryptosystem) Ide lain dari Shannon di bidang kriptografi adalah ide untuk menggabungkan 2 buah kriptosistem yang direpresentasikan dalam bentuk perkalian (product). Ide ini menjadi hal yang fundamental dalam perancangan kriptosistem yang modern seperti Data Encryption Standard (DES). Pada prakteknya, bentuk perkalian kriptosistem ini 13 diimplementasikan dalam teknik substitusi dan permutasi yang merupakan metode yang paling banyak digunakan dalam kriptosistem yang ada saat ini. 4. Daftar Pustaka [1] C.E. Shannon, “A mathematical theory of communication”, Bell Syst. Tech., J., vol. 27, pp. 379-423, 623-656, July-Ock. 1948. [2] H. Nyquist, “Certain factors affecting telegraph speed”, Bell Syst. Tech. J., vol. 3, pp. 324-352, Apr. 1924. [3] S. Verdu, “Fifty years of shannon theory”, IEEE Transaction on information theory, vol. 44, no.6, October 1998. [4] D. Stinson, “Cryptography Theory and Practice”, CRC Press LLC, March 1995. 14