1 BAB I PENDAHULUAN 1.1 Latar Belakang Pengembangan pengetahuan mengenai teknologi informasi dan komunikasi berkembang cukup pesat. Salah satu perkembangan teknologi informasi dan komunikasi yang sangat terlihat saat ini adalah adanya penggunaan teknologi komputer. Penggunaan model komunikasi berbasiskan teknologi jaringan komputer merupakan teknologi yang sudah banyak digunakan. Model komunikasi pada jaringan komputer, menggunakan aturan komunikasi yang sesuai dengan standar tipe komunikasi yang sering dikenal dengan nama network protocol. Jumlah dari port yang mengidentifikasikan network protocol menurut IANA adalah sejumlah 65.536 port. Banyaknya penggunaan network protocol dalam suatu komunikasi terkadang menuntut adanya penggunaan prioritas komunikasi seperti kualitias troughput, delay time, realability dan kemanan komunikasi. Penggunaan service prioritas sering disebut dengan istilah QoS. Dasar pemberian prioritas (QoS) adalah dengan penganalisaan terhadap Network traffic. Network traffic atau Internet Traffic adalah lalu lintas komunikasi data dalam jaringan yang ditandai dengan satu set aliran statistikal dengan penerapan pola terstruktur, Pola terstruktur yang dimaksud adalah informasi dari header data informasi komunikasi. Klasifikasi yang tepat terhadap sebuah trafik internet sangat penting dilakukan terutama dalam hal desain perancangan arsitektur jaringan, manajemen jaringan dan keamanan jaringan. Klasifikasi yang dilakukan adalah berdasarkan atas banyaknya tipe aktifitas komunikasi. Aktifitas komunikasi dalam jaringan komputer diatur dalam proses komunikasi menggunakan network protocol. Analisa terhadap suatu trafik jaringan komputer merupakan salah satu cara mengetahui penggunaan protocol komunikasi jaringan komputer, sehingga dapat menjadi dasar penentuan prioritas (QoS). 2 Terkait dengan klasifikasi trafik jaringan komputer, beberapa penelitian telah dilakukan dengan fokus pada penerapan data mining. Rachili (2007) mengajukan penelitian mengenai Email Filtering Menggunakan Naïve Bayesian. Pada penelitian tersebut Naïve Bayesian filter dibangun dari sekumpulan email yang telah diklasifikasikan ke dalam spam mail dan legitimate mail. Hasil yang didapat dari klasifikasi tersebut dibangun sebuah database filter yang digunakan untuk mengidentifikasi email sebagai spam atau legitimate mail. Naïve Bayes filter mengklasifikasikan email dengan menghitung probabilitas email berdasarkan nilai probabilitas token pada database filter yang telah dibangun. Internet Traffic Classification Using Bayesian Analysis Techniques yang dilakukan oleh Andrew W. Moore dan Denis Zuev adalah menggambarkan pengklasifikasi Internet Traffic pada Machine-Learning sebagai penentu QoS (Quality of Service) dengan tingkat akurasi yang tinggi menggunakan Naïve Bayes Estimator. Data (data latih) yang dipergunakan dalam acuan pengklasifikasian adalah data yang diolah sendiri. Judul Penelitian Klasifikasi Trending Topic Twitter Dengan Penerapan Metode Naïve Bayes yang dilakukan oleh Puteri Alpita Agustina adalah mengklasifikasikan beragam topik pembicaraan yang popular pada aplikasi Twitter dimana beberapa topic pembicaraan dapat digolongkan sebagai topik pembicaraan yang sama atau kategori tertentu. Pada penelitaannya digunakan 5 kategori yang masing-masing memiliki 20 fitur. Metode Naïve Bayes menggunakan klasifikasi kata dari topik pembicara yang sama dengan membandingkan setiap fitur yang dimiliki oleh tiap kategori. Dalam pengambilan sebuah trafik jaringan komputer, terdapat beberapa masalah diantaranya: a. Standarisasi atau format dalam trafik jaringan komputer tidak selalu sama antar perangkat maupun antar pengguna tool. b. Trafik dalam bentuk log aktifitas jaringan terkadang hanya bertujuan untuk pencatatan aktifitas yng sama dan trafik yang terdapat dalam suatu perangkat server ataupun router bersifat realtime terkadang tidak mampu menyimpan secara permanen. Hal ini disebabkan karena perangkat 3 tersebut memiliki system yang secara default atau hanya memiliki kapasitas penyimpanan yang kecil. c. Tidak sembarang orang yang dapat mengambil dan menganalisis suatu trafik jaringan untuk megetahui aktifitas dalam lalulintas jaringan. Solusi yang dapat ditawarkan dalam permasalahan diatas terkait dengan pengambilan informasi trafik jaringan adalah dengan mengambil sebuah capture trafik dari sebuah komunikasi jaringan komputer. Tentunya dalam hal ini seorang administrator akan menggunakan tool yang memiliki kemampuan dan terakui keakuratannya. Sehingga nantinya pengambilan informasi yang didapat dari capture trafik lebih bermanfaat. Ketika capture traffic telah dimiliki oleh admin jaringan, maka tugas seorang administrator jaringan akan lebih mudah dalam melakukan pengklasifikasian terhadap aktifitas yang rawan akan keamanan (apakah terdapat serangan keamanan / hacking) atau termasuk lalulintas yang normal. Implementasinya pada suatu system jaringan komputer. Capture trafik yang didapat adalah dalam jumlah record yang besar. Record dari hasil lalu litas jaringan merupakan catatan transaksi yang dilakukan oleh host dalam aktifitas yang dilakukannya. Salah satu aplikasi yang mampu mengenalkan bagaimana bentuk data trafik capture adalah aplikasi wireshark. Trafik capture yang dihasilkan oleh aplikasi wireshark dapat terdiri dari jumlah record yang besar hingga 200.000 record per 3 menit. Hal yang diutamakan adalah bagaimana seorang administrator mampu menganalisis dan membaca dengan tepat tentang adanya keamanan jaringan terutama yang berhubungan dengan serangan (hacking) dari hasil capture trafik yang ada. Bagi administrator yang kurang mengerti mengenai trafik jaringan akan memerlukan waktu yang lama untuk membaca dari hasil capture trafik. Berdasarkan dari fakta-fakta yang didapatkan pada penelitian sebelumnya yang membahas mengenai klasifikasi trafik jaringan komputer atau menggunakan metode Naïve Bayes sebagai pengklasifikasian dalam menentukan QoS (Quality of Service) serta melihat masalah dalam pembelajaran yang didapat dari penelitian sebelumnya, maka penulis melalui penelitian ini mengusulkan mengklasifikasi trafik jaringan di Universitas Udayana dengan dasar penganalisaan dari hasil 4 capture trafik data yang dihasilkan. Adapun yang digunakan sebagai tools aplikasi capture trafik data adalah aplikasi wireshark. Hasil data trafik capture akan diolah dengan proses data mining dengan menggunakan metode Naïve Bayes sebagai algoritma klasifikasi yang akan digunakan dalam data trafik jaringan komputer. Dengan adanya metode Naïve Bayes, maka penganalisaan terhadap klasifikasi trafik jaringan komputer yang dilakukan dari hasil data capture trafik akan memudahkan dalam penganalisaan record yang besar. 1.2 Rumusan Masalah Berdasarkan latar belakang yang telah diuraikan, maka rumusan permasalahan yang akan dibahas lebih lanjut dalam penelitian ini adalah sebagai berikut: 1. Bagaimanakah penerapan teknik Naïve Bayes untuk klasifkasi trafik jaringan Universitas Udayana ? 2. Bagaimanakah akurasi klasifikasi trafik jaringan internet Universitas Udayana didasarkan pada label kelas ? 1.3 Tujuan Menghasilkan sistem pengklasifikasian dalam jaringan komputer dengan penggunaan data capture traffic network yang diolah menggunakan metode Naïve Bayes. 1.4 Manfaat Adapun manfaat yang dapat diambil dari penyusunan tugas akhir ini adalah sebagai berikut : 1. Bagi penulis, dapat memperkaya pengetahuan di bidang Pengklassifikasi Network Traffic menggunakan metode Naïve Bayes 2. Terbentuknya klasifikasi jaringan komputer dengan proses klasifikasi yang didapat dari data capture traffic network sehingga dalam hal pembacaan 5 tidak secara manual yang mengharuskan membaca dari record dalam jumlah besar. 1.5 Ruang Lingkup Dan Batasan Masalah Dengan luasnya cakupan yang dapat terkait dengan tugas akhir ini dan untuk keseragaman pemahaman dalam penelitian, maka terdapat batasan-batasan yang perlu diberlakukan pada tugas akhir ini. Adaupun batasan permasalahan yang penulis angkat pada penelitian ini adalah : a. Penggunaan data input yang digunakan adalah dari capture traffic network yang dalam bentuk .csv yang di dapat dari penggunaan tool wireshark. b. Metode pengklasifikasian yang digunakan adalah Naïve Bayes. c. Data set yang digunakan untuk proses klasifikasi adalah dengan membangun dataset tersendiri. d. Waktu pengambilan network traffic yang dilakukan adalah selama 2 menit. e. Data uji yang digunakan dalam fase pengujian system adalah data sample dari trafik jaringan Universitas Udayana di gedung GDLN. 1.6 Sistematika Penulisan Sistematika penulisan dalam penyusunan tugas akhir ini terdiri dari pokok pembahasan yang saling berkaitan antara satu dengan lainnya, yaitu : BAB I : PENDAHULUAN Bab ini membahas mengenai gambaran umum penelitian mulai dari latar belakang, rumusan masalah, tujuan penulisan, manfaat penelitian, batasan masalah dan sistematika penulisan. 6 BAB II : TINJAUAN PUSTAKA Bab ini berisikan teori-teori dasar yang digunakan dalam pengklasifikasian penggunaan protocol komunikasi pada trafik jaringan menggunakan metode Naïve Bayes. BAB III : METODE PERANCANGAN SISTEM Bab ini menjelaskan mengenai lokasi dilakukan penelitian, waktu penelitian dimulai, sumber dan jenis data yang akan diolah dalam penelitian, alatalat penunjang dalam penelitian, dan tahapan penelitian yang dimulai dari alur analisis penelitian hingga simulasi sistem pengklasifikasian menggunakan metode Naïve Bayes. BAB IV HASIL DAN PEMBAHASAN Pada bab ini akan dibahas mengenai penerapan algoritma Naïve Bayes ke dalam sistem serta pengujiannya. BAB V PENUTUP Dalam bab ini akan dijelaskan mengenai kesimpulan yang didapatkan dari pembahasan tentang sistem pengklasifikasian Trafik Jaringan dengan menggunakan algoritma Naïve Bayes, disertai beberapa saran sebagai hasil akhir dari penelitian yang telah dilakukan 7