BAB 1 PENDAHULUAN 1.1 Latar Belakang Informasi merupakan sebuah komponen yang penting dalam sebuah jaringan komputer dari sebuah perusahaan. Integrity, availability (ketersediaan), dan confidentiality (kerahasiaan) informasi yang ada di dalam sebuah perusahaan sangat penting. Apabila dari ketiga sifat (Integrity, availability, dan confidentiality) ada yang terganggu maka keamanan jaringan (network security) dari perusahaan tersebut patut diperhatikan dengan seksama. Sistem keamanan jaringan yang ada harus diperbaiki. Apabila data dari perusahaan tersebut diubah atau dicuri oleh perusahaan lain yang berperan sebagai kompetitornya, maka perusahaan tersebut dapat terganggu kelangsungan bisnisnya. Trend connection yang dilakukan oleh user yang terhubung ke internet via jaringan komputer yang ada perlu juga diperhatikan. Apabila user terlalu banyak mengakses ke website yang tidak ada hubungan dengan bisnis dan produktivitas perusahaan yang menyebabkan bisnis dan produktivitas perusahaan tersebut menurun maka perlu dipertimbangkan beberapa tindak lanjut seperti akses untuk ke website tersebut bisa di block atau ditutup. Customer yang ingin mencari atau mendownload informasi akan mendapatkan kemudahan. Dari sejumlah besar data jaringan komputer yang telah terkumpul melalui sebuah program analisis jaringan, Wireshark, dapat diketahui kegiatan keseluruhan dari jaringan komputer yang ada tersebut. Sejumlah besar data tersebut mengandung data mengenai protocol yang digunakan, waktu pengambilan data, siapa saja yang berperan sebagai 1 2 source dan sebagainya. Namun, dari data yang terkumpul tersebut perlu diperoleh informasi yang bermakna. Data yang dikumpulkan ini sekedar data mentah (raw data) yang berasal dari jaringan. Data hanya menunjukkan kegiatan pemakai jaringan. Data akan lebih bermakna bilamana dapat ditarik informasi darinya. 1.2 Ruang Lingkup Skripsi ini meneliti informasi yang dapat ditarik bilamana data diproses dengan salah satu teknik data mining. Mengambil informasi dari data jaringan yang sudah terkumpul dari hasil capture Wireshark menggunakan metode classify dan algoritma tree J-48 dari software data mining (WEKA: Waikato Environment for Knowledge Analysis) yang meliputi: 1. Source 2. Destination 3. Protocol yang digunakan antara source dan destination 1.3 Tujuan dan Manfaat Tujuan: 1. Klasifikasi menggunakan algoritma Tree J-48 dan Full training set pada Test Option dengan Info sebagai atribut kelas berkaitan dengan destination = 68.180.219.51. 2. Klasifikasi menggunakan algoritma Tree J-48 dan Full training set pada Test Option dengan destination sebagai atribut kelas berkaitan dengan source = 66.151.61.142 dan destination = 10.21.6.200. 3 3. Klasifikasi menggunakan algoritma Tree J-48 dan Full training set pada Test Option dengan source sebagai atribut kelas berkaitan dengan destination = 68.180.219.51 dan source = 10.21.42.112 4. Klasifikasi menggunakan algoritma Tree J-48 dan Full training set pada Test Option dengan destination sebagai atribut kelas berkaitan dengan source = 10.21.7.14 Manfaat: 1. Mendapatkan informasi dari hasil klasifikasi menggunakan algoritma Tree J48 dan Full training set pada Test Option dengan destination sebagai atribut kelas berupa banyaknya komunikasi antara source = 66.151.61.142 dan destination = 10.21.6.200 berdasarkan data laporan dari hasil capture jaringan komputer yang telah dilakukan sebelumnya. 2. Mendapatkan informasi dari hasil klasifikasi menggunakan algoritma Tree J48 dan Full training set pada Test Option dengan source sebagai atribut kelas berupa banyaknya komunikasi antara destination = 68.180.219.51 dan source = 10.21.42.112 berdasarkan nomor urut paket yang terdapat pada data laporan hasil capture jaringan komputer yang telah dilakukan sebelumnya. 3. Mendapatkan info dari hasil klasifikasi menggunakan algoritma Tree J-48 dan Full training set pada Test Option dengan destination sebagai atribut kelas berkaitan dengan source = 10.21.7.14 4 1.4 Metodologi Untuk menunjang pembuatan skripsi ini maka dibutuhkan data-data dari jaringan komputer yang actual dan berbagai informasi teknik maupun non teknik yang dapat dijadikan sebagai bahan acuan dalam pembuatan skripsi ini. Untuk itu dibutuhkan suatu metodologi dalam mengumpulkan data dan mendapatkan informasi dari data. Dalam pembuatan skripsi ini digunakan metodologi penelitian dengan langkah sebagai berikut: 1 Studi kepustakaan • Perangkat jaringan • Data mining • Data mining Tools 2 Pengumpulan data 3 Pemrosesan data menggunakan salah satu teknik data mining 1.5 Sistematika Penulisan Adapun sistematika penulisan laporan skripsi ini terbagi atas 5 bab di mana setiap bab secara ringkas adalah sebagai berikut: BAB 1 : PENDAHULUAN Bab 1 dari skripsi ini merupakan pendahuluan yang menjelaskan mengenai latar belakang penelitian, ruang lingkup penelitian, manfaat dan tujuan dari penelitian, dan metodologi penelitian yang digunakan. BAB 2 : LANDASAN TEORI Pada bab ini dibahas teori-teori dasar mengenai teknik data mining, teknik pengumpulan data (data collection) jaringan (dalam hal ini mengenai Packet Capture 5 pada Wireshark), software WEKA, dan perangkat jaringan yang dikumpulkan informasi jaringannya (dalam hal ini switch). BAB 3 : CARA PENGOLAHAN DATA Pada bab ini akan dijelaskan skema jaringan yang digunakan pada penelitian ini, cara memulai dan berhenti packet capture, cara menyimpan hasil capture tersebut ke dalam bentuk file yang sesuai (export file) agar dapat digunakan sebagai source / sumber untuk diolah menggunakan software teknik data mining, cara mengolah data hasil packet capture tersebut menggunakan salah satu teknik data mining (classification) dari software WEKA yang meliputi tahap preprocess (memasukkan file yang akan dianalisa menggunakan WEKA), memilih teknik data mining yang digunakan (dalam hal ini Classification dengan classifier Tree J-48) sampai dengan menghasilkan output pada window classifier output. BAB 4 : HASIL ANALISA DATA Pada bab ini akan dibahas mengenai analisis dari hasil yang ditampilkan pada window classifier output dengan tujuan memperoleh informasi dari sejumlah besar data laporan jaringan yang ada. BAB 5 : SIMPULAN Pada bab ini akan berisikan simpulan-simpulan secara keseluruhan mengenai parameter-parameter yang harus digunakan agar diperoleh hasil yang tingkat reliabilitynya besar. Pada bab ini akan disimpulkan bahwa teknik data mining yang banyak digunakan dalam strategi bisnis dapat digunakan pula untuk mendapatkan informasi dari sejumlah besar data jaringan di mana data jaringan tersebut diperoleh dengan cara mencapture paket pada jaringan komputer menggunakan Wireshark. 6 Pada bab ini akan disimpulkan bahwa terdapat tahapan preprocess yang digunakan untuk memasukkan data laporan jaringan agar data laporan jaringan tersebut dapat diolah menggunakan salah satu teknik data mining (klasifikasi). Setelah tahapan preprocess ini, dapat ditentukan teknik data mining (klasifikasi, clustering, regresi, Association rule mining) yang akan digunakan untuk mendapatkan informasi dari sejumlah besar data jaringan tersebut. Pada bab ini akan disimpulkan bahwa informasi yang diperoleh dengan data mining tergantung pada teknik data mining yang digunakan, atribut kelas yang dipilih, dan output yang dipilih. Peran kepakaran/kemahiran manusia yang menggunakan tools akan berpengaruh pada penafsiran informasi yang diperoleh. Selain itu, pada bab 5 ini juga akan diberikan saran-saran yang dapat digunakan untuk pembuatan skripsi berikutnya untuk topik data mining ini.