1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Informasi merupakan

advertisement
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Informasi merupakan sebuah komponen yang penting dalam sebuah jaringan
komputer
dari
sebuah
perusahaan.
Integrity,
availability
(ketersediaan),
dan
confidentiality (kerahasiaan) informasi yang ada di dalam sebuah perusahaan sangat
penting. Apabila dari ketiga sifat (Integrity, availability, dan confidentiality) ada yang
terganggu maka keamanan jaringan (network security) dari perusahaan tersebut patut
diperhatikan dengan seksama. Sistem keamanan jaringan yang ada harus diperbaiki.
Apabila data dari perusahaan tersebut diubah atau dicuri oleh perusahaan lain yang
berperan
sebagai
kompetitornya,
maka
perusahaan
tersebut
dapat
terganggu
kelangsungan bisnisnya.
Trend connection yang dilakukan oleh user yang terhubung ke internet via
jaringan komputer yang ada perlu juga diperhatikan. Apabila user terlalu banyak
mengakses ke website yang tidak ada hubungan dengan bisnis dan produktivitas
perusahaan yang menyebabkan bisnis dan produktivitas perusahaan tersebut menurun
maka perlu dipertimbangkan beberapa tindak lanjut seperti akses untuk ke website
tersebut bisa di block atau ditutup. Customer yang ingin mencari atau mendownload
informasi akan mendapatkan kemudahan.
Dari sejumlah besar data jaringan komputer yang telah terkumpul melalui sebuah
program analisis jaringan, Wireshark, dapat diketahui kegiatan keseluruhan dari jaringan
komputer yang ada tersebut. Sejumlah besar data tersebut mengandung data mengenai
protocol yang digunakan, waktu pengambilan data, siapa saja yang berperan sebagai
1
2
source dan sebagainya. Namun, dari data yang terkumpul tersebut perlu diperoleh
informasi yang bermakna.
Data yang dikumpulkan ini sekedar data mentah (raw data) yang berasal dari
jaringan. Data hanya menunjukkan kegiatan pemakai jaringan. Data akan lebih
bermakna bilamana dapat ditarik informasi darinya.
1.2 Ruang Lingkup
Skripsi ini meneliti informasi yang dapat ditarik bilamana data diproses dengan
salah satu teknik data mining. Mengambil informasi dari data jaringan yang sudah
terkumpul dari hasil capture Wireshark menggunakan metode classify dan algoritma tree
J-48 dari software data mining (WEKA: Waikato Environment for Knowledge Analysis)
yang meliputi:
1. Source
2. Destination
3. Protocol yang digunakan antara source dan destination
1.3 Tujuan dan Manfaat
Tujuan:
1. Klasifikasi menggunakan algoritma Tree J-48 dan Full training set pada Test
Option dengan Info sebagai atribut kelas berkaitan dengan destination =
68.180.219.51.
2. Klasifikasi menggunakan algoritma Tree J-48 dan Full training set pada Test
Option dengan destination sebagai atribut kelas berkaitan dengan source =
66.151.61.142 dan destination = 10.21.6.200.
3
3. Klasifikasi menggunakan algoritma Tree J-48 dan Full training set pada Test
Option dengan source sebagai atribut kelas berkaitan dengan destination =
68.180.219.51 dan source = 10.21.42.112
4. Klasifikasi menggunakan algoritma Tree J-48 dan Full training set pada Test
Option dengan destination sebagai atribut kelas berkaitan dengan source =
10.21.7.14
Manfaat:
1. Mendapatkan informasi dari hasil klasifikasi menggunakan algoritma Tree J48 dan Full training set pada Test Option dengan destination sebagai atribut
kelas berupa banyaknya komunikasi antara source = 66.151.61.142 dan
destination = 10.21.6.200 berdasarkan data laporan dari hasil capture jaringan
komputer yang telah dilakukan sebelumnya.
2. Mendapatkan informasi dari hasil klasifikasi menggunakan algoritma Tree J48 dan Full training set pada Test Option dengan source sebagai atribut kelas
berupa banyaknya komunikasi antara destination = 68.180.219.51 dan source
= 10.21.42.112 berdasarkan nomor urut paket yang terdapat pada data laporan
hasil capture jaringan komputer yang telah dilakukan sebelumnya.
3. Mendapatkan info dari hasil klasifikasi menggunakan algoritma Tree J-48 dan
Full training set pada Test Option dengan destination sebagai atribut kelas
berkaitan dengan source = 10.21.7.14
4
1.4 Metodologi
Untuk menunjang pembuatan skripsi ini maka dibutuhkan data-data dari jaringan
komputer yang actual dan berbagai informasi teknik maupun non teknik yang dapat
dijadikan sebagai bahan acuan dalam pembuatan skripsi ini. Untuk itu dibutuhkan suatu
metodologi dalam mengumpulkan data dan mendapatkan informasi dari data. Dalam
pembuatan skripsi ini digunakan metodologi penelitian dengan langkah sebagai berikut:
1 Studi kepustakaan
•
Perangkat jaringan
•
Data mining
•
Data mining Tools
2 Pengumpulan data
3 Pemrosesan data menggunakan salah satu teknik data mining
1.5 Sistematika Penulisan
Adapun sistematika penulisan laporan skripsi ini terbagi atas 5 bab di mana setiap
bab secara ringkas adalah sebagai berikut:
BAB 1 : PENDAHULUAN
Bab 1 dari skripsi ini merupakan pendahuluan yang menjelaskan mengenai latar
belakang penelitian, ruang lingkup penelitian, manfaat dan tujuan dari penelitian, dan
metodologi penelitian yang digunakan.
BAB 2 : LANDASAN TEORI
Pada bab ini dibahas teori-teori dasar mengenai teknik data mining, teknik
pengumpulan data (data collection) jaringan (dalam hal ini mengenai Packet Capture
5
pada Wireshark), software WEKA, dan perangkat jaringan yang dikumpulkan informasi
jaringannya (dalam hal ini switch).
BAB 3 : CARA PENGOLAHAN DATA
Pada bab ini akan dijelaskan skema jaringan yang digunakan pada penelitian ini,
cara memulai dan berhenti packet capture, cara menyimpan hasil capture tersebut ke
dalam bentuk file yang sesuai (export file) agar dapat digunakan sebagai source / sumber
untuk diolah menggunakan software teknik data mining, cara mengolah data hasil
packet capture tersebut menggunakan salah satu teknik data mining (classification) dari
software WEKA yang meliputi tahap preprocess (memasukkan file yang akan dianalisa
menggunakan WEKA), memilih teknik data mining yang digunakan (dalam hal ini
Classification dengan classifier Tree J-48) sampai dengan menghasilkan output pada
window classifier output.
BAB 4 : HASIL ANALISA DATA
Pada bab ini akan dibahas mengenai analisis dari hasil yang ditampilkan pada
window classifier output dengan tujuan memperoleh informasi dari sejumlah besar data
laporan jaringan yang ada.
BAB 5 : SIMPULAN
Pada bab ini akan berisikan simpulan-simpulan secara keseluruhan mengenai
parameter-parameter yang harus digunakan agar diperoleh hasil yang tingkat
reliabilitynya besar.
Pada bab ini akan disimpulkan bahwa teknik data mining yang banyak digunakan
dalam strategi bisnis dapat digunakan pula untuk mendapatkan informasi dari sejumlah
besar data jaringan di mana data jaringan tersebut diperoleh dengan cara mencapture
paket pada jaringan komputer menggunakan Wireshark.
6
Pada bab ini akan disimpulkan bahwa terdapat tahapan preprocess yang digunakan
untuk memasukkan data laporan jaringan agar data laporan jaringan tersebut dapat
diolah menggunakan salah satu teknik data mining (klasifikasi). Setelah tahapan
preprocess ini, dapat ditentukan teknik data mining (klasifikasi, clustering, regresi,
Association rule mining) yang akan digunakan untuk mendapatkan informasi dari
sejumlah besar data jaringan tersebut.
Pada bab ini akan disimpulkan bahwa informasi yang diperoleh dengan data
mining tergantung pada teknik data mining yang digunakan, atribut kelas yang dipilih,
dan output yang dipilih. Peran kepakaran/kemahiran manusia yang menggunakan tools
akan berpengaruh pada penafsiran informasi yang diperoleh.
Selain itu, pada bab 5 ini juga akan diberikan saran-saran yang dapat digunakan
untuk pembuatan skripsi berikutnya untuk topik data mining ini.
Download