6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas

advertisement
6
BAB 2
LANDASAN TEORI
Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang
mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat.
2.1 Basis Data (Database)
Database adalah koleksi data item yang saling terkait terkelola sebagai satu unit.
Beberapa defenisi lain tentang database yaitu sebagai berikut:
1. Suatu pengorganisasian sekumpulan data yang saling berhubungan sehingga
memudahkan aktivitas untuk memperoleh informasi (Sutanta, Edhy. 2004).
2. Database merupakan data yang saling terhubung dan deskripsi dari data yang
dirancang untuk kebutuhan organisasi (McLeod, Raymond & Schell, George. 2004).
3. Sedangkan menurut Date, database adalah record yang terkomputerisasi yang
bertujuan menyediakan informasi ketika dibutuhkan (Kadir, Abdul. 2003).
Penerapan database dalam sistem informasi disebut database system. Dari
teori-teori tersebut dapat disimpulkan bahwa database adalah sekumpulan data yang
terorganisasi dan saling terhubung untuk menyediakan informasi yang diperlukan.
Basis data (database), atau sering pula dieja basis data, adalah kumpulan
informasi yang disimpan didalam komputer secara sistematik sehingga dapat diperiksa
menggunakan suatu program komputer untuk memperoleh informasi dari basis data
tersebut. Perangkat lunak yang digunakan untuk mengelola dan memanggil kueri
(query) basis data disebut sistem manajemen basis data (Database Management
System, DBMS) (Sutanta, Edhy. 2004).
Universitas Sumatera Utara
7
Sistem basis data (database system) didefinisikan sebagai sekumpulan
subsistem yang terdiri atas basis data dengan para pemakai yang menggunakan basis
data secara bersama-sama, personal-personal yang merancang dan mengelola basis
data, teknik- teknik untuk merancang dan mengelola basis data, serta sistem komputer
untuk mendukungnya (Kadir, Abdul. 2003). Database system adalah sistem
penyimpanan informasi yang terorganisasi dengan suatu cara sehingga memudahkan
untuk proses pengolahan data (McLeod, Raymond & Schell, George. 2004).
2.1.1 DBMS (Database Management System)
DBMS adalah sebuah sistem perangkat lunak yang mengizinkan pengguna untuk
mendefinisikan, membuat, memelihara, dan mengatur akses ke database. Sedangkan
menurut McLeod dan Schell, DBMS adalah aplikasi perangkat lunak yang
menyimpan struktur database, hubungan antardata dalam database, serta berbagai
formulir laporan yang berkaitan dengan database tersebut (McLeod, Raymond &
Schell, George. 2004).
2.2 Konsep dasar pengambilan keputusan
Pengambilan keputusan adalah memilih satu atau lebih diantara sekian banyak
alternatif keputusan yang mungkin. Alternatif keputusan meliputi keputusan ada
kepastian, keputusan berisiko, keputusan ketidakpastian dan keputusan dalam konflik.
2.2.1 Tahapan Pengambilan Keputusan
Simon tahun 1960 memperkenalkan empat aktivitas dalam proses pengambilan
keputusan (Turban, E., Aronson, J. E. & Liang, T, 2005):
1. Intelligence: Pengumpulan informasi untuk mengidentifikasikan permasalahan.
Proses yang terjadi pada fase ini adalah :
1. Menemukan masalah
2. Klasifikasi masalah
3. Penguraian masalah
4. Kepemilikan masalah
Universitas Sumatera Utara
8
2. Design: Tahap ini meliputi pembuatan, pengembangan, dan analisis hal-hal yang
mungkin untuk dilakukan. Termasuk juga disini pemahaman masalah dan
pengecekan solusi yang layak. Tugas-tugas yang ada pada tahap ini merupakan
kombinasi dari seni dan pengetahuan, yaitu:
1. Komponen-komponen model
2. Struktur model
3. Seleksi prinsip-prinsip pemilihan (kriteria evaluasi)
4. Pengembangan (penyediaan) alternative
5. Prediksi hasil
6. Pengukuran hasil
7. Skenario
3. Choice: Tahap memilih solusi dari alternatif-alternatif yang disediakan. Ada dua
pendekatan dalam pencarian pilihan (choice) yaitu :
1. Teknis analitis: Menggunakan perumusan matematis
2. Algoritma: Langkah demi langkah proses.
4. Implementation: Tahap melaksanakan keputusan dan melaporkan hasilnya.
Keuntungan pada tahapan ini adalah dalam memberikan ketajaman dan detil dari
analisis dan output yang dihasilkan.
2.3 Data Mining
Definisi sederhana dari data mining adalah ekstraksi informasi atau pola yang penting
atau menarik dari data yang ada di database. Secara lengkap, Data mining merupakan
serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini
tidak diketahui secara manual dari suatu basis data dengan melakukan penggalian
pola-pola dari tumpukan data dengan tujuan untuk memanipulasi data menjadi
informasi yang lebih berharga (Kusrini, & Emha Taufiq Luthfi. 2009).
Universitas Sumatera Utara
9
Data mining adalah mengeksplorasi dan menganalisis data dalam jumlah besar
untuk menemukan pola dan rule yang berarti (Berry, Michael J.A dan Linoff, Gordon
S. 2004.). Data mining adalah proses menambang (mining) pengetahuan dari
sekumpulan data yang sangat besar, data mining merupakan suatu langkah dalam
Knowledge Discovery in Database (KDD) (Han, Jiawei, Micheline Kamber, Jian Pei.
2001). Jadi, dengan semakin berkembangnya kebutuhan akan informasi-informasi,
semakin banyak pula bidang-bidang yang rnenerapkan konsep data mining.
2.3.1 Tahapan Data Mining
Dalam aplikasinya, data mining sebenarnya merupakan bagian dari Knowledge
Discovery in Database (KDD), bukan sebagai teknologi yang utuh berdiri sendiri.
Data mining merupakan suatu bagian langkah yang penting dalam KDD terutama
berkaitan dengan ekstraksi dan perhitungan pola-pola dari data yang ditelah. Seperti
yang ditunjukkan pada gambar 2.1 (Han, Jiawei, Micheline Kamber, Jian Pei. 2001):
Gambar 2.1 Tahapan Data Mining
Dari gambar 2.1 dapat dijelaskan proses dari data mining dari setiap tahap yaitu
berikut ini:
Universitas Sumatera Utara
10
1. Data cleaning
Tahapan ini dilakukan untuk menghilangkan data noise dan data yang tidak
konsisten atau relevan dengan tujuan akhir dari proses data mining.
2. Data integration
Tahapan ini dilakukan untuk menggabungkan atau mengkombinasikan dari
multiple data source.
3. Data selection
Yang dilakukan pada tahapan ini adalah memilih atau menyeleksi data apa saja
yang relevan dan diperlukan dari database.
4. Data transformation
Untuk mentransformasikan data ke dalam bentuk yang lebih sesuai untuk di
mining.
5. Data mining
Proses terpenting dimana metode tertentu diterapkan dalam database untuk
menghasilkan data pattern.
6. Pattern evaluation
Untuk mengidentifikasi apakah interesting patterns yang didapatkan sudah cukup
mewakili knowledge berdasarkan perhitungan tertentu.
7. Knowledge presentation
Untuk mempresentasikan knowledge yang sudah didapatkan dari user.
Universitas Sumatera Utara
11
2.4 Pohon Keputusan
Pohon keputusan merupakan salah satu metode klasifikasi yang sangat menarik yang
melibatkan konstruksi pohon keputusan yang terdiri dari node keputusan yang
dihubungkan dengan cabang-cabang dari simpul akar sampai ke node daun (akhir).
Pada node keputusan attribut akan diuji, dan setiap hasil akan menghasilkan cabang.
Setiap cabang akan diarahkan ke node lain atau ke node akhir untuk menghasilkan
suatu keputusan (Larose, 2005).
Pohon keputusan adalah salah satu metode klasifikasi yang dinyatakan sebagai
partisi rekursif. Pohon keputusan terdiri dari node yang membentuk pohon yang
berakar, semua node memiliki satu masukan. Node yang keluar disebut node tes.
Node yang lain disebut node keputusan atau sering disebut node daun. Setiap simpul
internal membagi dua atau lebih sub-ruang sesuai dengan kategori attribut dan akan
dipartisi sesuai dengan nilai kategori kasus. Kasus kasus tersebut membentuk pohon
keputusan, yang menghasilkan problem solving (Kusrini, 2007).
Pohon keputusan adalah sebuah flowchart seperti struktur tree, dimana tiap
internal node menunjukkan sebuah test pada sebuah atribut, setiap cabang
menunjukkan hasil dari test, dan leaf node menunjukkan kelas (Sujana, 2010).
Pohon keputusan biasanya digunakan untuk mendapatkan informasi untuk
tujuan pengambilan sebuah keputusan. Pohon keputusan dimulai dengan sebuah root
node (titik awal) yang diapakai oleh user untuk mengambil tindakan. Dari node root
ini, user memecahkan sesuai dengan algoritma decision tree.
Hasil akhirnya adalah sebuah pohon keputusan dengan setiap cabangnya
menunjukkan kemungkinan skenario dari keputusan yang diambil serta hasilnya.
2.4.1 Konsep Pohon keputusan
Mengubah data menjadi sebuah pohon keputusan (decision tree) dan aturan aturan
keputusan (rule), konsep pohon keptusan dapat dilihat pada gambar 2.2.
Gambar 2.2 konsep pohon keputusan
Universitas Sumatera Utara
12
Data dinyatakan dalam bentuk tabel dengan atribut dan record. Atribut menyatakan
suatu parameter yang dibuat sebagai kriteria dalam pembentukan tree.
Konsep data dalam pohon keputusan yaitu :
a. Data dinyatakan dalam bentuk tabel dengan atribut dan record.
b. Atribut menyatakan suatu parameter yang dibuat sebagai kriteria dalam
pembentukan tree.
c. Atribut memiliki nilai-nilai yang dinamakan dengan instance.
2.4.2 Manfaat Metode Pohon Keputusan
Konsep dari pohon keputusan adalah mengubah data menjadi pohon keputusan
dan aturan-aturan keputusan. Manfaat utama dari penggunaan pohon keputusan adalah
kemampuannya untuk mem-break down proses pengambilan keputusan yang
kompleks menjadi lebih simpel sehingga pengambil keputusan akan lebih
menginterpretasikan solusi dari permasalahan.
Pohon Keputusan juga berguna untuk mengeksplorasi data, menemukan
hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel
target. Pohon keputusan memadukan antara eksplorasi data dan pemodelan, sehingga
sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan
sebagai model akhir dari beberapa teknik lain. Sering terjadi tawar menawar antara
keakuratan model dengan transparansi model. Dalam beberapa aplikasi, akurasi dari
sebuah klasifikasi atau prediksi adalah satu-satunya hal yang ditonjolkan, misalnya
sebuah perusahaan direct mail membuat sebuah model yang akurat untuk
memprediksi anggota mana yang berpotensi untuk merespon permintaan, tanpa
memperhatikan bagaimana atau mengapa model tersebut bekerja.
2.4.3 Kelebihan Pohon Keputusan
Kelebihan dari metode pohon keputusan adalah (Simarmata, 2005):
a. Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat global,
dapat diubah menjadi lebih simpel dan spesifik.
b. Eliminasi
perhitungan-perhitungan
yang
tidak
diperlukan,
karena
ketika
menggunakan metode pohon keputusan maka sample diuji hanya berdasarkan
kriteria atau kelas tertentu.
Universitas Sumatera Utara
13
c. Fleksibel untuk memilih fitur dari internal node yang berbeda, fitur yang terpilih
akan membedakan suatu kriteria dibandingkan kriteria yang lain dalam node yang
sama. Kefleksibelan metode pohon keputusan ini meningkatkan kualitas keputusan
yang dihasilkan jika dibandingkan ketika menggunakan metode penghitungan satu
tahap yang lebih konvensional.
d. Dalam analisis multivariat, dengan kriteria dan kelas yang jumlahnya sangat
banyak, seorang penguji biasanya perlu untuk mengestimasikan baik itu distribusi
dimensi tinggi ataupun parameter tertentu dari distribusi kelas tersebut. Metode
pohon keputusan dapat menghindari munculnya permasalahan ini dengan
menggunakan criteria yang jumlahnya lebih sedikit pada setiap node internal tanpa
banyak mengurangi kualitas keputusan yang dihasilkan.
2.4.4 Algoritma C4.5
Algoritma C4.5 adalah salah satu metode untuk membuat decision tree berdasarkan
training data yang telah disediakan. Secara umum algoritma C4.5 untuk membangun
pohon keputusan adalah sebagai berikut (Kusrini, 2007):
1. Pilih atribut sebagai akar.
2. Buat cabang untuk masing-masing nilai.
3. Bagi kasus dalam cabang.
4. Ulangi proses untuk masing-masing cabang sampai semua kasus
selesai.
Untuk memilih atribut sebagai akar, didasarkan pada nilai Gain tertinggi dari
atribut-atribut yang ada.
Untuk memilih atribut sebagai akar, didasarkan pada nilai Gain tertinggi dari
atribut-atribut yang ada. Untuk menghitung Gain digunakan rumus seperti tertera
dalam Rumus 1.
Universitas Sumatera Utara
14
Rumus algoritma C4.5 adalah
Keterangan:
S
: Himpunan Kasus
A
: Atribut
n
: Jumlah Partisi Atribut A
Si
: Jumlah Kasus Pada Partisi ke-i
S
: Jumlah Kasus dalam S
Keterangan:
S
: Himpunan Kasus
A
: Fitur
n
: Jumlah partisi S
pi
: Proporsi dari Si terhadap S
Universitas Sumatera Utara
15
Kemudian dibuatlah pohon keputusannya:
Gambar 2.2 Contoh pohon keputusan
Lalu didapatkanlah rules dari pohon keputusan tersebut:
IFNodeAkar=kondisia^Node1=kondisia THEN syarat=Memenuhi
IFNodeAkar=kondisia^Node1=kondisib^Node1.1=kondisia THEN syarat=Memenuhi
IFNodeAkar=kondisia^Node1=kondisib^Node1.1=kondisib^Node1.2=kondisia
THEN syarat=Memenuhi
IFNodeAkar=kondisia^Node1=kondisib^Node1.1=kondisib^Node1.2=kondisib
THEN syarat=Tidak Memenuhi
IFNodeAkar=kondisia^Node1=kondisib^Node1.1=kondisic
THEN
syarat=Tidak
Memenuhi
IFNodeAkar=kondisib^Node2=kondisia THEN syarat=Memenuhi
IFNodeAkar=kondisib^Node2=kondisib THEN syarat=Tidak Memenuhi
Universitas Sumatera Utara
Download