6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database adalah koleksi data item yang saling terkait terkelola sebagai satu unit. Beberapa defenisi lain tentang database yaitu sebagai berikut: 1. Suatu pengorganisasian sekumpulan data yang saling berhubungan sehingga memudahkan aktivitas untuk memperoleh informasi (Sutanta, Edhy. 2004). 2. Database merupakan data yang saling terhubung dan deskripsi dari data yang dirancang untuk kebutuhan organisasi (McLeod, Raymond & Schell, George. 2004). 3. Sedangkan menurut Date, database adalah record yang terkomputerisasi yang bertujuan menyediakan informasi ketika dibutuhkan (Kadir, Abdul. 2003). Penerapan database dalam sistem informasi disebut database system. Dari teori-teori tersebut dapat disimpulkan bahwa database adalah sekumpulan data yang terorganisasi dan saling terhubung untuk menyediakan informasi yang diperlukan. Basis data (database), atau sering pula dieja basis data, adalah kumpulan informasi yang disimpan didalam komputer secara sistematik sehingga dapat diperiksa menggunakan suatu program komputer untuk memperoleh informasi dari basis data tersebut. Perangkat lunak yang digunakan untuk mengelola dan memanggil kueri (query) basis data disebut sistem manajemen basis data (Database Management System, DBMS) (Sutanta, Edhy. 2004). Universitas Sumatera Utara 7 Sistem basis data (database system) didefinisikan sebagai sekumpulan subsistem yang terdiri atas basis data dengan para pemakai yang menggunakan basis data secara bersama-sama, personal-personal yang merancang dan mengelola basis data, teknik- teknik untuk merancang dan mengelola basis data, serta sistem komputer untuk mendukungnya (Kadir, Abdul. 2003). Database system adalah sistem penyimpanan informasi yang terorganisasi dengan suatu cara sehingga memudahkan untuk proses pengolahan data (McLeod, Raymond & Schell, George. 2004). 2.1.1 DBMS (Database Management System) DBMS adalah sebuah sistem perangkat lunak yang mengizinkan pengguna untuk mendefinisikan, membuat, memelihara, dan mengatur akses ke database. Sedangkan menurut McLeod dan Schell, DBMS adalah aplikasi perangkat lunak yang menyimpan struktur database, hubungan antardata dalam database, serta berbagai formulir laporan yang berkaitan dengan database tersebut (McLeod, Raymond & Schell, George. 2004). 2.2 Konsep dasar pengambilan keputusan Pengambilan keputusan adalah memilih satu atau lebih diantara sekian banyak alternatif keputusan yang mungkin. Alternatif keputusan meliputi keputusan ada kepastian, keputusan berisiko, keputusan ketidakpastian dan keputusan dalam konflik. 2.2.1 Tahapan Pengambilan Keputusan Simon tahun 1960 memperkenalkan empat aktivitas dalam proses pengambilan keputusan (Turban, E., Aronson, J. E. & Liang, T, 2005): 1. Intelligence: Pengumpulan informasi untuk mengidentifikasikan permasalahan. Proses yang terjadi pada fase ini adalah : 1. Menemukan masalah 2. Klasifikasi masalah 3. Penguraian masalah 4. Kepemilikan masalah Universitas Sumatera Utara 8 2. Design: Tahap ini meliputi pembuatan, pengembangan, dan analisis hal-hal yang mungkin untuk dilakukan. Termasuk juga disini pemahaman masalah dan pengecekan solusi yang layak. Tugas-tugas yang ada pada tahap ini merupakan kombinasi dari seni dan pengetahuan, yaitu: 1. Komponen-komponen model 2. Struktur model 3. Seleksi prinsip-prinsip pemilihan (kriteria evaluasi) 4. Pengembangan (penyediaan) alternative 5. Prediksi hasil 6. Pengukuran hasil 7. Skenario 3. Choice: Tahap memilih solusi dari alternatif-alternatif yang disediakan. Ada dua pendekatan dalam pencarian pilihan (choice) yaitu : 1. Teknis analitis: Menggunakan perumusan matematis 2. Algoritma: Langkah demi langkah proses. 4. Implementation: Tahap melaksanakan keputusan dan melaporkan hasilnya. Keuntungan pada tahapan ini adalah dalam memberikan ketajaman dan detil dari analisis dan output yang dihasilkan. 2.3 Data Mining Definisi sederhana dari data mining adalah ekstraksi informasi atau pola yang penting atau menarik dari data yang ada di database. Secara lengkap, Data mining merupakan serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data dengan melakukan penggalian pola-pola dari tumpukan data dengan tujuan untuk memanipulasi data menjadi informasi yang lebih berharga (Kusrini, & Emha Taufiq Luthfi. 2009). Universitas Sumatera Utara 9 Data mining adalah mengeksplorasi dan menganalisis data dalam jumlah besar untuk menemukan pola dan rule yang berarti (Berry, Michael J.A dan Linoff, Gordon S. 2004.). Data mining adalah proses menambang (mining) pengetahuan dari sekumpulan data yang sangat besar, data mining merupakan suatu langkah dalam Knowledge Discovery in Database (KDD) (Han, Jiawei, Micheline Kamber, Jian Pei. 2001). Jadi, dengan semakin berkembangnya kebutuhan akan informasi-informasi, semakin banyak pula bidang-bidang yang rnenerapkan konsep data mining. 2.3.1 Tahapan Data Mining Dalam aplikasinya, data mining sebenarnya merupakan bagian dari Knowledge Discovery in Database (KDD), bukan sebagai teknologi yang utuh berdiri sendiri. Data mining merupakan suatu bagian langkah yang penting dalam KDD terutama berkaitan dengan ekstraksi dan perhitungan pola-pola dari data yang ditelah. Seperti yang ditunjukkan pada gambar 2.1 (Han, Jiawei, Micheline Kamber, Jian Pei. 2001): Gambar 2.1 Tahapan Data Mining Dari gambar 2.1 dapat dijelaskan proses dari data mining dari setiap tahap yaitu berikut ini: Universitas Sumatera Utara 10 1. Data cleaning Tahapan ini dilakukan untuk menghilangkan data noise dan data yang tidak konsisten atau relevan dengan tujuan akhir dari proses data mining. 2. Data integration Tahapan ini dilakukan untuk menggabungkan atau mengkombinasikan dari multiple data source. 3. Data selection Yang dilakukan pada tahapan ini adalah memilih atau menyeleksi data apa saja yang relevan dan diperlukan dari database. 4. Data transformation Untuk mentransformasikan data ke dalam bentuk yang lebih sesuai untuk di mining. 5. Data mining Proses terpenting dimana metode tertentu diterapkan dalam database untuk menghasilkan data pattern. 6. Pattern evaluation Untuk mengidentifikasi apakah interesting patterns yang didapatkan sudah cukup mewakili knowledge berdasarkan perhitungan tertentu. 7. Knowledge presentation Untuk mempresentasikan knowledge yang sudah didapatkan dari user. Universitas Sumatera Utara 11 2.4 Pohon Keputusan Pohon keputusan merupakan salah satu metode klasifikasi yang sangat menarik yang melibatkan konstruksi pohon keputusan yang terdiri dari node keputusan yang dihubungkan dengan cabang-cabang dari simpul akar sampai ke node daun (akhir). Pada node keputusan attribut akan diuji, dan setiap hasil akan menghasilkan cabang. Setiap cabang akan diarahkan ke node lain atau ke node akhir untuk menghasilkan suatu keputusan (Larose, 2005). Pohon keputusan adalah salah satu metode klasifikasi yang dinyatakan sebagai partisi rekursif. Pohon keputusan terdiri dari node yang membentuk pohon yang berakar, semua node memiliki satu masukan. Node yang keluar disebut node tes. Node yang lain disebut node keputusan atau sering disebut node daun. Setiap simpul internal membagi dua atau lebih sub-ruang sesuai dengan kategori attribut dan akan dipartisi sesuai dengan nilai kategori kasus. Kasus kasus tersebut membentuk pohon keputusan, yang menghasilkan problem solving (Kusrini, 2007). Pohon keputusan adalah sebuah flowchart seperti struktur tree, dimana tiap internal node menunjukkan sebuah test pada sebuah atribut, setiap cabang menunjukkan hasil dari test, dan leaf node menunjukkan kelas (Sujana, 2010). Pohon keputusan biasanya digunakan untuk mendapatkan informasi untuk tujuan pengambilan sebuah keputusan. Pohon keputusan dimulai dengan sebuah root node (titik awal) yang diapakai oleh user untuk mengambil tindakan. Dari node root ini, user memecahkan sesuai dengan algoritma decision tree. Hasil akhirnya adalah sebuah pohon keputusan dengan setiap cabangnya menunjukkan kemungkinan skenario dari keputusan yang diambil serta hasilnya. 2.4.1 Konsep Pohon keputusan Mengubah data menjadi sebuah pohon keputusan (decision tree) dan aturan aturan keputusan (rule), konsep pohon keptusan dapat dilihat pada gambar 2.2. Gambar 2.2 konsep pohon keputusan Universitas Sumatera Utara 12 Data dinyatakan dalam bentuk tabel dengan atribut dan record. Atribut menyatakan suatu parameter yang dibuat sebagai kriteria dalam pembentukan tree. Konsep data dalam pohon keputusan yaitu : a. Data dinyatakan dalam bentuk tabel dengan atribut dan record. b. Atribut menyatakan suatu parameter yang dibuat sebagai kriteria dalam pembentukan tree. c. Atribut memiliki nilai-nilai yang dinamakan dengan instance. 2.4.2 Manfaat Metode Pohon Keputusan Konsep dari pohon keputusan adalah mengubah data menjadi pohon keputusan dan aturan-aturan keputusan. Manfaat utama dari penggunaan pohon keputusan adalah kemampuannya untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih simpel sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan. Pohon Keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. Pohon keputusan memadukan antara eksplorasi data dan pemodelan, sehingga sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari beberapa teknik lain. Sering terjadi tawar menawar antara keakuratan model dengan transparansi model. Dalam beberapa aplikasi, akurasi dari sebuah klasifikasi atau prediksi adalah satu-satunya hal yang ditonjolkan, misalnya sebuah perusahaan direct mail membuat sebuah model yang akurat untuk memprediksi anggota mana yang berpotensi untuk merespon permintaan, tanpa memperhatikan bagaimana atau mengapa model tersebut bekerja. 2.4.3 Kelebihan Pohon Keputusan Kelebihan dari metode pohon keputusan adalah (Simarmata, 2005): a. Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat global, dapat diubah menjadi lebih simpel dan spesifik. b. Eliminasi perhitungan-perhitungan yang tidak diperlukan, karena ketika menggunakan metode pohon keputusan maka sample diuji hanya berdasarkan kriteria atau kelas tertentu. Universitas Sumatera Utara 13 c. Fleksibel untuk memilih fitur dari internal node yang berbeda, fitur yang terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain dalam node yang sama. Kefleksibelan metode pohon keputusan ini meningkatkan kualitas keputusan yang dihasilkan jika dibandingkan ketika menggunakan metode penghitungan satu tahap yang lebih konvensional. d. Dalam analisis multivariat, dengan kriteria dan kelas yang jumlahnya sangat banyak, seorang penguji biasanya perlu untuk mengestimasikan baik itu distribusi dimensi tinggi ataupun parameter tertentu dari distribusi kelas tersebut. Metode pohon keputusan dapat menghindari munculnya permasalahan ini dengan menggunakan criteria yang jumlahnya lebih sedikit pada setiap node internal tanpa banyak mengurangi kualitas keputusan yang dihasilkan. 2.4.4 Algoritma C4.5 Algoritma C4.5 adalah salah satu metode untuk membuat decision tree berdasarkan training data yang telah disediakan. Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut (Kusrini, 2007): 1. Pilih atribut sebagai akar. 2. Buat cabang untuk masing-masing nilai. 3. Bagi kasus dalam cabang. 4. Ulangi proses untuk masing-masing cabang sampai semua kasus selesai. Untuk memilih atribut sebagai akar, didasarkan pada nilai Gain tertinggi dari atribut-atribut yang ada. Untuk memilih atribut sebagai akar, didasarkan pada nilai Gain tertinggi dari atribut-atribut yang ada. Untuk menghitung Gain digunakan rumus seperti tertera dalam Rumus 1. Universitas Sumatera Utara 14 Rumus algoritma C4.5 adalah Keterangan: S : Himpunan Kasus A : Atribut n : Jumlah Partisi Atribut A Si : Jumlah Kasus Pada Partisi ke-i S : Jumlah Kasus dalam S Keterangan: S : Himpunan Kasus A : Fitur n : Jumlah partisi S pi : Proporsi dari Si terhadap S Universitas Sumatera Utara 15 Kemudian dibuatlah pohon keputusannya: Gambar 2.2 Contoh pohon keputusan Lalu didapatkanlah rules dari pohon keputusan tersebut: IFNodeAkar=kondisia^Node1=kondisia THEN syarat=Memenuhi IFNodeAkar=kondisia^Node1=kondisib^Node1.1=kondisia THEN syarat=Memenuhi IFNodeAkar=kondisia^Node1=kondisib^Node1.1=kondisib^Node1.2=kondisia THEN syarat=Memenuhi IFNodeAkar=kondisia^Node1=kondisib^Node1.1=kondisib^Node1.2=kondisib THEN syarat=Tidak Memenuhi IFNodeAkar=kondisia^Node1=kondisib^Node1.1=kondisic THEN syarat=Tidak Memenuhi IFNodeAkar=kondisib^Node2=kondisia THEN syarat=Memenuhi IFNodeAkar=kondisib^Node2=kondisib THEN syarat=Tidak Memenuhi Universitas Sumatera Utara