laporan tugas akhir aplikasi pencarian data buku pada

advertisement
LAPORAN TUGAS AKHIR
APLIKASI PENCARIAN DATA BUKU PADA
PERPUSTAKAAN
(Studi Kasus : Perpustakaan Daerah Wilayah Jawa Tengah)
Laporan ini disusun guna memenuhi salah satu syarat untuk menyelesaikan
program studi Teknik Informatika S1 pada Fakultas Ilmu Komputer
Universitas Dian Nuswantoro Semarang
Disusun Oleh :
Nama
: Anjar Bagus Triyadi
Nim
: A11.2010.05413
Program Studi
: Teknik Informatika – S1
FAKULTAS ILMU KOMPUTER
UNIVERSITAS DIAN NUSWANTORO
SEMARANG
2015
i
PERSETUJUAN LAPORAN TUGAS AKHIR
Nama Pelaksana
: Anjar Bagus Triyadi
NIM
: A11.2010.05413
Program Studi
: Teknik Informatika – S1
Fakultas
: Ilmu Komputer
Judul Tugas akhir
: Aplikasi Pencarian Data Buku Pada Perpustakaan (Studi
Kasus : Perpustakaan Daerah Wilayah Jawa Tengah)
Tugas akhir ini telah diperiksa dan disetujui,
Semarang, 03 Maret 2015
Menyetujui :
Mengetahui :
Pembimbing
Dekan Fakultas Ilmu Komputer
Wijanarto, M. Kom
Dr. Drs. Abdul Syukur, MM
ii
PENGESAHAN DEWAN PENGUJI
Nama Pelaksana
: Anjar Bagus Triyadi
NIM
: A11.2010.05413
Program Studi
: Teknik informatika – S1
Fakultas
: Ilmu Komputer
Judul Tugas akhir
: Aplikasi Pencarian Data Buku Pada Perpustakaan
(Studi Kasus : Perpustakaan Daerah Wilayah Jawa
Tengah)
Tugas akhir ini telah diujikan dan dipertahankan dihadapan Dewan Penguji pada
Sidang tugas akhir tanggal 03 Maret 2015. Menurut pandangan kami, tugas akhir
ini memadai dari segi kualitas maupun kuantitas untuk tujuan penganugrahan
gelar Sarjana Komputer (S.Kom).
Semarang, 03 Maret 2015
Dewan Penguji
Anggota I
Anggota II
Suprayogi, M.Kom
Sugiyanto, M.Kom
Ketua Penguji
Heru Agus Santoso, Ph.D
iii
PERNYATAAN KEASLIAN TUGAS AKHIR
Sebagai mahasiswa Universitas Dian Nuswantoro, yang bertanda tangan di bawah
ini, saya :
Nama
: Anjar Bagus Triyadi
NIM
: A11.2010.05413
Menyatakan bahwa karya ilmiah saya yang berjudul :
Aplikasi Pencarian Data Buku Pada Perpustakaan
Merupakan karya asli saya (kecuali cuplikan dan ringkasan yang masing-masing
telah saya jelaskan sumbernya). Apabila dikemudian hari, karya saya disinyalir
bukan merupakan karya asli saya, yang disertai dengan bukti-bukti yang cukup,
maka saya bersedia untuk dibatalkan gelar saya beserta hak dan kewajiban yang
melekat pada gelar tersebut. Demikian surat pernyataan ini saya buat dengan
sebenarnya,
Dibuat di
: Semarang
Pada Tanggal : 03 Maret 2015
Yang menyatakan
(Anjar Bagus Triyadi)
iv
PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH
UNTUK KEPENTINGAN AKADEMIS
Sebagai mahasiswa Universitas Dian Nuswantoro, yang bertanda tangan di bawah
ini, saya :
Nama Pelaksana
: Anjar Bagus Triyadi
NIM
: A11.2010.05413
Demi mengembangkan Ilmu Pengetahuan, menyetujui untuk memberikan kepada
Universitas Dian Nuswantoro Hak Bebas Royalti Non Ekslusif (Non-exclusive
Royalty-Free Right) atas karya ilmiah saya yang berjudul :
Aplikasi Pencarian Data Buku Pada Perpustakaan
beserta perangkat yang diperlukan (bila ada). Dengan Hak Bebas Royalti NonEkslusif ini Universitas Dian Nuswantoro berhak untuk menyimpan, mengkopi
ulang (memperbanyak), menggunakan, mengelolanya dalam bentuk pangkalan
data (database), mendistribusikannya dan menampilkan/ mempublikasikannya di
internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari
saya selama tetap mencantumkan nama saya sebagai penulis/ pencipta.
Saya bersedia untuk menanggung secara pribadi, tanpa melibatkan pihak
Universitas Dian Nuswantoro, segala bentuk tuntutan hukum yang timbul atas
pelanggaran hak Cipta dalam karya ilmiah saya ini.
Demikian surat pernyataan ini saya buat dengan sebenarnya
Dibuat di
: Semarang
Pada Tanggal : 03 Maret 2015
Yang menyatakan
(Anjar Bagus Triyadi)
v
UCAPAN TERIMA KASIH
Dengan memanjatkan puji syukur kehadirat Allah SWT, atas karunianya
yang telah dilimpahkan kepada penulis “Aplikasi Pencarian Data Buku Pada
Perpustakaan (Studi Kasus : Perpustakaan Daerah Wilayah Jawa Tengah)”.
Laporan Tugas Akhir ini merupakan suatu kewajiban guna melengkapi
syarat untuk menempuh ujian akhir di Universitas Dian Nuswantoro Semarang.
Adapun penulis dalam membuat Laporan Tugas Akhir ini tidak luput dari
kesulitan dan kesalahan, namun berkat bimbingan dan bantuan dari dosen
pembimbing serta berbagai pihak yang tidak mungkin disebutkan disini maka
laporan ini dapat penulis selesaikan. Dengan bekal pengetahuan yang penulis
terima dengan segenap kemampuan terbaik yang bisa penulis lakukan.
Atas terselesainya Laporan Tugas Akhir ini penulis menyampaikan
penghargaan dan ucapan terima kasih yang sangat mendalam kepada :
1. Bapak Dr. Ir. Edi Noersasongko, M.Kom, selaku Rektor Universitas Dian
Nuswantoro Semarang.
2. Bapak Dr. Drs. Abdul Syukur, MM , selaku Dekan Fakultas Ilmu Komputer
Universitas Dian Nuswantoro Semarang.
3. Bapak Dr. Heru Agus Santoso M.Kom, selaku Kaprogdi Sistem Informasi
Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang.
4. Bapak Wijanarto, M.Kom, selaku Dosen Pembimbing yang telah membantu
dan memberikan bimbingan dan arahan dalam penyusunan Laporan Tugas
Akhir ini.
5. Bapak dan Ibu selaku orangtua yang telah membantu secara moril maupun
meteriil dalam penyelesaian Laporan Tugas Akhir ini, juga untuk doa dan
kasih sayang yang tanpa henti.
6. Dosen-dosen Fasilkom Universitas Dian Nuswantoro Semarang yang telah
memberikan ilmu sehingga penulis dapat mengimplementasikan ilmu yang
telah disampaikan.
7. Desy Puspitasari, S.pd yang telah memberikan dukungan moral dan semangat
kepada penulis.
vi
Penulis menyadari bahwa Laporan Tugas Akhir ini masih jauh dari
kesempurnaan, sehingga dengan segala kerendahan hati penulis mengharapkan
saran serta kritik yang membangun dalam kesempurnaan Laporan Tugas Akhir
ini.
Akhirnya penulis berharap semoga Laporan Tugas Akhir ini dapat
bermanfaat bagi semua pihak yang berkepentingan.
Semarang, 03 Maret 2015
Penulis
(Anjar Bagus Triyadi)
vii
ABSTRAK
Kebutuhan akan informasi dibidang pendidikan khususnya dinilai cenderung
meningkat. Salah satunya adalah kebutuhan akan informasi dari koleksi buku
yang ada di Perpustakaan Daerah Wilayah Jawa Tengah. Banyaknya buku yang
masih tersimpan dalam bentuk fisik di dalam pencarian buku seringkali hanya
dapat memberikan sepenggal informasi bagi pengunjung perpustakaan. Karena itu
dibutuhkan suatu aplikasi yang dapat mengolah data buku tersebut menjadi
informasi tambahan bagi user. Pembuatan aplikasi data mining ini akan mengolah
data berupa database yaitu buku sehingga diperoleh keyword untuk masingmasing buku. Data mining sangat cocok digunakan untuk menganalisa data dalam
jumlah yang besar. Dengan demikian jika diinputkan keyword dalam setiap
pencarian maka akan dapat dicari itemsetnya atau kombinasi keywordnya dengan
cara algoritma priori yang nantinya dapat digunakan untuk menentukan buku
mana saja yang berhubungan dengan keyword yang berhubungan. Dengan
menggunakan data mining, user akan lebih mudah melakukan pencarian dengan
menginput kata-kata atau judul buku yang diinginkan. Dari inputan user tadi akan
diperoleh keyword yang saling berasosiasi sehingga keyword yang dicari oleh user
tidak hanya menapilkan sepenggal informasi berkenaan dengan keyword tersebut
namun juga informasi lain berdasarkan keyword rekomendasi yang diperoleh dari
association rules. Dengan aplikasi ini buku yang ditampilkan milai dari buku
yang sangat berhubungan dengan keyword sampai buku yang sedikit
hubungannya dengan keyword. Karena dalam pencariannya di cari kata perkata
yang ada di judul dan sinopsis. Dengan aplikasi ini dapat mempermudah dan
mempercepat pencarian data.
Kata Kunci : data mining, metode bayes, perpustakaan, pencarian buku
viii
DAFTAR ISI
Halaman
Halaman Sampul Depan ..................................................................................... i
Halaman Persetujuan.......................................................................................... ii
Halaman Pengesahan ......................................................................................... iii
Halaman Pernyataan Keaslian Tugas Akhir ...................................................... iv
Halaman Pernyataan Persetujuan Publikasi ....................................................... v
Halaman Ucapan Terima Kasih ......................................................................... vi
Halaman Abstrak ................................................................................................ viii
Halaman Daftar Isi ............................................................................................. ix
Halaman Daftar Tabel ........................................................................................ xi
Halaman Daftar Gambar .................................................................................... xii
BAB I
PENDAHULUAN ............................................................................ 1
1.1 Latar Belakang............................................................................ 1
1.2 Rumusan Masalah ...................................................................... 3
1.3 Batasan Masalah ......................................................................... 4
1.4 Tujuan Penelitian ........................................................................ 4
1.5 Manfaat Penelitian ...................................................................... 4
BAB II
KAJIAN PUSTAKA ........................................................................ 5
2.1 Pengertian Data Mining .............................................................. 5
2.2 Pengenalan Pola, Data Mining dan Machine Learning .............. 6
2.3 Tahap-tahap Data Mining ........................................................... 7
2.4 Metode Bayes ............................................................................. 10
2.5 Metode Data Mining................................................................... 11
2.5.1 Association Rules ............................................................ 11
2.5.2 Decision Tree .................................................................. 15
2.5.3 Clustering ....................................................................... 16
2.5.4 Software Aplikasi ........................................................... 17
2.5.5 Basis data dan sistem manajemen basis data .................. 17
2.5.6 Perancangan perangkat lunak ......................................... 21
ix
2.5.7 Implementasi dan Pengujian Unit ...........................................23
BAB III METODOLOGI PENELITIAN .............................................................24
3.1 Instrumen Penelitian ...........................................................................24
3.2 Prosedur Pengumpulan Data ..............................................................25
3.3 Metodologi Penelitian ........................................................................26
BAB IV ANALISIS DAN PERANCANGAN APLIKASI ...................................33
4.1 Analisis Data Mining ..........................................................................33
4.2 Sumber Data .......................................................................................33
4.3 Integrasi Data ......................................................................................34
4.4 Transformasi Data ..............................................................................34
4.5 Perancangan Sistem ............................................................................35
4.5.1 Use Case Diagram ...................................................................35
4.5.2 Sequence Diagram ...................................................................36
4.5.3 Class Diagram .........................................................................40
4.5.4 Struktur File .............................................................................40
4.5.5 Desain Input Output ................................................................42
4.5.6 Implementasi Sistem ...............................................................46
4.5.7 Pengujian Sistem .....................................................................52
4.5.8 Pengujian Data Mining ............................................................60
BAB V PENUTUP .................................................................................................62
5.1 Kesimpulan .........................................................................................62
5.2 Saran ...................................................................................................62
DAFTAR PUSTAKA ...............................................................................................63
x
DAFTAR TABEL
Halaman
Tabel 4.1 : Tabel data master buku ................................................................... 33
Tabel 4.2 : Tahap login ..................................................................................... 40
Tabel 4.3 : Tabel buku ...................................................................................... 40
Tabel 4.4 : Tabel kategori ................................................................................. 41
Tabel 4.5 : Tabel deskripsi ................................................................................ 42
xi
DAFTAR GAMBAR
Halaman
Gambar 2.1 : Data Mining merupakan irisan dari berbagai disiplin ................. 7
Gambar 2.2 : Tahap-tahap Data Mining ........................................................... 7
Gambar 2.3 : Clustering .................................................................................... 16
Gambar 2.4 : Komponen DBMS ....................................................................... 20
Gambar 2.5 : Waterfall model ........................................................................... 22
Gambar 3.1 : Operasi pada dimensi waktu ....................................................... 29
Gambar 3.2 : Operasi pada dimensi buku ......................................................... 30
Gambar 3.3 : Metodologi Penelitian ................................................................. 32
Gambar 4.1 : Use Case diagram data mining perpustakaan............................... 35
Gambar 4.2 : Sequence diagram penambahan buku .......................................... 36
Gambar 4.3 : Sequence diagram pencarian buku berdasarkan judul ................. 37
Gambar 4.4 : Sequence diagram pencarian buku berdasarkan kategori ............ 37
Gambar 4.5 : Sequence diagram pencarian buku berdasarkan deskripsi buku .. 38
Gambar 4.6 : Sequence diagram edit buku ........................................................ 39
Gambar 4.7 : Sequence diagram login ............................................................... 39
Gambar 4.8 : Class diagram aplikasi sistem perpustakaan ................................ 40
Gambar 4.9 : Desain menu utama ...................................................................... 42
Gambar 4.10 : Desain form login ....................................................................... 43
Gambar 4.11 : Desain form data buku ............................................................... 44
Gambar 4.12 : Desain form pencarian buku ...................................................... 45
Gambar 4.13 : List data buku ............................................................................. 45
Gambar 4.14 : Tampilan Menu Utama .............................................................. 46
Gambar 4.15 : Tampilan Form Login ................................................................ 47
Gambar 4.16 : Tampilan Form Data Buku......................................................... 48
Gambar 4.17 : Tampilan Form Pencarian Buku ................................................ 50
Gambar 4.18 : Pilihan cetak list buku ................................................................ 51
Gambar 4.19 : List Data Buku ........................................................................... 51
Gambar 4.20 : Pengujian pada halaman login ................................................... 52
Gambar 4.21 : Pengujian penyimpanan ............................................................. 53
xii
Gambar 4.22 : Pengujian pencarian data............................................................ 55
Gambar 4.23 : Pengujian penghapusan data ...................................................... 56
Gambar 4.24 : Pengujian input data kembar ...................................................... 58
Gambar 4.25 : Pengujian pengisian kode buku .................................................. 59
Gambar 4.26 : Pengujian data mining ................................................................ 60
xiii
BAB I
PENDAHULUAN
1.1 Latar Belakang
Dengan kemajuan teknologi informasi dewasa ini, kebutuhan akan
informasi yang akurat sangat dibutuhkan dalam kehidupan seari-hari,
sehingga informasi akan menjadi suatu elemen penting dalam perkembangan
masyarakat saat ini dan waktu mendatang. Namun kebutuhan informasi yang
tinggi kadang tidak diimbangi dengan penyajian informasi yang memadai,
seringkali informasi tersebut masih harus digali ulang dari data yang
jumlahnya sangat besar. Metode tradisional untuk menganalisis data yang
ada, tidak dapat menangani data dalam jumlah besar, sehingga membutuhkan
teknologi informasi yang mampu mengumpulkan dan menyimpan berbagai
tipe data serta dapat menganalisis, eringkas dan mengekstrak pengetahuan
dari data.
Pemanfaatan data yang ada di dalam sistem informasi untuk
menunjang
kegiatan
pengambilan
keputusan,
tidak
cukup
hanya
mengandalkan data operasional saja, diperlukan suatu analisis data untuk
menggali potensi-potensi informasi yang ada. Para pengambil keputusan
berusaha untuk memanfaatkan gudang data yang sudah dimiliki untuk
menggali informasi yang berguna membantu mengambil keputusan, hal ini
mendorong munculnya cabang ilmu baru untuk mengatasi masalah
penggalian informasi atau pola yang penting atau menarik dari data dalam
jumlah besar, yang disebut dengan data mining. Penggunaan teknik data
mining diharapkan dapat memberikan pengetahuan-pengetahuan yang
sebelumnya tersembunyi di dalam gudang data sehingga menjadi informasi
yang berharga.
Perpustakaan sebagaimana yang ada dan berkembang sekarang telah
dipergunakan sebagai salah satu pusat informasi, sumber ilmu pengetahuan,
penelitian, rekreasi, pelestarian khasanah budaya bangsa, serta memberikan
1
2
berbagai layanan jasa lainnya. Hal tersebut telah ada sejak dulu dan
terus berproses secara alamiah menunjuk kepada suatu kondisi dan tingkat
perbaikan yang signifikan meskipun belum memuaskan semua pihak.
Perpustakaan pada prinsipnya mempunyai tiga kegiatan pokok, yaitu
pertama, mengumpulkan (to collect) semua informasi yang sesuai dengan
bidang kegiatan dan misi organisasi dan masyarakat yang dilayaninya. Kedua,
melestarikan, memelihara, dan merawat seluruh koleksi perpustakaan, agar
tetap dalam keadaan baik, utuh, layak pakai, dan tidak lekas rusak baik karena
pemakaian maupun karena usianya (to preserve). Ketiga, menyediakan dan
menyajikan informasi untuk siap dipergunakan dan di berdayakan (to make
availlable) seluruh koleksi
yang dihimpun di
perpustakaan untuk
dipergunakan pemakainya.
“Informasi
memegang peranan
yang semakin besar dalam
perkembangan ilmu pengetahuan (dalam arti luas). Informasi meningkatkan
efisiensi ilmu pengetahuan yang merupakan kakas (force) produktif pada
masyarakat modern. Ilmu pengetahuan dan sistem pemencaran pengetahuan
berjalan dalam skala massal, namun mentalitas pemakai dalam memanfaatkan
informasi
masih
mencerminkan
tingkat
awal
pengembangan
ilmu
pengetahuan. Kini dengan banyaknya unit informasi serta berkembangnya
teknologi informasi, pengumpulan dan pengolahan informasi dilakukan oleh
berbagai unit informasi sementara emakain tinggal memanfaatkannya.
Perpustakaan Daerah Provinsi Jawa Tengah, atau yang sering disebut
para penggunanya sebagai “Perwil” (Perpustakaan Wilayah), mempunyai visi
mewujudkan masyarakat membaca dan belajar menuju masyarakat madani
yang sadar akan informasi. Pemakai Perpustakaan tersebut tersebut adalah
semua mahasiswa, dosen, sivitas akademik serta masyarakat umum daerah
Semarang dan sekitarnya. Mahasiswa merupakan pemakai yang paling aktif
dalam memanfaatkan sumber informasi yang ada di Perpustakaan.
Sejauh ini belum diketahui dengan jelas kebutuhan dan pola perilaku
mahasiswa dalam pencarian informasi. Kebutuhan informasi pemakai dapat
dilihat dari perilaku dalam pencarian informasi, maka perpustakaan perlu
3
memperhatikan hal
tersebut
guna mendapatkan umpan balik bagi
perpustakaan untuk memberikan layanan informasi yang sesuai dengan
kebutuhan pemakai. Ketepatan strategi yang diterapkan untuk mendapatkan
informasi yang diperlukan sebagai penunjang kegiatan perkuliahan sangat
menentukan dalam pencarian informasi.
Bayes memperkenalkan suatu metode yang diperlukan untuk
mengetahui bentuk distribusi awal (prior) dari populasi yang dikenal dengan
metode bayesian. Informasi ini kemudian digabungkan dengan informasi dari
sampel untuk digunakan dalam mengestimasi parameter populasi. Pada
metode bayesian, seorang peneliti harus menentukan distribusi prior dari
parameter yang ditaksir. Distribusi prior ini dapat berasal dari data penelitian
sebelumnya atau berdasarkan intuisi seorang peneliti.
Metode bayes memberikan cara yang mendasar dalam memasukkan
informasi eksternal ke dalam proses analisa data. Proses ini diawali dengan
distribusi probabilitas yang sudah ada diberikan untuk himpunan data yang
dianalisa.
Karena
distribusi
diberikan
sebelum
ada
data
yang
dipertimbangkan, sehingga disebut distribusi priori. Himpunan data baru
menjadikan distribusi priori ini menjadi distribusi posterior. Perubahan yang
terjadi dari priori ke posterior merujuk pada Teorema Bayes.
Teorema Bayes merupakan latar belakang teoritis untuk pendekatan
statistic terhadap masalah pengambilan kesimpulan induktif. Penulis akan
terlebih dahulu menjelaskan konsep-konsep dasar yang didefinisikan dalam
Teorem Bayes dan kemudian menggunakan teorema ini dalam penjelasan
tentang proses Klasifikasi Bayes Naif, atau Klasifikator Bayes Sederhana.
Berdasarkan latar belakang tersebut diatas, dengan memanfaatkan
data buku dengan metode bayes maka dapat diketahui informasi mengenai
informasi detail tentang buku yang dicari.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan sebelumnya, hal
yang menjadi rumusan masalah dalam penelitian ini adalah bagaimana
4
kebutuhan pencarian informasi data buku di Perpustakaan Daerah Provinsi
Jawa Tengah dengan teknik data mining menggunakan metode bayes
classifier.
1.3 Batasan Masalah
Pembatasan masalah pada penelitian ini antara lain :
1. Input data buku
2. Pencarian buku dengan menggunakan aplikasi data mining menggunakan
metode bayes
3. Aplikasi dibuat menggunakan bahasa pemrograman Microsoft Visual
Basic 6.0 dengan database MySql
1.4 Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk mengetahui kebutuhan dan
pencarian informasi data buku oleh anggota perpustakaan Perpustakaan
Daerah Provinsi Jawa Tengah dengan teknik data mining menggunakan
metode bayes classifier.
1.5 Manfaat Penelitian
Hasil penelitian ini diharapkan dapat memberikan manfaat terutama :
1. Sebagai masukan terhadap pihak Perpustakaan Daerah Provinsi Jawa
Tengah mengenai kebutuhan dan pencarian informasi data buku.
2. Dapat digunakan sebagai acuan bagi peneliti berikutnya, khususnya
penelitian yang menyangkut masalah dan jenis yang sama dengan
penelitian yang dilakukan ini.
BAB II
KAJIAN PUSTAKA
2.1
Pengertian Data Mining
Secara sederhana data mining adalah penambangan atau penemuan
informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data
yang sangat besar. Data mining juga disebut sebagai serangkaian proses
untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak
diketahui secara manual dari suatu kumpulan data. Data mining, sering juga
disebut sebagai knowledge discovery in database (KDD). KDD adalah
kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk
menemukan keteraturan, pola atau hubungan dalam set data berukuran
besar. Data mining adalah kegiatan menemukan pola yang menarik dari data
dalam jumlah besar, data dapat disimpan dalam database, data warehouse,
atau penyimpanan informasi lainnya. Data mining berkaitan dengan bidang
ilmu-ilmu lain, seperti database system, data warehousing, statistik,
machine learning, information retrieval, dan komputasi tingkat tinggi.
Selain itu, data mining didukung oleh ilmu lain seperti neural network,
pengenalan pola, spatial data analysis, image database, signal processing.
Data mining didefinisikan sebagai proses menemukan pola-pola dalam data.
Proses ini otomatis atau seringnya semiotomatis. Pola yang ditemukan harus
penuh arti dan pola tersebut memberikan keuntungan, biasanya keuntungan
secara ekonomi. Data yang dibutuhkan dalam jumlah besar.
Karakteristik data mining sebagai berikut :
1. Data mining berhubungan dengan penemuan sesuatu yang tersembunyi
dan pola data tertentu yang tidak diketahui sebelumnya.
2. Data mining biasa menggunakan data yang sangat besar. Biasanya data
yang besar digunakan untuk membuat hasil lebih dipercaya.
3. Data mining berguna untuk membuat keputusan yang kritis, terutama
dalam strategi
5
6
Berdasarkan beberapa pengertian tersebut dapat ditarik kesimpulan
bahwa data mining adalah suatu teknik menggali informasi berharga yang
terpendam atau tersembunyi pada suatu koleksi data (database) yang sangat
besar sehingga ditemukan suatu pola yang menarik yang sebelumnya tidak
diketahui. Kata mining sendiri berarti usaha untuk mendapatkan sedikit
barang berharga dari sejumlah besar material dasar. Karena itu data mining
sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan
buatan (artificial intelligent), machine learning, statistik dan database.
Beberapa metode yang sering disebut-sebut dalam literatur data mining
antara lain clustering, classification, association rules mining, neural
network, genetic algorithm dan lain-lain.
2.2
Pengenalan Pola, Data Mining dan Machine Learning
Pengenalan pola adalah suatu disiplin ilmu yang mempelajari caracara mengklasifikasikan obyek ke beberapa kelas atau kategori dan
mengenali kecenderungan data. Tergantung pada aplikasinya, obyek-obyek
ini bisa berupa pasien, mahasiswa, pemohon kredit, image atau signal atau
pengukuran lain yang perlu diklasifikasikan atau dicari fungsi regresinya.
Data mining, sering juga disebut knowledge discovery in database
(KDD), adalah kegiatan yang meliputi pengumpulan, pemakaian data
historis untuk menemukan keteraturan, pola atau hubungan dalam set data
berukuran besar. Keluaran dari data mining ini bisa dipakai untuk
memperbaiki pengambilan keputusan di masa depan. Sehingga istilah
pattern recognition jarang digunakan karena termasuk bagian dari data
mining.
Machine Learning adalah suatu area dalam artificial intelligence
atau kecerdasan buatan yang berhubungan dengan pengembangan teknikteknik yang bisa diprogramkan dan belajar dari data masa lalu. Pengenalan
pola, data mining dan machine learning sering dipakai untuk menyebut
sesuatu yang sama. Bidang ini bersinggungan dengan ilmu probabilitas dan
7
statistik kadang juga optimasi. Machine learning menjadi alat analisis dalam
data mining.
Machine
Learning
Visualisasi
Data mining
Database
Statistik
Gambar 2.1
Data Mining merupakan irisan dari berbagai disiplin
2.3
Tahap-tahap Data Mining
Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi
beberapa tahap seperti gambar berikut :
Gambar 2.2 : Tahap-tahap Data Mining
Sumber : Han, 2006
Tahap-tahap data mining ada 6 yaitu :
8
1.
Pembersihan data (data cleaning)
Pembersihan data merupakan proses menghilangkan noise dan data
yang tidak konsisten atau data tidak relevan. Pada umumnya data yang
diperoleh, baik dari database suatu perusahaan maupun hasil
eksperimen, memiliki isian-isian yang tidak sempurna seperti data yang
hilang, data yang tidak valid atau juga hanya sekedar salah ketik. Selain
itu, ada juga atribut-atribut data yang tidak relevan dengan hipotesa
data mining yang dimiliki. Data-data yang tidak relevan itu juga lebih
baik dibuang. Pembersihan data juga akan mempengaruhi performasi
dari teknik data mining karena data yang ditangani akan berkurang
jumlah dan kompleksitasnya.
2.
Integrasi data (data integration)
Integrasi data merupakan penggabungan data dari berbagai database ke
dalam satu database baru. Tidak jarang data yang diperlukan untuk
data mining tidak hanya berasal dari satu database tetapi juga berasal
dari beberapa database atau file teks. Integrasi data dilakukan pada
atribut-aribut yang mengidentifikasikan entitas-entitas yang unik seperti
atribut nama, jenis produk, nomor pelanggan dan lainnya. Integrasi data
perlu dilakukan secara cermat karena kesalahan pada integrasi data bisa
menghasilkan hasil yang menyimpang dan bahkan menyesatkan
pengambilan aksi nantinya. Sebagai contoh bila integrasi data
berdasarkan jenis produk ternyata menggabungkan produk dari kategori
yang berbeda maka akan didapatkan korelasi antar produk yang
sebenarnya tidak ada.
3.
Seleksi Data (Data Selection)
Data yang ada pada database sering kali tidak semuanya dipakai, oleh
karena itu hanya data yang sesuai untuk dianalisis yang akan diambil
dari database. Sebagai contoh, sebuah kasus yang meneliti faktor
kecenderungan orang membeli dalam kasus market basket analysis,
tidak perlu mengambil nama pelanggan, cukup dengan id pelanggan
saja.
9
4.
Transformasi data (Data Transformation)
Data diubah atau digabung ke dalam format yang sesuai untuk diproses
dalam data mining. Beberapa metode data mining membutuhkan format
data yang khusus sebelum bisa diaplikasikan. Sebagai contoh beberapa
metode standar seperti analisis asosiasi dan clustering hanya bisa
menerima input data kategorikal. Karenanya data berupa angka numerik
yang berlanjut perlu dibagi-bagi menjadi beberapa interval. Proses ini
sering disebut transformasi data.
5.
Proses mining,
Merupakan suatu proses utama saat metode diterapkan untuk
menemukan pengetahuan berharga dan tersembunyi dari data.
6.
Evaluasi pola (pattern evaluation),
Untuk mengidentifikasi pola-pola menarik kedalam knowledge based
yang ditemukan. Dalam tahap ini hasil dari teknik data mining berupa
pola-pola yang khas maupun model prediksi dievaluasi untuk menilai
apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang
diperoleh tidak sesuai hipotesa ada beberapa alternatif yang dapat
diambil seperti menjadikannya umpan balik untuk memperbaiki proses
data mining, mencoba metode data mining lain yang lebih sesuai, atau
menerima hasil ini sebagai suatu hasil yang di luar dugaan yang
mungkin bermanfaat.
7.
Presentasi pengetahuan (knowledge presentation),
Merupakan visualisasi dan penyajian pengetahuan mengenai metode
yang digunakan untuk memperoleh pengetahuan yang diperoleh
pengguna. Tahap terakhir dari proses data mining adalah bagaimana
memformulasikan keputusan atau aksi dari hasil analisis yang didapat.
Ada kalanya hal ini harus melibatkan orang-orang yang tidak
memahami data mining. Karenanya presentasi hasil data mining dalam
bentuk pengetahuan yang bisa dipahami semua orang adalah satu
tahapan yang diperlukan dalam proses data mining. Dalam presentasi
10
ini, visualisasi juga bisa membantu mengkomunikasikan hasil data
mining.
2.4
Metode Bayes
Metode bayes memberikan cara yang mendasar dalam memasukkan
informasi eksternal ke dalam proses analisa data. Proses ini diawali dengan
distribusi probabilitas sudah ada diberikan untuk himpunan data yang
dianalisa.
Karena
distribusi
diberikan
sebelum
ada
data
yang
dipertimbangkan, sehingga disebut distribusi priori. Himpunan data baru
menjadikan distribusi priori ini menjadi distribusi posterior. Perubahan yang
terjadi dari priori ke posterior merujuk pada Teorema Bayes.
Rumus bayes adalah sebagai berikut :
Dengan
Dengan :
- P(Hi|A) adalah peluang kejadian Hi dengan syarat A
- i dimulai dari 1 hingga n
Persamaan bayes yang digunakan untuk menghitung nilai setiap
alternatif disederhanakan menjadi :
Total Nilaii = ∑ Nilaiij (Kritj)
Dimana :
Total nilai i
= total nilai akhir dari alternatif ke-i
Nilai ij
= nilai dari alternatif ke-i pada kriteria ke-j
Krit j
= tingkat kepentingan (bobot) kriteria ke-j
i
= 1, 2, 3, ....... n
n
= jumlah alternatif
j
= 1, 2, 3, ... m
m
= jumlah kriteria
11
2.5 Metode Data mining
Dengan definisi data mining yang luas, ada banyak jenis metode
analisis yang dapat digolongkan dalam data mining.
2.5.1
Association rules
Association rules (aturan asosiasi) atau affinity analysis
(analisis afinitas) berkenaan dengan studi tentang “apa bersama
apa”. Sebagai contoh dapat berupa berupa studi transaksi di
supermarket, misalnya seseorang yang membeli susu bayi juga
membeli sabun mandi. Pada kasus ini berarti susu bayi bersama
dengan sabun mandi. Karena awalnya berasal dari studi tentang
database transaksi pelanggan untuk menentukan kebiasaan suatu
produk dibeli bersama produk apa, maka aturan asosiasi juga sering
dinamakan market basket analysis.
Aturan asosiasi ingin memberikan informasi tersebut dalam
bentuk hubungan “if-then” atau “jika-maka”. Aturan ini dihitung
dari data yang sifatnya probabilistik.
Analisis asosiasi dikenal juga sebagai salah satu metode data
mining yang menjadi dasar dari berbagai metode data mining
lainnya. Khususnya salah satu tahap dari analisis asosiasi yang
disebut analisis pola frekuensi tinggi (frequent pattern mining)
menarik perhatian banyak peneliti untuk menghasilkan algoritma
yang efisien. Penting tidaknya suatu aturan assosiatif dapat
diketahui dengan dua parameter, support (nilai penunjang) yaitu
prosentase kombinasi item tersebut. dalam database dan confidence
(nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan
assosiatif. Analisis asosiasi didefinisikan suatu proses untuk
menemukan semua aturan assosiatif yang memenuhi syarat
minimum untuk support (minimum support) dan syarat minimum
untuk confidence (minimum confidence).
12
Ada beberapa algoritma yang sudah dikembangkan mengenai
aturan asosiasi, namun ada satu algoritma klasik yang sering
dipakai yaitu algoritma apriori. Ide dasar dari algoritma ini adalah
dengan mengembangkan frequent itemset. Dengan menggunakan
satu item dan secara rekursif mengembangkan frequent itemset
dengan dua item, tiga item dan seterusnya hingga frequent itemset
dengan semua ukuran.
Untuk mengembangkan frequent set dengan dua item, dapat
menggunakan frequent set item. Alasannya adalah bila set satu item
tidak melebihi support minimum, maka sembarang ukuran itemset
yang lebih besar tidak akan melebihi support minimum tersebut.
Secara umum, mengembangkan set dengan fc-item menggunakan
frequent set dengan k – 1 item yang dikembangkan dalam langkah
sebelumnya. Setiap langkah memerlukan sekali pemeriksaan ke
seluruh isi database.
Dalam asosiasi terdapat istilah antecedent dan consequent,
antecedent untuk mewakili bagian “jika” dan consequent untuk
mewakili bagian “maka”. Dalam analisis ini, antecedent dan
consequent adalah sekelompok item yang tidak punya hubungan
secara bersama.
Dari jumlah besar aturan yang mungkin dikembangkan, perlu
memiliki aturan-aturan yang cukup kuat tingkat ketergantungan
antar item dalam antecedent dan consequent. Untuk mengukur
kekuatan aturan asosiasi ini, digunakan ukuran support dan
confidence. Support adalah rasio antara jumlah transaksi yang
memuat antecedent dan consequent dengan jumlah transaksi.
Confidence adalah rasio antara jumah transaksi yang meliputi
semua item dalam antecedent dan consequent dengan jumlah
transaksi yang meliputi semua tem dalam antecedent.
13
Keterangan :
S
= Support
∑(Ta+Tc)
= Jumlah transaksi yang mengandung antecedent
dan consequencent
∑(T)
= Jumlah transaksi
Keterangan :
C
= Confidence
∑(Ta+Tc)
= Jumlah transaksi yang mengandung antecedent
dan consequencent
∑(Ta)
= Jumlah transaksi yang mengandung antecedent
Langkah pertama algoritma apriori adalah, support dari
setiap item dihitung dengan men-scan database. Setelah support dari
setiap item didapat, item yang memiliki support lebih besar dari
minimum support dipilih sebagai pola frekuensi tinggi dengan
panjang 1 atau sering disingkat 1-itemset. Singkatan k-itemset berarti
satu set yang terdiri dari k item.
Iterasi kedua menghasilkan 2-itemset yang tiap set-nya
memiliki dua item. Pertama dibuat kandidat 2-itemset dari kombinasi
semua 1-itemset. Lalu untuk tiap kandidat 2-itemset ini dihitung
support-nya dengan men-scan database. Support artinya jumlah
transaksi dalam database yang mengandung kedua item dalam
kandidat 2-itemset. Setelah support dari semua kandidat 2-itemset
didapatkan, kandidat 2-itemset yang memenuhi syarat minimum
14
support dapat ditetapkan sebagai 2-itemset yang juga merupakan
pola frekuensi tinggi dengan panjang 2.
Untuk selanjutnya iterasi-iterasi ke-k dapat dibagi lagi
menjadi beberapa bagian :
1. Pembentukan kandidat itemset
Kandidat k-itemset dibentuk dari kombinasi (k-1)-itemset yang
didapat dari iterasi sebelumnya. Satu ciri dari algoritma apriori
adalah adanya pemangkasan kandidat k-itemset yang subset-nya
yang berisi k-1 item tidak termasuk dalam pola frekuensi tinggi
dengan panjang k-1.
2. Penghitungan support dari tiap kandidat k-itemset
Support dari tiap kandidat k-itemset didapat dengan men-scan
database untuk menghitung jumlah transaksi yang memuat semua
item di dalam kandidat k-item set tersebut. Ini adalah juga ciri
dari algoritma apriori yaitu diperlukan penghitungan dengan scan
seluruh database sebanyak k-itemset terpanjang.
3. Tetapkan pola frekuensi tinggi
Pola frekuensi tinggi yang memuat k item atau k-itemset
ditetapkan dari kandidat k-itemset yang support-nya lebih besar
dari minimum support. Kemudian dihitung confidence masingmasing kombinasi item. Iterasi berhenti ketika semua item telah
dihitung sampai tidak ada kombinasi item lagi.
Secara ringkas algoritma apriori sebagai berikut :
Create L1 = set of supported itemsets of cardinality one
Set k to 2
while (Lk−1 _= ∅){
Create Ck from Lk−1
Prune all the itemsets in Ck that are not
supported, to create Lk
Increase k by 1
}
15
The set of all supported itemsets is L1 ∪ L2 ∪ · · · ∪ Lk
Selain algoritma apriori, terdapat juga algoritma lain seperti
FP-Grwoth. Perbedaan algoritma apriori dengan FP-Growth pada
banyaknya scan database. Algoritma apriori melakukan scan
database setiap kali iterasi sedangkan algoritma FP-Growth hanya
melakukan sekali di awal.
2.5.2 Decision Tree
Dalam decision tree tidak menggunakan vector jarak untuk
mengklasifikasikan obyek. Seringkali data observasi mempunyai
atribut-atribut yang bernilai nominal.
Ada beberapa macam algoritma decision tree diantaranya
CART dan C4.5. Beberapa isu utama dalam decision tree yang
menjadi perhatian yaitu seberapa detail dalam mengembangkan
decision tree, bagaimana mengatasi atribut yang bernilai continues,
memilih ukuran yang cocok untuk penentuan atribut, menangani data
training yang mempunyai data yang atributnya tidak mempunyai
nilai, memperbaiki efisiensi perhitungan. Decision tree sesuai
digunakan untuk kasus-kasus yang keluarannya bernilai diskrit.
Walaupun banyak variasi model decision tree dengan tingkat
kemampuan dan syarat yang berbeda, pada umumnya beberapa ciri
yang cocok untuk diterapkannya decision tree adalah sebagai
berikut :
1.
Data dinyatakan dengan pasangan atribut dan nilainya
2.
Label/keluaran data biasanya bernilai diskrit
3.
Data mempunyai missing value (nilai dari suatu atribut tidak
diketahui)
Dengan cara ini akan mudah mengelompokkan obyek ke
dalam beberapa kelompok. Untuk membuat decision tree perlu
memperhatikan hal-hal berikut ini :
1.
Atribut mana yang akan dipilih untuk pemisahan obyek
2.
Urutan atribut mana yang akan dipilih terlebih dahulu
16
3.
Struktur tree
4.
Kriteria pemberhentian
5.
Pruning.
2.5.3 Clustering
Clustering termasuk metode yang sudah cukup dikenal dan
banyak dipakai dalam data mining. Sampai sekarang para ilmuwan
dalam bidang data mining masih melakukan berbagai usaha untuk
melakukan perbaikan model clustering karena metode yang
dikembangkan sekarang masih bersifat heuristic. Usaha-usaha untuk
menghitung jumlah cluster yang optimal dan pengklasteran yang
paling baik masih terus dilakukan. Dengan demikian menggunakan
metode yang sekarang, tidak bisa menjamin hasil pengklasteran
sudah merupakan hasil yang optimal. Namun, hasil yang dicapai
biasanya sudah cukup bagus dari segi praktis.
Gambar 2.3 : Clustering
Tujuan utama dari metode clustering adalah pengelompokan
sejumlah data/obyek ke dalam cluster (group) sehingga dalam setiap
cluster akan berisi data yang semirip mungkin seperti diilustrasikan
pada gambar diatas. Dalam clustering metode ini berusaha untuk
menempatkan obyek yang mirip (jaraknya dekat) dalam satu klaster
dan membuat jarak antar klaster sejauh mungkin. Ini berarti obyek
dalam satu cluster sangat mirip satu sama lain dan berbeda dengan
17
obyek dalam cluster-cluster yang lain. Dalam metode ini tidak
diketahui sebelumnya berapa jumlah cluster dan bagaimana
pengelompokannya.
2.5.4 Software Aplikasi
Software aplikasi terdiri atas program yang berdiri sendiri
yang mampu mengatasi kebutuhan bisnis tertentu. Aplikasi
memfasilitasi operasi bisnis atau pengambilan keputusan manajemen
maupun teknik sebagai tambahan dalam aplikasi pemrosesan data
konvensional. Sofware aplikasi digunakan untuk mengatur fungsi
bisnis secara real time.
2.5.5 Basis Data dan Sistem Manajemen Basis Data (Database and
Database Management System)
Database adalah sekumpulan data yang saling berelasi.
Database didesain, dibuat, dan diisi dengan data untuk tujuan
mendapatkan informasi tertentu. Pendekatan database memiliki
beberapa keuntungan seperti keberadaan katalog, indepedensi
program-data, mendukung view (tampilan) untuk banyak pengguna,
dan sharing data pada sejumlah transaksi. Selain itu masih ada
fleksibelitas, ketersediaan up-to-date informasi untuk semua
pengguna, skala ekonomis.
Kategori utama pengguna database terbagi menjadi empat
kategori, yakni Administrator, Designer, End user, System Analyst
dan Application Programmers. Administrator atau Data Base
Administrator (DBA) bertanggung jawab pada otoritas akses
database, koordinasi dan monitoring penggunaan, dan pemilihan
perangkat keras dan lunak yang dibutuhkan. Designer bertanggung
jawab pada identifikasi data yang disimpan dalam database dan
memilih struktur yang tepat untuk menggambarkan dan menyimpan
data. End User adalah orang yang kegiatannya membutuhkan akses
ke database untuk melakukan query, update, dan membuat laporan.
18
System Analysts menentukan kebutuhan End User. Application
Programmers mengimplementasikan program sesuai spesifikasi.
Sistem Manajemen Basis Data (SMBD) adalah program yang
digunakan pengguna untuk membuat dan memelihara database.
SMBD memfasilitasi untuk mendefinisikan, mengkonstruksi, dan
memanipulasi database untuk berbagai aplikasi. Pendefinisian
database meliputi spesifikasi tipe data, struktur, dan constraint untuk
data yang disimpan dalam database. Pengkonstruksian database
adalah
proses
penyimpanan
data
itu
sendiri
pada
media
penyimpanan. Pemanipulasian database meliputi fungsi memanggil
query database untuk mendapatkan data yang spesifik, update
database, dan meng-generate laporan dari data tersebut.
Keuntungan yang diperoleh menggunakan SMBD meliputi
mengontrol redudansi, membatasi akses yang tidak berwenang,
menyediakan penyimpanan yang persisten, menghasilkan interface
(antar muka) banyak pengguna, menjaga integritas constraint,
menyediakan backup dan recovery.
Dalam SMBD menyediakan perintah yang digunakan untuk
mengelola dan mengorganisasikan data, yakni Data Definition
Language (DDL) dan Data Manipulation Language (DML). Data
Definition Language adalah bahasa untuk medefinisikan skema atau
dan database fisik ke SMBD. (DDL). Data Manipulation Language
adalah bahasa untuk memanipulasi data yaitu pengambilan informasi
yang telah disimpan, penyisipan informasi baru, penghapusan
informasi, modifikasi informasi yang disimpan dalam database.
Selanjutnya, query adalah statemen yang ditulis untuk mengambil
informasi. Bagian dari DML yang menangani pengambilan
informasi ini disebut bahasa query.
Ada lima komponen utama dalam lingkungan DBMS,
yaitu :
1. Perangkat keras (hardware), teridir dari:
19
a. Penyimpanan secondary (magnetic disk), I/O device seperti:
disk drives), device controller, I/O channels dan lainnya.
b. Hardware processor dan main memory, digunakan untuk
mendukung saat eksekusi system software database
2. Perangkat lunak, terdiri dari : DBMS, sistem operasi, software
jaringan dan program aplikasinya
3. Data, digunakan oleh organisasi dan data ini digambarkan dalam
bentuk skema
4. Prosedur adalah instruksi dan aturan yang harus diterapkan untuk
mendesain dan menggunakan basis data dan DBMS
5. Orang, terdiri dari :
a. Application Programmers, bertanggungjawab untuk membuat
aplikasi basis data dengan menggunakan bahasa pemrograman
yang ada.
b. End Users, siapapun yang berinteraksi dengan system secara
online melalui workstation/terminal.
c. DA (Data Administrator), seseorang yang berwenang untuk
membuat keputusan strategis dan kebijakan mengenai data
yang ada.
d. DBA (DataBase Administrator), menyediakan dukungan
teknis
untuk
implementasi
keputusan
tersebut,
dan
bertanggungjawab atas keseluruhan kontrol system pada level
teknis
Hardware
Software
Mesin
Data
Jembatan
Prosedur
Orang
Manusia
Gambar 2.4 : Komponen DBMS
SQL (dibaca "ess-que-el") singkatan dari Structured Query
Language. SQL adalah bahasa yang digunakan untuk berkomunikasi
20
dengan database. Menurut ANSI (American National Standards
Institute), bahasa ini merupakan standard untuk relational database
management systems (RDBMS). Secara prinsip, perintah-perintah
SQL (biasa disebut dengan pernyataan) dapat dibagi dalam tiga
kelompok, yaitu :
1. DDL (Data Definition Language) atau bahasa penerjemah data
Adalah perintah-perintah yang berkaitan dengan penciptaan atau
penghapusan objek seperti tabel dan indek dalam database. Versi
ANSI mencakup CREATE TABLE, CREATE INDEX, ALTER
TABLE, DROP TABLE, DROP VIEW, dan DROP INDEX.
Beberapa sistem database menambahkan pernyataan DDL seperti
CREATE DATABASE dan CREATE SCHEMA.
2. DML (Data Manipulation Language) atau bahasa pemanipulasi
data
Mencakup perintah-perintah yang digunakan untuk memanipulasi
data. Misalnya untuk menambahkan data (INSERT), memperoleh
data (SELECT), mengubah data (UPDATE), dan menghapus data
(DELETE).
3. DCL (Data Control Language) atau bahasa pengendali data
Merupakan kelompok perintah yang dipakai untuk melakukan
otorisasi terhadap pengaksesan data dan pengalokasian ruang.
Misalnya, suatu data bisa diakses si A, tetapi tidak bisa diakses
oleh si B. Termasuk dalam kategori DCL yaitu pernyataanpernyataan GRANT, REVOKE, COMMIT, dan ROLLBACK.[12]
2.6 Perancangan Perangkat Lunak
Proses perancangan sistem membagi persyaratan dalam sistem
perangkat keras atau perangkat lunak. Kegiatan ini menentukan arsitektur
sistem secara keseluruhan. Perancangan perangkat lunak melibatkan
identifikasi dan deskripsi abstraksi sistem perangkat lunak yang
mendasar dan hubungan-hubungannya.
21
Sebagaimana persyaratan, desain didokumentasikan dan menjadi
bagian dari konfigurasi software. Langkah penyelesaian dengan tahapan
pengembangan perangkat lunak menggunakan model proses atau
paradigma waterfall. Sebagai paradigma kehidupan klasik, waterfall
model memiliki tempat penting dalam rekayasa perangkat lunak. Bahkan
paradigma ini merupakan paradigma rekayasa perangkat lunak yang
paling luas dipakai dan yang paling tua.
Waterfall model merupakan salah satu model proses perangkat
lunak yang mengambil kegiatan proses dasar seperti spesifikasi,
pengembangan, validasi dan evolusi, serta mempresentasikannya sebagai
fase-fase proses yang berbeda seperti analisis dan definisi persyaratan,
perancangan perangkat lunak, implementasi, pengujian unit, integrasi
sistem, pengujian sistem, operasi dan pemeliharaan:
Tahap-tahap utama dari waterfall model pada gambar 2.4
memetakkan kegiatan-kegiatan pengembangan dasar, yaitu :
Analisis dan definisi
persyaratan
Perancangan sistem dan
perangkat lunak
Implementasi dan
pengujian unit
Integrasi dan pengujian
sistem
Operasi dan
pemeliharaan
Gambar 2.5 : Waterfall model
Sumber : Ian Sommerville, Software Engineering (Rekayasa
Perangkat Lunak), 2003
1. Analisis dan Definisi Persyaratan
Proses menumpulkan informasi kebutuhan sistem/perangkat lunak
melalui konsultas dengan user system. Proses ini mendefinisikan
secara rinci mengenai fungsi-fungsi, batasan dan tujuan dari perangkat
lunak sebagai spesifikasi sistem yang akan dibuat.
22
2. Perancangan Sistem dan Perangkat Lunak
Proses perancangan sistem ini difokuskan pada empat atribut, yaitu
struktur data, arsitektur perangkat lunak, representasi antarmuka, dan
detail (algoritma) prosedural. Yang dimaksud struktur data adalah
representasi dari hubungan logis antara elemen-elemen data
individual.
3. Implementasi dan Pengujian Unit
Pada tahap ini, perancangan perangkat lunak direalisasikan sebagai
serangkaian program atau unit program. Kemudian pengujian unit
melibatkan verifikasi bahwa setiap unit program telah memenuhi
spesifikasinya.
4. Integrasi dan Pengujian Sistem
Unit program/program individual diintegrasikan menjadi sebuah
kesatuan sistem dan kemudian dilakukan pengujian. Dengan kata lain,
pengujian ini ditujukan untuk menguji keterhubungan dari tiap-tiap
fungsi perangkat lunak untuk menjamin bahwa persyaratan sistem
telah terpenuhi. Setelah pengujian sistem selesai dilakukan, perangkat
lunak dikirim ke pelanggan/user.
5. Operasi dan Pemeliharaan
Tahap ini biasanya memerlukan waktu yang paling lama. Sistem
diterapkan (di-install) dan dipakai. Pemeliharaan mencakup koreksi
dari beberapa kesalahan yang tidak diketemukan pada tahapan
sebelumnya,
perbaikan
atas
implementasi
unit
sistem
dan
pengembangan pelayanan sistem, sementara persyaratan-persyaratan
baru ditambahkan.
2.7 Implementasi dan Pengujian Unit
Pada tahap ini, perancangan perangkat lunak direalisasikan sebagai
serangkaian program atau unit program. Kemudian pengujian unit
melibatkan verifikasi bahwa setiap unit program telah memenuhi
spesifikasinya. Program sebaiknya dirilis setelah dikembangkan, diuji
23
untuk memperbaiki kesalahan yang ditemukan pada pengujian untuk
menjamin kualitasnya. Terdapat dua metode pengujian yaitu :
1) Metode white box yaitu pengujian yang berfokus pada logika internal
software (source code program).
2) Metode black box yaitu mengarahkan pengujian untuk menemukan
kesalahan-kesalahan dan memastikan bahwa input yang dibatasi akan
memberikan hasil aktual yang sesuai dengan hasil yang dibutuhkan.
Pada tahap pengujian, penulis melakukan metode black box yaitu
menguji fungsionalitas dari perangkat lunak saja tanpa harus mengetahui
struktur internal program (source code).
BAB III
METODOLOGI PENELITIAN
Pada bab ini akan dipaparkan langkah-langkah yang digunakan untuk
membahas permasalahan yang diambil dalam penelitian. Dibagian ini juga
dijelaskan alat dan metoda yang digunakan untuk melakukan perencanaan dan
mendapatkan spesifikasi kebutuhan pengguna, dan dibagian akhir dituliskan
rencana pengerjaan penelitian.
3.1
Instrumen Penelitian
1. Identifikasi Kebutuhan Software
Agar konsep bisa berfungsi sebagaimana mestinya perlu didukung oleh
perangkat software yang memadai yaitu terdiri dari:
a.
Bahasa Pemrograman (Human Made Sistem) dalam hal ini
menggunakan bahasa Visual Basic 6.0 karena memiliki fasilitas
fungsi perintah yang lengkap dan kecepatan eksekusi.
b.
Software aplikasi yang lain digunakan untuk mendukung bagian–
bagian yang lain diluar penanganan sistem misalnya Microsoft
word, Microsoft excel, dan lain–lain.
2. Identifikasi Kebutuhan Hardware
Dengan
mempertimbangkan
kebutuhan
pengguna
sistem
yang
merupakan home industri, maka hardware yang dibutuhkan adalah
sebagai berikut :
a.
Laptop Asus K42F
Pertimbangan menggunakan laptop, karena harganya relatif murah
dan fleksibel, dengan spesifikasi sbb, Processor
Intel® Core™
i5 Processor 520M/430M : 2.4 GHz - 2.26 GHz, with Turbo Boost
up to 2.93/2.53 GHz; Chipset Mobile Intel® HM55 Express
Chipset, RAM Type 1066Mhz DDR3, RAM Slots 2, HDD 320
24
25
b.
Printer Epson T13
Merupakan salah satu alat untuk mencetak proses dari komputer
yang mempunyai hasil pengolahan sistem komputer. Pemilihan
untuk jenis tersebut didasarkan pada petimbangan kebutuhan
pencetakan dokumen, harga relatif murah, kecepatan tinggi serta
kualitas cetakan yang lebih baik,dengan spesifikasi Ink System 4colour, MAX PHOTO DRAFT – 10 x 15 cm / 4” x 6” Approx. 65
sec per photo (W/Border), Approx. 91 sec per photo (Borderless)
Connectivity and Compatibility Interfaces Hi-speed USB 2.0, OS
Support Windows® XP/XP Professional x64 Edition/VistaTM/7,
Mac OS® 10.4.11 or later, Max. Paper Size 8.5"
x
44",
Max.
Paper Capacity 100 sheets
c.
UPS Power Link 650 W (Unitteruptible Power Supply )
Pertimbangan menggunakan UPS yaitu jika sewaktu–waktu listrik
padam masih ada sisa arus listrik yang dapat digunakan untuk
melakukan penyimpanan data yang baru saja dimasukkan sehingga
data tidak hilang.
3.2
Prosedur Pengumpulan Data
Sesuai dengan sumber data dan tujuan penyusunan laporan penelitian
ini, maka dalam pengumpulan data penulis menggunakan beberapa metode
antara lain sebagai berikut :
1. Wawancara
Yaitu metode pengumpulan data dengan mengadakan wawancara
secara langsung untuk mendapatkan data-data yang sudah dipersiapkan
guna memperoleh informasi yang dibutuhkan. Dalam melakukan
wawancara dijelaskan mengenai maksud dan tujuan dari penulis dalam
melakukan penelitian. Wawancara dilakukan dengan pihak yang
berkaitan langsung dengan data.
26
2. Observasi
Yaitu teknik pengumpulan data dengan cara mengadakan
pengamatan dan peninjauan secara langsung terhadap objek penelitian.
3. Studi Kepustakaan
Yaitu metode pengumpulan data dengan cara membaca dan
mempelajari literatur, majalah, buku yang berhubungan dengan pokokpokok permasalahan, untuk mendapatkan dasar-dasar teori dari data yang
dibutuhkan.
3.3
Metodologi Penelitian
Agar penelitian yang dilakukan lebih terarah maka akan digunakan
suatu metode. Dalam penelitian ini, metode yang digunakan adalah
waterfall. Langkah yang dilakukan dimulai dengan identifikasi dan analisis
kebutuhan pengguna, yang dilakukan bersama-sama dengan mengamati
kondisi sistem yang saat ini digunakan. Setelah itu dilanjutkan dengan
menjelaskan desain aplikasi, kemudian dilanjutkan dengan desain data
warehouse dan desain data mining. Desain-desain tersebut kemudian
diaplikasikan dan dievaluasi agar didapatkan aplikasi yang benar-benar
bermanfaat bagi pengguna.
Berikut dijelaskan secara lebih detail tahapan pengerjaan yang akan
dilakukan :
1.
Identifikasi dan analisi kebutuhan aplikasi
Tahap identifikasi dan analisis kebutuhan aplikasi dilakukan
untuk mengetahui kebutuhan pengguna terhadap aplikasi yang akan
dikembangkan.
Hal
ini
perlu
dilakukan
agar
aplikasi
yang
dikembangkan sesuai dengan kebutuhan pengguna.
Dibagian ini juga dijelaskan siapa saja yang akan menggunakan
aplikasi ini, dan informasi apa saja yang bisa digunakan oleh mereka.
Kegiatan yang dilakukan pada tahap identifikasi dan analisa kebutuhan
ini antara lain :
a.
Melakukan review pada kondisi eksisting dari objek penelitian
27
b.
Melakukan studi literatur atau studi pustaka untuk lebih menguasai
dan memahami dasar-dasar teori dan konsep-konsep yang
mendukung penelitian
c.
Melakukan observasi permasalahan yang terjadi pada obyek
penelitian dan dilanjutkan dengan mengidentifikasinya
Observasi dilakukan dengan beberapa langkah antara lain :
a.
Melakukan pengamatan dan menganalisa kondisi objek penelitian,
terutama pada sistem informasi yang saat ini digunakan. Dari
sistem tersebut dilakukan pengamatan terhadap proses bisnis yang
ada, alur transaksi pada masing-masing proses, model-model
laporan yang dihasilkan, desain database yang digunakan, model
penyimpanan data, serta hal-hal lain yang berhubungan dengan
sistem yang ada.
b.
Melakukan wawancara
pada
beberapa
stakeholder
sebagai
pengambil keputusan, penggguna ditingkat operasional, staf
teknologi informasi, dan staf-staf lain yang diperlukan. Skenario
yang akan dilakukan untuk proses wawancara ini adalah sebagai
berikut :
1) Menentukan orang-orang yang akan dijadikan sebagai sumber
informasi, baik dari pihak manajemen, bagian teknologi
informasi, bagian pelayanan dan bagian-bagian lain yang
berhubungan
2) Membuat jadwal dan agenda dengan orang-orang yang akan
diwawancarai
3) Menyiapkan pertanyaan baik yang bersifat strategis ataupun
teknis untuk mengetahui kebutuhan pengguna pada aplikasi
4) Menyiapkan alat bantu wawancara seperti buku catatan atau
perekam suara
5) Melakukan wawancara dan mencatat semua hasil yang
didapatkan
28
c.
Melakukan analisa pada dokumen-dokumen yang dimiliki oleh
Perpustakaan
2.
Mendiskripsikan aplikasi yang akan dikembangkan
Setelah kebutuhan pengguna didapatkan, langkah selanjutnya
adalah menggambarkan aplikasi yang akan dikembangkan. Gambaran
aplikasi ini bertujuan agar pengguna mempunyai gambaran awal
mengenai aplikasi dan fitur-fitur apa saja yang ada diaplikasi yang
dikembangkan.
3.
Mengumpulkan dan Menganalisa Data
Setelah mendeskripsikan aplikasi yang akan dikembangkan,
langkah selanjutnya adalah mengumpulkan data. Data yang dibutuhkan
adalah data transaksi peminjaman dan pengembalian buku. Setelah data
tersebut didapatkan, langkah selanjutnya adalah menganalisa data.
Langkah ini diperlukan agar karakteristik dari masing-masing data
diketahui. Dengan mengetahui karakteristik data, bisa diketahui pula
data mana yang dibutuhkan data mana yang tidak dibutuhkan.
4.
Mendesain Data Warehouse
Untuk mendesain data warehouse, langkah yang akan dilakukan
adalah :
a. Mendesain basis data logikal untuk data warehouse.
b. Menentukan skema data warehouse yang akan dipakai. Apakah akan
memakai skema bintang, skema bola salju atau Fact constellations.
Hasil akhir dari tahap ini berupa script untuk membangun tabel,
script untuk pembuatan index.
c. Membersihkan data. Data transaksi peminjaman dan pengembalian
buku tidak bisa langsung dimasukkan dalam data warehouse. Data
tersebut harus dipersiapkan terlebih dahulu dengan cara meringkas
dan membersihkan dari kemungkinan error dengan membuang
record-record
yang
mengandung
kesalahan
atau
diragukan
validitasnya. Selain itu, data tersebut juga dipilih. Data tidak
29
berhubungan dengan penelitian tidak akan dimasukkan dalam data
warehouse
d. Melakukan input data kedalam data warehouse
5.
Membangun OLAP dan Analisa Data Multidimensi
Setelah data warehouse siap, data tersebut kemudian diolah dan
dianalisa dengan menggunakan OLAP. Pengolahan data dengan OLAP
dilakukan dengan membuat dimensi dan cube. Dimensi dan cube ini
dibuat berdasarkan desain data warehouse yang dibuat pada tahap
sebelumnya. Dengan menggunakan OLAP data dianalisa dengan
melakukan operasi slicing, dicing, roll up, dan drill down pada
warehouse. Salah satu contoh operasi drill-down dan roll up yang akan
dilakukan pada OLAP terlihat pada gambar 3.1 dan gambar 3.2
6.
Market Basket Analysis pada transaksi peminjaman buku
Untuk mendapatkan informasi yang berhubungan dengan
keterkaitan buku yang dipinjam oleh anggota, dilakukan proses data
mining pada data warehouse yang sudah dibuat. Proses data mining
dilakukan dengan menggunakan SQL Server 2005 dan menggunakan
metode Association Rule Mining
Shift
Harian
Minggu
Bulanan
Tahunan
Gambar 3.1 : Operasi pada dimensi waktu
30
Buku
Kategori
Gambar 3.2 : Operasi pada dimensi buku
Sebelum melakukan data mining, beberapa hal yang harus
dilakukan adalah :
a. Menyusun taksonomi buku
Contoh taksonomi adalah sebagai berikut :
Agama
Pengantar Agama Islam
Belajar membaca Al-Quran
Basis data
Perancangan sistem basis data
Basis data
Mengenal Microsoft Visual Basic
Bahasa pemrograman
6.0
Pemrograman berbasis visual
Perancangan
sistem
informasi
menggunakan Microsoft Visual
Basic dan Database MySql
Mengenali pemrograman berbasis
visual
b. Menyusun nilai support dan cofidence yang diinginkan
c. Melakukan proses data mining
d. Mengolah rule yang didapatkan dan merumuskannya sehingga
didapatkan informasi mengenai keterkaitan barang yang dibeli oleh
konsumen.
7.
Uji Coba Aplikasi dan Evaluasi
Untuk memastikan bahwa aplikasi yang dikembangkan bebas dari
kesalahan, dilakukan testing (uji coba) pada aplikasi tersebut. Uji coba
31
yang dilakukan mencakup uji coba pada desain data warehouse, proses
ekstraksi, transformasi, dan load data ke data warehouse, ujicoba pada
OLAP, dan yang terakhir uji coba pada hasil data mining. Pada tahap
ini juga akan dilakukan evaluasi terhadap hasil penelitian yang
dilakukan. Evaluasi dilakukan mencakup evaluasi hasil dan manfaat
cara dengan membandingkan hasil yang didapatkan dengan kebutuhan
pengguna saat survey kebutuhan pengguna.
8.
Menyusun Laporan Penelitian
Langkah terakhir dari penelitian ini adalah membuat laporan
penelitian. Laporan ini berisi hal-hal yang dikerjakan selama melakukan
penelitin dan hasil-hasil yang didapatkan ketika melakukan penelitian.
Dari uraian diatas, dapat digambarkan langkah-langkah yang
digunakan pada penelitian ini adalah sebagai berikut :
32
Mulai
Identifikasi Kebutuhan Pengguna
1. Identifikasi permasalahan
2. Studi literatur/pustaka
3. Analisis dokumen obyek penelitian
4. Wawancara
5. Kuesioner
Mengamati Kondisi Obyek Penelitian
1. Perangkat lunak yang dimiliki
2. Perangkat keras yang dimiliki
3. Model data yang dimiliki
4. Kondisi komputer
Mendeskripsikan Sistem yang akan
dikembangkan
1. Aplikasi migrasi data
2. Data Warehouse dan OLAP
3. Data Mining
4. Model Penyajian Data
Mengumpulkan dan menganalisa data
Mendesain dan Implementasi Data Warehouse
1. Membersihkan data
2. Desain dan Implementasi Basis Data Logic
3. Desain dan Implementasi Aplikasi
Membangun OLAP dan Analisa Data
Multidimensi
1. Membuat dimensi dan cube
2. Melakukan analisa data multi dimensi
3. Merumuskan informasi hasil operasi
Melakukan Analisa Data Mining
1. Menyusun taksonomi barang
2. Memasukkan nilai support dan confidence
3. Melakukan proses data mining
4. Mengolah rule yang dihasilkan menjadi
informasi
Evaluasi dan uji coba
Menyusun laporan penelitian
Sele
sai
Gambar 3.3 : Metodologi Penelitian
BAB IV
ANALISIS DAN PERANCANGAN APLIKASI
Bab ini menjelaskan tentang analisis dan perancangan dalam membangun
Aplikasi Data Mining. Analisis meliputi analisis data mining, analisis lingkungan
sistem serta analisis dalam membangun aplikasi.
4.1
Analisis Data Mining
Aplikasi data mining yang dihasilkan akan melakukan pem-filter-an,
penyimpanan kata penting pada tiap sinopsis, menemukan dan menganalisa
relasi antar sinopsis, dan kemudian menampilkan hasil analisa tersebut
kepada user. Dengan aplikasi ini nantinya diperoleh list judul buku dari
yang paling berhubungan dengan keyword yang diinputkan oleh user sampai
dengan yang paling sedikit hubungannya dengan keyword yang dientrikan.
4.2
Sumber Data
Data yang digunakan dalam penulisan tugas akhir ini terdiri dari satu
sumber data yaitu data master buku.
Data master buku adalah data buku yang didata oleh pihak
Perpustakaan ketika dilakukan penambahan atau perubahan data buku. Data
yang dicatat adalaha identitas buku dengan atribut sebagai berikut :
Tabel 4.1 : Tabel data master buku
Atribut
Kode buku
Keterangan
Kode buku adalah kode yang dimiliki buku
sebagai kode unik identitas buku
Judul buku
Merupakan judul buku yang bersangkutan
Anak judul
Merupakan judul spesifik buku
Pengarang
Merupakan nama pengarang buku
Pengarang tambahan
Merupakan nama pengarang, jika pengarang
lebih dari satu
Penerbit
Merupakan nama perusahaan penerbit buku
33
34
Tempat terbit
Merupakan tempat buku diterbitkan
Tahun terbit
Merupakan tahun buku diterbitkan
Cetakan/edisi
Merupakan edisi buku (Kesatu|kedua|ketiga)
No. Kelas
Merupakan kelas buku (fiksi|non fiksi)
Deskripsi fisik
Merupakan ukuran dan ketebalan buku
Penempatan
Merupakan penempatan rak buku
ISBN/ISSN
Merupakan nomor ISBN
Data buku yang diambil dalam sampel adalah semua data buku yang
ada di Perpustakaan Daerah Wilayah Jawa Tengah sejak tahun 2010. Data
tersebut diperoleh langsung oleh peneliti dari bagian sirkulasi Perpustakaan
Daerah Wilayah Jawa Tengah.
4.3
Intergrasi Data
Dalam penelitian ini diasumsikan bahwa semua data yang diambil
sudah berupa tabel-tabel dalam satu server. Untuk proses mining data buku
digunakan judul buku, pengarang, deskripsi dan kategori sebagai keyword.
Proses integrasi data dilakukan ketika proses ETL (ekstract, transform, and
load)
4.4
Transformasi Data
Transformasi
data
merupakan
proses
pengubahan
atau
penggabungan data ke dalam format yang sesuai untuk diproses dalam data
mining. Seringkali data yang akan digunakan dalam proses data mining
mempunyai format yang belum langsung dapat digunakan, oleh karena itu
perlu dirubah formatnya.
35
4.5
Perancangan Sistem
Rancangan aplikasi pencarian buku ini akan dilakukan lebih
mendalam dengan mendeskripsikan buku-buku tersebut dan akan dilakukan
pengklasifikasian dengan menggunakan metode naive bayes clasiffier
(NBC) sehingga akan mendapatkan hasil yang lebih optimal dikarenakan
user mendapatkan referensi buku yang lebih banyak.
Pada proses pencarian dengan menggunakan metode naive bayes
clasiffier (NBC) akan melalui dua tahap, yaitu proses learning dan proses
clasiffier. Dimana proses learning akan membentuk vocabulary pada setiap
dokumen data training, yaitu berupa kamus kata dasar yang nantinya akan
menjadi perbandingan antara satu kata dengan kata yang lainnya. Kemudian
proses learning akan akan menghitung probabilitas pada setiap kategori
tersebut untuk nantinya di klasifikasikan. Sedangkan pada proses clasiiffier
langkahnya yaitu menghitung probabilitas pada setiap dokumen terhadap
sekumpulan dokumen dan kemudian menentukan probabilitas kemunculan
kata yang terbesar pada suatu dokumen dengan kategori class tersebut.
Sehingga kata yang memiliki presentasi terbesarlah yang akan dimunculkan
pada hasil pencarian.
4.5.1 Use Case Diagram
Perancangan sistem dapat dilihat dari use case diagram dibawah ini :
Gambar 4.1 : Use Case Diagram Data Mining Perpustakaan
36
Gambar diatas menjelaskan bahwa dalam aplikasi data
mining pada Perpustakaan Daerah Wilayah Jawa Tengah terdapat 2
actor yaitu :
1. Admin
Dapat menjalankan sistem pada bagian login dan masuk ke menu
utama untuk melakukan tambah buku dan edit buku.
2. User
Dapat melakukan pencarian buku dengan memasukkan keyword
yang diinginkan dengan mengacu pada judul, pengarang,
deskripsi atau kategori dari buku yang dicari.
4.5.2 Sequence Diagram
Penjelasan antar proses akan digambarkan dengan sequence
diagram berikut :
1. Sequence diagram penambahan buku
Gambar 4.2 : Sequence diagram penambahan buku
Penambahan buku dilakukan oleh admin jika ada buku baru
yang masuk.
37
2. Sequence diagram pencarian buku berdasarkan judul
Gambar 4.3 : Sequence diagram pencarian buku berdasarkan
judul
Untuk
melakukan
pencarian
buku,
dapat
dilakukan
berdasarkan judul, kategori maupun deskripsi dari buku yang
ingin dicari. Gambar diatas menjelaskan alur sequence diagram
pencarian buku berdasarkan judul buku.
3. Sequence diagram pencarian buku berdasarkan kategori
Gambar 4.4 : Sequence diagram pencarian buku berdasarkan
kategori
38
Gambar
tersebut
menjelaskan
alur
pencarian
buku
berdasarkan kategori buku.
4. Sequence diagram pencarian buku berdasarkan deskripsi buku
Gambar 4.5 : Sequence diagram pencarian buku berdasarkan
deskripsi buku
Gambar tersebut menjelaskan alur sequence diagram
pencarian buku berdasarkan deskripsi buku.
39
5. Sequence diagram edit buku
Gambar 4.6 : Sequence diagram edit buku
Admin dapat juga melakukan edit buku untuk mengedit
kesalahan ketika memasukkan data buku dan sudah disimpam
dalam database.
6. Sequence diagram login
Gambar 4.7 : Sequence diagram login
40
4.5.3 Class Diagram
Gambar 4.8 : Class diagram aplikasi sistem perpustakaan
Dari kelas diagram diatas dapat dilihat bagaimana relasi
antar tabel dan atribut yang terdapat pada tabel. Data buku
menjadi inti dari proses pencarian, yang nantinya akan
dikelompokkan berdasarkan pencarian judul, kategori maupun
deskripsi yang dimasukkan oleh user.
4.5.4 Struktur File
1.
File Login
Nama tabel = Login
Kunci field = username
Tabel 4.1 : Tabel Login
No
2.
Nama field
Type
Width
Dec
Keterangan
1
Username
String
10
Nama user
2
Password
String
10
Password
File Buku
Nama tabel = buku
Kunci field = kode_buku
Tabel 4.2 : Tabel Buku
No
Nama field
Type
Width
1
Kode_buku
Integer
15
Dec
Keterangan
Kode buku
41
No
Nama field
Type
2
Judul
String
3
Anak_judul
String
4
5
Pengarang
Pengarang_t
String
Width
Dec
30
Judul buku
Anak judul (bila
30
ada)
Nama
20
pengarang
buku
String
ambahan
Keterangan
Nama
20
pengarang
tambahan
(bila
ada)
6
Penerbit
String
7
Tempat_terb String
it
8
Tahun_terbi
30
Penerbit buku
Tempat
30
diterbitkan
String
t
buku
Tahun
4
diterbitkannya
buku
3.
9
Cetakan
String
10
No_kelas
String
10
Cetakan buku
Nomor
5
kelas
penempatan
11
Deskripsi
String
100
Deskripsi buku
12
Penempatan
String
10
Penempatan buku
13
ISBN
String
10
Nomor ISBN
File Kategori
Nama tabel = Kategori
Kunci field = id_kategori
Tabel 4.3 : Tabel Kategori
No
Nama field
Type
Width
Dec
Keterangan
1
Id_kategori
Integer
5
Id kategori
2
Kategori
String
30
Kategori buku
42
4.
File Deskripsi
Nama tabel = Deskripsi
Kunci field = Kode_buku
Tabel 4.4 : Tabel Deskripsi
No
Nama field
Type
Width
Dec
Keterangan
1
Kode_buku
Integer
15
Kode buku
2
Deskripsi
String
100
Deskripsi
4.5.5 Desain Input Output
1. Desain menu utama
MENU UTAMA
Data
Buku
Cari
Buku
List
Buku
Login
Utility
Gambar 4.9 : Desain menu utama
Menu utama merupakan menu awal yang tampil apabila
program dijalankan, dalam menu utama tersebut user sudah
dapat melakukan pencarian buku yang diinginkan berdasarkan
judul, kategori maupun deskripsi buku dan juga melihat list
semua koleksi buku dari Perpustakaan Daerah Wilayah Jawa
Tengah.
Sedangkan admin dapat melakukan manipulasi data
buku, namun harus melalui login agar dapat mengakses
kewenangan admin meliputi input dan edit data buku.
43
2. Desain form login
Login Admin
Username
Gambar
Password
Ok
Cancel
Gambar 4.10 : Desain form login
Form login merupakan form yang disediakan untuk
admin agar dapat mengakses kewenangannya sebagai admin.
Untuk menjalankan login maka admin harus mengisi username
dan password yang sesuai. Apabila pengisian username dan
password salah maka admin akan mendapatkan informasi
kesalahan dan apabila pengisian benar maka admin dapat
mengakses aplikasi sesuai dengan kewenangannya.
44
3. Desain form data buku
DATA BUKU
Kode Buku
Judul
Anak judul
Pengarang
Pengarang
tambahan
Penerbit
Tempat Terbit
Tahun
Cetakan
No. Kelas
Deskripsi
Penempatan
Kategori
ISBN
Save
Cancel
Gambar 4.11 : Desain form data buku
Form diatas merupakan tampilan dari master data buku
yang digunakan oleh admin untuk melakukan pengisian data
buku.
45
4. Desain form pencarian buku
PENCARIAN BUKU
Kunci Pencarian
Kode buku
Judul
Pengarang
Exit
Gambar 4.12 : Desain form pencarian buku
Tampilan diatas merupakan form yang digunakan oleh
user untuk pencarian buku. User dapat mencari detail informasi
buku berdasarkan judul, kategori dan deskripsi buku. Apabila
ditemukan maka informasi buku akan ditampilkan pada kolom
tabel grid pada form tersebut dan jika tidak ditemukan maka
user akan mendapatkan informasi.
5. List buku
Data Buku
Tanggal : 99/99/9999
Kategori : xxxxxxxxxxxxxxxx
Kode buku
Judul
Pengarang
Penerbit
Tahun
99999999
Xxxxxxxxx
Xxxxxxx
Xxxxxxx
9999
99999999
Xxxxxxxxx
Xxxxxxx
Xxxxxxx
9999
99999999
Xxxxxxxxx
Xxxxxxx
Xxxxxxx
9999
99999999
Xxxxxxxxx
Xxxxxxxx
Xxxxxxx
9999
Gambar 4.13 : List data buku
46
Dalam list buku akan ditampilkan detail daftar buku
yang ada di koleksi Perpustakaan Daerah Wilayah Jawa Tengah.
List buku tersebut ditampilkan berdasarkan kategori buku.
4.5.6 Implementasi Sistem
Berikut adalah implementasi aplikasi data mining pencarian
buku di Perpustakaan Wilayah Daerah Jawa Tengah :
1. Form Menu Utama
Gambar 4.14 : Tampilan Menu Utama
Dalam desain menu utama diatas, disajikan pilihan-pilihan
proses yakni :
a. File, yang berisi fasilitas form tambah user
b. Data Buku
Form data buku digunakan oleh admin untuk input data buku
dan manipulasi database buku yang sudah disimpan.
c. Pencarian Buku
Form pencarian buku digunakan oleh user secara umum untuk
mencari data buku koleksi perpustakaan.
d. List Buku
47
Merupakan submenu informasi bagi user untuk melihat secara
detail semua data buku yang disajikan dalam bentuk pilihan
berdasarkan kategori buku.
e. Utility, merupakan fasilitas tambahan dalam aplikasi yang
berisi kalender dan kalkulator
2. Form Login
Gambar 4.15 : Tampilan Form Login
Form login difungsikan untuk admin perpustakaan. Dalam
form login terdapat username dan password yang harus diisi oleh
admin. Dalam form login terdapat dua tombol fungsi yaitu tombol
“Ok” untuk masuk aplikasi dan tombol “Batal” untuk
membatalkan login.
Dengan form login tersebut maka aplikasi akan dibatasi
aksesnya sesuai dengan kewenangan pemakai. Sehingga data
yang tidak boleh diakses secara umum akan dapat dibatasi.
48
3. Form Data Buku
Gambar 4.16 : Tampilan Form Data Buku
Form data buku berfungsi untuk input data buku dan
manipulasi database buku. Dalam form data buku terdapat 4
fasilitas tombol fungsi yaitu:
a. Input
Fasilitas fungsi input, digunakan oleh admin untuk melakukan
input data buku baru. Admin memilih tombol “Input”
kemudian semua textbox akan siap untuk diisi oleh admin.
Setelah pengisian semua texbox maka tombol Input akan
berubah menjadi “Simpan” dan admin memilih tombol
tersebut untuk melakukan simpanan data.
49
b. Edit
Fasilitas fungsi edit, digunakan oleh admin untuk melakukan
edit data yang sudah tersimpan kedalam database. Untuk edit
data maka admin menekan tombol “Edit” kemudian admin
harus mengisi kode buku yang akan diedit sehingga akan
ditampilkan data buku secara detail sesuai dengan kode buku
yang dipanggil. Setelah admin melakukan edit data maka
tombol “Edit” akan berubah menjadi tombol “Simpan” yang
dapat digunakan oleh admin untuk menyimpan data perubahan.
c. Hapus
Fasilitas
fungsi
hapus
digunakan
oleh
admin
untuk
penghapusan data buku yang sudah tersimpan dalam database.
Untuk mengoperasikannya, admin menekan tombol “Hapus”
kemudian mengisi kode buku yang akan dihapus sehingga
akan ditampilkan detail data buku sesuai dengan kode buku
yang dipanggil, serta ditampilkan konfirmasi hapus data, jika
data benar akan dihapus maka admin memilih tombol “ya” dan
jika tidak, maka admin memilih tombol “tidak”. Setelah
dihapus, maka data list buku yang ada di dalam Datagrid juga
akan terhapus.
d. Tutup
Fasilitas fungsi tersebut digunakan oleh admin untuk keluar
atau menutup form data buku.
50
4. Form Pencarian Buku
Gambar 4.17 : Tampilan Form Pencarian Buku
Form tersebut digunakan oleh umum (semua pemakai
perpustakaan) untuk mencari data buku yang diinginkan. Form
tersebut memfasilitas pengguna perpustakaan yang hendak
mencari buku namun kadang kala tidak tahu secara detail judul
buku tersebut. Atau terkadang tahu judul bukunya, namun banyak
sekali judul buku yang sama, memiliki isi yang hampir serupa
tetapi pengarang dan penerbitnya berbeda. Mungkin juga
pengguna tahu deskripsi buku yang diinginkan namun tidak tahu
judulnya.
Dengan form diatas, pengguna dapat mencari semua buku
yang diinginkan dengan memilih kunci pencarian, antara lain :
a. Judul buku
b. Pengarang buku
c. Deskripsi buku
d. Kategori buku
User tidak harus mengetikkan semua teks namun dapat
mengisikan kata yang diketahuinya, dan sistem sudah dapat
menyajikan informasi terkait kata atau huruf yang diinputkan oleh
51
user. Jika user sudah merasa menemukan data buku yang dicari,
maka untuk menampilkan detail informasi letak buku, user
melakukan “enter” sehingga data keseluruhan buku yang
diinginkan akan ditampilkan.
5. List Buku
Gambar 4.18 : Pilihan cetak list buku
Form diatas merupakan form pilihan cetal list buku
berdasarkan kategori buku. Untuk mencetak informasi list buku,
maka user harus mengisikan kategori buku yang ingin dilihat.
Dengan demikian informasi akan lebih jelas dan terinci sesuai
kategori buku.
Jika sudah dipilih kategor bukunya, maka akan ditampilkan
list detail buku sebagai berikut :
Gambar 4.19 : List Data Buku
52
4.5.7 Pengujian Sistem
Pengujian sistem dilakukan dengan uji black box yang menguji
batasan-batasan sistem apabila terjadi kesalahan dalam pengisian data.
Pengujian black box dilakukan antara lain pada form-form berikut :
1. Halaman Login
Jika admin salah memasukkan username dan password makan
akan ditampilkan pesan kesalahan seperti terlihat pada gambar berikut :
Gambar 4.20 : Pengujian pada halaman login
Berikut listing program dari pengujian diatas :
Private Sub cmdok_Click()
Call BukaDB
Snama = txtusername.Text
Spassword = txtpassword.Text
Set rs = New ADODB.Recordset
rs.Open
"select
*
from
login",
conn,
adOpenDynamic,
adLockOptimistic
Hnama = rs!UserName
Hpassword = rs!Password
If Hnama = Snama And Hpassword = Spassword Then
Me.Hide
menu.Show
Else
MsgBox
"Access
Error...Please
vbOKOnly + vbCritical, "Security Login"
enter
correct
password!",
53
txtusername.Text = ""
txtpassword.Text = ""
txtusername.SetFocus
End If
End Sub
2. Data Master Buku
Pengujian
dilakukan
untuk
mengetahui
apakah
fungsi
pencarian ke dalam database dapat berfungsi dengan baik. Berikut
merupakan hasil pengujian terhadap proses manipulasi data buku.
a. Data belum lengkap
Gambar 4.21 : Pengujian penyimpanan
Peringatan tersebut akan ditampilkan jika admin mengisi data
belum lengkap kemudian melakukan penyimpanan.
Listing program padakesalahan diatas adalah :
54
Private Sub CmdInput_Click()
If CmdInput.Caption = "&Input" Then
CmdInput.Caption = "&Simpan"
CmdEdit.Enabled = False
CmdHapus.Enabled = False
CmdTutup.Caption = "&Batal"
SiapIsi
KosongkanText
TxtNomor.Enabled = True
TxtNomor.SetFocus
Else
If TxtNomor = "" Or TxtJudul = "" Or TxtPengarang = "" Or
TxtPenerbit = "" Or txttahun = "" Or deskripsi = "" Then
MsgBox "Data Belum Lengkap...!"
Else
Dim SQLTambah As String
SQLTambah
=
"Insert
Into
Buku
(kode_buku,judul,anak_judul,
pengarang,pengarang_tambahan,penerbit,tempat_terbit,tahun_terbit,
cetakan, no_kelas, deskripsi, penempatan, isbn) values ('" &
TxtNomor & "','" & TxtJudul & "','" & anak_judul & "','" &
TxtPengarang & "','" & pengarang_tambahan & "','" & TxtPenerbit
& "','" & Txtkota & "','" & txttahun & "','" & cetakan & "','" & kelas
& "','" & deskripsi & "','" & penempatan & "','" & isbn & "')"
conn.Execute SQLTambah
Call cmdrefresh_click
KondisiAwal
End If
End If
End Sub
55
b. Buku tidak ditemukan
Gambar 4.22 : Pengujian pencarian data
Peringatan diatas akan tampil jika data tidak ditemukan saat
user melakukan pencarian data untuk dilakukan edit atau hapus data.
Untuk melakukan pencarian data, digunakan kode buku sebagai
kunci pencarian. Jika data yang dicari ditemukan maka akan
ditampilkan, dan jika tidak ditemukan maka akan ditampilkan pesan
kesalahan seperti terlihat pada gambar diatas.
Berikut listing program pencarian data:
If CmdEdit.Caption = "&Simpan" Then
56
Call CariData
If Not RSBuku.EOF Then
TampilkanData
TxtNomor.Enabled = False
TxtJudul.SetFocus
Else
MsgBox "Kode Buku Tidak Ada"
TxtNomor = ""
TxtNomor.SetFocus
End If
End If
c. Konfirmasi hapus data
Gambar 4.23 : Pengujian penghapusan data
57
Sebelum admin benar-benar melakukan penghapusan data,
maka sistem akan memberikan konfirmasi penghapusan data. Jika
benar data ingin dihapus maka pilih “Yes” dan jika tidak pilih “No”.
Berikut listing program pesan penghapusan data diatas:
If CmdHapus.Enabled = True Then
Call CariData
If Not RSBuku.EOF Then
TampilkanData
Pesan = MsgBox("Yakin akan dihapus", vbYesNo)
If Pesan = vbYes Then
Dim SQLHapus As String
SQLHapus = "Delete From Buku where kode_buku= '"
& TxtNomor & "'"
conn.Execute SQLHapus
Call cmdrefresh_click
KondisiAwal
Else
KondisiAwal
CmdHapus.SetFocus
End If
Else
MsgBox "Data Tidak ditemukan"
TxtNomor.SetFocus
End If
End If
End If
d. Input data kembar
Jika user memasukkan data yang sama dengan yang tersimpan
di dalam database, maka sistem akan memberikan konfirmasi
kesalahan bahwa “Data sudah ada”, seperti terlihat pada gambar
berikut :
58
Gambar 4.24 : Pengujian input data kembar
Listing program pengujian diatas sebagai berikut :
If CmdInput.Caption = "&Simpan" Then
Call CariData
If Not RSBuku.EOF Then
TampilkanData
MsgBox "Kode Buku Sudah Ada"
KosongkanText
TxtNomor.SetFocus
Else
TxtJudul.SetFocus
End If
End If
59
e. Input kode buku
Jika user salah memasukkan kode buku maka akan
ditampilkan pesan kesalahan seperti terlihat pada gambar berikut :
Gambar 4.25 : Pengujian pengisian kode buku
Listing program pada pesan kesalahan diatas adalah:
KeyAscii = Asc(UCase(Chr(KeyAscii)))
If KeyAscii = 13 Then
If Len(TxtNomor) < 12 Then
MsgBox "Kode Harus 12 Digit"
60
TxtNomor.SetFocus
Else
TxtJudul.SetFocus
End If
4.5.8 Pengujian Data Mining
Pengujian dilakukan pada pencarian berdasarkan deskripsi
buku, dengan menggunakan metode Naive Bayes Classifier.
Pencarian data berdasarkan deskripsi buku akan dapat menentukan
judul buku dan detail informasi tentang buku sesuai dengan keyword
yang dimasukkan oleh user.
Berikut hasil tampilan pengujian dengan memasukkan kata
“agama” dalam kolom deskripsi.
Gambar 4.26 : Pengujian data mining
61
Berdasarkan keyword yang dimasukkan user, yakni kata
“agama” maka ditemukan dua judul buku yang didalam diskripsinya
terdapat kata agama. Untuk melihat detail informasi buku, maka user
dapat memilih kode buku kemudian teka “enter” sehingga akan
ditampilkan informasi mengenai data buku yang dicari.
BAB V
PENUTUP
5.1
Kesimpulan
Kesimpulan yang dapat diambil dari penelitian ini antara lain :
1.
Aplikasi data mining ini dapat digunakan untuk menampilkan informasi
mengani judul buku serta detail penempatan buku serta informasi buku
lainnya.
2.
Keyword yang digunakan untuk pencarian data berdasarkan beberapa
pilihan kunci yakni, berdasarkan judul buku, pengarang buku, deskripsi
buku serta kategori buku.
3.
Hasil proses data mining ini dapat mempercepat pencarian buku bagi
pengguna Perpustakaan Daerah Wilayah Jawa Tengah walaupun tidak
mengetahui judul buku yang ingin dicari.
5.2
Saran
Untuk pengembangan aplikasi data mining lebih lanjut, dapat
dikembangkan lagi untuk pencarian data buku yang dipinjam atau
mengembangkan aplikasi data mining dengan algoritma lain misalkan
algoritma FP-Growth. Perbedaannya adalah algoritma apriori harus
melakukan scan database setiap kali iterasi, sedangkan algoritma FPGrowth hanya melakukan satu kali scan database.
62
DAFTAR PUSTAKA
[1]. Abdul Kadir, 2003, Basis Data, Andi Offset, Yogyakarta.
[2]. Al-Bahra bin Ladjamudin B, Analisis dan Desain Sistem Informasi, Graha Ilmu,
Yogyakarta.
[3]. Budi Sutedjo Dharma Oetomo, 2002, Perencanaan dan Pembangunan Sistem
Informasi, Andi Offset, Yogyakarta.
[4]. Bunafit Nugroho, 2005, Database Relational dengan MySql, Graha Ilmu,
Yogyakarta.
[5]. Jogiyanto, 2005, Analisis dan Desain Sistem Informasi, Andi Offset, Yogyakarta.
[6]. Turban, E., J. E. Aronson, dan T. Liang. 2005. Sistem Pendukung Keputusan dan
Sistem Cerdas, Andi Offset, Jogyakarta.
[7]. Janner Simarmata. 2007. Perancangan Basis Data, Andi Offset, Yogyakarta.
[8]. Fatansyah, 2004. Basis Data, Informatika, Bandung.
[9]. Rahmat Firdaus, 2009, Manajemen Perkreditan, ALFABETA, Ikapi.
63
Download