penerapan data mining untuk mengolah data pada perpustakaan

advertisement
Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016
ISSN 2502-6968 (Media Cetak)
PENERAPAN DATA MINING UNTUK MENGOLAH DATA PADA
PERPUSTAKAAN SMA NEGERI 2 LUBUK PAKAM
Wulandari
Mahasiswa Program Studi Teknik Informatika STMIK Budi Darma Medan
Jl.Sisingamangaraja No.338 Simpang Limun Medan
www.stmik-budidarma.ac.id//Email:[email protected]
ABSTRAK
Algoritma adalah urutan langkah logis tertentu untuk memecahkan suatu masalah. Yang ditekankan adalah
urutan langkah logis, yang berarti algoritma harus mengikuti suatu urutan tertentu, tidak boleh melompat-lompat.
Pelaksanaan algoritma adalah komputer. Manusia dan komputer berkomunikasi dengan cara manusia memberikan
perintah-perintah kepada komputer berupa instruksi-instruksi yang disebut program. Alat yang digunakan untuk
membuat program tersebut adalah bahasa pemrograman. Bahasa pemrograman sangat bermacam-macam : c, c++,
pascal, java, c#, basic, perl, PHP, ASP, JSP, J#, J++, dan masih banyak lagi bahasa lainnya. dari berbagai bahasa
pemrograman cara memberikan instruksinya berbeda-beda namun bertujuan menghasilkan output yang
sama.Kemajuan teknologi dalam media penyimpanan data, memungkinkan pengumpulan dan penyimpanan data
dalam jumlah yang besar dapat dilakukan denagn cepat dan mudah. Alat dan teknik analisa data secara manual
tidak dapat lagi digunakan secara optimal dalam mengekstrak informasi untuk jumlah data yang besar. Sehingga
diperlukan sebuah teknik baru yang dapat menjawab atas kebutuhan tersebut. Data mining merupakan salah satu
teknik yang dapat digunakan karena telah menggabungkan teknik klasik dengan algoritma yang canggih seperti
teknik Artificial Intelligent untuk memproses data dalam skala besar.Data mining adalah proses untuk menggali
nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data dengan
menggunakan teknik atau metode tertentu. Data mining merupakan ilmu baru yang berakar dari berbagai bidang
ilmu seperti kecerdasan buatan (artificial intelligent), mesin learning, statistic dan database.
Kata Kunci : Perpustakaan, Data Mining, Association Rules
1.
Pendahuluan
1.1 Latar Belakang Masalah
Kebutuhan informasi yang luas kadang tidak
diimbangi dengan penyajian informasi yang
memadai. Sering kali informasi tersebut masih harus
digali ulang dari data yang jumlahnya sangat besar.
Kemampuan
teknologi
informasi
untuk
mengumpulkan dan menyimpan berbagai tipe data
jauh meninggalkan kemampuan untuk menganalisis,
meringkas dan mengekstrak pengetahuan dari data.
Metode tradisional untuk menganalisis data yang ada,
tidak dapat menangani data dalam jumlah besar.
Pemanfaatan data yang ada di dalam sistem
informasi untuk menunjang kegiatan pengambilan
keputusan, tidak cukup hanya mengandalkan data
operasional saja, diperlukan suatu analisis data untuk
menggali potensi-potensi informasi yang ada. Para
pengambil keputusan berusaha untuk memanfaatkan
gudang data yang sudah dimiliki untuk menggali
informasi yang berguna membantu mengambil
keputusan. Hal ini mendorong munculnya cabang
ilmu untuk mengatasi masalah penggalian informasi
atau pola yang penting atau menarik dari data dalam
jumlah besar, yang disebut dengan Data Mining.
Penggunaan teknik data mining diharapkan dapat
memberikan
pengetahuan-pengetahuan
yang
sebelumnya tersembunyi di dalam gudang data
sehingga menjadi informasi yang berharga.
Di SMA Negeri 2 Lubuk Pakam, sebagai
sekolah RSBI (Rintisan Sekolah Berstandar
Internasional) dilengkapi dengan fasilitas berupa
perpustakaan. Perpustakaan ini memiliki koleksi buku
yang cukup banyak dari mulai buku pelajaran sampai
buku-buku ensiklopedi. Pengunjung perpustakaan
pun cukup banyak. Setiap akhir semester diberikan
penghargaan kepada siswa-siswa yang paling sering
mengunjungi perpustakaan.
Akan tetapi, seiring dengan makin banyaknya
pengunjung di perpustakaan tersebut, tidak diikuti
dengan jumlah buku yang sesuai. Jumlah buku tidak
sesuai dengan jumlah siswa yang meminjam buku.
Sehingga sering kali jika siswa ingin meminjam
buku, memerlukan waktu yang cukup lama karena
harus menunggu buku dikembalikan oleh siswa yang
lain. Dengan diterapakannya data mining ini
diharapkan pihak sekolah dapat menyesuaikan jumlah
buku dengan jumlah peminjam, terutama buku-buku
yang paling banyak dipinjam oleh siswa.
Penerapan Data Mining Untuk Mengolah Data Pada Perpustakaan SMA Negeri 2 Lubuk Pakam.
Oleh : Wulandari
157
Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016
1.2 Perumusan Masalah
Adapun permasalahan yang akan dibahas dalam
penelitian ini adalah :
1. Bagaimana mengumpulkan dan mengelompokkan
data-data buku di perpustakaan SMA Negeri 2
Lubuk Pakam?
2. Bagaimana menentukan urgensi buku pada mata
pelajaran kelas?
3. Bagaimana menerapkan data mining untuk
mengolah data buku di SMA Negeri 2 Lubuk
Pakam?
1.3 Batasan Masalah
Pada penulisan skripsi ini penulis
membatasi permasalahan sebagai berikut :
1. Data buku dikelompokkan berdasarkan pengarang
dan judul buku.
2. Buku yang banyak dipinjam siswa adalah bukubuku mata pelajaran kelas.
3. Data buku diolah dengan menggunakan metode
Association Rules.
1.4 Tujuan dan Manfaat Penelitian
1.4.1 Tujuan Penelitian
Tujuan yang ingin dicapai dalam pembuatan
skripsi ini adalah :
1. Untuk mengumpulkan dan mengelompokkan
data-data buku di perpustakaan SMA Negeri 2
Lubuk Pakam?
2. Untuk menentukan urgensi buku pada mata
pelajaran kelas?
3. Untuk menerapkan data mining untuk mengolah
data buku di SMA Negeri 2 Lubuk Pakam.
1.4.2 Manfaat Penelitian
Adapun manfaat yang didapat dari penulisan
skripsi ini adalah :
1. Dapat mengetahui stok buku yang tersedia di
sekolah SMA Negeri 2 Lubuk Pakam.
2. Dapat mengetahui buku mana yang paling
banyak dipinjam oleh siswa.
3. Dapat menyesuaikan stok buku sesuai
dengan tingkat keseringan buku-buku
tersebut dipinjam.
2.
Landasan Teori
2.1 Data Warehouse
Data warehouse adalah sebuah sistem yang
mengambil dan menggabungkan data secara periodik
dari sistem sumber data ke penyimpanan data bentuk
dimensional atau normal (Reinardi, 2008). Data
warehouse merupakan penyimpanan data dalam
bentuk nonvolatile sebagai pendukung manajemen
dalam proses pengambilan keputusan (Han, 2006).
Data warehouse menyatukan dan menggabungkan
data dalam bentuk multidimensi. Pembangunan data
ISSN 2502-6968 (Media Cetak)
warehouse meliputi pembersihan data, penyatuan
data dan transformasi data dan dapat dilihat sebagai
praproses yang penting untuk digunakan dalam data
mining. Selain itu data warehouse mendukung Online Analitycal Processing (OLAP), yang digunakan
untuk menganalisis secara interaktif dari bentuk
multidimensi yang mempunyai data yang rinci.
Sehingga dapat memfasilitasi secara efektif data
generalization dan data mining. Banyak metodemetode data mining yang lain seperti asosiasi,
klasifikasi,
prediksi,
dan
clustering,
dapat
diintegrasikan dengan operasi OLAP untuk
meningkatkan proses mining yang interaktif dari
beberapa level dari abstraksi. Oleh karena itu data
warehouse menjadi platform yang penting untuk data
analisis dan OLAP untuk dapat menyediakan
platform yang efektif untuk proses data mining.
Empat karakteristik dari data warehouse meliputi
:
1. Subject oriented : sebuah data warehouse disusun
dalam subject utama, seperti pelanggan, supplier,
produk, dan sales. Meskipun data warehouse
terkonsentrasi pada operasi harian dan proses
transaksi dalam perusahaan, data warehouse
fokus pada pemodelan dan analisis data untuk
pembuat keputusan. Oleh karena itu data
warehouse mempunyai karakter menyediakan
secara singkat dan sederhana gambaran seputar
objek lebih detail yang dibuat dari data luar yang
tidak berguna dalam proses pendukung keputusan.
2. Integrated : data warehouse biasanya dibangun
dari bermacam-macam sumber yang berbeda,
seperti database relational, flat files, dan on-line
transaction records. Pembersihan dan penyatuan
data diterapkan untuk menjamin konsistensi
dalam penamaan, struktur
15 kode, ukuran atribut,
dan yang lainnya.
3. Time variant : data disimpan untuk menyajikan
informasi dari sudut pandang masa lampau (misal
5-10 tahun yang lalu). Setiap struktur kunci dalam
data warehouse mempunyai elemen waktu baik
secara implisit maupun eksplisit.
4. Nonvolatile : sebuah data warehouse secara fisik
selalu disimpan terpisah dari data aplikasi
operasional. Penyimpanan yang terpisah ini, data
warehouse tidak memerlukan proses transaksi,
recovery
dan
mekanisme
pengendalian
konkurensi. Biasanya hanya membutuhkan dua
operasi dalam akses data yaitu initial load of data
dan access of data.
Dari pengertian tersebut, sebuah data
warehouse merupakan penyimpanan data tetap
sebagai implementasi fisik dari pendukung keputusan
model data. Data warehouse juga biasanya dilihat
sebagai arsitektur, pembangunan dan penyatuan data
dari bermacam-macam sumber data yang berbeda
Penerapan Data Mining Untuk Mengolah Data Pada Perpustakaan SMA Negeri 2 Lubuk Pakam.
Oleh : Wulandari
157
Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016
untuk mendukung struktur dan atau query tertentu,
laporan analisis, dan pembuatan keputusan.
Extract, Transform, dan Load (ETL) merupakan
sebuah sistem yang dapat membaca data dari suatu
data store, merubah bentuk data, dan menyimpan ke
data store yang lain. Data store yang dibaca ETL
disebut data source, sedangkan data store yang
disimpan ETL disebut target. Proses pengubahan data
digunakan agar data sesuai dengan format dan
kriteria, atau sebagai validasi data dari source system.
Proses ETL tidak hanya menyimpan data ke data
warehouse, tetapi juga digunakan untuk berbagai
proses pemindahan data. Kebanyakan ETL
mempunyai mekanisme untuk membersihkan data
dari source system sebelum disimpan ke warehouse.
Pembersihan data merupakan proses identifikasi dan
koreksi data yang kotor. Proses pembersihan ini
menerapkan
aturan-aturan
tertentu
yang
mendefinisikan data bersih.
Berdasarkan siapa yang memindahkan data,
ETL dapat dibedakan menjadi empat :
1. Proses ETL menarik data keluar dengan query
tertentu di source system database secara
periodik.
2. Triggers pada source system pendorong data
keluar. Triggers adalah suatu SQL statement yang
dijalankan setiap ada perintah insert, update, atau
delete dalam tabel.
3. Penjadwalan proses dalam source system untuk
mengekspor data secara periodik. Hal ini mirip
dengan proses yang pertama namun query
disimpan dalam data source.
4. Sebuah log reader yang bertugas membaca log
dalam source system untuk mengidentifikasi
perubahan data. Log reader merupakan program
yang membaca log file. Setelah dibaca, kemudian
data dipindahkan ke luar ke tempat penyimpanan
yang lain.
Berdasarkan di mana proses pembangkitan ETL,
ETL dibedakan menjadi tiga macam :
1. ETL dijalankan dalam server terpisah di antara
source system dan data warehouse system.
Pendekatan ini menghasilkan kinerja tinggi, ETL
berjalan sendiri, sehingga tidak menggunakan
sumber daya dari data warehouse server atau data
source server. Namun hal ini lebih mahal karena
harus menambah server lagi.
2. ETL dijalankan dalam data warehouse server.
Pendekatan ini dapat digunakan jika mempunyai
kapasitas lebih dalam data warehouse server atau
jika mempunyai idle time ketika data warehouse
tidak digunakan (misal pada waktu malam).
Pendekatan ini lebih murah dibandingkan
pendekatan pertama karena tidak membutuhkan
tambahan server.
ISSN 2502-6968 (Media Cetak)
3. ETL dijalankan pada server data source.
Pendekatan
ini
diimplementasikan ketika
membutuhkan real time data warehousing.
Dengan kata lain, jika data dalam source system
berubah, perubahan ini dilakukan juga ke dalam
data warehouse. Hal ini dapat dilakukan dengan
menggunakan trigger dalam source system. Tidak
semua data warehouse mempunyai komponen
lengkap seperti mekanisme kualitas data, database
multidimensi, aplikasi analisis, apliksi pengguna,
control system, audit system, dan metadata. Dalam
hal ini, data warehouse hanya mempunyai sebuah
ETL dan sebuah data store. Source system bukan
merupakan bagian dari data warehouse system.
Hal ini merupakan minimum dari sebuah data
warehouse. Jika satu komponen diambil sudah
bukan merupakan data warehouse lagi.
3.Analisa Dan Perancangan
3.1 Analisa Data Mining
Berikut ini adalah contoh transaksi peminjaman
buku pada perpustakaan SMA Negeri 1 Lubuk
Pakam. Hal ini dimaksudkan untuk memberikan
gambaran bagaimana melakukan data mining data
sehingga menghasilkan aturan asosiasi.
Tabel 4.1 Tabel Transaksi Peminjaman Buku
N
o
Nama
1
AYU
WANDRA
Biologi
X
2
ARYA
KAMANDA
KA
3
BIMA
ARYA
4
KHAIRUNN
ISA
Bahasa
Inggris
X
Bahasa
Inggris
X
Bahasa
Indone
sia X
5
SATRIA
WALJUKA
Biologi
X
6
GLADYS
AMELIA
Fisika
X
7
HARYA
ADITYA
8
HENI
PASARIBU
Buku Yang Di Pinjam
Bahasa
Inggris
X
Bahasa
Inggris
X
Penerapan Data Mining Untuk Mengolah Data Pada Perpustakaan SMA Negeri 2 Lubuk Pakam.
Oleh : Wulandari
Kamus
b.
Inggris
Kamus
b.
Inggris
Kamus
b.
Inggris
Bahasa
Inggris
X
Kehidup
an
Bakteri
Kumpul
an
Rumus
Fisika
Kamus
b.
Inggris
Kamus
b.
Inggris
Fisika X
Hello
Magazin
e
Menana
m Jamur
Kehidup
an
Bakteri
Hello
Magazin
e
Menana
m Jamur
Jakarta
Post
Hello
Magazin
e
158
Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016
9
JENNY
Biologi
X
1
0
FANDY
APRIANTO
Fisika
X
1
1
GAMAL
FUAD
1
2
RIZA
ANANDA
Kimia
X
Bahasa
Inggris
33
X
1
3
FACHRY
HASIHOLA
N
Fisika
X
Kehidup
an
Materi
Kumpul
an
Rumus
Fisika
Biolodi
X
kamus
b.
inggris
Kumpul
an
Rumus
Fisika
1
4
HERU
APRIANDI
Fisika
X
Kimia X
1
5
NANA
ZAIRINA
Bahasa
Inggris
X
Kimia X
No
Field Name
Size
Kamus
b.
Inggris
Data
Type
1.
Kode_buku
Int
8
2.
Judul_buku
Varchar
50
Fisika X
3
Pengarang
Varchar
40
Hello
Magazin
e
4
Penerbit
Varchar
50
5
Tahun_terbit
Varchar
4
Kamus
b.
Inggris
6
Kode_rak
Int
8
7
Jumlah_buku
Int
4
Kumpul
an
Rumus
Fisika
Kamus
b.
Inggris
3.2.1Tabel Database
Perancangan tabel atau desain
file untuk
menyampaikan data-data yang dapat diinputkan oleh
program aplikasi nantinya. Dalam perancangan
database dibentuk suatu file dan file tersebut akan
saling berhubungan satu sama lainnya dan dapat
digunakan sesuai kebutuhan.
Tabel 4.10 Tabel Rak
1.
2.
Field
Name
Kode_rak
Nama_rak
Data
Type
Int
Varchar
Size
8
50
Tabel 4.11 Tabel Buku
Jakarta
Post
3.2 Usulan Sistem yang Baru
Sistem yang diusulkan merupakan perubahan
dari sistem komputer yang sangat sederhana menjadi
sistem informasi komputerisasi, sehingga informasi
yang dihasilkan menjadi lebih baik. Sistem yang
diusulkan ini dirancang untuk mengatasi kekurangankekurangan yang ada serta mengatasi keterlambatan
informasi yang dihasilkan.
No
ISSN 2502-6968 (Media Cetak)
Keterangan
Primery key
Keterangan
Primery key
4.Kesimpulan Dan Saran
4.1 Kesimpulan
Berdasarkan hasil pembahasan yang telah
dilakukan sebelumnya, maka dapat disimpulkan
bahwa :
1. Bahwa mengumpulkan dan mengelompokkan
data-data buku di perpustakaan SMA Negeri 2
Lubuk Pakam
2. Bahwa menentukan urgensi buku pada mata
pelajaran kelas
3. Bahwa menerapkan data mining untuk mengolah
data buku di SMA Negeri 2 Lubuk Pakam.
4.2 Saran
Adanya saran-saran yang dikemukakan adalah
sebagai berikut.
1. Diharapkan pihak sekolah mengetahui stok buku
yang tersedia di sekolah SMA Negeri 2 Lubuk
Pakam.
2. Diharapkan pihak sekolah mengetahui buku
mana yang paling banyak dipinjam oleh siswa.
3. Diharapkan pihak sekolah menyesuaikan stok
buku sesuai dengan tingkat keseringan bukubuku tersebut dipinjam.
Daftar Pustaka
1. Jogiyanto
H.M
(1999).
Analisa
dan
Desain.Yogyakarta : Andi Offset
2. Sani Susanto dan Dedy Suryadi (2000).Pengantar
Data Mining.Yogyakarta : Penerbit Andi
Yogyakarta
3. Santoso, Budi(2007).”Data Mining Teknik
Pemanfaatan Data Untuk Keperluan Bisnis”,
Yogyakarta : Graha Ilmu.
4. eric.univ-Iyon2.fr/-ricco/Tanagra/en/Tanagra.html
5. http://jurnal.unair.ac.id/filesPDF/PERPUSTAKA
AN%20DIGITAL.pdf
Penerapan Data Mining Untuk Mengolah Data Pada Perpustakaan SMA Negeri 2 Lubuk Pakam.
Oleh : Wulandari
159
Download