Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016 ISSN 2502-6968 (Media Cetak) PENERAPAN DATA MINING UNTUK MENGOLAH DATA PADA PERPUSTAKAAN SMA NEGERI 2 LUBUK PAKAM Wulandari Mahasiswa Program Studi Teknik Informatika STMIK Budi Darma Medan Jl.Sisingamangaraja No.338 Simpang Limun Medan www.stmik-budidarma.ac.id//Email:[email protected] ABSTRAK Algoritma adalah urutan langkah logis tertentu untuk memecahkan suatu masalah. Yang ditekankan adalah urutan langkah logis, yang berarti algoritma harus mengikuti suatu urutan tertentu, tidak boleh melompat-lompat. Pelaksanaan algoritma adalah komputer. Manusia dan komputer berkomunikasi dengan cara manusia memberikan perintah-perintah kepada komputer berupa instruksi-instruksi yang disebut program. Alat yang digunakan untuk membuat program tersebut adalah bahasa pemrograman. Bahasa pemrograman sangat bermacam-macam : c, c++, pascal, java, c#, basic, perl, PHP, ASP, JSP, J#, J++, dan masih banyak lagi bahasa lainnya. dari berbagai bahasa pemrograman cara memberikan instruksinya berbeda-beda namun bertujuan menghasilkan output yang sama.Kemajuan teknologi dalam media penyimpanan data, memungkinkan pengumpulan dan penyimpanan data dalam jumlah yang besar dapat dilakukan denagn cepat dan mudah. Alat dan teknik analisa data secara manual tidak dapat lagi digunakan secara optimal dalam mengekstrak informasi untuk jumlah data yang besar. Sehingga diperlukan sebuah teknik baru yang dapat menjawab atas kebutuhan tersebut. Data mining merupakan salah satu teknik yang dapat digunakan karena telah menggabungkan teknik klasik dengan algoritma yang canggih seperti teknik Artificial Intelligent untuk memproses data dalam skala besar.Data mining adalah proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data dengan menggunakan teknik atau metode tertentu. Data mining merupakan ilmu baru yang berakar dari berbagai bidang ilmu seperti kecerdasan buatan (artificial intelligent), mesin learning, statistic dan database. Kata Kunci : Perpustakaan, Data Mining, Association Rules 1. Pendahuluan 1.1 Latar Belakang Masalah Kebutuhan informasi yang luas kadang tidak diimbangi dengan penyajian informasi yang memadai. Sering kali informasi tersebut masih harus digali ulang dari data yang jumlahnya sangat besar. Kemampuan teknologi informasi untuk mengumpulkan dan menyimpan berbagai tipe data jauh meninggalkan kemampuan untuk menganalisis, meringkas dan mengekstrak pengetahuan dari data. Metode tradisional untuk menganalisis data yang ada, tidak dapat menangani data dalam jumlah besar. Pemanfaatan data yang ada di dalam sistem informasi untuk menunjang kegiatan pengambilan keputusan, tidak cukup hanya mengandalkan data operasional saja, diperlukan suatu analisis data untuk menggali potensi-potensi informasi yang ada. Para pengambil keputusan berusaha untuk memanfaatkan gudang data yang sudah dimiliki untuk menggali informasi yang berguna membantu mengambil keputusan. Hal ini mendorong munculnya cabang ilmu untuk mengatasi masalah penggalian informasi atau pola yang penting atau menarik dari data dalam jumlah besar, yang disebut dengan Data Mining. Penggunaan teknik data mining diharapkan dapat memberikan pengetahuan-pengetahuan yang sebelumnya tersembunyi di dalam gudang data sehingga menjadi informasi yang berharga. Di SMA Negeri 2 Lubuk Pakam, sebagai sekolah RSBI (Rintisan Sekolah Berstandar Internasional) dilengkapi dengan fasilitas berupa perpustakaan. Perpustakaan ini memiliki koleksi buku yang cukup banyak dari mulai buku pelajaran sampai buku-buku ensiklopedi. Pengunjung perpustakaan pun cukup banyak. Setiap akhir semester diberikan penghargaan kepada siswa-siswa yang paling sering mengunjungi perpustakaan. Akan tetapi, seiring dengan makin banyaknya pengunjung di perpustakaan tersebut, tidak diikuti dengan jumlah buku yang sesuai. Jumlah buku tidak sesuai dengan jumlah siswa yang meminjam buku. Sehingga sering kali jika siswa ingin meminjam buku, memerlukan waktu yang cukup lama karena harus menunggu buku dikembalikan oleh siswa yang lain. Dengan diterapakannya data mining ini diharapkan pihak sekolah dapat menyesuaikan jumlah buku dengan jumlah peminjam, terutama buku-buku yang paling banyak dipinjam oleh siswa. Penerapan Data Mining Untuk Mengolah Data Pada Perpustakaan SMA Negeri 2 Lubuk Pakam. Oleh : Wulandari 157 Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016 1.2 Perumusan Masalah Adapun permasalahan yang akan dibahas dalam penelitian ini adalah : 1. Bagaimana mengumpulkan dan mengelompokkan data-data buku di perpustakaan SMA Negeri 2 Lubuk Pakam? 2. Bagaimana menentukan urgensi buku pada mata pelajaran kelas? 3. Bagaimana menerapkan data mining untuk mengolah data buku di SMA Negeri 2 Lubuk Pakam? 1.3 Batasan Masalah Pada penulisan skripsi ini penulis membatasi permasalahan sebagai berikut : 1. Data buku dikelompokkan berdasarkan pengarang dan judul buku. 2. Buku yang banyak dipinjam siswa adalah bukubuku mata pelajaran kelas. 3. Data buku diolah dengan menggunakan metode Association Rules. 1.4 Tujuan dan Manfaat Penelitian 1.4.1 Tujuan Penelitian Tujuan yang ingin dicapai dalam pembuatan skripsi ini adalah : 1. Untuk mengumpulkan dan mengelompokkan data-data buku di perpustakaan SMA Negeri 2 Lubuk Pakam? 2. Untuk menentukan urgensi buku pada mata pelajaran kelas? 3. Untuk menerapkan data mining untuk mengolah data buku di SMA Negeri 2 Lubuk Pakam. 1.4.2 Manfaat Penelitian Adapun manfaat yang didapat dari penulisan skripsi ini adalah : 1. Dapat mengetahui stok buku yang tersedia di sekolah SMA Negeri 2 Lubuk Pakam. 2. Dapat mengetahui buku mana yang paling banyak dipinjam oleh siswa. 3. Dapat menyesuaikan stok buku sesuai dengan tingkat keseringan buku-buku tersebut dipinjam. 2. Landasan Teori 2.1 Data Warehouse Data warehouse adalah sebuah sistem yang mengambil dan menggabungkan data secara periodik dari sistem sumber data ke penyimpanan data bentuk dimensional atau normal (Reinardi, 2008). Data warehouse merupakan penyimpanan data dalam bentuk nonvolatile sebagai pendukung manajemen dalam proses pengambilan keputusan (Han, 2006). Data warehouse menyatukan dan menggabungkan data dalam bentuk multidimensi. Pembangunan data ISSN 2502-6968 (Media Cetak) warehouse meliputi pembersihan data, penyatuan data dan transformasi data dan dapat dilihat sebagai praproses yang penting untuk digunakan dalam data mining. Selain itu data warehouse mendukung Online Analitycal Processing (OLAP), yang digunakan untuk menganalisis secara interaktif dari bentuk multidimensi yang mempunyai data yang rinci. Sehingga dapat memfasilitasi secara efektif data generalization dan data mining. Banyak metodemetode data mining yang lain seperti asosiasi, klasifikasi, prediksi, dan clustering, dapat diintegrasikan dengan operasi OLAP untuk meningkatkan proses mining yang interaktif dari beberapa level dari abstraksi. Oleh karena itu data warehouse menjadi platform yang penting untuk data analisis dan OLAP untuk dapat menyediakan platform yang efektif untuk proses data mining. Empat karakteristik dari data warehouse meliputi : 1. Subject oriented : sebuah data warehouse disusun dalam subject utama, seperti pelanggan, supplier, produk, dan sales. Meskipun data warehouse terkonsentrasi pada operasi harian dan proses transaksi dalam perusahaan, data warehouse fokus pada pemodelan dan analisis data untuk pembuat keputusan. Oleh karena itu data warehouse mempunyai karakter menyediakan secara singkat dan sederhana gambaran seputar objek lebih detail yang dibuat dari data luar yang tidak berguna dalam proses pendukung keputusan. 2. Integrated : data warehouse biasanya dibangun dari bermacam-macam sumber yang berbeda, seperti database relational, flat files, dan on-line transaction records. Pembersihan dan penyatuan data diterapkan untuk menjamin konsistensi dalam penamaan, struktur 15 kode, ukuran atribut, dan yang lainnya. 3. Time variant : data disimpan untuk menyajikan informasi dari sudut pandang masa lampau (misal 5-10 tahun yang lalu). Setiap struktur kunci dalam data warehouse mempunyai elemen waktu baik secara implisit maupun eksplisit. 4. Nonvolatile : sebuah data warehouse secara fisik selalu disimpan terpisah dari data aplikasi operasional. Penyimpanan yang terpisah ini, data warehouse tidak memerlukan proses transaksi, recovery dan mekanisme pengendalian konkurensi. Biasanya hanya membutuhkan dua operasi dalam akses data yaitu initial load of data dan access of data. Dari pengertian tersebut, sebuah data warehouse merupakan penyimpanan data tetap sebagai implementasi fisik dari pendukung keputusan model data. Data warehouse juga biasanya dilihat sebagai arsitektur, pembangunan dan penyatuan data dari bermacam-macam sumber data yang berbeda Penerapan Data Mining Untuk Mengolah Data Pada Perpustakaan SMA Negeri 2 Lubuk Pakam. Oleh : Wulandari 157 Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016 untuk mendukung struktur dan atau query tertentu, laporan analisis, dan pembuatan keputusan. Extract, Transform, dan Load (ETL) merupakan sebuah sistem yang dapat membaca data dari suatu data store, merubah bentuk data, dan menyimpan ke data store yang lain. Data store yang dibaca ETL disebut data source, sedangkan data store yang disimpan ETL disebut target. Proses pengubahan data digunakan agar data sesuai dengan format dan kriteria, atau sebagai validasi data dari source system. Proses ETL tidak hanya menyimpan data ke data warehouse, tetapi juga digunakan untuk berbagai proses pemindahan data. Kebanyakan ETL mempunyai mekanisme untuk membersihkan data dari source system sebelum disimpan ke warehouse. Pembersihan data merupakan proses identifikasi dan koreksi data yang kotor. Proses pembersihan ini menerapkan aturan-aturan tertentu yang mendefinisikan data bersih. Berdasarkan siapa yang memindahkan data, ETL dapat dibedakan menjadi empat : 1. Proses ETL menarik data keluar dengan query tertentu di source system database secara periodik. 2. Triggers pada source system pendorong data keluar. Triggers adalah suatu SQL statement yang dijalankan setiap ada perintah insert, update, atau delete dalam tabel. 3. Penjadwalan proses dalam source system untuk mengekspor data secara periodik. Hal ini mirip dengan proses yang pertama namun query disimpan dalam data source. 4. Sebuah log reader yang bertugas membaca log dalam source system untuk mengidentifikasi perubahan data. Log reader merupakan program yang membaca log file. Setelah dibaca, kemudian data dipindahkan ke luar ke tempat penyimpanan yang lain. Berdasarkan di mana proses pembangkitan ETL, ETL dibedakan menjadi tiga macam : 1. ETL dijalankan dalam server terpisah di antara source system dan data warehouse system. Pendekatan ini menghasilkan kinerja tinggi, ETL berjalan sendiri, sehingga tidak menggunakan sumber daya dari data warehouse server atau data source server. Namun hal ini lebih mahal karena harus menambah server lagi. 2. ETL dijalankan dalam data warehouse server. Pendekatan ini dapat digunakan jika mempunyai kapasitas lebih dalam data warehouse server atau jika mempunyai idle time ketika data warehouse tidak digunakan (misal pada waktu malam). Pendekatan ini lebih murah dibandingkan pendekatan pertama karena tidak membutuhkan tambahan server. ISSN 2502-6968 (Media Cetak) 3. ETL dijalankan pada server data source. Pendekatan ini diimplementasikan ketika membutuhkan real time data warehousing. Dengan kata lain, jika data dalam source system berubah, perubahan ini dilakukan juga ke dalam data warehouse. Hal ini dapat dilakukan dengan menggunakan trigger dalam source system. Tidak semua data warehouse mempunyai komponen lengkap seperti mekanisme kualitas data, database multidimensi, aplikasi analisis, apliksi pengguna, control system, audit system, dan metadata. Dalam hal ini, data warehouse hanya mempunyai sebuah ETL dan sebuah data store. Source system bukan merupakan bagian dari data warehouse system. Hal ini merupakan minimum dari sebuah data warehouse. Jika satu komponen diambil sudah bukan merupakan data warehouse lagi. 3.Analisa Dan Perancangan 3.1 Analisa Data Mining Berikut ini adalah contoh transaksi peminjaman buku pada perpustakaan SMA Negeri 1 Lubuk Pakam. Hal ini dimaksudkan untuk memberikan gambaran bagaimana melakukan data mining data sehingga menghasilkan aturan asosiasi. Tabel 4.1 Tabel Transaksi Peminjaman Buku N o Nama 1 AYU WANDRA Biologi X 2 ARYA KAMANDA KA 3 BIMA ARYA 4 KHAIRUNN ISA Bahasa Inggris X Bahasa Inggris X Bahasa Indone sia X 5 SATRIA WALJUKA Biologi X 6 GLADYS AMELIA Fisika X 7 HARYA ADITYA 8 HENI PASARIBU Buku Yang Di Pinjam Bahasa Inggris X Bahasa Inggris X Penerapan Data Mining Untuk Mengolah Data Pada Perpustakaan SMA Negeri 2 Lubuk Pakam. Oleh : Wulandari Kamus b. Inggris Kamus b. Inggris Kamus b. Inggris Bahasa Inggris X Kehidup an Bakteri Kumpul an Rumus Fisika Kamus b. Inggris Kamus b. Inggris Fisika X Hello Magazin e Menana m Jamur Kehidup an Bakteri Hello Magazin e Menana m Jamur Jakarta Post Hello Magazin e 158 Jurnal Ilmiah INFOTEK, Vol 1, No 1, Februari 2016 9 JENNY Biologi X 1 0 FANDY APRIANTO Fisika X 1 1 GAMAL FUAD 1 2 RIZA ANANDA Kimia X Bahasa Inggris 33 X 1 3 FACHRY HASIHOLA N Fisika X Kehidup an Materi Kumpul an Rumus Fisika Biolodi X kamus b. inggris Kumpul an Rumus Fisika 1 4 HERU APRIANDI Fisika X Kimia X 1 5 NANA ZAIRINA Bahasa Inggris X Kimia X No Field Name Size Kamus b. Inggris Data Type 1. Kode_buku Int 8 2. Judul_buku Varchar 50 Fisika X 3 Pengarang Varchar 40 Hello Magazin e 4 Penerbit Varchar 50 5 Tahun_terbit Varchar 4 Kamus b. Inggris 6 Kode_rak Int 8 7 Jumlah_buku Int 4 Kumpul an Rumus Fisika Kamus b. Inggris 3.2.1Tabel Database Perancangan tabel atau desain file untuk menyampaikan data-data yang dapat diinputkan oleh program aplikasi nantinya. Dalam perancangan database dibentuk suatu file dan file tersebut akan saling berhubungan satu sama lainnya dan dapat digunakan sesuai kebutuhan. Tabel 4.10 Tabel Rak 1. 2. Field Name Kode_rak Nama_rak Data Type Int Varchar Size 8 50 Tabel 4.11 Tabel Buku Jakarta Post 3.2 Usulan Sistem yang Baru Sistem yang diusulkan merupakan perubahan dari sistem komputer yang sangat sederhana menjadi sistem informasi komputerisasi, sehingga informasi yang dihasilkan menjadi lebih baik. Sistem yang diusulkan ini dirancang untuk mengatasi kekurangankekurangan yang ada serta mengatasi keterlambatan informasi yang dihasilkan. No ISSN 2502-6968 (Media Cetak) Keterangan Primery key Keterangan Primery key 4.Kesimpulan Dan Saran 4.1 Kesimpulan Berdasarkan hasil pembahasan yang telah dilakukan sebelumnya, maka dapat disimpulkan bahwa : 1. Bahwa mengumpulkan dan mengelompokkan data-data buku di perpustakaan SMA Negeri 2 Lubuk Pakam 2. Bahwa menentukan urgensi buku pada mata pelajaran kelas 3. Bahwa menerapkan data mining untuk mengolah data buku di SMA Negeri 2 Lubuk Pakam. 4.2 Saran Adanya saran-saran yang dikemukakan adalah sebagai berikut. 1. Diharapkan pihak sekolah mengetahui stok buku yang tersedia di sekolah SMA Negeri 2 Lubuk Pakam. 2. Diharapkan pihak sekolah mengetahui buku mana yang paling banyak dipinjam oleh siswa. 3. Diharapkan pihak sekolah menyesuaikan stok buku sesuai dengan tingkat keseringan bukubuku tersebut dipinjam. Daftar Pustaka 1. Jogiyanto H.M (1999). Analisa dan Desain.Yogyakarta : Andi Offset 2. Sani Susanto dan Dedy Suryadi (2000).Pengantar Data Mining.Yogyakarta : Penerbit Andi Yogyakarta 3. Santoso, Budi(2007).”Data Mining Teknik Pemanfaatan Data Untuk Keperluan Bisnis”, Yogyakarta : Graha Ilmu. 4. eric.univ-Iyon2.fr/-ricco/Tanagra/en/Tanagra.html 5. http://jurnal.unair.ac.id/filesPDF/PERPUSTAKA AN%20DIGITAL.pdf Penerapan Data Mining Untuk Mengolah Data Pada Perpustakaan SMA Negeri 2 Lubuk Pakam. Oleh : Wulandari 159