BAB I PENDAHULUAN 1.1. Latar Belakang Perpustakaan daerah merupakan unit kerja sebagai tempat untuk mengatur mengelola menyimpan dan mengumpulkan koleksi bahan pustaka seperti buku yang dapat digunakan untuk sumber informasi pendidikan. Pendidikan mempunyai peranan yang penting bagi manusia, dengan demikian pendidikan yang berkualitas meningkatkan kecerdasan suatu bangsa dan merupakan proses pembangunan nasional yang dapat meningkatkan pertumbuhan ekonomi suatu negara. Dengan mendorong manusia untuk lebih kualitas maka diperlukan beberapa sumber, salah satu sumber yang paling banyak digunakan yaitu buku dan komputer. Komputer merupakan suatu sistem elektronik yang dapat memanipulasi data dengan cepat dan tepat serta dirancang dan di organisasikan secara otomatis menerima dan menyimpan data input, memprosesnya dan menghasilkan output berdasarkan intruksi-intruksi yang sudah tersimpan didalam sebuah memory. Pada perpustakaan Kunci Ilmu Kendal pengelolaan data dilakukan secara konvensional mulai dari pengumpulan, pencatatan, seleksi, penyimpanan. Kendala yang dihadapi adalah kesulitan mencari data dan mendapatkan informasi dari perpustakaan. Hal ini dapat menyita waktu pada saat pencarian informasi. Misal dengan mencari data peminjam, seorang pustakawan membutuhkan waktu yang cukup lama untuk membuka daftar buku peminjaman dalam rak buku yang sudah ada dalam perpustakaan terlebih dahulu, kemudian mencari data peminjaman, dan menyesuaikan buku yang ditulis, dan menghitung batas waktu peminjaman. Bila peminjam mengembalikan buku telat maka dikenakan denda yang sudah ditentukan, kemudian pustakawan menghitung denda yang harus dibayar oleh peminjam. TF (Term Frequency) banyak digunakan ketika banyak kata yang muncul pada sebuah dokumen, sedangkan IDF ( Inverse Document Frequency) banyak digunakan ketika dokumen mengandung kata. Penulis memilih menggunakan TF-IDF karena memudahkan pengelompokkan dokumen yang mengandung kata dalam mencari kunci-kunci ketika mencari suatu dokumen agar lebih cepat dan praktis. Pada penelitian sebelumnya terdapat cara dan metode yang dapat digunakan untuk klasterisasi. Penelitian yang menjadi acuan penulis adalah klasterisasi untuk pencarian buku referensi dengan menggunakan metode KMeans yang telah dilakukan Deka Dwinavinta Candra Nugraha, Zumrotun Naimah, Makhfuzi Fahmi, dan Novi Setiani meneliti tentang pengunjung yang sulit mendapatkan buku referensi sesuai dengan kebutuhan, Karena kurangnya fasilitas yang dapat mengklasterisasi buku-buku sesuai dengan kategori dengan menggunakan teknik clustering yang merupakan teknik pengelompokan sejumlah data/obyek ke dalam cluster (group) sehingga dalam setiap cluster akan berisi data yang semirip mungkin. Teknik clustering ini menerapkan pada Perpustakaan Pusat Universitas Islam Indonesia yang akan mengelompokan judul buku sesuai dengan kategorinya. Buku-buku yang memiliki cluster yang sama akan digunakan sebagai bahan untuk analisis dalam pengambilan keputusan bertujuan untuk mempermudah pustakawan (petugas perpustakaan) dalam pengelolaan peletakan buku yang diminati dan merancang strategi dalam meningkatkan minat baca mahasiswa. Sebuah buku dapat dikelompokan ke dalam kategori tertentu berdasarkan kata-kata yang terkandung pada judul buku. Penelitian ini bertujuan untuk membuat aplikasi klasterisasi dan pencarian buku supaya lebih mudah dan akurat. Aplikasi ini dibangun menggunakan bahsa pemrograman PHP, database MySQL, dan menggunakan metode K-Means. Kategori buku yang digunakan ada enam, Agama, Bahasa, Kesenian,Olah Raga, Sejarah Umum, Anak-anak. Dengan enam kategori dihasilkan sebuah aplikasi klasterisasi dan pencarian dengan penerapan metode K-means untuk pengelompokan pengguna pada Bapersip Provinsi Jawa Timur. Dalam tugas akhir ini algoritma K-Means adalah algoritma klasterisasi yang cocok dengan pengklasterisasian. Metode yang dilakukan dengan konsep probabilitas adalah K-Means. Diharapkan dengan tugas akhir ini, dapat mengklasteringkan berbagai macam kategori perpustakaan dengan baik dan mendapatkan beberapa kelompok yang tepat sesuai dengan kategori yang dimilikinya. Setelah diklasteringkan menjadi beberapa kelompok yang sesuai, akan diterapkan suatu pengkatagorian terhadap kelompok buku. Hasil dari pengkatagorian dapat mengetahui jenis buku dan dapat mudah ditemukan dalam perpustakaan. Dengan adanya solusi tersebut diharapkan membantu pembaca menemukan dokumen yang sesuai kategori yang dicari di Perpustakaan Kunci Ilmu Kendal. Dari latar belakang diatas maka diajukan judul tugas akhir dengan judul “Pengelompokan Dokumen dengan Algoritma Naive Bayes pada Perpustakaan Kunci Ilmu Kendal”. 1.2. Perumusan Masalah Dilihat dari uraian diatas dalam pengelompokan dokumen masih belum optimal pada Perpustakaan Kunci Ilmu Kendal. Sehingga karyawan masih merasa kesulitan untuk pencarian dokumen. Berdasarkan latar belakang diatas maka perumusan masalah yaitu : Bagaimana performa K-Means dalam sering terjadinya kesalahan dalam sirkulasi peminjaman buku karena data-data yang belum terdokumentasi dengan baik. 1.3. Batasan Masalah Adapun batasan masalah dalam laporan tugas akhir antara lain sebagai berikut : 1. Menggunakan text document. 2. Menggunakan metode K-Means untuk penerapan sistem temu kembali. 3. Pemrograman menggunakan Visual Basic 6.0, database MySQL. 4. Sistem menggunakan algoritma term frequency-inverce document frequency (TF-IDF). 5. Data yang di pakai tahun 2014-2015. 6. Katagori yang digunakan yaitu : Agama, Bahasa, Kesenian, Olahraga, Sejarah Umum, Anak-anak. 1.4. Tujuan Penelitian Tujuan penelitian untuk mengetahui performa K-Means dalam mengurangi terjadinya kesalahan peminjaman dan pengambilan buku. 1.5. Manfaat Penelitian Manfaat penelitian diharapkan bermanfaat untuk pihak, beberapa pihak yang terkait yaitu : Mahasiswa a. Untuk memenuhi persyaratan dalam menyelesaikan program studi Teknik Informatika S-1 pada Fakultas Ilmu Komputer Universitas Dian Nuswantoro. b. Untuk menambah wawasan dalam penggunaan Algoritma Naive Bayes Classifier untuk pengklasifikasian katagori buku pada Perpustakaan Kunci Ilmu Kendal. Akademik a. Untuk referensi penelitian yang menggunakan Algoritma Naive Bayes Clasifier. b. Untuk bahan pengevaluasi akademik.