PENERAPAN DATA MINING UNTUK MENGETAHUI POLA ASOSIASI ANTARA DATA MAHASISWA DAN TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FOLD-GROWTH Betha Nurina Sari1, Drs.Muh. Arif Rahman M.Kom2, Yusi Tyroni Mursityo,S.Kom,M.S.3 Program Studi Ilmu Komputer, Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Brawijaya Email : [email protected], [email protected], [email protected] Abstrak Setiap tahun Universitas Brawijaya mengadakan penerimaan mahasiswa baru, masingmasing mahasiswa mengumpulkan data lengkap untuk pendataan pendaftaran mahasiswa. Selain itu, pendataan mahasiswa juga dilakukan untuk yang sudah lulus dari Universitas Brawijaya. Dewasa ini belum diketahui tentang pola asosiasi antara data mahasiswa dan data kelulusan mahasiswa. Pola asosiasi ini bisa digunakan untuk memprediksi tingkat kelulusan mahasiswa berdasarkan parameter data mahasiswa yang diteliti. Dalam penelitian ini, pencarian pola asosiasi antara data mahasiswa dan data tingkat kelulusan dilakukan berdasarkan jalur masuk dan program studi dengan menerapkan algoritma FOLD – Growth. Sistem akan mencari aturan asosiasi dengan tahap awal adalah mencari frequent itemset. Pada tahap akhir, association rule akan diuji dalam 3 jenis,yaitu uji pengaruh nilai minimum support dan confidence terhadap jumlah rule, uji lift ratio dan uji akurasi association rule. Perbandingan antara minimum support dan minimum confidence dengan jumlah rule berbanding terbalik. Nilai lift ratio tertinggi adalah 1,657 dari PSB,A2 pada program studi Statistika dan nilai lift ratio terendah sebesar 0,531 dari PSB,B2 pada program studi Ilmu Komputer.Hasil pengujian akurasi assosiation rule menunjukkan tingginya prosentase association rule yang diterapkan pada data uji, sehingga dapat digunakan untuk memprediksi tingkat kelulusan mahasiswa di waktu yang akan datang. Kata kunci: mahasiswa,tingkat kelulusan, pola asosiasi, FOLD-growth, association rule, lift ratio I. PENDAHULUAN Setiap tahun, setiap Universitas mengadakan penerimaan mahasiswa baru, termasuk salah satunya adalah Universitas Brawijaya. Setiap mahasiswa mengumpulkan data lengkap untuk proses registrasi seperti NIM, nama, fakultas, jurusan, program studi, jalur masuk, tempat tanggal lahir, asal sekolah, alamat. Selain pendataan mahasiswa saat registrasi, ada pula pendataan mahasiswa yang sudah lulus dari Universitas Brawijaya, yang dilakukan setelah mahasiswa tersebut menyelesaikan studinya. Dewasa ini belum diketahui tentang pola asosiasi antara data mahasiswa dan data kelulusan mahasiswa. Pola asosiasi antara dua jenis data tersebut dapat menunjukkan apakah ada keterkaitan antara variabel data mahasiswa yang terdiri dari jalur masuk dan program studi, dengan tingkat kelulusan mahasiswa yang bisa dilihat dari lama studi dan IPK. Pola asosiasi ini bisa digunakan sebagai dasar untuk memprediksi tingkat kelulusan mahasiswa. Pencarian pola dari data tersebut sangat erat kaitannya dengan data mining. Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual[1]. Ada sejumlah algoritma untuk menyelesaikan association rule, diantaranya adalah algoritma FOLD-Growth. Algoritma FOLD-Growth merupakan hasil gabungan dari algoritma FOLDARM (Fast Online Dynamic Association Rule Mining) dan FPGrowth (Frequent Pattern Growth) dalam proses penggalian itemset yang frequent [2] .Menurut penelitian yang telah dilakukan sebelumnya, durasi eksekusi, skalabilitas, reliabilitas, dan utilisasi memori dari penerapaan algoritma FOLD-Growth lebih baik daripada FP-Growth[3]. FOLD-Growth menunjukkan performa seratus kali lebih baik daripada FP-Growt [4]. 1 II. TINJAUAN PUSTAKA 2.1 Data Data merupakan representasi dari fakta atau gambaran mengenai suatu objek atau kejadian. Contohnya fakta mengenai biodata mahasiswa yang meliputi nama, alamat, jenis kelamin, agama, dan lain-lain. Data dapat dinyatakan dengan nilai yang berbentuk angka, deretan karakter, atau symbol[5]. 2.1.1 Data Mahasiswa Data mahasiswa yang harus diisi dalam formulir registrasi administrasi meliputi data pribadi mahasiswa, data asal sekolah, data keluarga,dan lain-lain. Data pribadi mahasiswa terdiri dari nama lengkap, tempat lahir, tanggal lahir, jenis kelamin, agama, golongan darah, warga negara, status pernikahan, hobi, alamat asal, alamat di malang, kode pos, nomor telepon, nomor hp, email, jumlah saudara, anak-ke. Data asal sekolah terdiri dari propinsi, kota, sekolah jurusan, tahun lulus, nilai UAN, prestasi akademik dan prestasi non akademik. Data keluarga terdiri dari nama ayah, nama ibu, alamat orangtua, pekerjaan ayah, pekerjaan ibu. 2.1.2 Data Kelulusan Seorang mahasiswa harus mengumpulkan jumlah kredit untuk menyelesaikan studi program sarjana mencapai 144-160 sks, termasuk skripsi. Predikat kelulusan mahasiswa dikategorikan menjadi tiga berdasarkan nilai indeks predikat kelulusan mahasiswa yang diatur dalam pedoman pendidikan,yaitu dapat dilihat pada Tabel 2.1. Tabel 2.1 Predikat Kelulusan Mahasiswa IPK Predikat 2,00 - 2,75 Memuaskan 2,76 - 3,50 Sangat memuaskan 3,51 - 4,00 Dengan pujian (cumlaude) Predikat kelulusan dengan pujian ditentukan juga dengan memperhatikan masa studi maksimum, untuk program sarjana maksimum 5 tahun[6]. 2.2. Data Mining Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual [1]. 2.3 Association Rule Association rule adalah suatu prosedur untuk mencari hubungan antar item dalam suatu data set yang ditentukan. Dalam menentukan suatu association rule, terdapat suatu ukuran kepercayaan yang didapatkan dari hasil pengolahan data dengan perhitungan tertentu. Association rule memberikan informasi dalam bentuk ”if – then” atau ”jika – maka”. Biasanya digunakan istilah antecedent untuk mewakili bagian ”jika” dan consequent untuk mewakili bagian ”maka”[7]. Support adalah suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu itemset dari keseluruhan transaksi[8]. Nilai support 1-itemset dapat diperoleh dari persamaan 2.2 dan nilai 2-itemset dapat diperoleh dari persamaan 2.3. ππ’πππππ‘ π΄ = Jumlah Transaksi yang Mengandung A Total Transaksi (2.2) ππ’πππππ‘ π΄, π΅ = Jumlah Transaksi yang Mengandung A dan B Total Transaksi (2.3) Confidence adalah suatu ukuran yang menunjukkan hubungan antara dua atau lebih item secara conditional[8]. πΆπππππππππ π΄ → π΅ = Jumlah Transaksi yang Mengandung A dan B Jumlah Transaksi yang Mengandung A 2.4 Algoritma FOLD-Growth Algoritma FOLD-Growth merupakan hasil gabungan dari algoritma FOLDARM dan FP-Growth. Pada algoritma FOLD-growth ini, diharapkan dapat menggabungkan keuntungan dari algoritma FOLDARM yang memiliki kinerja cepat pada saat ukuran itemset frequent maksimum (kmax) kecil atau kmax ≤ 10 dengan keuntungan dari algoritma FP-Growth yang memiliki kinerja yang cepat pada saat kmax > 10. Pseudocode dari algoritma FOLD-growth ditunjukkan pada Pseudocode 2.4[3]. Tahapan algoritma FOLD-Growth dibagi menjadi empat tahapan utama[9] yaitu : 2 (2.4) a. Penggalian 1 dan 2-itemset dengan menggunakan SOTrieIT Pada tahap ini, dilakukan pembacaan basis data sebanyak satu kali untuk membaca transaksi-transaksi yang ada dalam basis data. Untuk setiap transaksi akan dibangkitkan semua kemungkinankemungkinan 1-itemset dan 2-itemset yang kemudian dicatat dalam SOTrieIT. b. Pemangkasan item-item yang tidak frequent Dalam tahap ini, akan dilakukan pemangkasan pada setiap transaksi yang ada dalam basis data dengan menggunakan 1-itemset dan 2-itemset. Untuk setiap transaksi T, pada itemset L yang terdapat k dalam transaksi tersebut dimana panjang k lebih dari 2, akan dilakukan pengecekan dengan menggunakan 1-itemset dan 2itemset. Sehingga, untuk item-item yang dianggap tidak frequent akan dilakukan pemangkasan. Sebuah item dikatakan tidak frequent apabila nilai support countnya kurang dari batas minimum support yang telah ditentukan oleh pengguna. Setelah dilakukan pemangkasan terhadap transaksi T, dengan menggunakan 1itemset dan 2-itemset yang didapatkan melalui SOTrieIT, maka akan dihasilkan Ordered Frequent Items yang telah dipangkas. c. Pembangunan FP-tree menggunakan transaksi-transaksi yang telah dipangkas Pada tahapan ini, akan dilakukan pembangunan FP-Tree dengan menggunakan data transaksi T yang telah dipangkas dan diurutkan berdasarkan nilai support count. Dengan perolehan Frequent Items setelah dipangkas dan diurutkan, maka akan dibangun FP-Tree. d. Penggalian itemset frequent dengan algoritma FP-growth. Setelah tahap pembangunan FP-tree selesai, dilanjutkan dengan tahap penggalian itemset frequent dengan menggunakan algoritma FP-growth pada FP-tree tersebut. Himpunan pola asosiasi yang ditemukan berdasarkan basis data transaksi pada tabel 2.1 dan dengan minimum support dan minimum confidence adalah 50% dalam proses penggalian rekursif di atas, dapat dilihat pada Tabel 2.3[3]. 2.8 Lift Ratio Lift ratio digunakan untuk mengevaluasi kuat tidaknya sebuah aturan asosiasi. Lift ratio adalah perbandingan antara confidence sebuah aturan dengan nilai benchmark confidence. Benchmark confidence adalah perbandingan antara jumlah semua item consequent terhadap total jumlah transaksi [7]. Rumus benchmark confidence dan lift ratio dapat dilihat pada persamaan berikut. ππ π΅πππβππππ πΆπππππππππ = (2.6) π Nc = jumlah transaksi dengan item dalam consequent N = jumlah transaksi database πΏπππ‘ π ππ‘ππ = πΆπππππππππ (π΄, πΆ) π΅πππβππππ πΆπππππππππ (π΄, πΆ) (2.7) Apabila nilai lift ratio lebih besar dari 1, maka menunjukkan adanya manfaat dari aturan tersebut. Lebih tinggi nilai lift ratio maka lebih besar kekuatan asosiasinya[7]. Pengujian akurasi association rule yang terbentuk yaitu dengan membandingkan association rule hasil proses data mining pada data latih dengan data hasil pada data uji. Penghitungan akurasi association rule dilakukan dengan menggunakan persamaan 2.8. Error = |π π’πππππ‘ πππ‘π π’ππ −π π’πππππ‘ πππ‘ππππ‘π β | π π’πππππ‘ πππ‘π πππ‘π β π₯ 100% πππ’πππ π = 100% − πππππ III. ANALISIS DAN PERANCANGAN SISTEM Sistem ini merupakan sistem yang dikembangkan untuk melakukan analisa terhadap data registrasi dan kelulusan mahasiswa untuk mengetahui pola dan hubungan keterkaitan antar data. Parameter yang digunakan dalam analisa adalah jalur masuk, program studi, lama studi dan IPK mahasiswa. Dari pola yang dihasilkan kita dapat mengetahui keterkaitan antara data mahasiswa dengan tingkat kelulusannya. Selain itu, dari pola yang dihasilkan tersebut diharapkan dapat memberikan informasi mengenai hubungan data mahasiswa berupa jalur 3 masuk, program studi dengan tingkat kelulusannya. Transformasi data dilakukan pada data tingkat kelulusan mahasiswa. Tingkat kelulusan mahasiswa dapat dilihat dari lama studi dan IPK.Dari dua kategori tersebut dapat dibentuk kategori tingkat kelulusan menjadi enam berdasarkan kombinasi keduanya (Huda, 2010), seperti pada tabel 3.1. start min_sup,min_conf, data mahasiswa dan kelulusan Association Rule (AR) Rule yang dihasilkan Tabel 3.1 Kategori tingkat kelulusan mahasiswa No Kategori Keterangan 1 A1 lama studi kurang dari 4 tahun atau tepat 4 tahun dan IPK 3,51 – 4,00 2 A2 lama studi kurang dari 4 tahun atau tepat 4 tahun dan IPK 2,76 – 3,50 3 A3 lama studi kurang dari 4 tahun atau tepat 4 tahun dan IPK 2,00 – 2,75 4 B1 lama studi lebih dari 4 tahun dan IPK 3,51 – 4,00 5 B2 lama studi lebih dari 4 tahun dan IPK 2,76 – 3,50 6 B3 lama studi lebih dari 4 tahun dan IPK 2,00 – 2,75 Pengujian Rule Rule dan hasil pengujian rule end Proses yang ada di dalam algotima FOLD-Growth ini akan dibagi menjadi 4, yaitu penggalian 1-2 itemset dengan menggunakan struktur data SOTrieIT, pemangkasan item yang tidak frequent, pembangunan FP Tree, dan penggalian itemset frequent. Diagram alir proses dari FOLD-Growth ini dapat dilihat pada Gambar 3.2. Sistem menerima inputan berupa minimun support, minimum confidence, data mahasiswa, dan data kelulusan yang telah disimpan dalam database. Kemudian sistem akan melakukan proses association rule yang menghasilkan aturan asosiasi pada data inputan dan selanjutnya dilakukan pengujian rule. Proses ini merupakan gambaran secara umum sistem, dapat dilihat pada Gambar 3.1. Perhitungan manual dilakukan pada sampel data yang diambil sebanyak 20 data mahasiswa dengan minimum support 4 20% dan minimum confidence 50%. Sampel data yang telah melalui tahap preprocessing data dapat dilihat pada Tabel 3.2 yang menunjukkan sampel data mahasiswa dan data kelulusan. Tabel 3.2 Sampel Data Mahasiswa NIM Jalur Kategori 0410920001 SPMB B2 0410920002 PSB A1 0410920003 SPMB B2 0410920004 PSB B2 0410920006 PSB B2 0410920007 SPMB A2 0410920010 SPMB A1 0410920011 SPMB A2 0410920013 SPMB A2 0410920020 PSB B2 0410920023 SPMB A2 0410920026 PSB B2 0410922001 SAP B3 0410922002 SAP A2 0410923002 SPMK B2 0410923004 SPMK B2 0410923005 SPMK B2 0410923006 SPMK B2 0410923043 SPMK A1 0410923048 SPMK B3 Selanjutnya adalah tahap penggalian 1-2 itemset dengan menggunakan struktur data SOTrieIT. Proses penggalian 1-2 itemset dengan menggunakan struktur data SOTrieIT dapat dilihat pada Gambar 3.3. Itemset SPMB SPMK PSB SAP B2 A2 A1 B3 Count 7 6 5 2 10 5 3 2 Tabel 3.4 Penghitungan support 2-itemset Itemset Count Support 0.2 SPMB,A2 4 0.1 SPMB,B2 2 0.05 SPMB,A1 1 0.2 SPMK,B2 4 0.05 SPMK,A1 1 0.05 SPMK,B3 1 0.2 PSB, B2 4 0.05 PSB,A1 1 0.05 SAP,A2 1 0.05 SAP,B3 1 Tahap selanjutnya adalah pemangkasan item-item yang tidak frequent. Minimum support yang telah ditentukan adalah 20 % atau 0.2, jadi apabila nilai support count-nya kurang dari batas minimum support yang telah ditentukan maka dilakukan pemangkasan. ROOT B2(8) SPMB (4) A2 (4) Setelah membangun SOTrieIT yang utuh, dilakukan penghitungan support count pada 1-itemset dan 2-itemset ,pada Tabel 3.12 untuk hasil penghitungan support 1-itemset dan pada Tabel 3.13 untuk hasil penghitungan support 2itemset. Tabel 3.3 Penghitungan Support 1-itemset Support 0.35 0.3 0.25 0.1 0.5 0.25 0.15 0.1 SPMK (4) B2 (4) A2 (4) PSB (4) B2 (4) Selanjutnya adalah perhitungan nilai confidence pada frequent itemset. Pada Tabel 3.5 dapat dilihat hasil perhitungan nilai confidence frequent itemset. Tabel 3.5 Confidence Frequent Itemset Frequent Support Support Confidence Itemset (A,B) (A) 5 Pengaruh Nilai Minimum Support dan Nilai Minimum Confidence terhadap Jumlah Rule (Kimia) Jumlah Rule SPMB → 0.2 0.35 0.57 A2 PSB → 0.2 0.25 0.8 B2 SPMK → 0.2 0.3 0.67 B2 Berdasarkan minimum confidence yang telah ditentukan yaitu sebesar 50 %, maka apabila nilai confidence dari frequent itemset ο³ minimum confidence maka akan dibangkitkan menjadi rule. Rule yang terbentuk dapat dilihat pada Tabel 3.6. 6 min support 1% 4 2 0 40% 50% 60% Minimum Confidence Tabel 3.7 Lift Ratio Rules Rules Conf Frek Benchmark SPMB →A2 PSB →B2 SPMK → B2 0.63 5 0.25 Lift Ratio 2.28 0.57 10 0.5 1.6 0.2 10 0.5 1.14 Berdasarkan hasil perhitungan lift ratio pada Tabel 3.7, semua rule yang terbentuk memiliki kekuatan yang bagus karena nilai lift ratio rule tersebut lebih besar dari 1. IV. HASIL PEMBAHASAN Berdasarkan hasil pengujian pengaruh nilai minimum support dan nilai minimum confidence didapatkan bahwa jumlah rule yang dihasilkan berbanding terbalik. Hal ini digambarkan pada Gambar 4.1 untuk parameter program studi Kimia. Berbanding terbaliknya nilai minimum support dan nilai minimum confidence terhadap jumlah rule tersebut dikarenakan semakin tinggi nilai minimum support maka semakin tinggi nilai batas support /prosentase ketersediaan kombinasi data yang harus dicapai sehingga semakin sedikit yang dapat mencapai batasan untuk menjadi frequent itemset. Nilai lift ratio yang didapatkan setelah dilakukan perbandingan antara confidence untuk suatu rule dibagi dengan benchmark confidence,yaitu bisa disebut juga support dari consequence (maka). Penghitungan nilai lift ratio didasarkan pada asumsi bahwa consequent dan antecedent saling independen. Nilai lift ratio lebih besar dari 1 menunjukkan bahwa keterikatan antara dua item, consequent dan antecedent yang kuat, karena nilai kepercayaan atau confidence rule yang melebihi minimum confidence diuji lagi pada prosentase dengan kombinasi antecedent (maka). Hal ini digambarkan pada Gambar 4.2 untuk parameter program studi Kimia. Grafik Lift Rasio Association Rule yang Terbentuk 1,60 1,40 1,20 Lift Ratio Tabel 3.6 Rule yang terbentuk Rules Keterangan SPMB → A2 Jika jalur masuk SPMB maka kategori kelulusannya A2 PSB → B2 Jika jalur masuk PSB maka kategori kelulusannya B2 SPMK → B2 Jika jalur masuk SPMK maka kategori kelulusannya B2 Keterangan : A2 = lama studi kurang dari 4 tahun atau tepat 4 tahun dengan IPK 2,76– 3,50 B2 = lama studi lebih dari 4 tahun dengan IPK 2,76-3,50 Selanjutnya rule yang terdapat pada Tabel 3.20 dilakukan uji kekuatan rule dengan menggunakan lift ratio. Hasil perhitungan nilai lift ratio dapat dilihat pada Tabel 3.7 min support 5% 1,00 0,80 0,60 Lift Ratio 0,40 0,20 0,00 PSB,B2 SAP,A2 SPMB,A2 SPMB,B2 Association Rule 6 1. a. b. c. d. e. f. 2. 3. V. KESIMPULAN Berdasarkan hasil analisa uji coba dapat diambil kesimpulan: Berdasarkan hasil penerapan algoritma FOLD-Growth untuk didapatkan pola asosiasi data mahasiswa dan tingkat kelulusan mahasiswa berdasarkan paramater jalur masuk dan program studi yaitu sebagai berikut : Jika jalur masuk PSB maka lama lulusnya lebih dari 4 tahun dan IPK diantara 2,76 sampai dengan 3,5 atau kategori tingkat kelulusan B2 untuk biologi, kimia,fisika,matematika,dan ilkom Jika jalur masuk SPMB maka lama lulusnya lebih dari 4 tahun dan IPK diantara 2,76 sampai dengan 3,5 atau kategori tingkat kelulusan B2 untuk semua bidang studi Jika jalur masuk SPMB maka lama lulusnya kurang atau tepat dari 4 tahun dan IPK diantara 2,76 sampai dengan 3,5 atau kategori tingkat kelulusan A2 untuk program studi Kimia Jika jalur masuk SPMK maka lama lulusnya lebih dari 4 tahun dan IPK diantara 2,76 sampai dengan 3,5 atau kategori tingkat kelulusan B2 untuk semua bidang studi Ilmu Komputer Jika jalur masuk SAP maka lama lulusnya lebih dari 4 tahun dan IPK diantara 2,76 sampai dengan 3,5 atau kategori tingkat kelulusan B2 untuk semua bidang studi Kimia Jika jalur masuk PSB maka lama lulusnya kurang atau tepat dari 4 tahun dan IPK diantara 2,76 sampai dengan 3,5 atau kategori tingkat kelulusan A2 untuk program studi Statistika Nilai lift ratio yang bisa menunjukkan kekuatan rule didapatkan setelah membandingkan confidence rule dengan nilai benchmark confidence, dimana didapatkan nilai tertinggi lift ratio adalah 1,657 dari PSB,A2 pada program studi Statistika dan nilai lift ratio terendah sebesar 0,531 dari PSB,B2 pada program studi Ilmu Komputer. Hasil pengujian akurasi assosiation rule menunjukkan tingginya penerapan association rule yang terbentuk pada data latih pada data uji dan memberikan informasi terkait tingat akurasi rule yang dihasilkan, yang bisa digunakan untuk bahan dasar prediksi tingkat kelulusan mahasiswa di waktu yang akan datang. DAFTAR REFERENSI 1. Pramudiono, Iko. 2003. Pengantar Data Mining : Menambang Permata Pengetahuan di Gudang Data. http:// www.ilmukomputer.com, tanggal akses 22 Maret 2011. 2. Zhao,Qiankun and Sourav S. Bhowmick. 2003. Association Rule Mining : A Survey. Nanyang Technological University. Singapura 3. Soelaiman, Rully dan Ni Made Arini WP. 2006. Analisis Kinerja Algoritma Fold – Growth dan FP – Growth pada Penggalian Pola Asosiasi. Seminar Nasional Aplikasi Teknologi Informasi (SNATI) Institut Teknologi Sepuluh Nopember (ITS). Surabaya. 4. Woon, Yew – Kwong., Keong ,Wee Ng.,Lim, E.P. 2004. A Support – Ordered Trie for Fast Frequent Itemset Discovery. IEEE Transaction onKnowledge and Data Engineering, Volume 16, No. 7, halaman 875 – 879. 5. Kusrini, M.Kom. 2007. Konsep dan Aplikasi Sistem Pendukung Keputusan. CV Andi Offset. Yogyakarta. 6. Suharto,Bambang, dkk. 2010. Pedoman Pendidikan Tahun Akademik 2010/2011 Universitas Brawijaya. Universitas Brawijaya. Malang 7. Santosa, Budi. 2007. Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis. Graha Ilmu. Yogyakarta. 8. Han, Jiawei dan Micheline Kamber. 2006. Data Mining : Concepts and Techniques 2nd Edition. Morgan Kaufmann, California 9. Prastowo, Deni. 2008. Penggunaan Struktur Data SoTrieIT Untuk Pemangkasan Transaksi dengan Algoritma Data Mining Fold – Growth. Institut Pertanian Bogor (IPB). Bogor. 7