Edisi Juli 2015 Volume IX No. 2 ISSN 1979-8911 ANALISA POLA ASOSIASI JALUR MASUK TERHADAP KELULUSAN MAHASISWA DENGAN MENGGUNAKAN METODE FOLD-GROWTH (STUDI KASUS FAKULTAS SAINS DAN TEKNOLOGI) Mohamad Irfan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi Universitas Islam Negeri Sunan Gunung Djati Bandung [email protected] Abstrak Teknologi komunikasi dan informasi telah berkembang seiring dengan tuntutan untuk mendapatkan informasi yang lebih spesifik dan terukur. Data yang diolah dijadikan pendukung untuk mengambil keputusan dengan memanfaatkan basisdata yang dimiliki untuk menentukan pola asosiasi jalur masuk calon mahasiswa terhadap kelulusan. Pola asosiasi antara data mahasiswa dan data kelulsan mahasiswa. Pola asosiasi antara dua jenis data tersebut dapat menunjukkan apakah ada keterkaitan antara variabel data mahasiswa yang terdiri dari jalur masuk dan Jurusan, dengan tingkat kelulusan mahasiswa yang bisa dilihat dari lama studi dan indeks prestasi kumulatif (IPK). Penelitian mencari pola asosiasi antara jalur masuk dengan kelulusan mahasiswa menggunakan metode FOLDGrowth. Dalam metode FOLD-Growth tahapan pertama yang dilakukan adalah mencari frequent itemset, pemangkasan item-item yang tidak frequent, pembangunan FP-Tree menggunakan transaksi yang telah dipangkas dan penggalian itemset frequent. Pencarian pola antara jalur masuk dengan kelulusan mahasiswa disertai nilai support dan nilai confident menghasilkan jalur masuk melalui tes tulis maka lama lulusnya lebih dari 4 tahun dengan IPK berada diantara 3.00 sampai 3.49 masuk dalam kategori B2 di jurusan Teknik Informatika, dengan nilai support 28,73. Jalur masuk tes PPA maka lulusnya lebih dari 4 tahun dengan IPK berada diantara 3,00 smapai 3,49 atau kategori B2 dengan niali support 12,80. Kata Kunci: Asosiasi Rule, Itemset, FOLD-Growth, Mahasiswa, Data Mining 1. memakai sistem infor-masi untuk kegiatan Pendahuluan sehari-hari. 1.1 Latar Belakang Masalah Sistem informasi dapat digunakan untuk mendapatkan, mengolah Saat ini, sudah banyak instansi dan menyebarkan informasi untuk pemerintahan maupun swasta yang sudah menunjang kegiatan, memberikan 172 Edisi Juli 2015 Volume IX No. 2 ISSN 1979-8911 informasi dan sebagai sarana pengambil mining, keputusan dengan memanfaatkan data- diharapkan base yang dimiliki. Database merupakan pengetahuan-pengetahuan sistem memakai lumnya tersimpan di dalam database tersebut sehingga menjadi informasi yang berharga. penyimpanan komputer dimana data database penggunaan data dapat memberikan yang sebe- merupakan komponen utama dalam sistem Ada informasi, karena merupakan dasar dalam menyelesaikan menyediakan diantaranya algoritma Fold-Growth, yang informasi [5]. Dimana banyak berbagai bidang menggunakan sejumlah mining algoritma untuk association rule, masuk dalam algortima asosiasi [4]. database. Bahkan saat ini hampir semua Penelitian ini dibuat dengan tujuan perusahaan, perkantoran, supermarket untuk mendapatkan informasi yang termasuk Perguruan Tinggi meng-gunakan berguna tentang hubungan antara tingkat database. kelulusan mahasiswa dengan jalur masuk Belum diketahuinya pola asosiasi perguruan tinggi menggunakan teknik data antara data mahasiswa dan data kelulusan mining mahasiswa di Universitas Islam Negeri Growth. Informasi yang disajikan untuk Sunan Gunung Djati Bandung. mengukur Pola menggunakan tingkat metode kelulusan Fold- dan asosiasi antara dua jenis data tersebut hubungannya dapat menunjukkan apakah ada keterkaitan mahasiswa. Informasi yang ditampilkan antara variabel data mahasiswa yang berupa nilai support (nilai penunjang) terdiri dari jalur masuk dan program studi, confident (nilai kepastian) dan hubungan dengan tingkat kelulusan mahasiswa yang antara tingkat kelulusan dengan proses bisa dilihat dari lama studi dan IPK. masuk mahasiswa. dengan jalur masuk Pencarian data dari pola tersebut sangat 1.2 Identifikasi Masalah erat kaitannya dengan penggunan data 173 Edisi Juli 2015 Volume IX No. 2 ISSN 1979-8911 Berdasarkan latar belakang masalah diatas pokok permasalahan yang dicari solusinya adalah: hubungan antara tingkat kelulusan dengan proses masuk mahasiswa. 2. Pembahasan dilakukan pada Program Sarjana (SI) di Fakultas Fakultas Sains 1. Bagaimana membuat aplikasi untuk dan Teknologi Universitas Islam menghasilkan informasi yang dapat Negeri Sunan Gunung Djati Bandung. digunakan untuk mengukur tingkat 3. Bahasa pemograman yang digunakan kelulusan dan hubungannya dengan yaitu bahasa Java. jalur masuk mahasiswa. 4. Data yang dijadikan penelitian ini 2. Informasi yang ditampilkan berupa adalah data mahasiswa Fakultas Sains nilai support (nilai penunjang) dan confident (nilai kepastian) Teknologi Universitas Islam dan Negeri Sunan Gunung Djati Bandung hubungan antara tingkat kelulusan dari tahun 2006 sampai 2009 dan data dengan proses masuk mahasiswa. mahasiswa yang sudah menempuh pendidikan dari tahun 2006 sampai 1.3 Batasan Masalah 2009 di Fakultas Sains dan Teknologi. Adapun batasan masalah dalam aplikasi data mining untuk menganalisa hubungan antara jalur masuk dengan tingkat kelulusan mahasiswa menggunakan metode Fold-Growth ini adalah: 5. Input dari aplikasi ini adalah memilih data mahasiswa sesuai jurusan, memilih nilai support dan memilih nilai Confidence. 6. Output dari aplikasi ini adalah hasil dari perhitungan menggunakan metode Fold-Growth berupa kombinasi nilai support (nilai penunjang) dan itemset, support dan confident confidence. 1. Informasi yang ditampilkan berupa (nilai kepastian) dan nilai nilai 174 Edisi Juli 2015 Volume IX No. 2 ISSN 1979-8911 beberapa kategori (atau class) yang telah 1.4 Tujuan Penelitian ini dibuat dengan tujuan, menghasilkan aplikasi untuk mendapatkan didefinisikan sebelumnya. b. informasi yang berguna tentang hubungan antara tingkat kelulusan mahasiswa Clustering [ Descriptive] Mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa dengan jalur masuk menggunakan teknik sehingga data mining menggunakan metode Fold- kelompok tertentu memiliki set property Growth di Fakultas Sains dan teknologi. yang dishare bersama, dengan tingkat 2. elemen-elemen similaritas Dasar Teori yang tinggi dari dalam suatu satu kelompok dan tingkat similaritas antar 2.1 Data Mining kelompok yang rendah. Disebut juga Data mining merupakan analisis dari peninjauan kumpulan data dengan ‘unsupervised learning’ untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan bermanfaat bagi pemilik data. c. Assosiation Rule Discovery [Descriptive] Mendeteksi kumpulan atribut-atribut yang muncul bersamaan (co-accur) dalam frekuensi yang sering, dengan membentuk sejumlah kaidah dari kumpulan-kumpulan 2.2 Teknik Data Mining Beberapa teknik dan sifat data mining adalah sebagai berikut: a. Classification [Predictive] Klasifikasi adalah merupakan sebuah tersebut. Contohnya: 90% orang yang belanja di suatu supermarket yang membeli roti juga membeli selai, dan 60% dai semua orang yang berbelanja membeli keduanya. record data baru ke salah satu dari 175 Edisi Juli 2015 Volume IX No. 2 d. Sequential Pattern ISSN 1979-8911 Discovery mengasumsikan [Descriptive] ketergantungan Mencari sejumlah event yang secara Teknik ini sebuah linier banyak atau model nonlininer. dipelajari dalam umum terjadi bersama-sama. Contohnya, statistika, bidang jaringan saraf tiruan dalam satu set urutan DNA, ACGTC (neuron network). diikuti oleh GTCA setelah suatu celah selebar 9 dengan probabilitas sebesar 30%. Jika diberikan sekumpulan obyek, dengan masing-masing obyek 2.3 Analisa Asosiasi a. Frequent itemset Semua record dalam satu kelompok mempunyai idtrans yang sama. Mereka dihubungkan dengan waktu kejadiannya bersama-sama maka dapatkan pola yang memprediksi transaksi ketergantungan sekuensial pembelian satu item atau lebih. Suatu dependencies) yang (sequential kuat diantara kejadian-kejadian yang berbeda. (AB) (C)→(D E) dasarnya dibentuk dengan cara mencari semua kemungkinan pola yang ada. Nilaikejadian dalam pelanggan terjadi yang pada suatu melibatkan suatu tanggal tertentu dan nama dari tiap item yang Pola-pola sekuensial pertama, pada nilai transaksi menggambarkan pola diatur dibeli dicatat bersama dengan jumlahnya. Pembuatan tabel ‘denormalized’ untuk mempermudah data mining biasanya dilakukan pada tahan data cleaning dari proses KDD. Lebar transaksi didefinisikan sebaga berdasarkan urutan waktu kejadian. jumlah item yang terdapat dalam sebuah e. Regression [Predictive] transaksi. Suatu transaksi Memprediksi nilai dari suatu variable kontinyu yang diberikan berdasarkan nilai dari variable yang lain, dikatakan berisi sebuah itemset X jika X merupakan subset dari . Contohnya transaksi dengan 176 Edisi Juli 2015 Volume IX No. 2 ISSN 1979-8911 pertama pada tabel diatas berisi itemset muncul dalam transaksi yang berisi X. {Pena, Tinta} dan bukan {Pena, Air}. secara formal dapat dinyatakan dengan Support count(σ) merupakan jumlah transaksi yang berisi suatu itemset tertentu persamaan berikut ini: s(X→Y)= ( ∪ ) atau dengan kata lain merupakan frekuensi c(X→Y)= ( ∪ ) ( ) kejadian dari suatu itemset. Support dari dimana s adalah support dan c adalah sutau itemset adalah perbandingan dari confidence. transasksi dalam basisdata yang berisi 2.4 Association Rule Mining semua item dalam itemset. Biasanya jumlah himpunan item yang Jika terdapat sebuah himpunan sering dibeli bersamaan relative kecil, transaksi T, maka tujuan dari association khususnya saat ukuran itemset meningkat. rule mining adalah untuk menemukan Semua itemset yang support-nya lebih semua aturan yang mempunyai support tinggi dari nilai minimum yang ditetapkan ≥minsup user yang disebut dengan minsup; disebut Pendekatan brute-force untuk association frequentitemset. rule mining menggunakann pendekatan b. Association Rule dengan Association rule merupakan sebuah confidence dari semua kemungkinan rule. ekspresi implikasi yang berbentuk X →Y, Pendekatan Brute-frce terdiri dari langkah- dimana X dan Y merupakan disjoint langkah berikut: itemset ( X∩Y) = ∅ . Contoh :{Pena, a. Daftar Tinta} ® {jus}. Dalam association rule, kita dapat confidence. menghitung support adan Confidence menyatakan dan confidence menghitung semua ≥minconf. support dan kemungkinan association rule b. Hitung support dan confidence untuk setiap rule seberapa sering item-item-item dalam Y 177 Edisi Juli 2015 Volume IX No. 2 ISSN 1979-8911 c. Pangkas rule yang tidak memenuhi minsup dan minconf thresholds. (support Ordered-Trie Itemset) dalam penggalian itemset yang frequent. Secara umum, pendekatan ini sangat SOTrielT adalah sebuah struktur data yang mahal dalam waktu komputasinya. Jumlah melakukan ekstraksi 1-itemset dan 2- kemungkinan itemset dari semua transaksi dalam basis rule dari sebuha tabel transaksi yang terdiri d item adalaha data. sebesar: Dengan R =3 ͩ - 2 ͩ +1 menggunakan basis data transaksi yang terdiri dari kode transaksi, Misalkan digunakan data pada tabel dan kode dari barang yang di beli, pembelian diatas dengan jumlah itemd=5, algoritma maka jumlah kemungkinan rule adalah menghasilkan sebesar: penelitian yang dilakukan oleh Woon et al. R=3 - 2 + 1 = 243 – 64 +1 =180 ini akan diproses untuk pola asosiasi. pada (2004), penggabungan dua buah algoritma yaitu FP-GROWTH dengan FOLDARM Semua rule diatas merupakan partisi pada metode assosiasi menghasilkan biner dari itemset yang sama. Rules yang sebuah algoritma baru (FOLD-GROWTH) berasal dari itemset yang sama mempunyai yang memiliki kinerja yang lebih baik. support yang identik tetapi mempunyia Algoritma ini menggunakana struktur data confidence yang berbeda, sehingga kita SOTrielT, SOTrielT atau Sub Ordered Trie dapat memasangkan ulang untuk Itemset merupakan suatu Tree yang keperluan support dan confidence. digabungkan dengan yang utuh. Kinerja 2.5 Fold-Growth dari Fold-Growth merupakan salah satu metode penggalian menggunakan struktur pola asosiasi data SOTrielT algoritma tersebut menghasilkan proses yang lebih fleksibel dan efisien jika dibandingkan dengan algoritma-algoritma 178 Edisi Juli 2015 Volume IX No. 2 ISSN 1979-8911 aturan asosiasi lainnya seperti apriori dan yang mengandung suatu pola dikatakan FP-Growth. sering muncul (frequent pattern) apabila support dari pola tersebut tidak kurang 2.6 FP-Tree dari sutau konstanta ᶓ FP-Tree merupakan (batas ambang struktur minimum support). Permasalahan mencari penyimpanan data yang dimampatkan. FPpola frequent dengan batas ambang Tree dibangun dengan memetkan setuap minimum support count ᶓ inilah yang data transaksi ke dalam setiap lintasan dicoba untuk dipecahkan oleh FOLDtertentu dalam FR-Tree. Karena dalam Growth dengan bantuan struktur FP-Tree. setiap transaksi yang dipetakan, mungkin ada transaksi yang memiliki item yang sama, maka lintasanya memungkinkan 3. Data Data merupakan untuk saling menimpa. Semakan banyak keterangan data transaksi yang memiliki item yang dikumpulkan dari suatu populasi atau sama, maka proses pemampatan dengan bagian struktur data FP-Tree semakin efektif. karakte-ristik populasi tersebut [5]. Kelebihan dari FP-Tree adalah hanya atau keterangan- populasi fakta-fakta untuk yang menjelaskan 3.1 Data induk Mahasiswa memerlukan dua kali pemindaian data Data induk mahasiswa adalah data transaksi yang trebukti sangat efisien. mahasiswa yang di data ketika mahasiswa Missal I={a1, a2, …….,an} adalah pertama masuk ke Universitas Islam kumpulan dari item. Dan basis data Negeri Sunan Gunung Djati Bandung transaksi DB= {T1, T2, …..Tn}, dimana setelah melakukan registrasi ulang. Data Ti (I € [1….n]) adalah sekumpulan yang dicatat adalah identitas pribadi transaksi yang mengandung item di l. mahasiswa dan identitas sekolah asal sedangkan support adalah perhitungan mahasiswa. Proses pendaftaran dilakukan (counter) frequensi kemunculan transaksi 179 Edisi Juli 2015 Volume IX No. 2 di tingkat Universitas, setelah di rekap lalu disebarkan ke Fakultas dan Jurusan. Atribut yang terdaftar pada data induk Mahasiswa. Tabel 1 Atribut Mahasiswa Atribut No_Daftar Angkatan NIM Nama lulus Kota Lahir Tanggal Lahir Alamat Atribut Desa RT Kecamatan Kota Fakultas Keterangan No daftar adalah, no pendaftar pada saat siswa tersebut daftar ke Universitas Islam Negeri Sunan Gunung Djati Bandung Angkat adalah keterangan untuk tahun pada saat mahasiswa pertama masuk NIM (Nomor Induk Mahasiswa) adalah nomor Identitas mahasiswa yang diberikan oleh pihak Universitas Nama mahasiswa yang lulus seleksi masuk Kota dimana tempat mahasiswa yang bersangkutan lahir Tanggal dimana mahasiswa yang bersangkutan lahir Alamat temapt mahasiswa tinggal Keterangan Desa dimana mahasiswa yang bersangkutan tinggal RT (Rukun Tetangga) tempat dimana mahasiswa yang bersangkutan bertempat tinggal Kecamatan tempat dimana mahasiswa yang bersangkutan tinggal Kota dimana Tempat mahasiswa yang bersangkutan lihar Fakultas tempat dimana mahasiswa tersebut diterima ISSN 1979-8911 Kode Prodi Nomor unik prodi dimana tempat mahasiswa bersanglutan diterima Prodi Prodi dimana tempat mahasiswa tersebut diterima Kelas Kelas tempat dimana mahasiswa tersebut diterima Jenis Jenis kelamin mahasiswa Kelamin yang bersangkutan Kode Pos Kode Pos tempat dimana mahasiswa bertempat tinggal No Telp No Telp mahasiswa yang bersangkutan Sekolah Sekolah asal tempat mahasiswa sebelum melanjutkan ke jenjang Universitas Nama Nama sekolah tempat Sekolah mahasiswa yang bersangkutan sekolah sebelum menlanjutkan ke jenjang Universitas Rumpun Asal jurusan mahasiswa tersebut pada saat di sekolah menengah atas Warga Kewarganagaraan Negara mahasiswa yang bersangkutan Agama Agama yang dianut oleh mahasiswa yang bersangkutan Penghasilan Penghasilan orang tua Orang Tua mahasiswa yang bersangkutan Atribut Keterangan Nama Nama orang tua mahasiswa Orang Tua yang bersangkutan Pekerjaan Pekerjaan orang tua Orang Tua mahasiswa yang bersangkutan Tes Jalur masuk tes mahasiswa yang bersangkutan pada saat pertama masuk ke Universitas. Pada Universitas Islam Negeri Sunan Gunung Djati Bandung terdapat beberapa jalur masuk diantaranya, PPA, Jalur Tulis, dan juga 180 Edisi Juli 2015 Volume IX No. 2 Pendidikan Orang Tua Status 1 Propinsi SNMPTN Pendidikan treakhir orang tua Mahasiswa yang bersangkutan Status sekolah terakhir mahasiswa yang bersangkutan Propinsi dimana mahasiswa yang bersangkutan tinggal Tabel 2 Atribut Data Kelulusan Atribut Keterangan No pokok Nomor unik yang terdapat Ijazah di ijazah pada saat mahasiswa yang bersangkutan telah menyelesaikan pendidikannya di Universitas Tanggal Tanggap pada saat siding mahasiswa tersebut sidang tugas akhir dan dinyatakan lulus Nama Nama Mahasiswa yang Mahasiswa bersangkutan Tempat, tgl Tempat dan tanggal lahir Lahir mahasiswa yang bersangkutan Alamat Alamat tempat mahasiswa tinggal Yudicium Indeks prestasi yang di capai mahasiswa yang bersangkutan selama berkuliah di universitas Atribut Keterangan Judul Judul tugas dari Skripsi mahasiswa yang bersangkutan Pembimbing Orang/dosen yang membimbing tugas akhir mahasiswa yang bersangkutan Prodi Jurusan dari mahasiswa yang bersangkutan ISSN 1979-8911 Data kelulusan adalah data mahasiswa yang telah dinyatakan lulus dan sudah menyelesaikan pendidikan di Fakultas Sains dan teknologi. Dalam data kelulusan terdapat atribut data mahasiswa dan kelengkapan kelulusan diantaranya nomor pokok Ijazah, Tanggal sidang, Nama mahasiswa, Yudisium, judul skripsi, Program Studi, pembimbing, alamat serta tempat tanggal lahir. IPK dikategorikan berdasarkan prediksi kelulusan yang sudah ditetapkan dalam Universitas Islam Negeri Sunan Gunung Djati Bandung sebagai berikut [8]: Tabel 3 Indeks Prestasi Kumulatif No 1 2 3 4 5 Indek Prestasi 3.50-4.00 3.00-3.49 2.50-2.99 2.00-2.49 0.00-1.99 Predikat Kelulusan Cumlaude Amat Baik Baik Cukup Tidak Lulus 3.3 Proses Mining Data mining adalah proses yang memperkerjakan pembelajaran satu atau lebih komputer teknik untuk 3.2 Data Kelulusan 181 Edisi Juli 2015 Volume IX No. 2 menganalisis dan ISSN 1979-8911 mengekstraksi pengetahuan secara otomatis [2]. Data ( ) = mining berisi pencarian trend atau pola (2.1) yang diinginkan dalam database besar ( . )= untuk membantu pengam-bilan keputusan di waktu yang akan datang. Pola-pola ini (2.2) dikenal oleh perangkat tertentu yang dapat memberikan suatu analisa data yang berguna dan berwawasan yang kemudian ( → )= dapat dipelajari dengan lebih teliti, yang mungkin saja meng-gunakan perangkat (2.3) pendukung keputusan yang lainnya. Algoritma FOLD-Growth 4. Metode Algoritma FOLD-Growth merupakan 4.1 Assosiasi Rule hasil gabungan dari algoritma FOLDARM Association Rule merupakan sebuah ekspresi implikasi yang berbentuk X→Y , dimana X dan Y merupakan disjoint itemset. Dalam assosiasi rule kita dapat menghitung support dan confidence [1][3]. Confidence menyatakan seberapa sering item-item dalam Y muncul dalam transaksi yang berisi X. secara formal dapat dinyatakan dengan persamaan berikut ini: dan FP-Growth. diharapkan Pada dapat algoritma ini menggabungkan keuntungan dan kebaikan dari 2 (dua) algoritma antara FP-Growth dengan FOLD-ARM. Algoritma FOLDARM yang memiliki kinerja cepat dalam pengukuran itemset frequent maksi-mum( ) adalah kecil atau K ≤ 10, sedangkan algoritma FP-Growth memiliki kinerja yang cepat pada saat > 10 [1]. Dalam 182 Edisi Juli 2015 Volume IX No. 2 ISSN 1979-8911 algoritma ini terdapat pembagian tahap itemset dan 2-itemset. Sehingga, untuk pengerjaan sebanyak 4 (empat) tahapan item-item yang tidak sesuai akan utama [7]. dilakukan pemangkasan. Tahapan Utama dalam algoritma FOLD- c. Membangun FP-Tree menggunakan transaksi – Growth yaitu: transaksi yang telah dipangkas a. Penggalian L1 (large 1 – itemset) dan d. Penggalian itemset frequent 5. Pencarian Pola Asosiasi L2 (large 2 – Itemset) dengan menggunakan SOTrielT. Pada tahapan ini, dilakukan pembacaan basis data Dalam penelitian ini, variabel yang sebanyak satu kali untuk membaca digunakan yaitu jalur masuk, program transaksi-transaksi yang ada dalam studi, lama studi dan IPK. Dari tersebut akan yang bisa basis data. Untuk setiap transaksi akan penggbabungan data dibangkitkan semua kemungkinan 1terbentuk suatu pola itemset dan 2-itemsey yang kemudian memberikan informasi yang berkaitan dicatat dalam SOTrieIT. antara jalur masuk dengan kelulusan b. Pemangkasan item-item yang tidak mahasiswa. Pada data yang ada, akan frequent. Dalam tahapan ini, akan ditransformasi agar mudah dibaca. dilakukan pemang-kasan pada setiap Transfor-masi data yang dilakukan pada transaksi yang ada dalam basis data penelitian ini adalah data tingkat kelulusan dengan menggunakan 1-itemset dan 2mahasiswa. Dari data kelulu-san itemset. Untuk setiap transaksi T, pada mahasiswa dapat dilihat dari lama studi itemset Lk yang terdapat dalam dengan IPK. Dari dua data tersebut dapat transaksi tersebut dimana panjang k di kategorikan sesuai tingkat IPK yang lebih dari 2, akan dilakukan sudah ditentukan oleh Universitas. Dari pengecekan dengan menggunakan 1183 Edisi Juli 2015 Volume IX No. 2 ISSN 1979-8911 data tersebut dapat dikategorikan menjadi 8 kategori, yaitu. Tabel 4 Kategori Tingkat kelulusan Mahasiswa Kategori Keterangan Lama studi 4 tahun atau kurang A1 dari 4 tahun dan IPK 3,50 – 4,00 Lama studi 4 tahun atau kurang A2 dari 4 tahun dan IPK 3,00 – 3,49 Lama studi 4 tahun atau kurang A3 dari 4 tahun dan IPK 2.50 – 2,99 Lama studi 4 tahun atau kurang A4 dari 4 tahun dan IPK 2.00 – 2,49 Lama studi lebih dari 4 tahun B1 dan IPK 3,50 – 4,00 Kategori Keterangan Lama studi lebih dari 4 tahun B2 dan IPK 3,00 – 3,49 Lama studi lebih dari 4 tahun B3 dan IPK 2,50 – 2,99 Lama studi lebih dari 4 tahun B4 dan IPK 2,00 – 2,49 Gambar 1 Diagram alir prose FOLDGrowth Untuk melakukan analisa terhadap data mahasiswa dengan kelulusan mahasiswa. Perlu melakukan beberapa proses yang meliputi: Dalam proses pencarian pola ini ada a. Sistem menerima inputan beberapa langkah yang harus dijalani minimum secara mendapatkan support, data mahasiswa yang telah informasi yang baru dari dalam database. disimpan dalam database. Kemudian Pada proses ini dimulai dengan pengum- sistem pulan data. Preprocessing, data mining, association rule yang menghasilkan proses FOLD-Growth aturan asosiasi pada data inputan dan bertahap guna confident, berupa akan melakukan minimum proses selanjutnya melakukan pengujian rule b. Proses yang ada dalam algoritma foldgrowth ini terdiri dari 4 tahapan, yaitu penggalian 1-2 itemset dengan 184 Edisi Juli 2015 Volume IX No. 2 ISSN 1979-8911 menggunakan struktur data SOTrieIT, berdasarkan nilai support dan nilai pemangkasan counfidence yang paling besar dan item yang tidak frequent, pembangunan FP Tree, dan penggalian itemset frequent. c. f. pembanguna Growth adalah penggalian 1-2 itemset menggunakan dengan SOTrieIT yang dilakukan dipangkas dengan membaca database sebanyak urutan satu kali untuk membaca data-data counfident. setiap dan data kelulusan. akan Untuk g. dibangkitkan kemungkinan 1 itemset dan 2 itemset FP Tree item yang selanjutnya nilai support dengan telah berdasarkan dan nilai Tahap pada proses selanjutnya adalah tahap penggalian itemset frequent. h. Tahapan selanjutnya akan dilakukan yang kemudian dicatat dalam struktur conditional FP Tree, yaitu support data SOTrieIT. count dari setiap item dijumlahkan. Proses selanjutnya adalah Hanya item dengan nilai support lebih pemangkasan item yang tidak frequent besar yaitu apabila nilai support dan nilai minimum count dibangkitkan. nya minimum e. Kemudian tahapan selanjutnya adalah Proses pertama pada algoritma FOLD- mahasiswa d. yang telah dipangkas. kurang support dari yang batasan sudah i. atau sama support dengan nilai yang akan Tahapan terakhir dalam sistem adalah ditentukan. Jika minimum support dan pengujian terhadap rule yang minimum confidence tidak sesuai dihasilkan, yaitu pengujian lift ratio. maka akan dipangkas. Pada pengujian lift ratio dilakukan Setelah dilakukan pemangkasan item perbandingan antara confidence rule yang tidak frequent, maka item-item yang terbentuk dengan nilai beckmark yang diproses tersebut akan diurutkan confidence. 185 Edisi Juli 2015 Volume IX No. 2 j. ISSN 1979-8911 Kemudian sistem akan menampilkan rule yang dihasilkan, nilai counfidence, nilai support, lift ratio yang telah dip roses diatas. 206700050 207429727 207429751 206700073 206700102 206700144 206700163 Tulis PPA Tulis SNMPTN SPMB SPMB Tulis B3 B3 A2 A3 A1 B2 B2 Pada perhitungan manual, dilakukan dengan sample 30 data yang sudah melalui proses prepro-cessing dengan minimum support 20% dan minimum confident 50%. Sample data terdapat pada tabel 3.2 Tabel 5 Sample data mahasiswa NIM 206700110 206700072 206700076 206700103 206700105 206700112 206700180 206700026 206700034 206700044 206700046 206700071 206700091 206700094 206700098 206700109 206700141 206700142 206700143 206700146 206700169 206700181 206700194 Jalur PPA PPA Tulis SPMB SPMB SNMPTN Tulis Tulis PPA PPA SPMB SPMB Tulis SNMPTN PPA PPA SNMPTN SNMPTN SPMB SPMB PPA PPA Tulis Kategori B2 B2 B1 A1 B1 B3 B3 A2 A2 B2 B2 B2 A1 A3 A3 B3 B3 B2 B2 B1 B1 B2 B2 Selanjutnya adalah tahap penggalian 1-2 itemset dengan menggunakan struktur data SOTrieIT. Proses pengalian 1-2 itemset dengan menggunakan struktur data SOTrieIT dapa dilihat pada gambar. Gambar 2 Struktur data SOTrieIT penggalian 1-2 itemset Pada gambar 3.3. data yang sudah di SOTrieIT penggalian 1-2 itemset terdapat beberapa jalur masuk diantaranya PPA sebanyak 9 dengan kategori kelulusan yang berada di PPA ada A2 sebanyak 1, A3 sebanyak 1, B1 sebanyak 1, B2 sebanyak 4 dan B3 sebanyak 2. Tulis 186 Edisi Juli 2015 Volume IX No. 2 sebanyak 8 dengan kategori kelulusan ISSN 1979-8911 B3 6 0.30 yang berada di Tulis yaitu B1 sebanyak 1, B3 sebanyak 2, B2 sebanyak 2, A2 Tabel 7 Perhitungan Support 2-itemset sebanyak 2, A1 sebanyak 1. SNMPTN sebanyak 5 dengan kategori kelulusan yang berada di SNMPTN yaitu B3 sebanyak 2, A3 sebanyak 2, B2 sebanyak 1. Sedangkan SPMB sebanyak 8 dengan kategori kelulusan yang berada di jalur SPMB yaitu B2 sebanyak 4, B1 sebanyak 2, dan A1 sebanyak 2. Setelah membangun SOTrieIT yang utuh. Dilakukan penghitungan support Itemset PPA,A2 PPA,B2 PPA,A3 PPA,B1 PPA,B3 TULIS,A1 TULIS,A2 TULIS,B1 TULIS,B2 TULIS,B3 SNMPTN,A3 SNMPTN,B2 SNMPTN,B3 SPMB,A1 SPMB,B1 SPMB,B2 Count 1 4 1 1 2 1 2 1 2 2 2 1 2 2 2 4 Support 0.05 0.2 0.05 0.05 0.1 0.05 0.1 0.05 0.1 0.1 0.1 0.05 0.1 0.1 0.1 0.2 count pada 1-itemset dan 2-itemset, pada tabel 3.13 untuk hasil penghitungan support 1-itemset dan untuk tabel 3.4 perhitungan Support 2-itemset. Tabel 6 Perhitungan Support 1-itemset Itemset PPA TULIS SNMPTN SPMB A1 A2 A3 B1 B2 Count 9 8 5 8 3 3 3 4 11 Support 0.45 0.40 0.25 0.40 0.15 0.15 0.15 0.20 0.55 Pada tabel 3.4 terdapat penggabungan 2-itemset dan perhitungan nilai count dengan nilai support. Tahap pemangkasan selanjutnya item-item adalah yang tidak frequent. Minimum support yang telah ditentukan adalah 20% atau 0.2, jadi apabila nilai support countnya kurang dari batas minimum support yang telah ditentukan maka dilakukan pemangkasan. 187 Edisi Juli 2015 Volume IX No. 2 ISSN 1979-8911 Tabel 8 perhitungan support 2 itemset Itemset PPA,B2 SPMB,B2 Count 4 4 Support 0.2 0.2 Berdasarkan minimum confidence yang telah ditentukan yaitu sebesar 50% maka apabila nilai confidence dari frequent Tahapan membangun adalah itemset ≥ minimum confidence maka akan menggunakan dibangkitkan menjadi rule. Rule yang selanjutnya FP-Tree transaksi-transaksi data yang telah di terbentuk dapat dilihat pada tabel 4.6 pangkas Tabel 10 Rule yang dihasilkan Frequent Itemset SPMB →B2 Keterangan Jika Jalur Masuknya SPMB maka Kategori kelulusannya B2 Dari hasil perhitungan manual dengan sampel 30 data, dihasilkan SPMB→B2 dengan nilai confident 0,50. Gambar 3 FP-Tree 6. Kesimpulan Tahap selanjutnya adalah perhitungan nilai confidence pada frequent itemset. Pada tahapan ini, dicari nilai confidence pada frequent itemset yang telah terbentuk. 1. Jika jalur masuknya melalui tes TULIS maka lama lulusnya lebih dari 4 tahun dan IPK berada diantara 3.00 sampai 3.49 atau masuk dalam kategori B2 Tabel 9 Confidence Frequent itemset Frequent Itemset PPA →B2 SPMB →B2 Support Support Confidence (A,B) (A) 0,2 0,45 0.44 0,2 0,40 0.50 untuk jurusan Manajemen pendidikan Islam. 2. Jika jalur masuknya melalui tes PPA maka lama lulusnya lebih dari 4 tahun 188 Edisi Juli 2015 Volume IX No. 2 ISSN 1979-8911 dengan IPK berada diantara 3.00 6. Jika jalur masuknya melalui tes sampai 3.49 atau masuk dalam kategori SNMPTN maka lama lulusnya lebih B2 untuk jurusan pendidikan Agama dari 4 tahun dan IPK berada diantara Islam, pendidikan fisika,matematika, 3.00 sampai 3.49 atau masuk dalam biologi, kimia, Agroteknologi. kategori 3. Jika jalur masuknya melalui tes TULIS B2 untuk jurusan matematika,Biologi, Teknik elektro. maka lama lulusnya lebih dari 4 tahun 7. Jika jalur masuknya melalui tes SPMB dan IPK berada diantara 3.00 sampai maka lama lulusnya lebih dari 4 tahun 3.49 atau masuk dalam kategori B2 dan IPK berada diantara 3.00 sampai untuk jurusan Pendidikan Agama Islam, 3.49 atau masuk dalam kategori B2 matematika, fisika, kimia, Teknik untuk jurusan matematika, biologi. Informatika, Agroteknologi, Teknik 8. Jika Elektro. jalur masuknya melalui tes SNMPTN maka lama lulusnya kurang 4. Jika jalur masuknya tes TULIS maka dari atau pas 4 tahun dan IPK berada lama lulusnya kurang dari atau pas 4 diantara 3.00 sampai 3.49 atau masuk tahun dan IPK berada diantara 3.00 dalam kategori A2 untuk jurusan Fisika, sampai 3.49 atau masuk kategori A2 kimia. untuk jurusan Pendidikan Bahasa Arab, kimia. DAFTAR PUSTAKA [1] Hamnon, Marissa. 2012. Penerapan Metode 5. Jika jalur masuknya tes PPA maka lama Association Algoritma lulusnya kurang dari atau pas 4 tahun Rule FP-Growth Dengan Pada Data Transaksi Penjualan Buku. Semarang: dan IPK berada diantara 3.00 sampai Universitas Brawijaya. 3.49 atau masuk kategori A2 untuk jurusan Pendidikan Bahasa [2] Hermawati, A. F. 2009. Data Mining. Surabaya: Penerbit Andi. Arab,Bahasa Inggris, 189 Edisi Juli 2015 Volume IX No. 2 [3] Slimani, Thabet. 2013. ISSN 1979-8911 Efecient Analysis of Pattem Association Rule Mining. LARODEC Lab. [4] Ma’ruf, Amrul, F .2013. Aplikasi Data Mining Untuk Mengetahui Hubungan Proses Masuk Dengan Kelulusan Mahasiswa. Tingkat Yogyakarta: AMIKOM. [5] Mata, T. Ramon, A. 2002. Dasardasar Database Relational. Jakarta: Penerbit Erlangga [6] Prasetyo, Eko. 2012. Data Mining Konsep dan Aplikasi Menggunakan MATLAB. Gresik: Penerbit Andi [7] Prastow, Deni. 2008. Penggunaan Struktur Data Pemangkasan SoTrieIT Transaksi untuk dengan Algoritma Data Mining Fold-Growth. Institut Pertanian Bogor(IPB). Bogor. [8] UIN Bandung. 2014. Pedoman Akademik UIN Sunan Gunung Djati Bandung. CV. Insan Mandiri. 190