Penerapan Algoritma Apriori dan Algoritma FP-Growth Dalam Menemukan Hubungan Data Nilai Ijazah Matematika dan Bahasa Inggris Dengan Nilai Mata Pelajaran Pemrograman dan Web Programming (Studi Kasus SMK Sandikta Kelas X Bekasi) Maulana, S.Kom. Magister Ilmu Komputer, STMIK Nusa Mandiri, Jakarta Menara Salemba Jl. Salemba Raya No. 5 Jakarta Pusat. Email : [email protected]. Abstrak Kata Kunci : Data Mining, Algoritma Apriori, Algoritma FP-Growth, Mata Pelajaran, Pemrograman, Web Programming, Matematika, Bahasa Inggris. Abstract Keywords : Data Mining, Apriori Algorithm, FP-Growth Algorithm, Subjects, Programming, Web Programming, Math, English I. Pendahuluan Penelitian ini bertujuan untuk membandingkan proses dari dua Algoritma yang sangat umum dalam Data Mining guna mendapatkan informasi yang dibutuhkan. Informasi tersebut berasal dari data-data yang dikumpulkan. Data dapat berasal dari beberapa sumber, seperti: hasil wawancara, observasi dan juga database. Database merupakan media penyimpanan dari sebuah program, yang berisi data-data mengenai institusi/organisasi yang menggunakan program tersebut. Data-data tersebut tidak akan bermanfaat hingga data tersebut dapat dirubah menjadi informasi yang sangat berguna. Dalam melakukan atau merubah data-data tersebut menjadi sebuah informasi yang bermanfaat, di butuhkan suatu konsep untuk mencari atau membantu menggali informasi tersebut. Salah satu konsep yang berhubungan dengan hal ini adalah Data Mining. Data Mining adalah suatu konsep yang tujuan nya menemukan data yang tersembunyi pada database dan pengetahuan atau informasi yang tersebunyi merupakan data yang berjumlah besar. di dalam database. Data mining merupakan Konsep inilah yang juga akan digunakan proses semi otomatik yang menggunakan pada teknik statistik, matematika, kecerdasan SMK Sandikta Bekasi, untuk menemukan data-data yang terkait dengan buatan data nilai ijazah Matematika dan Bahasa mengekstraksi Inggris dengan data mata pelajaran Bahasa informasi Pemrograman dan Web Programming. berguna yang tersimpan didalam database Adapun data yang diambil merupakan data dari murid kelas X-A SMK dan machine learning dan untuk mengidentifikasi pengetahuan potensial dan besar (Turban, 2005). Menutur Gartner Group, Data Sandikta, tahun ajaran 2013-2014. Dalam hal Mining adalah suatu proses menemukan ini kelas X tahun ajaran 2013-2014 SMK hubungan Sandikta menggunakan kurikulim 2013 yang kecenderungan dengan memeriksa dalam memuat dalam kurikulum tersebut mata sekumpulan besar data yang tersimpan pelajaran Bahasa Pemrograman dan Web dalam penyampaian dengan menggunakan Programming yang diajarkan pada kelas X. teknik pengenalan pola seperti teknik Penggunaaan Data diharapkan dapat keterhubungan antara Mining ini yang berarti, pola dan statistik dan matematika (Larose, 2005) membantu nilai ijazah B. Algoritma Matematika dan Bahasa Inggris dengan Algoritma adalah deskripsi langkah- mata pelajaran Bahasa Pemrograman dan langkah penyelesaian masalah yang tersusun Web Programming, sehingga hasilnya nanti secara logis atau urutan logis pengambilan dapat menjadi referensi yang berguna dan keputusan untuk pemecahan suatu masalah. bermanfaat bagi Pihak SMK Sandikta Bekasi. Algoritma ditulis dengan notasi khusus, Selain itu dengan membandingkan dua notasi mudah dimengerti dan notasi dapat proses Data Mining dengan menggunakan diterjemahkan menjadi sintaks suatu Bahasa Algoritma Apriori dan Algoritma FP-Growth, Pemrograman (Zakaria dan Priyono, 2006:5) akan didapat kekurangan dan kelebihan masing-masing proses Algoritma tersebut. Suatu algoritma akan memerlukan masukan memulainya, II. Landasan Teori dan tertentu akan untuk menghasilkan keluaran (output) tertentu pada akhirnya. A. Data Mining. yang (input) Hal-hal yang harus diperhatikan dalam Data mining adalah suatu konsep algoritma adalah mencari langkah-langkah digunakan yang paling sesuai untuk menyelesaikan untuk menemukan suau masalah, karena setiap algoritma memiliki karakteristik tertentu 2. Sangat mudah dan sederhana dalam yang mengaplikasikan. Beberapa hal yang harus dipahami D. Algoritma FP-Growth mempunyai kelebihan dan kekurangan. dalam mencari algoritma antara lain: Algoritma 1. Masalah seperti apa yang hendak diselesaikan. dari Algoritma Apriori. Frequent Pattern Growth adalah salah satu 2. Gagasal apa yang ada pada algoritma tersebut. alternatif algoritma yang digunakan untuk menentukan himpunan data yang paling 3. Berapa lama waktu yang diperlukan untuk menyelesaikan masalah. 4. Berapa pengembangan FP-Growth merupakan jumlah data sering muncul (frequent itemsets) dalam sebuah kumpulan data (David, 2008). yang dapat ditangani oleh sebuah algoritma. Pada Algoritma FP-Growth menggunakan konsep pembangunan tree, yang disebut FP-Tree, dalam pencarian C. Algoritma Apriori frequent Algoritma Apriori adalah salah satu itemsets bukan menggunakan generate candidate seperti yang dilakukan algoritma pertama yang yang terbaik untuk pada melakukan frequent menggunakan konsep tersebut, Algoritma teknik FP-Growth menjadi lebih cepat dibandingkan itemset pencarian dengan semua menggunakan Association Rule (Erwin, 2009). Algoritma Apriori juga bisa berfungsi Algoritma Apriori. Dengan dengan Algoritma Apriori (Erwin, 2009). Metode FP-Growth dibagi menjadi sebagai Algoritma untuk membentuk dan tiga tahapan utama, yaitu (Micheline, 2006): menghasilkan kandidat secara lebih baik. 1. Tahap pembangkitan conditional pattern Karena algoritma ini menggunakan cara pencarian dari data pertama hingga kandidat terhitung. base. 2. Tahap pembangkitan conditional pattern Tree 3. Tahap pencarian frequent itemset. E. Association Rule Association Rule merupakan suatu Keuntungan dari Algoritma Apriori adalah: 1. Dapat mengakomodasi data yang sangat besar proses pada data mining untuk menentukan semua aturan asosiatif yang memenuhi syarat minimum untuk support (minsup) dan confidence (minconf) pada sebuah database. Kedua syarat tersebut akan digunakan untuk interesting asociation rule b. Pembentukan Aturan Asosiasi dengan dibandingkan dengan batasan yang Setelah semua pola frekuensi tinggi telah ditentukan, yaitu minsup dan minconf ditemukan, barulah dicari aturan asosiasi (Rosadi, 2013). yang memenuhi syarat minimum untuk Association Rule Mining adalah suatu prosedur untuk mencari hubungan confidence, dengan menghitung aturan asosiatif A->B. item dalam dataset. Dimulai dengan mencari frequent itemset, yaitu kombinasi yang Nilai confidence dari aturan diperoleh dari rumus berikut: paling sering terjadi dalam suatu itemset ( dan harus memenuhi minsup (Rosadi, 2013). ) ∑ ∑ F. Support and Confidence Didalam Association Rule Mining ada dua parameter penting yang berfungsi untuk pembentukan rules yaitu support dan confidence, sehingga dihasilkan aturan adalah persentase kombinasi suatu item dalam database, sedangkan confidence adalah kuatnya hubungan antar item dalam aturan asosiasi. Dalam analisa asosiasi mempunyai metodologi dasar yang terbagi menjadi dua Lokasi penelitian dilakukan di SMK Sandikta Bekasi dengan Objek penelitian yaitu siswa-siswi kelas X-A. Dari objek tersebut dibutuhkan data awal dari nilai ijazah SMP Mata Pelajaran Matematika dan Bahasa Inggris serta data nilai akhir mata pelajaran Bahasa Pemrograman dan Web (kusrini, 2009): a. Metode Penelitian A. Lokasi dan Objek Penelitian asosiasi yang kuat (strong rules). Support III. Analisa Pola Frekuensi Tinggi Pada tahap ini untuk mencari Programming untuk mencari keterhubungan kedua data tersebut. kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Nilai support sebuah item diperoleh dengan rumus berikut: ( ) ( ) B. Metode Pengumpulan Data. 1. Data Primer ( ) ∑ ∑ Data Primer adalah data yang dikumpulkan langsung dari responden. Teknik pengumpulan data primer yang dilakukan menggunakan satu cara, yaitu: Matematika Bahasa Inggris Bahasa Pemrograman Web Programming Tabel 1 M I P W wawancara. Wawancara dilakukan pada kepada Kepala Sekolah SMK Sandikta Bekasi, tujuannya adalah meminta izin melakukan riset dan meminta data murid yang Berikut data siswa berdasarkan itemset diatas: No M 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 5 4 6 6 5 5 5 4 5 5 6 6 5 5 5 5 5 6 4 4 4 I P W 8 7 8 8 6 5 6 6 8 7 7 7 6 8 8 8 6 7 5 5 6 8 6 6 8 6 7 7 7 7 6 6 7 8 8 8 8 7 6 6 6 7 dibutuhkan. 2. Data Sekunder Data Sekunder adalah data yang sudah tersedia sehingga diberikan oleh data Kepala bisa langsung Sekolah. Data berbentuk softcopy yang sudah diolah dengan microsoft excel, data tersebut sudah diolah oleh Tata Usaha SMK Sandikta Bekasi. IV. Hasil Penelitian Setelah mendapatkan data maka dilakukan proses penerapan Algoritma Apriori dan Algoritma FP-Growth pada mata pelajaran Matematika dan Bahasa Inggris dengan data nilai Mata Pelajaran Pemrograman dan Web Programming. A. Algoritma Apriori Dari ditentukan data-data tersebut itemset-itemset yang 7 7 6 6 7 7 7 6 6 6 7 8 7 6 6 6 6 8 7 7 6 Tabel 2 telah akan digunakan. 1. Nilai Itemset digunakan Data yang inisialisasi Matematika Pemrograman dan Bahasa Langkah pertama yang dilakukan P8 7 adalah penginisialisasian. Tujuannya adalah memudahkan saat melakukan proses perhitungan. Tabel 4 Data yang tidak Nilai 4 berinisial M4, Nilai 5 berinisial M5 dan Nilai 6 berinisial M6. Iterasi 2.1.A. Pola Kombinasi menjadi 4: Nilai 5 berinisial P5, Nilai 6 itemset yang 1.1.A. berinisial P6, Nilai 7 berinisial P7 dan Nilai 8 Pola 2 itemset Jumlah (K) berinisial P8. M5,P6 4 M5,P8 5 P6,P8 0 Suport Tabulasi Data Jumlah 5 11 5 3 6 5 7 Tabel 3 K+1 ⁄ Iterasi 1.1.A. Itemset M4 M5 M6 P5 P6 P7 P8 2 mememenuhi minimum support di Iterasi Nilai Bahasa Pemrograman dibagi 5 ⁄ 6 0 Support ⁄ ⁄ 0 0 Tabel 5 Proses pengkombinasian hanya sampai pola 2 itemset. Tabel Final Association Rule Pola 2 itemset M5,P8 2. minimum support akan di eliminasi. Nilai Matematika dibagi menjadi 3: 1. memenuhi Suport Confidence ⁄ ⁄ Frequent Itemset, dengan mengoleksi Tabel 6 data berdasarkan minimum support 25% Itemset M4 1. Jumlah 5 Support Nilai Bahasa Inggris dan Bahasa Pemrograman Langkah pertama yang dilakukan M5 11 adalah penginisialisasian. Tujuannya adalah M6 5 memudahkan P5 3 P6 6 3: Nilai 5 berinisial I6, Nilai 7 berinisial I7 P7 5 dan Nilai 8 berinisial I8. saat melakukan proses perhitungan. Nilai Bahasa Inggris dibagi menjadi Nilai Bahasa Pemrograman dibagi Iterasi 2.2.A. menjadi 4: Nilai 5 berinisial P5, Nilai 6 1. Pola Kombinasi 2 itemset yang berinisial P6, Nilai 7 berinisial P7 dan Nilai 8 mememenuhi minimum support di berinisial P8. Iterasi 1.2.A. Iterasi 1.2.A. 1. Tabulasi Data Itemset I6 I7 I8 P5 P6 P7 P8 Pola 2 itemset I6,P6 Jumlah 9 10 2 3 6 5 7 Jumlah ⁄ ⁄ ⁄ ⁄ 2 I6,P8 6 I7,P6 4 I7,P8 1 I6,I7 0 0 P6,P8 0 0 Tabel 7 2. Suport Tabel 9 Frequent Itemset, dengan mengoleksi Proses pengkombinasian hanya sampai pola data berdasarkan minimum support 2 itemset. 25% Tabel Final Association Rule Itemset I6 Jumlah 9 I7 10 I8 2 P5 3 P6 6 P7 5 Support Pola 2 itemset Suport Confidence ⁄ I6,P8 ⁄ Tabel 10 3. Nilai Matematika dan Web Programming Langkah pertama yang dilakukan adalah penginisialisasian. Tujuannya adalah P8 7 memudahkan Tabel 8 saat melakukan proses perhitungan. Nilai Matematika dibagi menjadi 3: Data yang tidak memenuhi minimum Nilai 4 berinisial M4, Nilai 5 berinisial M5 support akan di eliminasi. dan Nilai 6 berinisial M6. Nilai Web Programming dibagi menjadi 3: Nilai 6 berinisial W6, Nilai 7 berinisial W7 dan Nilai 8 berinisial W8. Iterasi 1.3.A. Pola 2 itemset Jumlah (K) M5,W6 2 M5,W7 4 M5,W8 5 W6,W7 W6,W8 W7,W8 0 0 0 K+1 ⁄ Support ⁄ 3 ⁄ 1. Tabulasi Data Itemset Jumlah M4 5 M5 11 M6 5 W6 8 W7 7 W8 6 Tabel 11 Suport ⁄ 5 ⁄ ⁄ 6 0 0 0 0 0 0 0 0 0 Tabel 13 Proses pengkombinasian hanya sampai pola 2 itemset. Tabel Final Association Rule 2. Frequent Itemset, dengan mengoleksi data berdasarkan minimum support Pola 2 itemset M5,W8 25% Suport Confidence ⁄ ⁄ Itemset M4 Jumlah 5 Support M5 11 M6 5 W6 8 adalah penginisialisasian. Tujuannya adalah W7 7 memudahkan W8 6 Tabel 14 4. Nilai Bahasa Inggris dan Web Programming Langkah pertama yang dilakukan saat melakukan proses perhitungan. Nilai Bahasa Inggris dibagi menjadi Tabel 12 3: Nilai 5 berinisial I6, Nilai 7 berinisial I7 dan Nilai 8 berinisial I8. Data yang tidak memenuhi minimum Nilai Web Programming dibagi support akan di eliminasi. menjadi 3: Nilai 6 berinisial W6, Nilai 7 Iterasi 2.3.A. berinisial W7 dan Nilai 8 berinisial W8. 1. Pola Kombinasi 2 itemset yang mememenuhi minimum support di Iterasi 1.3.A. Iterasi 1.4.A. 1. Tabulasi Data Itemset I6 I7 Jumlah 9 10 I8 W6 W7 W8 2 8 7 6 Tabel 15 2. Frequent Itemset, dengan mengoleksi Pola 2 itemset Jumlah (K) I6,W6 2 I6,W7 3 I6,W8 4 I7,W6 5 I7,W7 3 I8,W8 2 data berdasarkan minimum support 25% Itemset I6 Jumlah 9 I7 10 I8 2 W6 8 W7 7 W8 6 Support Suport K+1 ⁄ ⁄ 3 ⁄ ⁄ 4 ⁄ ⁄ 5 ⁄ ⁄ 6 ⁄ ⁄ 4 ⁄ Support ⁄ 3 Tabel 17 Proses pengkombinasian hanya sampai pola 2 itemset. Tabel Final Association Rule Pola 2 itemset Tabel 16 I7,W6 support akan di eliminasi. 2 itemset yang mememenuhi minimum support di Iterasi 1.4.A. ⁄ ⁄ B. Algoritma FP-Growth Iterasi 2.4.A. Kombinasi Confidence Tabel 18 Data yang tidak memenuhi minimum 2. Pola Suport Berikut dataset yang akan digunakan dalam pengolahan data menggunakan Algoritma FP-Growth Itemset Data yang digunakan Matematika Bahasa Inggris Bahasa Pemrograman Web Programming Tabel 19 inisialisasi M I P W Berikut data siswa berdasarkan itemset diatas: Nilai Bahasa Pemrograman dibagi menjadi 4: Nilai 5 berinisial P5, Nilai 6 No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 M 5 4 6 6 5 5 5 4 5 5 6 6 5 5 5 5 5 6 4 4 4 I 7 7 6 6 7 7 7 6 6 6 7 8 7 6 6 6 6 8 7 7 6 Tabel 20 P 8 7 8 8 6 5 6 6 8 7 7 7 6 8 8 8 6 7 5 5 6 W 8 6 6 8 6 7 7 7 7 6 6 7 8 8 8 8 7 6 6 6 7 berinisial P6, Nilai 7 berinisial P7 dan Nilai 8 berinisial P8. Nilai Web Programming dibagi menjadi 3: Nilai 6 berinisial W6, Nilai 7 berinisial W7 dan Nilai 8 berinisial W8. Berikut adalah tabel Inisial dan frekuensi dari itemset-itemset pada dataset awal Itemset Jumlah M4 5 M5 11 M6 5 I6 9 I7 10 I8 2 W6 8 W7 7 W8 6 P5 3 P6 6 P7 5 P8 7 Tabel 21 Untuk selanjutnya dataset tersebut akan di inisialisasi untuk memudahkan dalam membuat data frekuensi kemunculan 1. dengan Bahasa Pemrograman itemset tersebut. Berikut insialisasi Hubungan Mata Pelajaran Matematika dari itemset-itemset tersebut: Nilai Matematika dibagi menjadi 3: Nilai 4 berinisial M4, Nilai 5 berinisial M5 dan Nilai 6 berinisial M6. Nilai Bahasa Inggris dibagi menjadi 3: Nilai 5 berinisial I6, Nilai 7 berinisial I7 dan Nilai 8 berinisial I8. a. Dataset Berikut adalah tabel keterhubungan antara mata pelajaran Matematika dengan mata pelajaran Pemrograman, berdasarkan pada dataset awal. Tabel TID merupakan bentuk dari dataset kombinasi 2 itemset mata pelajaran Matematika dan Bahasa Pemrograman. No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 M 5 4 6 6 5 5 5 4 5 5 6 6 5 5 5 5 5 6 4 4 4 P 8 7 8 8 6 5 6 6 8 7 7 7 6 8 8 8 6 7 5 5 6 Itemset M5,P8 M4,P7 M6,P8 M6,P8 M5,P6 M5,P5 M5,P6 M4,P6 M5,P8 M5,P7 M6,P7 M6,P7 M5,P6 M5,P8 M5,P8 M5,P8 M5,P6 M6,P7 M4,P5 M4,P5 M4,P6 NULL 5 M4 2 1 5 11 M6 M5 2 1 4 c. 5 1 P6 P5 2 3 P7 P8 FP-Growth Untuk langkah selanjut nya adalah tahap pembangkitan Conditional Patern Base, pembangkitan Conditional FP-Tree dan tahap pencarian frequent itemset. Pada tahapan ini dapat dilakukan b. dengan melihat kembali FP-Tree yang Pembentukan FP-Tree Dengan hasil dataset yang sudah pernah dibuat sebelum nya diolah tersebut, selanjutkan akan dibentuk FP-Tree dengan kombinasi 2 itemset. Berikut bentukan FP-Tree dari kombinasi 2 itemset bredasarkan table TID diatas. Item Conditional Patern Base P5 {{M4:2}, {M5:1}} P6 {{M4:2}, {M5:4}} P7 {{M4:1}, {M5:1}, {M6:3}} P8 {{M5:5}, {M6:2}} Item Conditional FP-Tree P5 {{M4:2}, {M5:1}} P6 {{M4:2}, {M5:4}} P7 {{M4:1}, {M5:1}, {M6:3}} P8 {{M5:5}, {M6:2}} Item Frequent Itemset Dengan P5 {{M4,P4:2}, {M5,P5:1},{P5:3)} Support, maka langkah selanjut nya yaitu P6 {{M4,P6:2}, {M5,P6:4},{P6:6}} dengan mencari nilai confidence dari selurut P7 {{M4,P7:1}, {M5,P7:1}, itemset yang memnuhi kriteria minimum {M6,P7:3},{P7:5}} support:, {{M5,P8:5}, {M6,P8:2},{P8:7}} Berikut hasil perhitungan confidence: P8 didapatkannya Pola 2 itemset d. seluruh nilai Confidence Association Rule Setelah mendapat pola selanjutnya kita akan menghitung M5,W8 ⁄ confidence berdasarkan dari tabel-tabel dan FP-Tree 2. diatas. dengan Web Programming Dalam hal ini syarat minimum yang dibutuhkan adalah 25% Hubungan Mata Pelajaran Matematika a. Dataset Sehingga hasil yang didapat dari Berikut adalah tabel keterhubungan perhitungan berdasarkan rumus support antara mata pelajaran Matematika dengan adalah: mata Web Programming, berdasarkan pada Untuk nilai matematika: dataset awal. Tabel ID merupakan bentuk dari dataset kombinasi 2 itemset mata pelajaran Matematika dan Web Programming. Untuk nilai bahasa pemrograman: No 1 2 3 4 5 6 7 8 9 10 11 12 M 5 4 6 6 5 5 5 4 5 5 6 6 W 8 6 6 8 6 7 7 7 7 6 6 7 Itemset M5,W8 M4,W6 M6,W6 M6,W8 M5,W6 M5,W7 M5,W7 M4,W7 M5,W7 M5,W6 M6,W6 M6,W7 13 14 15 16 17 18 19 20 21 5 5 5 5 5 6 4 4 4 8 8 8 8 7 6 6 6 7 Pada tahapan ini dapat dilakukan M5,W8 M5,W8 M5,W8 M5,W8 M5,W7 M6,W6 M4,W6 M4,W6 M4,W7 dengan melihat kembali FP-Tree yang pernah dibuat sebelum nya Item Conditional Patern Base W6 {{M4:3}, {M5:2}, {M6:3}} W7 {{M4:2}, {M5:4}, {M6:1}} W8 {{M5:5}, {M6:2}} Item Conditional FP-Tree diolah tersebut, selanjutkan akan dibentuk W6 {{M4:3}, {M5:2}, {M6:3}} FP-Tree dengan kombinasi 2 itemset. W7 {{M4:2}, {M5:4}, {M6:1}} W8 {{M5:5}, {M6:2}} Item Frequent Itemset W6 {{M4,W6:3}, {M5,W6:2}, b. Pembentukan FP-Tree Dengan hasil dataset yang sudah Berikut bentukan FP-Tree dari kombinasi 2 itemset bredasarkan table TID diatas. {M6,W6:3}} NULL W7 {{M4,W7:2}, {M5,W7:4}, {M6,W7:1}} 5 5 11 M4 W8 {{M5,W8:5}, {M6,W8:2}} M6 M5 e. Association Rule Setelah mendapat pola selanjutnya 3 2 3 W6 2 4 1 2 5 W7 W8 kita akan menghitung confidence berdasarkan dari tabel-tabel dan FP-Tree diatas. Dalam hal ini syarat minimum yang dibutuhkan adalah 25% e. FP-Growth Untuk langkah selanjut nya adalah Sehingga hasil yang didapat dari perhitungan berdasarkan rumus support tahap pembangkitan Conditional Patern adalah. Base, pembangkitan Conditional FP-Tree dan Untuk nilai matematika: tahap pencarian frequent itemset. mata pelajaran Bahasa Inggris dan Bahasa Pemrograman Untuk nilai bahasa pemrograman: Dengan didapatkannya seluruh nilai Support, maka langkah selanjut nya yaitu dengan mencari nilai confidence dari selurut itemset yang memnuhi kriteria minimum support:, Berikut hasil perhitungan confidence: Pola 2 itemset M5,W8 Confidence No 1 2 3 4 5 6 I 7 7 6 6 7 7 P 8 7 8 8 6 5 Itemset I7,P8 I7,P7 I6,P8 I6,P8 I7,P6 I7,P5 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 7 6 6 6 7 8 7 6 6 6 6 8 7 7 6 6 6 8 7 7 7 6 8 8 8 6 7 5 5 6 I7,P6 I6,P6 I6,P8 I6,P7 I7,P7 I8,P7 I7,P6 I6,P8 I6,P8 I6,P8 I6,P6 I8,P7 I7,P5 I7,P5 I6,P6 ⁄ b. Pembentukan FP-Tree Dengan hasil dataset yang sudah 3. Hubungan Mata Bahasa Inggris dengan Bahasa Pemrograman a. diolah tersebut, selanjutkan akan dibentuk FP-Tree dengan kombinasi 2 itemset. Dataset Berikut Berikut adalah tabel keterhubungan antara mata pelajaran Bahasa Inggris dengan mata pelajaran Pemrograman, berdasarkan pada dataset awal: Tabel TID berikut merupakan bentuk dari dataset kombinasi 2 itemset bentukan FP-Tree dari kombinasi 2 itemset bredasarkan table TID diatas. NULL 10 I6 3 I8 I7 3 3 2 2 1 P6 P5 2 9 P7 Frequent Itemset P5 {{I7,P5:3}} P6 {{I6,P6:3}, {I7,P6:3}} P7 {{I6,P7:1}, {I7,P7:2}, {I8,P7:2}} P8 {{I6,P8:6}, {I7,P8:1}} d. 1 6 Item Association Rule Setelah mendapat pola selanjutnya P8 kita akan menghitung confidence berdasarkan dari tabel-tabel dan FP-Tree diatas. Dalam hal ini syarat minimum yang c. FP-Growth dibutuhkan adalah 25% Untuk langkah selanjut nya adalah Sehingga hasil yang didapat dari tahap pembangkitan Conditional Patern perhitungan berdasarkan rumus support Base, pembangkitan Conditional FP-Tree dan adalah. tahap pencarian frequent itemset. Untuk nilai Bahsa Inggris: Pada tahapan ini dapat dilakukan dengan melihat kembali FP-Tree yang pernah dibuat sebelum nya Item Conditional Patern Base P5 {{I7:3}} P6 {{I6:3}, {I7:3}} P7 {{I6:1}, {I7:2}, {I8:2}} P8 {{I6:6}, {I7:1}} Item Conditional FP-Tree P5 {{I7:3}} P6 {{I6:3}, {I7:3}} P7 {{I6:1}, {I7:2}, {I8:2}} P8 {{I6:6}, {I7:1}} Untuk nilai bahasa pemrograman: Dengan didapatkannya seluruh nilai 15 16 17 18 19 20 21 Support, maka langkah selanjut nya yaitu dengan mencari nilai confidence dari selurut itemset yang memnuhi kriteria minimum support:, Berikut hasil perhitungan confidence: Pola 2 itemset Confidence b. 8 8 7 6 6 6 7 I6,W8 I6,W8 I6,W7 I8,W6 I7,W6 I7,W6 I6,W7 Pembentukan FP-Tree Dengan hasil dataset yang sudah ⁄ I6,P8 6 6 6 8 7 7 6 diolah tersebut, selanjutkan akan dibentuk FP-Tree dengan kombinasi 2 itemset. 4. Hubungan Mata Bahasa Inggris dengan Web Programming a. Berikut bentukan FP-Tree dari kombinasi 2 itemset bredasarkan table TID diatas. Dataset Berikut adalah tabel keterhubungan NULL antara mata pelajaran Bahasa Inggris dengan mata pelajaran Web Programming, berdasarkan pada dataset awal: Tabel TID merupakan bentuk dari 9 2 10 I6 I8 I7 dataset kombinasi 2 itemset mata pelajaran Bahasa Inggris dan Web Programming No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 I 7 7 6 6 7 7 7 6 6 6 7 8 7 6 W 8 6 6 8 6 7 7 7 7 6 6 7 8 8 Itemset I7,W8 I7,W6 I6,W6 I6,W8 I7,W6 I7,W7 I7,W7 I6,W7 I6,W7 I6,W6 I7,W6 I8,W7 I7,W8 I6,W8 2 5 2 1 W7 W6 c. 1 4 2 4 W8 FP-Growth Untuk langkah selanjut nya adalah tahap pembangkitan Conditional Patern Base, pembangkitan Conditional FP-Tree dan tahap pencarian frequent itemset. Pada tahapan ini dapat dilakukan dengan melihat kembali FP-Tree yang pernah dibuat sebelum nya Item Conditional Patern Base W6 {{M4:3}, {M5:2}, {M6:3}} W7 {{M4:2}, {M5:4}, {M6:1}} W8 {{M5:5}, {M6:2}} Item Conditional FP-Tree W6 {{M4:3}, {M5:2}, {M6:3}} W7 {{M4:2}, {M5:4}, {M6:1}} W8 {{M5:5}, {M6:2}} Untuk nilai bahasa pemrograman: Dengan Item Frequent Itemset W6 {{M4,W6:3}, {M5,W6:2}, itemset yang memnuhi kriteria minimum support:, Berikut hasil perhitungan confidence: {M6,W7:1}} Pola 2 itemset {{M5,W8:5}, {M6,W8:2}} I6,P8 d. nilai dengan mencari nilai confidence dari selurut {{M4,W7:2}, {M5,W7:4}, W8 seluruh Support, maka langkah selanjut nya yaitu {M6,W6:3}} W7 didapatkannya Confidence ⁄ Association Rule Setelah mendapat pola selanjutnya kita akan menghitung confidence berdasarkan dari tabel-tabel dan FP-Tree V. A. diatas. Sehingga hasil yang didapat dari perhitungan berdasarkan rumus support adalah. Untuk nilai Bahsa Inggris: Kesimpulan Kesimpulan dari hasil penelitian Dalam hal ini syarat minimum yang dibutuhkan adalah 25% Kesimpulan dan Saran tersebut adalah: 1. Berdasarkan hasil keterhubungan nilai matematika dengan pemrograman yang nilai bahasa memiliki nilai confidence tertinggi adalah 54.5%, dengan nilai matematika 5 dan bahasa pemrograman 8 2. Berdasarkan hasil keterhubungan nilai perbedaan dari sisi kecepatan dan keakuratan hasil dari kedua algoritma tersebut, sebagai aplikasi penerapan dari kedua algoritma tersebut. bahasa inggris dengan nilai bahasa pemrograman yang memiliki nilai confidence tertinggi adalah 66.7%, dengan nilai bahasa inggris 6 dan VI. Daftar Pustaka 1. Hernawati, Astuti. 2013. Pengenalan bahasa pemrograman 8 3. Berdasarkan hasil keterhubungan nilai matematika dengan programming yang nilai memiliki web Data Mining, Jakarta: Meda Kita. 2. nilai 3. inggris programming confidence dengan nilai web yang memiliki nilai tertinggi adalah 60%, 4. Data. dan Lutfi, Data Taufik. Mining. 2009. Jakarta: Arifin, Nurul Riza. 2009. Implementasi FP-Growth Menentukan Asosiasi Antar Produk (Studi Kasus NadiaMart). Semarang: Universitas Dian 5. Growth, didapatkan nilai confidence Apriori. Saran Adapun saran dari penulis, adalah sebagai berikut: M.S. Algorithms. proses yang lebih sederhana dan cepat menggunakan Mythili, 2013. Performance Evaluation of Apriori and FP-Growth yang variasi, dan terlihat perbedaan B. Basis dan Nuswantoro Untuk hasil dari proses Algoritma FP- dengan Kusrini Algoritma bahasa pemrograman 6 dibandingkan Konsep Penerbit Andi dengan nilai bahasa inggris 7 dan 5. Praktis Algoritma Berdasarkan hasil keterhubungan nilai bahasa 2005. Yogyakarta: Penerbit Andi web programming 8 4. Abdul. Tuntutan confidence tertinggi adalah 54.5%, dengan nilai matematika 5 dan bahasa Kadir, Tiruchirappalli: Bishop Heber College. 6. Larasati, Dyah Prameti. 2015. Analisis dan Implementasi Algoritma FP-Growth Pada Aplikasi Smart Untuk Menentukan Market Basket Analisis Pada Usaha Retail. Bandung: Universitas Telkom 1. Object dari penelitian bisa diperbanyak dengan menambah kelas lain di kelas X. Agar mendapatkan variasi data sebagai bahan acuan memberikan bahan ajaran kepada murid siswa kelas 10 pada mata pelajaran Pemrograman dan Bahasa Pemrograman 2. Membandingkan kedua proses dalam bentuk aplikasi, agar dapat terllihat Bandung.