Penerapan Algoritma Apriori dan Algoritma FP-Growth - FST-UIA

advertisement
Penerapan Algoritma Apriori dan Algoritma FP-Growth Dalam
Menemukan Hubungan Data Nilai Ijazah Matematika dan Bahasa
Inggris Dengan Nilai Mata Pelajaran Pemrograman dan Web
Programming
(Studi Kasus SMK Sandikta Kelas X Bekasi)
Maulana, S.Kom.
Magister Ilmu Komputer, STMIK Nusa Mandiri, Jakarta
Menara Salemba Jl. Salemba Raya No. 5 Jakarta Pusat.
Email : [email protected].
Abstrak
Kata Kunci :
Data Mining, Algoritma Apriori, Algoritma FP-Growth, Mata Pelajaran,
Pemrograman, Web Programming, Matematika, Bahasa Inggris.
Abstract
Keywords : Data Mining, Apriori Algorithm, FP-Growth Algorithm, Subjects, Programming, Web
Programming, Math, English
I.
Pendahuluan
Penelitian ini bertujuan untuk
membandingkan proses dari dua Algoritma
yang sangat umum dalam Data Mining guna
mendapatkan informasi yang dibutuhkan.
Informasi tersebut berasal dari data-data
yang dikumpulkan. Data dapat berasal dari
beberapa sumber, seperti: hasil wawancara,
observasi dan juga database. Database
merupakan media penyimpanan dari sebuah
program, yang berisi data-data mengenai
institusi/organisasi yang menggunakan
program tersebut. Data-data tersebut tidak
akan bermanfaat hingga data tersebut dapat
dirubah menjadi informasi yang sangat
berguna.
Dalam melakukan atau merubah
data-data
tersebut
menjadi
sebuah
informasi yang bermanfaat, di butuhkan
suatu konsep untuk mencari atau membantu
menggali informasi tersebut. Salah satu
konsep yang berhubungan dengan hal ini
adalah Data Mining. Data Mining adalah
suatu konsep yang tujuan nya menemukan
data yang tersembunyi pada database dan
pengetahuan atau informasi yang tersebunyi
merupakan data yang
berjumlah besar.
di dalam database. Data mining merupakan
Konsep inilah yang juga akan digunakan
proses semi otomatik yang menggunakan
pada
teknik statistik, matematika, kecerdasan
SMK
Sandikta
Bekasi,
untuk
menemukan data-data yang terkait dengan
buatan
data nilai ijazah Matematika dan Bahasa
mengekstraksi
Inggris dengan data mata pelajaran Bahasa
informasi
Pemrograman dan Web Programming.
berguna yang tersimpan didalam database
Adapun
data
yang
diambil
merupakan data dari murid kelas X-A SMK
dan
machine
learning
dan
untuk
mengidentifikasi
pengetahuan
potensial
dan
besar (Turban, 2005).
Menutur
Gartner
Group,
Data
Sandikta, tahun ajaran 2013-2014. Dalam hal
Mining adalah suatu proses menemukan
ini kelas X tahun ajaran 2013-2014 SMK
hubungan
Sandikta menggunakan kurikulim 2013 yang
kecenderungan dengan memeriksa dalam
memuat dalam kurikulum tersebut mata
sekumpulan besar data yang tersimpan
pelajaran Bahasa Pemrograman dan Web
dalam penyampaian dengan menggunakan
Programming yang diajarkan pada kelas X.
teknik pengenalan pola seperti teknik
Penggunaaan
Data
diharapkan
dapat
keterhubungan
antara
Mining
ini
yang
berarti,
pola
dan
statistik dan matematika (Larose, 2005)
membantu
nilai
ijazah
B. Algoritma
Matematika dan Bahasa Inggris dengan
Algoritma adalah deskripsi langkah-
mata pelajaran Bahasa Pemrograman dan
langkah penyelesaian masalah yang tersusun
Web Programming, sehingga hasilnya nanti
secara logis atau urutan logis pengambilan
dapat menjadi referensi yang berguna dan
keputusan untuk pemecahan suatu masalah.
bermanfaat bagi Pihak SMK Sandikta Bekasi.
Algoritma ditulis dengan notasi khusus,
Selain itu dengan membandingkan dua
notasi mudah dimengerti dan notasi dapat
proses Data Mining dengan menggunakan
diterjemahkan menjadi sintaks suatu Bahasa
Algoritma Apriori dan Algoritma FP-Growth,
Pemrograman (Zakaria dan Priyono, 2006:5)
akan didapat kekurangan dan kelebihan
masing-masing proses Algoritma tersebut.
Suatu algoritma akan memerlukan
masukan
memulainya,
II.
Landasan Teori
dan
tertentu
akan
untuk
menghasilkan
keluaran (output) tertentu pada akhirnya.
A. Data Mining.
yang
(input)
Hal-hal yang harus diperhatikan dalam
Data mining adalah suatu konsep
algoritma adalah mencari langkah-langkah
digunakan
yang paling sesuai untuk menyelesaikan
untuk
menemukan
suau masalah, karena setiap algoritma
memiliki
karakteristik
tertentu
2. Sangat mudah dan sederhana dalam
yang
mengaplikasikan.
Beberapa hal yang harus dipahami
D. Algoritma FP-Growth
mempunyai kelebihan dan kekurangan.
dalam mencari algoritma antara lain:
Algoritma
1. Masalah seperti apa yang hendak
diselesaikan.
dari
Algoritma
Apriori.
Frequent Pattern Growth adalah salah satu
2. Gagasal apa yang ada pada algoritma
tersebut.
alternatif algoritma yang digunakan untuk
menentukan himpunan data yang paling
3. Berapa lama waktu yang diperlukan
untuk menyelesaikan masalah.
4. Berapa
pengembangan
FP-Growth merupakan
jumlah
data
sering muncul (frequent itemsets) dalam
sebuah kumpulan data (David, 2008).
yang
dapat
ditangani oleh sebuah algoritma.
Pada
Algoritma
FP-Growth
menggunakan konsep pembangunan tree,
yang disebut FP-Tree, dalam pencarian
C. Algoritma Apriori
frequent
Algoritma Apriori adalah salah satu
itemsets
bukan
menggunakan
generate candidate seperti yang dilakukan
algoritma pertama yang yang terbaik untuk
pada
melakukan
frequent
menggunakan konsep tersebut, Algoritma
teknik
FP-Growth menjadi lebih cepat dibandingkan
itemset
pencarian
dengan
semua
menggunakan
Association Rule (Erwin, 2009).
Algoritma Apriori juga bisa berfungsi
Algoritma
Apriori.
Dengan
dengan Algoritma Apriori (Erwin, 2009).
Metode FP-Growth dibagi menjadi
sebagai Algoritma untuk membentuk dan
tiga tahapan utama, yaitu (Micheline, 2006):
menghasilkan kandidat secara lebih baik.
1. Tahap pembangkitan conditional pattern
Karena algoritma ini menggunakan cara
pencarian dari data pertama hingga kandidat
terhitung.
base.
2. Tahap pembangkitan conditional pattern
Tree
3. Tahap pencarian frequent itemset.
E. Association Rule
Association Rule merupakan suatu
Keuntungan dari Algoritma Apriori adalah:
1. Dapat mengakomodasi data yang
sangat besar
proses pada data mining untuk menentukan
semua aturan asosiatif yang memenuhi
syarat minimum untuk support (minsup) dan
confidence (minconf) pada sebuah database.
Kedua
syarat
tersebut
akan
digunakan untuk interesting asociation rule
b.
Pembentukan Aturan Asosiasi
dengan dibandingkan dengan batasan yang
Setelah semua pola frekuensi tinggi
telah ditentukan, yaitu minsup dan minconf
ditemukan, barulah dicari aturan asosiasi
(Rosadi, 2013).
yang memenuhi syarat minimum untuk
Association
Rule
Mining
adalah
suatu prosedur untuk mencari hubungan
confidence, dengan menghitung aturan
asosiatif A->B.
item dalam dataset. Dimulai dengan mencari
frequent itemset, yaitu kombinasi yang
Nilai
confidence
dari
aturan
diperoleh dari rumus berikut:
paling sering terjadi dalam suatu itemset
(
dan harus memenuhi minsup (Rosadi, 2013).
)
∑
∑
F. Support and Confidence
Didalam Association Rule Mining ada
dua parameter penting yang berfungsi untuk
pembentukan rules yaitu support dan
confidence,
sehingga
dihasilkan
aturan
adalah
persentase
kombinasi suatu item dalam database,
sedangkan
confidence
adalah
kuatnya
hubungan antar item dalam aturan asosiasi.
Dalam analisa asosiasi mempunyai
metodologi dasar yang terbagi menjadi dua
Lokasi penelitian dilakukan di SMK
Sandikta Bekasi dengan Objek penelitian
yaitu siswa-siswi kelas X-A. Dari objek
tersebut dibutuhkan data awal dari nilai
ijazah SMP Mata Pelajaran Matematika dan
Bahasa Inggris serta data nilai akhir mata
pelajaran Bahasa Pemrograman dan Web
(kusrini, 2009):
a.
Metode Penelitian
A. Lokasi dan Objek Penelitian
asosiasi yang kuat (strong rules).
Support
III.
Analisa Pola Frekuensi Tinggi
Pada tahap ini untuk mencari
Programming untuk mencari keterhubungan
kedua data tersebut.
kombinasi item yang memenuhi syarat
minimum dari nilai support dalam database.
Nilai support sebuah item diperoleh dengan
rumus berikut:
(
)
(
)
B. Metode Pengumpulan Data.
1. Data Primer
(
)
∑
∑
Data
Primer
adalah
data
yang
dikumpulkan langsung dari responden.
Teknik pengumpulan data primer yang
dilakukan menggunakan satu cara, yaitu:
Matematika
Bahasa Inggris
Bahasa Pemrograman
Web Programming
Tabel 1
M
I
P
W
wawancara. Wawancara dilakukan pada
kepada Kepala Sekolah SMK Sandikta Bekasi,
tujuannya adalah meminta izin melakukan
riset
dan
meminta
data
murid
yang
Berikut data siswa berdasarkan itemset
diatas:
No
M
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
5
4
6
6
5
5
5
4
5
5
6
6
5
5
5
5
5
6
4
4
4
I
P
W
8
7
8
8
6
5
6
6
8
7
7
7
6
8
8
8
6
7
5
5
6
8
6
6
8
6
7
7
7
7
6
6
7
8
8
8
8
7
6
6
6
7
dibutuhkan.
2. Data Sekunder
Data Sekunder adalah data yang sudah
tersedia
sehingga
diberikan
oleh
data
Kepala
bisa
langsung
Sekolah.
Data
berbentuk softcopy yang sudah diolah
dengan microsoft excel, data tersebut sudah
diolah oleh Tata Usaha SMK Sandikta Bekasi.
IV.
Hasil Penelitian
Setelah mendapatkan data maka
dilakukan
proses
penerapan
Algoritma
Apriori dan Algoritma FP-Growth pada mata
pelajaran Matematika dan Bahasa Inggris
dengan
data
nilai
Mata
Pelajaran
Pemrograman dan Web Programming.
A. Algoritma Apriori
Dari
ditentukan
data-data
tersebut
itemset-itemset
yang
7
7
6
6
7
7
7
6
6
6
7
8
7
6
6
6
6
8
7
7
6
Tabel 2
telah
akan
digunakan.
1. Nilai
Itemset
digunakan
Data
yang
inisialisasi
Matematika
Pemrograman
dan
Bahasa
Langkah pertama yang dilakukan
P8
7
adalah penginisialisasian. Tujuannya adalah
memudahkan
saat
melakukan
proses
perhitungan.
Tabel 4
Data
yang
tidak
Nilai 4 berinisial M4, Nilai 5 berinisial M5
dan Nilai 6 berinisial M6.
Iterasi 2.1.A.
Pola
Kombinasi
menjadi 4: Nilai 5 berinisial P5, Nilai 6
itemset
yang
1.1.A.
berinisial P6, Nilai 7 berinisial P7 dan Nilai 8
Pola 2
itemset
Jumlah
(K)
berinisial P8.
M5,P6
4
M5,P8
5
P6,P8
0
Suport
Tabulasi Data
Jumlah
5
11
5
3
6
5
7
Tabel 3
K+1
⁄
Iterasi 1.1.A.
Itemset
M4
M5
M6
P5
P6
P7
P8
2
mememenuhi minimum support di Iterasi
Nilai Bahasa Pemrograman dibagi
5
⁄
6
0
Support
⁄
⁄
0
0
Tabel 5
Proses pengkombinasian hanya sampai pola
2 itemset.
Tabel Final Association Rule
Pola 2
itemset
M5,P8
2.
minimum
support akan di eliminasi.
Nilai Matematika dibagi menjadi 3:
1.
memenuhi
Suport
Confidence
⁄
⁄
Frequent Itemset, dengan mengoleksi
Tabel 6
data berdasarkan minimum support
25%
Itemset
M4
1.
Jumlah
5
Support
Nilai Bahasa Inggris dan Bahasa
Pemrograman
Langkah pertama yang dilakukan
M5
11
adalah penginisialisasian. Tujuannya adalah
M6
5
memudahkan
P5
3
P6
6
3: Nilai 5 berinisial I6, Nilai 7 berinisial I7
P7
5
dan Nilai 8 berinisial I8.
saat
melakukan
proses
perhitungan.
Nilai Bahasa Inggris dibagi menjadi
Nilai Bahasa Pemrograman dibagi
Iterasi 2.2.A.
menjadi 4: Nilai 5 berinisial P5, Nilai 6
1. Pola Kombinasi 2 itemset yang
berinisial P6, Nilai 7 berinisial P7 dan Nilai 8
mememenuhi minimum support di
berinisial P8.
Iterasi 1.2.A.
Iterasi 1.2.A.
1. Tabulasi Data
Itemset
I6
I7
I8
P5
P6
P7
P8
Pola 2
itemset
I6,P6
Jumlah
9
10
2
3
6
5
7
Jumlah
⁄
⁄
⁄
⁄
2
I6,P8
6
I7,P6
4
I7,P8
1
I6,I7
0
0
P6,P8
0
0
Tabel 7
2.
Suport
Tabel 9
Frequent Itemset, dengan mengoleksi
Proses pengkombinasian hanya sampai pola
data berdasarkan minimum support
2 itemset.
25%
Tabel Final Association Rule
Itemset
I6
Jumlah
9
I7
10
I8
2
P5
3
P6
6
P7
5
Support
Pola 2
itemset
Suport
Confidence
⁄
I6,P8
⁄
Tabel 10
3.
Nilai
Matematika
dan
Web
Programming
Langkah pertama yang dilakukan
adalah penginisialisasian. Tujuannya adalah
P8
7
memudahkan
Tabel 8
saat
melakukan
proses
perhitungan.
Nilai Matematika dibagi menjadi 3:
Data yang tidak memenuhi minimum
Nilai 4 berinisial M4, Nilai 5 berinisial M5
support akan di eliminasi.
dan Nilai 6 berinisial M6.
Nilai
Web
Programming
dibagi
menjadi 3: Nilai 6 berinisial W6, Nilai 7
berinisial W7 dan Nilai 8 berinisial W8.
Iterasi 1.3.A.
Pola 2
itemset
Jumlah
(K)
M5,W6
2
M5,W7
4
M5,W8
5
W6,W7
W6,W8
W7,W8
0
0
0
K+1
⁄
Support
⁄
3
⁄
1. Tabulasi Data
Itemset
Jumlah
M4
5
M5
11
M6
5
W6
8
W7
7
W8
6
Tabel 11
Suport
⁄
5
⁄
⁄
6
0
0
0
0
0
0
0
0
0
Tabel 13
Proses pengkombinasian hanya sampai pola
2 itemset.
Tabel Final Association Rule
2. Frequent Itemset, dengan mengoleksi
data berdasarkan minimum support
Pola 2
itemset
M5,W8
25%
Suport
Confidence
⁄
⁄
Itemset
M4
Jumlah
5
Support
M5
11
M6
5
W6
8
adalah penginisialisasian. Tujuannya adalah
W7
7
memudahkan
W8
6
Tabel 14
4.
Nilai
Bahasa
Inggris
dan
Web
Programming
Langkah pertama yang dilakukan
saat
melakukan
proses
perhitungan.
Nilai Bahasa Inggris dibagi menjadi
Tabel 12
3: Nilai 5 berinisial I6, Nilai 7 berinisial I7
dan Nilai 8 berinisial I8.
Data
yang
tidak
memenuhi
minimum
Nilai
Web
Programming
dibagi
support akan di eliminasi.
menjadi 3: Nilai 6 berinisial W6, Nilai 7
Iterasi 2.3.A.
berinisial W7 dan Nilai 8 berinisial W8.
1. Pola
Kombinasi
2
itemset
yang
mememenuhi minimum support di
Iterasi 1.3.A.
Iterasi 1.4.A.
1. Tabulasi Data
Itemset
I6
I7
Jumlah
9
10
I8
W6
W7
W8
2
8
7
6
Tabel 15
2. Frequent Itemset, dengan mengoleksi
Pola 2
itemset
Jumlah
(K)
I6,W6
2
I6,W7
3
I6,W8
4
I7,W6
5
I7,W7
3
I8,W8
2
data berdasarkan minimum support
25%
Itemset
I6
Jumlah
9
I7
10
I8
2
W6
8
W7
7
W8
6
Support
Suport
K+1
⁄
⁄
3
⁄
⁄
4
⁄
⁄
5
⁄
⁄
6
⁄
⁄
4
⁄
Support
⁄
3
Tabel 17
Proses pengkombinasian hanya sampai pola
2 itemset.
Tabel Final Association Rule
Pola 2
itemset
Tabel 16
I7,W6
support akan di eliminasi.
2
itemset
yang
mememenuhi minimum support di
Iterasi 1.4.A.
⁄
⁄
B. Algoritma FP-Growth
Iterasi 2.4.A.
Kombinasi
Confidence
Tabel 18
Data yang tidak memenuhi minimum
2. Pola
Suport
Berikut dataset yang akan digunakan
dalam
pengolahan
data
menggunakan
Algoritma FP-Growth
Itemset
Data
yang
digunakan
Matematika
Bahasa Inggris
Bahasa Pemrograman
Web Programming
Tabel 19
inisialisasi
M
I
P
W
Berikut data siswa berdasarkan itemset
diatas:
Nilai Bahasa Pemrograman dibagi
menjadi 4: Nilai 5 berinisial P5, Nilai 6
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
M
5
4
6
6
5
5
5
4
5
5
6
6
5
5
5
5
5
6
4
4
4
I
7
7
6
6
7
7
7
6
6
6
7
8
7
6
6
6
6
8
7
7
6
Tabel 20
P
8
7
8
8
6
5
6
6
8
7
7
7
6
8
8
8
6
7
5
5
6
W
8
6
6
8
6
7
7
7
7
6
6
7
8
8
8
8
7
6
6
6
7
berinisial P6, Nilai 7 berinisial P7 dan Nilai 8
berinisial P8.
Nilai
Web
Programming
dibagi
menjadi 3: Nilai 6 berinisial W6, Nilai 7
berinisial W7 dan Nilai 8 berinisial W8.
Berikut adalah tabel Inisial dan
frekuensi dari itemset-itemset pada dataset
awal
Itemset
Jumlah
M4
5
M5
11
M6
5
I6
9
I7
10
I8
2
W6
8
W7
7
W8
6
P5
3
P6
6
P7
5
P8
7
Tabel 21
Untuk selanjutnya dataset tersebut
akan di inisialisasi untuk memudahkan
dalam membuat data frekuensi kemunculan
1.
dengan Bahasa Pemrograman
itemset tersebut.
Berikut
insialisasi
Hubungan Mata Pelajaran Matematika
dari
itemset-itemset
tersebut:
Nilai Matematika dibagi menjadi 3:
Nilai 4 berinisial M4, Nilai 5 berinisial M5
dan Nilai 6 berinisial M6.
Nilai Bahasa Inggris dibagi menjadi
3: Nilai 5 berinisial I6, Nilai 7 berinisial I7
dan Nilai 8 berinisial I8.
a.
Dataset
Berikut adalah tabel keterhubungan
antara mata pelajaran Matematika dengan
mata pelajaran Pemrograman, berdasarkan
pada dataset awal.
Tabel TID merupakan bentuk dari
dataset kombinasi 2 itemset mata pelajaran
Matematika dan Bahasa Pemrograman.
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
M
5
4
6
6
5
5
5
4
5
5
6
6
5
5
5
5
5
6
4
4
4
P
8
7
8
8
6
5
6
6
8
7
7
7
6
8
8
8
6
7
5
5
6
Itemset
M5,P8
M4,P7
M6,P8
M6,P8
M5,P6
M5,P5
M5,P6
M4,P6
M5,P8
M5,P7
M6,P7
M6,P7
M5,P6
M5,P8
M5,P8
M5,P8
M5,P6
M6,P7
M4,P5
M4,P5
M4,P6
NULL
5
M4
2
1
5
11
M6
M5
2
1
4
c.
5
1
P6
P5
2
3
P7
P8
FP-Growth
Untuk langkah selanjut nya adalah
tahap pembangkitan Conditional Patern
Base, pembangkitan Conditional FP-Tree dan
tahap pencarian frequent itemset.
Pada tahapan ini dapat dilakukan
b.
dengan melihat kembali FP-Tree yang
Pembentukan FP-Tree
Dengan hasil dataset yang sudah
pernah dibuat sebelum nya
diolah tersebut, selanjutkan akan dibentuk
FP-Tree dengan kombinasi 2 itemset.
Berikut
bentukan
FP-Tree
dari
kombinasi 2 itemset bredasarkan table TID
diatas.
Item
Conditional Patern Base
P5
{{M4:2}, {M5:1}}
P6
{{M4:2}, {M5:4}}
P7
{{M4:1}, {M5:1}, {M6:3}}
P8
{{M5:5}, {M6:2}}
Item
Conditional FP-Tree
P5
{{M4:2}, {M5:1}}
P6
{{M4:2}, {M5:4}}
P7
{{M4:1}, {M5:1}, {M6:3}}
P8
{{M5:5}, {M6:2}}
Item
Frequent Itemset
Dengan
P5
{{M4,P4:2}, {M5,P5:1},{P5:3)}
Support, maka langkah selanjut nya yaitu
P6
{{M4,P6:2}, {M5,P6:4},{P6:6}}
dengan mencari nilai confidence dari selurut
P7
{{M4,P7:1}, {M5,P7:1},
itemset yang memnuhi kriteria minimum
{M6,P7:3},{P7:5}}
support:,
{{M5,P8:5}, {M6,P8:2},{P8:7}}
Berikut hasil perhitungan confidence:
P8
didapatkannya
Pola 2
itemset
d.
seluruh
nilai
Confidence
Association Rule
Setelah mendapat pola selanjutnya
kita
akan
menghitung
M5,W8
⁄
confidence
berdasarkan dari tabel-tabel dan FP-Tree
2.
diatas.
dengan Web Programming
Dalam hal ini syarat minimum yang
dibutuhkan adalah 25%
Hubungan Mata Pelajaran Matematika
a.
Dataset
Sehingga hasil yang didapat dari
Berikut adalah tabel keterhubungan
perhitungan berdasarkan rumus support
antara mata pelajaran Matematika dengan
adalah:
mata Web Programming, berdasarkan pada
Untuk nilai matematika:
dataset awal.
Tabel
ID merupakan bentuk dari
dataset kombinasi 2 itemset mata pelajaran
Matematika dan Web Programming.
Untuk nilai bahasa pemrograman:
No
1
2
3
4
5
6
7
8
9
10
11
12
M
5
4
6
6
5
5
5
4
5
5
6
6
W
8
6
6
8
6
7
7
7
7
6
6
7
Itemset
M5,W8
M4,W6
M6,W6
M6,W8
M5,W6
M5,W7
M5,W7
M4,W7
M5,W7
M5,W6
M6,W6
M6,W7
13
14
15
16
17
18
19
20
21
5
5
5
5
5
6
4
4
4
8
8
8
8
7
6
6
6
7
Pada tahapan ini dapat dilakukan
M5,W8
M5,W8
M5,W8
M5,W8
M5,W7
M6,W6
M4,W6
M4,W6
M4,W7
dengan melihat kembali FP-Tree yang
pernah dibuat sebelum nya
Item
Conditional Patern Base
W6
{{M4:3}, {M5:2}, {M6:3}}
W7
{{M4:2}, {M5:4}, {M6:1}}
W8
{{M5:5}, {M6:2}}
Item
Conditional FP-Tree
diolah tersebut, selanjutkan akan dibentuk
W6
{{M4:3}, {M5:2}, {M6:3}}
FP-Tree dengan kombinasi 2 itemset.
W7
{{M4:2}, {M5:4}, {M6:1}}
W8
{{M5:5}, {M6:2}}
Item
Frequent Itemset
W6
{{M4,W6:3}, {M5,W6:2},
b.
Pembentukan FP-Tree
Dengan hasil dataset yang sudah
Berikut
bentukan
FP-Tree
dari
kombinasi 2 itemset bredasarkan table TID
diatas.
{M6,W6:3}}
NULL
W7
{{M4,W7:2}, {M5,W7:4},
{M6,W7:1}}
5
5
11
M4
W8
{{M5,W8:5}, {M6,W8:2}}
M6
M5
e.
Association Rule
Setelah mendapat pola selanjutnya
3
2
3
W6
2
4
1
2
5
W7
W8
kita
akan
menghitung
confidence
berdasarkan dari tabel-tabel dan FP-Tree
diatas.
Dalam hal ini syarat minimum yang
dibutuhkan adalah 25%
e.
FP-Growth
Untuk langkah selanjut nya adalah
Sehingga hasil yang didapat dari
perhitungan berdasarkan rumus support
tahap pembangkitan Conditional Patern
adalah.
Base, pembangkitan Conditional FP-Tree dan
Untuk nilai matematika:
tahap pencarian frequent itemset.
mata pelajaran Bahasa Inggris dan Bahasa
Pemrograman
Untuk nilai bahasa pemrograman:
Dengan
didapatkannya
seluruh
nilai
Support, maka langkah selanjut nya yaitu
dengan mencari nilai confidence dari selurut
itemset yang memnuhi kriteria minimum
support:,
Berikut hasil perhitungan confidence:
Pola 2
itemset
M5,W8
Confidence
No
1
2
3
4
5
6
I
7
7
6
6
7
7
P
8
7
8
8
6
5
Itemset
I7,P8
I7,P7
I6,P8
I6,P8
I7,P6
I7,P5
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
7
6
6
6
7
8
7
6
6
6
6
8
7
7
6
6
6
8
7
7
7
6
8
8
8
6
7
5
5
6
I7,P6
I6,P6
I6,P8
I6,P7
I7,P7
I8,P7
I7,P6
I6,P8
I6,P8
I6,P8
I6,P6
I8,P7
I7,P5
I7,P5
I6,P6
⁄
b.
Pembentukan FP-Tree
Dengan hasil dataset yang sudah
3.
Hubungan Mata Bahasa Inggris dengan
Bahasa Pemrograman
a.
diolah tersebut, selanjutkan akan dibentuk
FP-Tree dengan kombinasi 2 itemset.
Dataset
Berikut
Berikut adalah tabel keterhubungan
antara mata pelajaran Bahasa Inggris dengan
mata pelajaran Pemrograman, berdasarkan
pada dataset awal:
Tabel TID
berikut merupakan
bentuk dari dataset kombinasi 2 itemset
bentukan
FP-Tree
dari
kombinasi 2 itemset bredasarkan table TID
diatas.
NULL
10
I6
3
I8
I7
3
3
2
2
1
P6
P5
2
9
P7
Frequent Itemset
P5
{{I7,P5:3}}
P6
{{I6,P6:3}, {I7,P6:3}}
P7
{{I6,P7:1}, {I7,P7:2}, {I8,P7:2}}
P8
{{I6,P8:6}, {I7,P8:1}}
d.
1
6
Item
Association Rule
Setelah mendapat pola selanjutnya
P8
kita
akan
menghitung
confidence
berdasarkan dari tabel-tabel dan FP-Tree
diatas.
Dalam hal ini syarat minimum yang
c. FP-Growth
dibutuhkan adalah 25%
Untuk langkah selanjut nya adalah
Sehingga hasil yang didapat dari
tahap pembangkitan Conditional Patern
perhitungan berdasarkan rumus support
Base, pembangkitan Conditional FP-Tree dan
adalah.
tahap pencarian frequent itemset.
Untuk nilai Bahsa Inggris:
Pada tahapan ini dapat dilakukan
dengan melihat kembali FP-Tree yang
pernah dibuat sebelum nya
Item
Conditional Patern Base
P5
{{I7:3}}
P6
{{I6:3}, {I7:3}}
P7
{{I6:1}, {I7:2}, {I8:2}}
P8
{{I6:6}, {I7:1}}
Item
Conditional FP-Tree
P5
{{I7:3}}
P6
{{I6:3}, {I7:3}}
P7
{{I6:1}, {I7:2}, {I8:2}}
P8
{{I6:6}, {I7:1}}
Untuk nilai bahasa pemrograman:
Dengan
didapatkannya
seluruh
nilai
15
16
17
18
19
20
21
Support, maka langkah selanjut nya yaitu
dengan mencari nilai confidence dari selurut
itemset yang memnuhi kriteria minimum
support:,
Berikut hasil perhitungan confidence:
Pola 2
itemset
Confidence
b.
8
8
7
6
6
6
7
I6,W8
I6,W8
I6,W7
I8,W6
I7,W6
I7,W6
I6,W7
Pembentukan FP-Tree
Dengan hasil dataset yang sudah
⁄
I6,P8
6
6
6
8
7
7
6
diolah tersebut, selanjutkan akan dibentuk
FP-Tree dengan kombinasi 2 itemset.
4.
Hubungan Mata Bahasa Inggris dengan
Web Programming
a.
Berikut
bentukan
FP-Tree
dari
kombinasi 2 itemset bredasarkan table TID
diatas.
Dataset
Berikut adalah tabel keterhubungan
NULL
antara mata pelajaran Bahasa Inggris dengan
mata
pelajaran
Web
Programming,
berdasarkan pada dataset awal:
Tabel TID merupakan bentuk dari
9
2
10
I6
I8
I7
dataset kombinasi 2 itemset mata pelajaran
Bahasa Inggris dan Web Programming
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
I
7
7
6
6
7
7
7
6
6
6
7
8
7
6
W
8
6
6
8
6
7
7
7
7
6
6
7
8
8
Itemset
I7,W8
I7,W6
I6,W6
I6,W8
I7,W6
I7,W7
I7,W7
I6,W7
I6,W7
I6,W6
I7,W6
I8,W7
I7,W8
I6,W8
2
5
2
1
W7
W6
c.
1
4
2
4
W8
FP-Growth
Untuk langkah selanjut nya adalah
tahap pembangkitan Conditional Patern
Base, pembangkitan Conditional FP-Tree dan
tahap pencarian frequent itemset.
Pada tahapan ini dapat dilakukan
dengan melihat kembali FP-Tree yang
pernah dibuat sebelum nya
Item
Conditional Patern Base
W6
{{M4:3}, {M5:2}, {M6:3}}
W7
{{M4:2}, {M5:4}, {M6:1}}
W8
{{M5:5}, {M6:2}}
Item
Conditional FP-Tree
W6
{{M4:3}, {M5:2}, {M6:3}}
W7
{{M4:2}, {M5:4}, {M6:1}}
W8
{{M5:5}, {M6:2}}
Untuk nilai bahasa pemrograman:
Dengan
Item
Frequent Itemset
W6
{{M4,W6:3}, {M5,W6:2},
itemset yang memnuhi kriteria minimum
support:,
Berikut hasil perhitungan confidence:
{M6,W7:1}}
Pola 2
itemset
{{M5,W8:5}, {M6,W8:2}}
I6,P8
d.
nilai
dengan mencari nilai confidence dari selurut
{{M4,W7:2}, {M5,W7:4},
W8
seluruh
Support, maka langkah selanjut nya yaitu
{M6,W6:3}}
W7
didapatkannya
Confidence
⁄
Association Rule
Setelah mendapat pola selanjutnya
kita
akan
menghitung
confidence
berdasarkan dari tabel-tabel dan FP-Tree
V.
A.
diatas.
Sehingga hasil yang didapat dari
perhitungan berdasarkan rumus support
adalah.
Untuk nilai Bahsa Inggris:
Kesimpulan
Kesimpulan dari hasil penelitian
Dalam hal ini syarat minimum yang
dibutuhkan adalah 25%
Kesimpulan dan Saran
tersebut adalah:
1.
Berdasarkan hasil keterhubungan nilai
matematika
dengan
pemrograman
yang
nilai
bahasa
memiliki
nilai
confidence tertinggi adalah 54.5%,
dengan nilai matematika 5 dan bahasa
pemrograman 8
2.
Berdasarkan hasil keterhubungan nilai
perbedaan dari sisi kecepatan dan
keakuratan hasil dari kedua algoritma
tersebut, sebagai aplikasi penerapan
dari kedua algoritma tersebut.
bahasa inggris dengan nilai bahasa
pemrograman
yang
memiliki
nilai
confidence tertinggi adalah 66.7%,
dengan nilai bahasa inggris 6 dan
VI.
Daftar Pustaka
1. Hernawati, Astuti. 2013. Pengenalan
bahasa pemrograman 8
3.
Berdasarkan hasil keterhubungan nilai
matematika
dengan
programming
yang
nilai
memiliki
web
Data Mining, Jakarta: Meda Kita.
2.
nilai
3.
inggris
programming
confidence
dengan
nilai
web
yang
memiliki
nilai
tertinggi
adalah
60%,
4.
Data.
dan
Lutfi,
Data
Taufik.
Mining.
2009.
Jakarta:
Arifin, Nurul Riza. 2009. Implementasi
FP-Growth
Menentukan
Asosiasi Antar Produk (Studi Kasus
NadiaMart). Semarang: Universitas Dian
5.
Growth, didapatkan nilai confidence
Apriori.
Saran
Adapun saran dari penulis, adalah
sebagai berikut:
M.S.
Algorithms.
proses yang lebih sederhana dan cepat
menggunakan
Mythili,
2013.
Performance
Evaluation of Apriori and FP-Growth
yang variasi, dan terlihat perbedaan
B.
Basis
dan
Nuswantoro
Untuk hasil dari proses Algoritma FP-
dengan
Kusrini
Algoritma
bahasa pemrograman 6
dibandingkan
Konsep
Penerbit Andi
dengan nilai bahasa inggris 7 dan
5.
Praktis
Algoritma
Berdasarkan hasil keterhubungan nilai
bahasa
2005.
Yogyakarta: Penerbit Andi
web programming 8
4.
Abdul.
Tuntutan
confidence tertinggi adalah 54.5%,
dengan nilai matematika 5 dan bahasa
Kadir,
Tiruchirappalli:
Bishop
Heber College.
6.
Larasati, Dyah Prameti. 2015. Analisis
dan Implementasi Algoritma FP-Growth
Pada Aplikasi Smart Untuk Menentukan
Market Basket Analisis Pada Usaha
Retail. Bandung: Universitas Telkom
1. Object dari penelitian bisa diperbanyak
dengan menambah kelas lain di kelas X.
Agar mendapatkan variasi data sebagai
bahan acuan memberikan bahan ajaran
kepada murid siswa kelas 10 pada mata
pelajaran Pemrograman dan Bahasa
Pemrograman
2.
Membandingkan kedua proses dalam
bentuk aplikasi, agar dapat terllihat
Bandung.
Download