Penggunaan Struktur Data SO TrieIT Untuk

advertisement
PENDAHULUAN
Latar Belakang
Begitu banyaknya fungsionalitas dalam
penggalian data terkadang membuat kita
harus memilih secara seksama. Pemilihan
fungsionalitas yang tepat dalam melakukan
suatu
penggalian
data
menentukan
keefektifan serta keefisienan waktu yang
dibutuhkan dalam mengekstrak data
tersebut.
Penggalian data dengan pola asosiasi
merupakan salah satu pilihan fungsionalitas
yang dapat kita cermati karena kegunaanya
yang dapat diterapkan pada berbagai macam
situasi seperti e-commerce, klasifikasi,
pengelompokan dan lain sebagainya. Dalam
penggalian data dengan pola asosiasi
ditemukan
atribut
–
atribut
yang
menunjukkan kondisi di mana atribut –
atribut tersebut muncul secara bersama –
sama dalam suatu data yang diberikan.
Penggalian data dengan pola asosiasi ini
lebih sering digunakan dalam pengolahan
dan analisis data transaksi, selanjutnya lebih
dikenal dengan nama market – basket
analysis. Ada beberapa algoritme yang dapat
digunakan untuk memperbaiki kinerja
penggalian data dengan pola asosiasi, namun
algoritme tersebut hanya dapat menangani
kondisi tertentu saja dan memiliki
kekurangan
dalam
kondisi
lainnya.
Sementara itu dalam penggalian data
keefektifan serta keefisienan sumber daya
yang digunakan sangat diperlukan.
Pada penelitian yang dilakukan oleh
Woon et al. (2004), penggabungan dua buah
algoritme FP – GROWTH dengan
FOLDARM
pada
metode
assosiasi
menghasilkan sebuah algoritme baru (FOLD
- Growth) yang memiliki kinerja yang lebih
baik. Algoritme ini menggunakan struktur
data SOTrieIT. Kinerja dari algoritme
tersebut menghasilkan proses yang lebih
fleksibel dan efisien jika dibandingkan
dengan algoritme – algoritme aturan
asosisiasi lainnya seperti Apriori dan FP Growth. Dengan demikian penggunaan
algoritme ini diharapkan dapat memperbaiki
kinerja algoritme sebelumnya dan dapat
diimplementasikan pada kasus penggalian
data transaksi berdasarkan market - basket.
menggunakan struktur data SOTrieIT serta
algoritme FOLD - Growth.
Ruang Lingkup
Ruang lingkup dari penelitian ini adalah :
1
2
Penggunaan metode association rule
untuk melakukan proses update
menggunakan algoritme FOLD –
Growth
hanya
terbatas
pada
penambahan data transaksi.
Pembahasan meliputi analisis hasil
penggalian yang meliputi confidence
serta support suatu item terhadap item
yang lain.
Manfaat
Diharapkan dengan adanya penelitian ini,
maka dapat menjadi sebuah referensi terhadap
pemilihan algoritme dalam metode association
rule. Penelitian ini juga memberikan sedikit
gambaran mengenai proses update suatu
transaksi saat dilakukan penggalian data.
TINJAUAN PUSTAKA
Penggalian Data (Data mining)
Data mining adalah proses pencarian suatu
korelasi - korelasi baru suatu data yang
mempunyai makna, pola dan tren tertentu
dengan cara menyelidiki atau meneliti suatu
data yang berukuran besar yang terdapat di
dalam suatu gudang data dengan menggunakan
teknologi pengenalan pola serta teknik statistik
dan matematika (Larose 2005).
Pola Asosiasi (Association Rule)
Pola asosiasi ialah salah satu teknik dalam
penggalian data yang bertujuan untuk
mengekstrak korelasi yang menarik, pola – pola
yang sering muncul, hubungan kumpulan item
di dalam suatu basis data atau gudang data yang
berisi record transaksi (Zhao et al. 2003).
Terdapat dua hal utama yang melandasi
teknik ini yaitu support dan confidence (Zhao et
al. 2003). Support dari suatu association rule
didefinisikan sebagai persentase dari record X
Y terhadap seluruh jumlah transaksi di dalam
basis data. Support dapat dihitung dengan
menerapkan rumus sebagai berikut :
Support (XY) =
SupportOfXY
TotalNumberOfTransaction
Tujuan
Penelitian
ini
bertujuan
untuk
menerapkan pemangkasan transaksi dengan
Confidence dari suatu association rule
didefinisikan sebagai persentase dari jumlah
1
Download