data mining untuk analisa tingkat kejahatan jalanan dengan

advertisement
Volume : III, Nomor : 1, Mei 2014
Majalah Ilmiah
Informasi dan Teknologi Ilmiah (INTI)
ISSN : 2339-210X
DATA MINING UNTUK ANALISA TINGKAT KEJAHATAN JALANAN
DENGAN ALGORITMA ASSOCIATION RULE METODE APRIORI
(Studi Kasus Di Polsekta Medan Sunggal)
Fadlina
Pasca Sarjana Ilmu Komputer Universitas Putra Indonesia “YPTK” PADANG
Alamat : Jl. Raya Lubuk Begalung Padang, Sumatera Barat
No. Telepon : (0751) 776666-72472-730000, Fax : (0751) 71973
Website : http://upi-yptk.ac.id // Email : [email protected]
Abstrack
Data mining, or often referred to as knowledge discovery in databases (KDD) is acollection of activities
that include, the use of historical data to discoverregularities,patterns or relationships in large data. In this thesis
data mining is used to analyze the level of street crime. This technique aims to provide information about the
area and the potential for street crime that can assist the police in anticipation of a crime that often appears, was
done by using analysis of habit how often do street crimes. Detection of crime which often occur simultaneously
called association rule (association rules). Algorithm that can be used to find Apriori association rule is. Apriori
algorithm is the association rule mining through multiple scan data sets, find a relationship between the variables
and present a strong rule in a large database. The data is taken as a case study of street crime data Polsekta
Sunggal Medan. Test data using data mining software Tanagra and Microsoft Excel for data storage. Results
from a combination of patterns and rules obtained to provide information that could be followed up or contain
important information that can be utilized to enhance the security and sensitivity of street crime.
Keywords: Data mining, Association rules, Apriori, Knowledge Discovery in Database
1. Pendahuluan
1.1.
Latar Belakang Masalah
Perkembangan jaman berdampak pada
perkembangan masyarakat, perilaku, maupun
pergeseran
budaya.
Terjadinya
peningkatan
kepadatan penduduk, pengangguran bertambah,
kemiskinan yang mengakibatkan tingginya angka
kriminalitas terutama di daerah urban yang padat.
Makaampoh, (2013) dalam penelitiannya
menyatakan tindak kekerasan dalam KUHP salah
satunya adalah aksi kejahatan jalanan (Street Crime)
seperti
pencurian,
pemerasan,
pemerkosaan,
penganiayaan, tindak kekerasan terhadap orang atau
barang, perilaku Mabuk dimuka umum, yang
tentunya dapat mengganggu ketertiban umum serta
menimbulkan keresahan di masyarakat
Kepolisian berkaitan dengan fungsinya
sebagai pengayom masyarakat diharapkan mampu
mengambil tindakan dalam menyikapi fenomena
kejahatan jalanan dengan melakukan operasi razia
dalam mengungkap kejahatan yang dapat dilakukan
dengan menggunakan teknik analisis dari kebiasaan
seberapa sering kejahatan jalanan dilakukan.
Pendeteksian kejahatan yang sering terjadi secara
bersamaan disebut association rule (aturan asosiasi).
Wakabi-Waiswa dan Baryamureeba, (2008)
menggunakan Association rule untuk mengekstrak
atau menarik korelasi dari pola yang sering muncul
atau struktur kasual antara set item dalam transaksi
database atau repository data lainnya.
Umarani
dan
Punithavalli,
(2011)
menggunakan Proses pertambangan aturan asosiasi
dari database yang besar menjadi dua langkah yaitu
generasi itemset sering yang disebut minsupport dan
association rule generation dari itemset sering,
menghasilkan semua aturan asosiasi yang disebut
minconfidence. Algoritma yang dapat digunakan
untuk menemukan association rule adalah Apriori.
Algoritma Apriori adalah aturan asosiasi
pertambangan melalui beberapa scan set data,
menemukan hubungan antara variabel
dan
menyajikan aturan yang kuat dalam database yang
besar (Padmaja dan Poongodai, 2011).
Dalam penelitian Prasad dan Malik, (2011)
juga mengimplementasikan algoritma apriori untuk
aturan dari dataset yang berisi transaksi penjualan
toko ritel. Sedangkan dalam penelitian ini akan
dilakukan pengujian apakah metode Association Rule
dapat digunakan untuk menyelesaikan permasalahan
pada data kejahatan jalanan. Data yang digunakan
adalah daerah dan jenis kejahatan jalanan dari data
statistik Polsek Medan Sunggal. Hasil dari penelitian
ini diharapkan dapat memberikan informasi
mengenai daerah dan potensi kejahatan jalanan yang
dapat
membantu
pihak
kepolisian
dalam
mengantisipasi kejahatan yang sering muncul.
1.2. Perumusan Masalah
Berdasarkan uraian latar belakang, maka
penulis merumuskan suatu permasalahan yaitu
sebagai berikut:
1. Bagaimana menganalisa tingkat
kejahatan
jalanan untuk menemukan aturan assosiatif
antara suatu kombinasi item dan membentuk
Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule
Metode Apriori. Oleh : Fadlina
144
Volume : III, Nomor : 1, Mei 2014
2.
3.
pola kombinasi itemsets dengan menggunakan
algoritma apriori?
Bagaimana mengimplementasikan Data Mining
dengan algoritma Association Rule untuk
menganalisa tingkat kejahatan jalanan?
Bagaimana faktor pendukung tersebut bisa
dijadikan
sebagai
informasi
dalam
meningkatkan kewaspadaan masyarakat agar
terhindar dari kejahatan di jalanan (Street
Crime)?
1.3 Batasan Masalah
Agar penulisan tesis tidak lepas dari latar
belakang dan perumusan masalah, maka penulis
membuat batasan masalahnya yaitu sebagai berikut :
1. Menggunakan data mining Association Rule
untuk menghasilkan rules dan algoritma Apriori
untuk menemukan pola kombinasi itemset
2. Data yang digunakan adalah data kejahatan
jalanan (Street Crime) dan daerah kejahatan pada
Polsekta Medan Sunggal.
3. Menggunakan aplikasi atau tools data mining
Tanagra sebagai pengujian data.
1.4 Tujuan Penelitian
Beberapa tujuan yang ingin dicapai dalam
penelitian ini yaitu sebagai berikut:
1. Mengimplementasikan data mining Association
Rule dan Algoritma Apriori pada kejahatan
jalanan untuk mengekstrak ilmu pengetahuan,
informasi penting dan menarik dari database.
2. Membentuk pola kombinasi itemsets dari data
kejahatan
jalanan
dengan
menggunakan
algoritma Apriori .
3. Menghasilkan rules dari pola kombinasi itemsets
yang interesting, sehingga dapat diketahui tingkat
kejahatan jalanan apa yang sering dilakukan.
4. Merancang metode Association Rule untuk
penanganan kejahatan jalanan sehingga dapat
meningkatkan efektifitas dan efesiensi kinerja
kepolisian.
5. Membangun suatu pengetahuan baru dalam
menganalisa tingkat kejahatan sehingga dapat
meningkatkan
keamanan
dan
sensitifitas
kejahatan.
6. Menguji Data kejahatan jalanan dengan
menggunakan Tools Tanagra sehingga informasi
ini dapat membantu kepolisian dalam mengatasi
tingkat kriminaliatas.
2. Landasan Teori
Landasan teori merupakan panduan untuk
membahas tentang teori pemecahan masalah yang
dihadapi. Dalam hal ini akan dikemukakan beberapa
teori yang berhubungan dan relevan dengan masalah
yang dibahas dalam penelitian ini.
Teori-teori yang menjadi landasan dalam
penulisan tesis ini antara lain teori Data Mining,
Algoritma Appriori, dan pada tesis ini juga penulis
Majalah Ilmiah
Informasi dan Teknologi Ilmiah (INTI)
ISSN : 2339-210X
juga menyampaikan jenis dan bentuk dari algoritma
Association Rule.
2.1 Data Mining
Tahun 90-an telah melahirkan “gunungan”
data di bidang ilmu pengetahuan, bisnis dan
pemerintah. Kemampuan teknologi informasi untuk
mengumpulkan dan menyimpan berbagai tipe data
jauh meninggalkan kemampuan untuk menganalisis,
meringkas dan mengekstraksi “pengetahuan” dari
data. Metodologi tradisional untuk menganalisis data
yang ada, tidak dapat menangani data dalam jumlah
besar. Sementara para pelaku bisnis memiliki
kebutuhan-kebutuhan untuk memanfaatkan gudang
data yang sudah dimiliki, para peneliti melihat
peluang untuk melahirkan sebuah teknologi baru
yang menjawab kebutuhan ini, yaitu data mining.
Teknologi ini sekarang sudah ada dan diaplikasikan
oleh perusahaan perusahaan untuk memecahkan
berbagai permasalahan bisnis dan juga untuk
menggali pengetahuan baru dari bongkahan data
2.2. Defenisi Data Mining
Data mining atau sering disebut sebagai
knowledge discovery in database (KDD) adalah
kegiatan yang meliputi pengumpulan, pemakaian
data historis untuk menemukan keteraturan, pola atau
hubungan dalam data berukuran besar. Keluaran data
mining ini bisa dipakai untuk membantu
pengambilan
keputusan
di
masa
depan.
Pengembangan KDD ini menyebabkan penggunaan
pattern recognition semakin berkurang karena telah
menjadi bagian data mining (Subekti Mujiasih,
2011).
Metode ini merupakan gabungan 4 (empat)
disiplin ilmu yakni statistik, visualisasi, database,
dan machine learning). Adapun machine learning
adalah suatu area dalam artificial intelligence atau
kecerdasan buatan yang berhubungan dengan
pengembangan
teknik-teknik
pemrograman
berdasarkan
pembelajaran
masa
lalu
dan
bersinggungan dengan ilmu statistika dan juga
optimasi.
2.3. Pengelompokan Data Mining
Data mining dibagi menjadi beberapa
kelompok berdasarkan tugas yang dapat dilakukan,
yaitu (Kusrini dan Emha Taufiq Luthfi, 2009):
1. Deskripsi
Terkadang peneliti dan analis secara sederhana
ingin
mencoba
mencari
data
untuk
menggambarkan pola dan kecenderungan yang
terdapat dalam data. Sebagai contoh, petugas
pengumpulan suara mungkin tidak dapat
menentukan keterangan atau fakta bahwa siapa
yang tidak cukup profesional akan sedikit
didukung dalam pemilihan presiden.
2. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali
variabel target estimasi lebih kearah numerik dari
Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule
Metode Apriori. Oleh : Fadlina
145
Volume : III, Nomor : 1, Mei 2014
pada kearah kategori.
Model dibangun
menggunakan record lengkap yang menyediakan
nilai dari variabel target sebagai prediksi.
Selanjutnya, pada peninjauan berikutnya estimasi
nilai dari variabel target dibuat berdasarkan nilai
variabel predikasi.
Sebagai contoh akan
dilakukan estimasi tekanan darah sistolik pada
pasien rumah sakit berdasarkan umur pasien,
jenis kelamin, indeks berat badan, dan level
sodium darah. Hubungan antara tekanan darah
sistolik dan nilai variabel prediksi dalam proses
pembelajaran akan menghasilkan model estimasi.
Model estimasi yang dihasilkan dapat digunakan
untuk kasus baru lainnya.
3. Prediksi.
Prediksi hampir sama dengan klasifikasi dan
estimasi, kecuali bahwa dalam prediksi nilai dari
hasil akan ada di masa mendatang.
Contoh prediksi bisnis dan penelitian adalah:
a. Prediksi harga beras dalam tiga bulan yang
akan datang.
b. Prediksi persentasi kenaikan kecelakaan lalu
lintas tahun depan jika batas bawah
kecepatan dinaikkan.
Beberapa metode dan teknik yang digunakan
dalam klasifikasi dan estimasi dapat pula
digunakan (untuk keadaan yang tepat) untuk
prediksi.
4. Klasifikasi
Klasifikasi adalah fungsi pembelajaran yang
memetakan (mengklasifikasi) sebuah unsur (item)
data ke dalam salah satu dari beberapa kelas yang
sudah didefinisikan. Contoh lain klasifikasi
dalam bisnis dan penelitian adalah:
a. Menentukan apakah suatu transaksi kartu
kredit merupakan transaksi yang curang atau
tidak.
b. Memperkirakan apakah suatu pengajuan
hipotek oleh nasabah merupakan suatu kredit
yang baik atau buruk.
c. Mendiagnosis penyakit seorang pasien untuk
mendapatkan termasuk kategori penyakit
apa.
5. Pengklusteran
Pengelompokan (clustering) merupakan tugas
deskripsi yang banyak digunakan dalam
mengidentifikasi sebuah himpunan terbatas pada
kategori atau cluster untuk mendeskripsikan data
yang ditelaah. Kategori-kategori ini dapat bersifat
eksklusif
dan
ekshaustif
mutual,
atau
mengandung representasi yang lebih kaya seperti
kategori yang hirarkis atau saling menumpu
(overlapping). Contoh pengklusteran dalam bisnis
dan penelitian adalah:
a. Mendapatkan
kelompok-kelompok
konsumen untuk target pemasaran dari satu
suatu produk bagi perusahaan yang tidak
memiliki dana pemasaran yang besar.
Majalah Ilmiah
Informasi dan Teknologi Ilmiah (INTI)
ISSN : 2339-210X
b.
Untuk tujuan audit akuntansi, yaitu
melakukan pemisahan terhadap perilaku
financial dalam baik dan mencurigakan.
c. Melakukan pengklusteran terhadap ekspresi
dari gen, untuk mendapatkan kemiripan
perilaku dari gen dalam jumlah besar.
6. Asosiasi.
Tugas asosiasi dalam data mining adalah
menemukan attribut yang muncul dalam satu
waktu. Dalam dunia bisnis lebih umum disebut
analisis keranjang belanja.
Contoh asosiasi dalam bisnis dan penelitian
adalah:
a. Meneliti jumlah pelanggan dari perusahaan
telekomunikasi seluler yang diharapkan
untuk memberikan respon positif terhadap
penawaran upgrade layanan yang diberikan.
b. Menentukan barang dalam supermarket yang
dibeli secara bersamaan dan yang tidak
pernah dibeli secara bersamaan.
2.4. Association Rule
Analisis asosiasi atau association rule
mining adalah teknik data mining untuk menemukan
aturan assosiatif antara suatu kombinasi item.
Algoritma aturan asosiasi akan menggunakan data
latihan, sesuai dengan pengertian data mining, untuk
menghasilkan pengetahuan. Pengetahuan apakah
yang hendak dihasilkan dalam aturan asosiasi?
Pengetahuan untuk mengetahuan item-item belanja
yang sering dibeli secara bersamaan dalam suatu
waktu. Aturan asosiasi yang berbentuk “if…then…”
atau “jika…maka…” merupakan pengetahuan yang
dihasilkan dari fungsi aturan asosiasi (Seni Susanto
dan Dedy Suryadi, 2010).
2.5. Tahapan Association Rules
Analisis asosiasi dikenal juga sebagai salah
satu teknik data mining yang menjadi dasar dari
berbagai teknik data mining lainnya. Khususnya
salah satu tahap dari analisis asosiasi yang disebut
analisis pola frequensi tinggi (frequent pattern
mining) menarik perhatian banyak peneliti untuk
menghasilkan algoritma yang efisien. Penting
tidaknya suatu aturan assosiatif dapat diketahui
dengan dua parameter, support (nilai penunjang)
yaitu persentase kombinasi item tersebut dalam
database dan confidence (Nugroho Wandi, et al.
2012).
A.
Data Preparation.
Pada banyak bidang keilmuan, terutama
komputer sains, diperlukan data
yang berkualitas melalui proses preparation dari data
mentah. Dalam prakteknya, ditemukan bahwa data
cleaning dan preparation membutuhkan total usaha
80% dari usaha untuk merekayasa data, sehingga
menjadikan data preparation sebagai proses yang
krusial. Pentingnya proses ini dapat dilihat dari tiga
aspek, yakni:
Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule
Metode Apriori. Oleh : Fadlina
146
Volume : III, Nomor : 1, Mei 2014
Data real world merupakan data kotor. Data
real world bisa mengandung data yang tidak,
terdapat noise, tidak konsisten, yang
dikarenakan:
a. Tidak
lengkap
(incomplete),
yaitu
kekurangan nilai atribut atau hanya
mengandung agregat data (contoh : address = "
")
b. Noise, yaitu masih mengandung error dan
outliers.
c. Tidak konsisten (inconsistent), yaitu data
yang mengandung discrepansi dalam code dan
nama atau singkatnya datanya tidak konsisten.
2.
Sistem mining dengan performa tinggi
membutuhkan data yang berkualitas. Data
preparation atau preparation menghasilkan
dataset yang lebih sedikit daripada dataset yang
asli, ini bias meningkatkan efisiensi dari data
mining. Langkah ini mengandung:
a. Memilih data yang relevan
b. Mengurangi data
3. Data yang berkualitas menghasilkan pola yang
berkualitas. Dengan data preparation, maka
data yang dihasilkan adalah data yang
berkualitas, yang mengarah pada pola yang
berkualitas pula, dengan:
a. Mengembalikan data yang tidak lengkap
b. Membenarkan eror, atau menghilangkan
outliers
c. Membenahi data yang bertentangan.
Majalah Ilmiah
Informasi dan Teknologi Ilmiah (INTI)
ISSN : 2339-210X
1.
B. Association Rules
Association rule merupakan salah satu
metode yang bertujuan mencari pola yang sering
muncul di antara banyak transaksi, dimana setiap
transaksi terdiri dari beberapa item sehingga metode
ini akan mendukung system rekomendasi melalui
penemuan pola antar item dalam transaksi-transaksi
yang terjadi
Metodologi dasar analisis asosiasi terbagi menjadi
dua tahap :
1. Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang
memenuhi syarat minimum dari nilai support dalam
database. Nilai support sebuah item diperoleh dengan
rumus berikut:
C. Frequent Itemset
Langkah pertama pada association rule adalah
menghasilkan
semua
itemset
yang
memungkinkan dengan kemungkinan itemset
yang muncul dengan m-item adalah 2m. Karena
besarnya komputasi untuk menghitung frequent
itemset, yang membandingkan setiap kandidat
itemset dengan setiap transaksi, maka ada
beberapa pendekatan untuk mengurangi
komputasi tersebut, salah satunya dengan
algoritma apriori.
D. Apriori
Algoritma apriori digunakan untuk mencari
frequent itemset yang memenuhi minsup
kemudian mendapatkan rule yang memenuhi
minconf dari frequent itemset tadi. Algoritma ini
mengontrol berkembangnya kandidat itemset
dari hasil frequent itemset dengan support-based
pruning untuk menghilangkan itemset yang tidak
menarik dengan menetapkan minsup. Prinsip
dari apriori ini adalah bila itemset digolongkan
sebagai frequent itemset, yang memiliki support
lebih dari yang ditetapkan sebelumnya, maka
semua subsetnya juga termasuk golongan
frequent itemset, dan sebaliknya.
E. Rule Generation
Setelah
mendapatkan
frequent
itemset
menggunakan algoritma apriori, langkah
selanjutnya adalah mendapatkan rule yang
memenuhi confidence. Karena rule yang
dihasilkan berasal dari frequent itemset, dengan
kata lain, dalam menghitung rule menggunakan
confidence, tidak perlu lagi menghitung supportnya karena semua calon rules yang dihasilkan
telah memenuhi minsup sesuai yang ditentukan.
Penghitungan ini juga tidak perlu melakukan
perulangan scanning pada database untuk
menghitung
confidence,
cukup
dengan
mengambil itemset dari hasil support.
1.5. Algoritma Apriori
Algoritma apriori yaitu langkah yang
membutuhkan pemrosesan lebih adalah frequent
itemset berdasarkan sifat frequent itemset yaitu setiap
subset frequent itemset harus menjadi frequent
itemset (Dana Sulistiyo Kusumo, et al. 2003).
. Algoritma ini mengontrol berkembangnya
kandidat itemset dari hasil frequent itemset dengan
support-based pruning untuk menghilangkan itemset
2. Pembentukan aturan assosiatif
yang tidak menarik dengan menetapkan minsup.
Setelah semua pola frekuensi tinggi
Prinsip dari apriori ini adalah bila itemset
ditemukan, barulah dicari aturan assosiatif yang
digolongkan sebagai frequent itemset, yang memiliki
memenuhi syarat minimum untuk confidence dengan
support lebih dari yang ditetapkan sebelumnya, maka
menghitung confidence aturan assosiatif A _B Nilai
semua subsetnya juga termasuk golongan frequent
confidence dari aturan A _B diperoleh dari rumus
itemset, dan sebaliknya. Cara algoritma ini bekerja
berikut:
adalah algoritma akan menghasilkan kandidat baru
Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule
147
Metode Apriori. Oleh : Fadlina
Volume : III, Nomor : 1, Mei 2014
dari k-itemset dari frequent itemset pada langkah
sebelumnya dan menghitung nilai support k-itemset
tersebut. Itemset yang memiliki nilai support di
bawah dari minsup akan dihapus. Algortima berhenti
ketika tidak ada lagi frequent itemset baru yang
dihasilkan.
Kedua, dari hasil frequent itemset tersebut,
langkah selanjutnya dihitung minconf mengikuti
rumus sesuai yang telah ditentukan. Support tidak
perlu dilihat lagi, karena generate frequent itemset
didapatkan dari melihat minsup-nya. Bila rule yang
didapatkan memenuhi batasan yang ditentukan dan
batasan itu tinggi, maka rule tersebut tergolong
strong rules.
Prinsip algoritma apriori terbagi dalam
beberapa tahap (Leo Wilyanto Santoso, 2003)
1. Kumpulkan jumlah item tunggal, dapatkan
item besar
2. Dapatkan candidate pairs, hitung => large
paris dari item-item
3. Dapatkan candidate triplets, hitung => large
triplets dari item-item seterusnya.
4. Sebagai petunjuk : setiap subset dari sebuah
frequent itemsets harus menjadi frequent.
Contoh dari penerapan algoritma apriori
adalah diilustrasikan digambar berikut:
Gambar 1 : Ilustrasi Algoritma Apriori
Gambar 1menunjukkan bahwa algoritma
akan menghasilkan kandidat baru dari 1-itemset dari
frequent itemset dan menghitung nilai support 1itemset tersebut. Selanjutnya masuk ke 2-itemset dan
dihitung lagi support 2-itemset. Kemudian Itemset
yang memiliki nilai support di bawah dari minsup
akan dihapus. Algortima berhenti jika tidak ada lagi
frequent itemset baru yang dihasilkan dan
menetapkan minimum support nya = 3.
Majalah Ilmiah
Informasi dan Teknologi Ilmiah (INTI)
ISSN : 2339-210X
diinginkan di dalam penelitian ini, maka data
tersebut di export ke dalam bentuk Microsoft excel.
Data mining digunakan pada data kejahatan
jalanan (street crime) adalah untuk mengekstrak ilmu
pengetahuan seperti mengetahui tingkat kejahatan
jalanan khususnya pada Polsekta Medan Sunggal,
untuk mengetahui jenis kejahatan apa yang sering
muncul secara bersamaan, untuk mengetahui modus
kejahatan apa saja yang banyak dilakukan dan
menghasilkan rules antar jenis item
yang
berkombinasi.
Data mining ialah serangkaian proses untuk
menggali nilai tambah dari suatu kumpulan data
berupa pengetahuan yang selama ini tidak diketahui
secara manual. Dalam data mining ada beberapa
teknik menganalisis data, salah satunya adalah
dengan algoritma apriori. Algoritma apriori adalah
algoritma untuk menemukan
frekuensi dan
kombinasi frekuensi itemsets yang dijalankan pada
sekumpulan data, sedangkan teknik untuk
menemukan hubungan antara satu item dengan item
yang lain, dan antara pola kombinasi itemsest yang
satu dengan pola kombinasi itemsets yang lain
disebut association rules.
3.2. Pembahasan
Proses pembentukan pola kombinasi
itemsets dan pembuatan rules dimulai dari analisis
data. Data yang digunakan adalah data kejahatan
jalanan, kemudian dilanjutkan dengan pembentukan
pola kombinasi itemsets dan dari pola kombinasi
itemsets yang menarik terbentuk association rules.
3.3. Analisis Data
Dengan studi kasus pada Polsekta Medan
Sunggal, dapat dilakukan analisa terhadap data
kejahatan jalanan dengan salah satu tujuan adalah
untuk menemukan pola kombinasi dan hubungan
antar item jenis kejahatan. Berikut ini adalah tabel 1
yaitu beberapa data yang akan dijadikan sampel
untuk analisis dan juga untuk pengujian.
Tabel 1 : Tabel Real Data Kejahatan Jalanan
3. Analisa Dan Pembahasan
3.1. Analisa
Data administrasi Reskrim pada Polseka
Medan Sunggal sudah menggunakan komputerisasi.
Salah satu output adalah data kejahatan jalanan
(Street Crime). Untuk mencapai tujuan yang
Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule
Metode Apriori. Oleh : Fadlina
148
Volume : III, Nomor : 1, Mei 2014
Majalah Ilmiah
Informasi dan Teknologi Ilmiah (INTI)
ISSN : 2339-210X
Data table 3adalah bentuk transaksi data real terdiri
atas attribute nomor, laporan polisi, tkp dan modus
dalam bentuk kode atau tabel alias
3.5. Analisa Pola Frekuensi Tinggi
Untuk mencari pola kombinasi terlebih
dulu dicari semua nama jenis item kejahatan yang
ada seperti pada seperti pada tabel diatas sekaligus
menentukan support per item jenis kejahatan, di
mana tahap ini mencari kombinasi item yang
memenuhi syarat minimum dari nilai support
dalam database, nilai support sebuah item
diperoleh dengan rumus 1 sebagai berikut:
Support (KF) =
3.4. Data Tabular Kejahatan Jalanan
Untuk melakukan pengujian, menggunakan
salah satu database Microsoft Excel dalam bentuk
tabular yang dikonversi ke dalam bentuk biner, yaitu
format data dalam bentuk 1 dan 0. Hasil proses
konversi data kejahatan ke format data dalam bentuk
biner adalah seperti pada tabel 2berikut ini:
Tabel 2 Data Dalam Bentuk Tabular Data
%
%
Tabel berikut merupakan tabel semua jenis
item seperti pada tabel 4 berikut ini:
Tabel 4 : Keterangan Jenis Items Kejahatan
Kejalanan
Data di atas menggambar bentuk data satu
item, yang terdiri atas attribute item sebagai nama
item jenis semua yang ada, support yaitu jumlah
setiap item yang
ada di semua data, sedangkan support (%) adalah
presentasi jumlah item yang ada di dalam data
kejahatan, yang didapat dari jumlah item dibagi
jumlah semua transaksi dikali seratus persen. Tabel
berikut adalah item data yang memenuhi support
minimal, nilai support minimal sama dengan 20
persen (%). Seperti yang terlihat pada tabel 5 berikut
ini:
Tabel 5: Jenis Items Kejahatan jalanan yang
Memenuhi Support Minimal
Untuk mempermudah dalam melakukan
pengujian data maka tabel real data kejahatan jalanan
dibuat dalam bentuk kode atau tabel alias untuk
menerangkan atribute yang digunakan sehingga data
bisa lebih dimengerti.
Tabel 3 Tabel Alias Data Kejahatan jalanan
Tabel 5 di atas merupakan data item jenis
yang memenuhi support minimal. Di mana data di
atas akan digunakan untuk membentuk pola
kombinasi dua item mulai dari pembentukan pola
kombinasi dua itemsets, sampai pada pembentukan
pola kombinasi tiga itemsets.
Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule
Metode Apriori. Oleh : Fadlina
149
Volume : III, Nomor : 1, Mei 2014
3.6. Pembentukan Pola Kombinasi Dua Itemsets
Pembentukan pola frekuensi dua itemsets,
dibentuk dari items-items jenis yang memenuhi
support minimal yaitu dengan cara mengkombinasi
semua item kedalam pola dua kombinasi, hasil
pembentukan pola kombinasi dua itemsets yang
dibentuk dari tabel 5 adalah seperti pada tabel 4
berikut ini:
Majalah Ilmiah
Informasi dan Teknologi Ilmiah (INTI)
ISSN : 2339-210X
itemsets yang memenuhi suppor minimal. Hasil
pembentukan pola kombinasi tiga itemsets yang
dibentuk dari tabel 6 adalah seperti pada tabel 7
berikut ini:
Tabel 7 : Pola Kombinasi Tiga Itemsets
Tabel 6 : Pola Kombinasi Dua Itemsets
Data tabel 7 merupakan pola hasil
kombinasi tiga itemsets yang dibentuk dari
kombinasi itemsets dua. Dengan support minimal
sama dengan 20 persen(%), maka data yang
memenuhi support minimal seperti pada tabel 8
berikut ini:
Tabel 8 : Pola Tiga Itemsets yang memenuhi
support minimal
Support
Itemsets
Support
(%)
KF,PC,MC
4/20
20
Data tabel 6 merupakan kombinasi dua
itemsets yang
merupakan hasil dari semua
kombinasi semua jenis items. Dengan menetapkan
support minimal sama dengan 20 persen (%), maka
data yang memenuhi support minimal adalah seperti
pada tabel 7 berikut ini:
Tabel 7 : Pola Kombinasi Dua Itemsets yang
Memenuhi Support Minimal
Data table 7 adalah pola kombinasi dua
itemsets yang memenuhi support minimal, terlihat
data kombinasi jenis kejahatan KF dan PK, KF dan
PC, KF dan PR, KF dan MC, PK dan PC, PK dan
PR, PC dan MC memiliki support yang terbanyak,
itu menandakan bahwa pola kombinasi dua itemsets
tersebut paling banyak di dalam transaksi data.
3.7. Pembentukan Pola Kombinasi Tiga Itemsets
Pembentukan pola kombinasi tiga itemsets
dibentuk dari pola kombinasi dua itemsets yang
memenuhi
support
minimal.
Pembentukan
kombinasi tiga itemsets dibentuk dengan dasar
kombinasi dua itemsets, kemudian dikombinasikan
dengan salah satu item dari pola kombinasi dua
itemsets yang lain, dengan ketentuan bahwa pola
kombinasi item tersebut ada di dalam kombinasi dua
Data tabel 8 diatas merupakan hasil pola
kombinasi tiga items yang dibentuk dari pola
kombinasi dua itemsets, data terlihat hanya memiliki
satu pola kombinasi item. Berhubung karena pola
kombinasi lima itemsets hanya satu pola kombinasi
itemsets maka pembentukan pola kombinasi itemsets
berikutnya tidak akan terbentuk.
3.8. Pembentukan Association Rules
Setelah semua pola frekuensi tinggi
ditemukan, baru dicari association rules yang
memenuhi syarat minimum confidence, dengan
menghitung confidence aturan asosiasi A ke B.
Untuk melihat kuat tidaknya aturan asosiasi
adalah membandingkannya dengan nilai benchmark,
dimana diasumsikan kejadian item dari consequent
dalam suatu transaksi adalah independent dengan
kejadian dari antecedent dari suatu aturan asosiasi.
Nilai estimasi dari confidence benchmark dihitung
dari data suatu aturan dengan rumus 4 , seperti
berikut:
Confidence _ benchmark 
Jumlah _ transaksi _ items _ dalam _ Consequent
Jumlah _ transaksi _ dalam _ database
Confidence_benchmark =
%
Lift rasio adalah perbandingan antara
confidence untuk suatu aturan dibagi dengan
confidence, dimana diasumsikan consequent dan
antecedent saling independent. Rumus untuk
mendapat lift sebagai berikut:
Lift 
Confidence
benchmark _ Confidence
Lift =
Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule
Metode Apriori. Oleh : Fadlina
150
Volume : III, Nomor : 1, Mei 2014
Jika nilai lift rasio lebih besar dari pada 1
menunjukkan adanya manfaat dari aturan tersebut.
Lebih tinggi nilai lift rasio, lebih besar kekuatan
asosiasi. Dari tabel yaitu tabel pola kombinasi dua
itemsets, dapat dilihat besarnya nilai support dan
confidence dari calon association rules seperti
tampak pada tabel 9 berikut ini:
Tabel 9 Calon Association Rules
Majalah Ilmiah
Informasi dan Teknologi Ilmiah (INTI)
ISSN : 2339-210X
dilakukan. Informasi tersebut dapat dijadikan acuan
bagi pihak kepolisian dan masyarakat sehingga dapat
mengatasi tingkat kriminalitas dalam meningkatkan
keamanan dan sensitifitas kejahatan jalanan (Street
Crime).
4. Implementasi Dan Pengujian
4.1 Implementasi
Langkah-langkah implementasi proses
algoritma apriori pada aplikasi Tanagra merupakan
tahap
penerapan
software
tanagra
untuk
dioperasikan.
4.2 . Data Tabular Kejahatan Jalanan
Aplikasi yang digunakan dalam pengujian
adalah aplikasi yang menggunakan salah satu
database Microsoft Exel dengan data dalam bentuk
tabular data, maka data kejahatan jalanan, dikonversi
ke dalam bentuk biner. Format tabular data adalah
format data dalam bentuk 1 dan 0 atau format data
dalam bentuk biner. Hasil proses konversi data
kejahatan ke format data dalam bentuk tabular data
adalah seperti pada lampiran B
Tabel 4.8 merupakan tabel calon association
rules dari kombinasi dua itemsets, tabel diatas terdiri
atas rules dari pola kombinasi dua items, lift sebagai
yang tingkat kekuatan rules atas kejadian acak dari
antecedent dan consequent berdasarkan support
masing-masing, support (itemsets) sebagai nilai
support antara itemsets yang berkombinasi, support
sebagai nilai support item yang mengandung
antecedent. Dengan menetapkan nilai confidence
minimal adalah 40 persen (%), maka rules
interesting yang dihasilkan adalah seperti pada tabel
10 berikut ini:
Tabel 10 : Association Rules yang Memenuhi
Confidence Minimal
4.3. Pengujian
Untuk membuktikan data-data yang telah
dihasilkan berupa pola hubungan kombinasi antar
items dan rules-rules asosiasi sesuai dengan
algoritma apriori maka perlu dilakukan pengujian
dengan menggunakan aplikasi. Aplikasi yang
digunakan adalah Tanagra versi 1.4.48 sebagai
berikut :
Gambar 1 : Tampilan Utama Tanagra
Association rules menunjukkan bahwa
setiap kejahatan jalanan yang dilakukan baik itu
perampokan,
penjambretan,
pencurian
dan
perampasan maka juga akan melakukan kekerasan
fisik dan mengancam. Dari hasil tabel diatas juga
dapat dijadikan satu ilmu pengetahuan baru atau
informasi kejahatan jalanan apa yang sering
Gambar 1 merupakan
tampilan utama
aplikasi Tanagra tampilan bagian atas horizontal
adalah merupakan menu utama program yang terdiri
atas menu File, merupakan tempat komponen yang
akan diproses hasilnya, jendala bagian kiri yang lebar
merupakan tempat hasil dari proses, sedangkan
bagian bawah adalah merupakan tempat komponen
berbagai jenis algoritma, termasuk algoritma apriori.
Cara menggunakan aplikasi Tanagra dimulai dengan
mengklik menu File, New, muncul jendela untuk
load database. Load database supaya masuk ke
system.
Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule
Metode Apriori. Oleh : Fadlina
151
Volume : III, Nomor : 1, Mei 2014
Gambar 2 : Pemilihan Datasheet
Gambar 2 menjelaskan untuk membuat atau
mengambil database pada textbox datasheet diketik
nama datasheet yang akan kita gunakan untuk
pengujian software.
4.4.
Pengujian Untuk Menghasilkan Pola
Kombinasi Itemsets
Pada Aplikasi Tanagra pengujian yang
pertama dilakukan adalah menghitung frekuensi
items atau frequent itemsets. Untuk menghasilkan
pola kombinasi itemsets yaitu dengan cara klik menu
icon define status dan masukkan komponen frequent
itemsets dan masukkan parameters nya, kemudian
execute, pilih view untuk melihat hasilnya.
Majalah Ilmiah
Informasi dan Teknologi Ilmiah (INTI)
ISSN : 2339-210X
Gambar 4 : Penetapan Parameter
Tabel 11 di bawah ini adalah hasil dari pola
kombinasi itemset yang dihasilkan dengan minimum
support sebesar 20%.
Tabel 11 :Jenis Items yang Memenuhi Support
Minimal 20%
Items
support
Support (%)
KF-PC
28/100
28
KF-PK
34/100
34
PK-PC
39/100
39
Setelah dilakukan pengujian dengan penentuan nilai
parameters, maka dihasilkan jenis item dan pola
kombinasi dua items seperti pada gambar 5 berikut
ini:
Gambar 5 : Hasil Pengujian Dengan Satu Item
dan Pola Kombinasi Dua Itemsets
Gambar 3 : Jendela Frequent Itemset
Gambar 3 diatas menunjukkan dengan
paremeters adalah minimal support sama dengan 20
persen (%), maksimal support sama dengan 100
persen (%), minimal length sama dengan satu,
maksimal length sama dengan dua, dan itemset type
sama dengan frequent. Seperti pada gambar 4 berikut
ini:
Gambar 5 : yaitu tampilan pengujian
dengan untuk menghasilkan jenis item dan pola
kombinasi dua itemset. Ada dua attribute yang
digunakan, yaitu Description dan Support.
Description menggambarkan jenis items dan bentuk
pola kombinasi dua items, Sedangkan support adalah
nilai presentasi banyak jumlah jenis items, dan
jumlah presentasi banyak items dan pola kombinasi
dua items di dalam data.
4.5. Pengujian Untuk Menghasilkan Rules
Setelah melakukan pengujian untuk
menghasilkan jenis items dan pola kombinasi, mulai
dari kombinasi dua items sampai dengan pola
kombinasi tiga items, maka pengujian yang
Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule
152
Metode Apriori. Oleh : Fadlina
Volume : III, Nomor : 1, Mei 2014
dilakukan selanjutnya adalah pengujian untuk
menghasilkan rules-rules, di mana rules-rules
tersebut terbentuk dari pola kombinasi items pada
pengujian sebelumnya.
4.6. Hasil Pengujian pertama
Pengujian yang dilakukan pertama adalah
pengujian untuk menghasilkan rules-rules yang
terbentuk dari pola kombinasi dua items dan
penentuan parameter dari Apriori. Jendela Parameter
Association rules adalah seperti pada gambar 6 :
berikut:
Majalah Ilmiah
Informasi dan Teknologi Ilmiah (INTI)
ISSN : 2339-210X
menghasilkan maximum confidence 65% yaitu PC
dan PK. Rules di atas terdiri atas Antecedent,
consequent, lift, support(%), Confidence. Jumlah
rule yang dihasilkan dari pengujian di atas adalah
sebanyak 6 rules.
4.7. Hasil Pengujian kedua
Pengujian
kedua
dilakukan
dengan
menetapkan minimum support 30% dan Maximum
confidence sebesar 50% maka rules yang dihasilkan
adalah seperti pada tabel 13 dibawah ini
Tabel 13 Calon Association Rules dari
tabel
Dengan merubah nilai minimum Support
dan minimum confidence menjadi lebih tinggi dan
dari pengujian rule yang dihasilkan menjadi lebih
sedikit yaitu 3 rules seperti terlihat pada gambar 8
dibawah ini
Gambar 6 : Jendela Association Rules Paremeters
Gambar 5.6 menunjukkan paremeters yang
harus di isi adalah support sama dengan 20 persen
(%), Confidence sama dengan 45 persen (%),
maksimal card itemsets
sama dengan enam.
Association rules yang memenuhi syarat minimum
confidence, dengan menghitung confidence aturan
asosiasi A ke B terlihat pada tabel 12 dibawah ini:
Tabel 12 : Calon Association Rules dari tabel 11
Gambar 8 Hasil Pengujian kedua Dengan Rules
Gambar 8 diatas merupakan hasil dari
pengujian dengan meningkatkan minimal support
dan confidence dari 100 data kejahatan jalanan dan
menghasilkan 3 rules itu artinya jumlah rules yang
dihasilkan akan lebih sedikit apabila minimum
support dan confidence nya di naikkan.
Setelah dilakukan pengujian dengan
penentuan nilai parameters, maka rules-rules yang
dihasilkan dari parameters di atas adalah seperti
pada gambar 7 berikut ini:
Gambar 7 : Pengujian Dengan Rules Dari Pola
Kombinasi Dua Itemset
4.8. Hasil Pengujian ketiga
Pengujian
ketiga
digunakan
untuk
menghasilkan rules dari kombinasi 2 item dimana
parameter adalah minimum support 35% confidence
55% sedangkan lift rasio nya adalah 0 maka rules
yang dihasilkan sebagai berikut:
Tabel 14 : Calon Association Rules dari
tabel
Dan hasil pengujian dengan menggunakan aplikasi
Tanagra adalah seperti terihat pada gambar di bawah
ini
Hasil pengujian
gambar 7 di atas
menggunakan 100 data kejahatan untuk menghasil
rules dari pola kombinasi dua items yang
Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule
Metode Apriori. Oleh : Fadlina
153
Volume : III, Nomor : 1, Mei 2014
Majalah Ilmiah
Informasi dan Teknologi Ilmiah (INTI)
ISSN : 2339-210X
dapat dimanfaatkan dalam menanggulangi tingkat
kejahatan jalanan.
2. Dari kelemahan data mining dengan algoritma
apriori yaitu membutuhkan waktu yang lama
maka perlu pengembangan dari algoritma apriori
untuk menemukan pola hubungan (asosiasi) antar
item dari suatu data yang besar.
6. Daftar Pustaka
Gambar 9 : Hasil Pengujian ketiga
Dengan Rules
Gambar 9 : diatas menunjukkan rules dari
hasil pengujian yang dilakukan dengan minimum
support dan minimum confidence lebih besar maka
rules yang dihasilkan semakin sedikit yaitu 2 rules.
[1]
[2]
5. Kesimpulan Dan Saran
5.1 Kesimpulan
Berdasarkan penelitian dan pembahasan
yang dilakukan, maka dapat disimpulkan beberapa
hal sebagai berikut :
1. Data mining adalah proses menemukan polapola didalam data, dimana proses penemuan
tersebut dilakukan secara otomatis atau semi
otomatis dan pola-pola yang ditemukan harus
bermanfaat sebagai ilmu pengetahuan yang
baru dan informasi penting dari data kejahatan
jalanan (Street Crime) bagi kepolisian dan
masyarakat dalam menanggulangi tingkat
kejahatan jalanan dan sensitifitas kejahatan.
2. Program Tanagra 1.4.48 adalah salah satu tools
Data Mining yang mampu menangani persoalan
mengeksplorasi data dengan size yang sangat
besar yang dapat menghasilkan pola kombinasi
itemsets dan rules.
3. Hasil dari perancangan data mining dengan
algoritma apriori ini diperoleh informasi yang
dibutuhkan oleh pihak kepolisian berupa
prosentase yang digunakan oleh bagian reskrim
untuk mengetahui kejahatan jalanan apa yang
sering terjadi sehingga persoalan tingkat
kejahatan jalanan dapat di minimalisasi.
4.
Kelemahan data mining dengan algoritma
apriori yaitu harus melakukan scan database
setiap kali iterasi, sehingga dalam pencarian
pola
kombinasi itemset dan rule yang
interesting membutuhkan waktu yang lama.
5.2 Saran
Untuk perkembangan lebih lanjut dari
penulisan tesis ini maka penulis memberikan
beberapa saran sebagai berikut :
1. Agar hasil dari pengujian dapat lebih
dikembangkan yaitu dengan menambah jumlah
data dan penentuan tingkat support dan
confidence yang lebih bervariasi sehingga
menghasilkan asosiasi antara data yang lebih
banyak
dan
menghasilkan
Knowledge
(pengetahuan baru) dan informasi penting untuk
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
Beta Noranita dan Nurdin Bahtiar (2010).
Implementasi
Data
Mining
Untuk
Menemukan
Pola
Hubungan
Tingkat
Kelulusan Mahasiswa Denga Data Induk
Mahasiswa.
Budi Santosa (2007). Data Mining, Teknik
Pemanfaatan Data Untuk Keperluan Bisnis.
Yogyakarta. Penerbit Graha Ilmu.10.
Eko Prasetyo (2012). Data Mining Konsep
Dan
Aplikasi
Menggunakan
Matlab.
Yogyakarta.Penerbit Andi.1
Eko Wahyu Tyas D (2008). Penerapan
Metode Association Rules Menggunakan
Algoritma Apriori Untuk Analisa Pola Data
Hasil Tangkapan Ikan.
Feri Sulianto dan Dominikus Juju (2010).
Data Mining, Meramalkan Bisnis Perusahaan.
Jakarta. Penerbit Elex Media Komputindo.1922.
Kusrini dan Emha Taufig Luthfi (2009).
Algoritma Data Mining. Yogyakarta. Penerbit
Andi.3-12.
Leo Wilyanto Santoso (2003). Pembuatan
Perangkat Lunak Data Mining Untuk
Penggalian Kaidah Asosiasi Menggunakan
Metode Apriori
Makaampoh (2013). Kedudukan Dan Tugas
Polri Untuk Memberantas Aksi Premanisme
Serta Kaitannya Dengan Tindak Pidana
Kekerasan Dalam KUHP
Nugroho Wandi. et all (2012). Pengembangan
Sistem Rekomendasi Penelusuran Buku
dengan Pengendalian Association Rule
Menggunakan Algoritma Apriori (Studi Kasus
Badan Perpustakaan dan Kearsipan Provinsi
Jawa Timur)
Padmaja dan Poongodai (2011). Mining
Weighted Association Rules
Prasad dan Malik, (2011). Using Association
Rule Mining for Extracting Product Sales
Patterns in Retail Store Transactions.
Sani Susanto dan Dedy Suryadi (2010).
Pengantar Data Mining. Yogyakarta. Penerbit
Andi.97.
Subekti Mujiasih (2011). Pemanfatan Data
Mining Untuk Prakiraan Cuaca
Umarani dan Punithavalli (2011). A Study On
Effevtive Mining Of Association Rules From
Huge Databases
Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule
Metode Apriori. Oleh : Fadlina
154
Download