perpustakaan.uns.ac.id digilib.uns.ac.id commit to user 5 BAB II

advertisement
perpustakaan.uns.ac.id
digilib.uns.ac.id
BAB II
TINJAUAN PUSTAKA
2.1 DASAR TEORI
2.1.1
2.1.1.1
Business Analytic
Pengertian Business Analytic (BA)
Business Analytic adalah aplikasi dan teknik untuk mengumpulkan,
menyimpan,
menganalisis dan menyediakan akses ke data untuk membantu
pengguna membuat lebih baik dan strategis keputusan (juga dikenal sebagai alat
pengolahan analisis, business intelligence tools atau aplikasi business intelligence)
(Turban, Aronson, Liang, & Sharda, 2007).
Contoh penggunaan BA meliputi (Turban, Aronson, Liang, & Sharda, 2007):

Menjelajahi data untuk menemukan pola-pola baru dan hubungan (data
mining)

Menjelaskan mengapa hasil tertentu terjadi (analisis statistik, analisis
kuantitatif)

Bereksperimen untuk menguji keputusan sebelumnya (A / B testing,
pengujian multivarian)

Peramalan hasil di masa mendatang (predictive modeling, analisis
prediktif)
Lima komponen utama Business Analytic Tools adalah (Turban, Aronson, Liang,
& Sharda, 2007) :

Data Warehousing
Komponen utama dari solusi business analytics yang mengintegrasikan
informasi bisnis penting dari seluruh seluruh organisasi. Memungkinkan
eksekutif untuk menangkap, menyimpan, mengelola dan mengambil data
sebelum mengubahnya menjadi informasi untuk pengambilan keputusan.
commit to user
5
6
digilib.uns.ac.id
perpustakaan.uns.ac.id

Business Intelligence (BI)
Melengkapi eksekutif dengan informasi yang tepat untuk membuka informasi
bisnis yang tepat dalam keunggulan kompetitif.

Enterprise Information Manajemen (EIM)
Para
eksekutif
tidak
dapat
melakukan
pekerjaannya,
ketika
mereka
mengandalkan informasi yang berlebihan atau tidak akurat. Karena itu,
perusahaan terkemuka memiliki manajemen strategi informasi perusahaan
yang jelas (EIM) untuk mengelola data terstruktur dan tidak terstruktur dan
kegiatan yang digunakan dalam aplikasi operasional, data warehouse, business
intelligence (BI) dan analisis.

Pengembangan Aplikasi
Sebagai daya saing lingkungan bisnis global terus meningkat, organisasi harus
menjadi sangat efisien dan lebih tepat dengan setiap keputusan untuk tetap
sukses. Jenis Enterprise Performance Management membutuhkan perhatian
diberikan untuk pemantauan, analisis, penilaian risiko, pelaporan yang tepat
waktu dan tindakan berdasarkan informasi yang datang dari banyak bagian
yang berbeda dari bisnis, termasuk mitra eksternal, vendor dan pelanggan.

Governance, risk & compliance (GRC)
Dengan meningkatnya jumlah eksekutif, para eksekutif ingin membuktikan
bahwa organisasi sedang mereka jalankan efektif, menguntungkan, dan etis,
perusahaan yang sukses membutuhkan Governance, risk & compliance (GRC)
strategi
terpadu
yang
memandu
orang,
standarisasi
proses,
dan
mengintegrasikan teknologi untuk menanamkan GRC pada setiap tingkat
organisasi.
Kategori analytic tools dan teknikya yaitu (Turban, Aronson, Liang, & Sharda,
2007) :
1. Informasi dan penemuan pengetahuan
2. Decision support dan Intelligent system
3. Visualization
commit to user
7
digilib.uns.ac.id
perpustakaan.uns.ac.id
Klasifikasi Business Analytic Tolls (Turban, Aronson, Liang, & Sharda, 2007) :
1. Enterprise reporting products
2. Cube analysis
3. Ad hoc querying and analysis
4. Statistical analysis and data mining
5. Report delivery and alerting
Analisis bisnis secara konvensional dibagi menjadi tiga domain :

Metode deskriptif
Metode deskriptif melibatkan menggunakan data untuk menggambarkan situasi
masa lalu saat ini atau baru-baru ini untuk sebuah organisasi . Sebagai contoh,
seseorang mungkin menggunakan metode tersebut untuk menanyakan
bagaimana keuntungan didistribusikan secara geografis. Metode deskriptif
biasanya tidak terikat erat dengan keputusan tertentu , dan melibatkan sedikit
atau tidak ada modeling.

Metode prediktif
Metode prediktif juga sangat bergantung pada data, meskipun beberapa model
biasanya terlibat . Di sini fokusnya adalah pada peramalan hasil masa depan,
biasanya di bawah asumsi bahwa kekuatan pendorong dalam bermain di masa
lalu akan terus berlanjut ke masa depan . Karena asumsi ini, metode prediksi
lebih mengandalkan analisis data dari pemodelan.

Metode preskriptif
Metode preskriptif menjawab pertanyaan yang berhubungan dengan pengambil
keputusan yang ingin terjadi di masa depan. Jadi mereka yang paling terkait
erat dengan proses pengambilan keputusan. Data berperan dalam metode ini,
tetapi pemodelan adalah alat fundamental di sini. Optimasi dan simulasi adalah
alat preskriptif.
commit to user
8
digilib.uns.ac.id
perpustakaan.uns.ac.id
2.1.2
2.1.2.1
Data mining
Pengertian Data Mining
Data mining adalah proses yang mengunakan teknik statistic, matematika
kecerdasan
buatan,
dan
machine
learning
untuk
mengekstraksi
dan
mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari
berbagai database besar (Turban, Aronson, & Liang, 2005). Data mining, sering
juga disebut sebagai knowledge discovery in database (KDD). KDD adalah
kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk menemukan
keteraturan, pola atau hubungan dalam set data berukuran besar (Santoso, 2007).
Menurut Gartner Group, data mining adalah suatu proses menemukan hubungan
yang berarti, pola, dan kecenderungan dengan memeriksa dalam sekumpulan
besar data yang tersimpan dalam penyimpanan dengan menggunakan teknik
pengenalan pola seperti teknik statistika dan matematika (Larose, 2005).
Faktor yang mendorong kemajuan dalam bidang data mining antara lain (Larose,
2005) :
1. Pertumbuhan yang cepat dalam kumpulan data
2. Penyimpanan data dalam data warehouse, sehingga seluruh perusahaan
memiliki akses ke dalam database yang andal.
3. Adanya peningkatan akses data melalui navigasi web dan intranet
4. Tekanan kompetisi bisnis untuk meningkatkan penguasaan pasar dalam
globalisasi ekonomi.
5. Perkembangan teknologi perangkat lunak untuk data mining.
6. Perkembangan
yang
hebat
dalam
kemampuan
komputasi
dan
pengembangan kapasitas media penyimpanan
Karakteristik data mining sebagai berikut (Davies & Beynon, 2004) :

Data mining berhubungan dengan penemuan sesuatu yang tersembunyi
dan pola data tertentu yang tidak diketahui sebelumnya.

Data mining biasanya menggunakan data yang sangat besar. Biasanya data
commit to user
yang besar digunakan untuk membuat hasil lebih dipercaya.
perpustakaan.uns.ac.id

9
digilib.uns.ac.id
Data mining berguna untuk membuat keputusan yang kritis, terutama
dalam strategi.
2.1.2.2 Tahap-tahap Data Mining
Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi
beberapa tahapan yang diilustrasikan di gambar dibawah.
Gambar 2.1 Tahap-tahap Data Mining (Han & Kamber, 2006)
Tahap-tahap data mining di bagi menjadi 6 yaitu (Han & Kamber, 2006) :
1. Pembersihan data (Data Cleaning)
Pembersihan data yaitu proses menghilangkan noise data yang tidak
konsisten (Han & Kamber, 2006). Pada umumnya data yang di dapat dari
database perusahaan ataupun eksperimen, memiliki kekurangan misalnya
isian-isian yang kurang sempurna, seperti data hilang, salah ketik ataupun
data yang tidak valid. Selain itu, ada juga atribut-atribut data yang tidak
commit to user
relevan dengan hipotesis data mining yang dimiliki. Data-data yang tidak
10
digilib.uns.ac.id
perpustakaan.uns.ac.id
relavan itu juga lebih baik dibuang. Pembersihan data juga akan
mempengaruhi performasi dari teknik data mining karena data yang
ditangani akan berkurang jumlah dan kompleksitasnya.
2. Integrasi data (Data Integration)
Integrasi data merupakan penggabungan data dari beberapa database ke
dalam satu database baru (Han & Kamber, 2006). Tidak jarang data yang
diperlukan untuk data mining tidak hanya berasal dari satu database tetapi
juga berasal dari beberapa database atau file teks. Integrasi data dilakukan
pada atribut-atribut yang mengidentifikasikan entitas-entitas yang unik
seperti atribut nama, jenis produk, nomor pelanggan dan lainnya. Integrasi
data perlu dilakukan secara cermat karena kesalahan pada integrasi data
bisa menghasilkan hasil yang menyimpang dan bahkan menyesatkan
pengambilan aksi nantinya. Sebagai contoh bila integrasi data berdasarkan
jenis produk ternyata menggabungkan produk dari kategori yang berbeda
maka akan didapatkan korelasi antar produk yang sebenarnya tidak ada.
3. Seleksi data (Data selection)
Data yang ada dalam di sebuah database tidak semuanya di pakai, oleh
karena itu hanya data yang sesuai dengan analisis akan di ambil dari
database tersebut. Sebagai contoh, sebuah kasus yang meneliti faktor
kecenderungan orang membeli dalam kasus market basket analysis, tidak
perlu mengambil nama pelanggan, cukup dengan id pelanggan saja.
4. Transformasi Data (Data transformation)
Data digabung atau diubah ke dalam format yang sesuai untuk diproses di
data mining (Han & Kamber, 2006). Dalam beberapa metode data mining
memerlukan format data yang khusus sebelum diaplikasikan. Sebagai
contoh metode standar analisis asosiasi hanya bisa menerima input data
kategorikal. Oleh karena itu, data yang berupa angka numerik yang
berlanjut perlu dibagi-bagi menjadi beberapa interval. Proses ini disebut
sebagai proses tranformasi data.
commit to user
11
digilib.uns.ac.id
perpustakaan.uns.ac.id
5. Proses mining
Merupakan suatu proses utama saat metode diterapkan untuk menemukan
pengetahuan berharga dan tersembunyi dari data.
6. Evaluasi pola (pattern evaluation)
Untuk mengidentifikasi pola-pola menarik kedalam knowledge
based
yang ditemukan (Han & Kamber, 2006). Dalam tahap ini hasil dari teknik
data mining berupa pola-pola yang khas maupun model prediksi
dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. Bila
ternyata hasil yang diperoleh tidak sesuai hipotesa ada beberapa alternatif
yang
dapat
diambil
seperti
menjadikannya
umpan
balik
untuk
memperbaiki proses data mining, mencoba metode data mining lain yang
lebih sesuai, atau menerima hasil ini sebagai suatu hasil yang di luar
dugaan yang mungkin bermanfaat.
7. Presentasi pengetahuan (knowledge presentation)
Merupakan penyajian pengetahuan mengenai metode yang digunakan
untuk memperoleh pengetahuan yang diperoleh oleh (Han & Kamber,
2006). Tahap yang terakhir dari proses mining yaitu bagaimana mengambil
keputusan dari hasil analisis yang didapat. Ada kalanya hal ini harus
melibatkan orang-orang yang tidak memahami data mining. Karenanya
presentasi hasil data mining dalam bentuk pengetahuan yang bisa
dipahami semua orang adalah satu tahapan yang diperlukan dalam proses
data mining. Dalam presentasi ini, visualisasi juga bisa membantu
mengkomunikasikan hasil data mining.
2.1.3
Association Rule
Association Rule (aturan asosiatif) adalah salah satu teknik utama dalam
data mining dan merupakan bentuk yang paling umum dipakai dalam menentukan
pattern atau pola dari suatu kumpulan data (Kantardzic, 2003). Association Rule
(aturan asosiatif) berusaha menemukan aturan – aturan tertentu yang
mengasosiasikan data yang satu dengan data yang lain. Untuk mencari association
commit tokita
userharus mencari lebih dahulu yang
rule dari suatu kumpulan data, pertama
perpustakaan.uns.ac.id
12
digilib.uns.ac.id
disebut frequent itemset atau sekumpulan item yang sering muncul bersamaan.
Setelah semua pola frequent itemset ditemukan, barulah dicari aturan asosiatif
yang memenuhi syarat yang telah ditentukan.
Contoh aturan asosiatif dari analisa pembelian di suatu pasar swalayan
adalah dapat diketahuinya berapa besar kemungkinan seorang pelanggan membeli
roti bersamaan dengan susu. Dengan pengetahuan tersebut pemilik pasar swalayan
dapat mengatur penempatan barangnya atau merancang kampanye pemasaran
dengan memakai kupon diskon untuk kombinasi barang tertentu.
Analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa
keranjang belanja di pasar swalayan. Analisis asosiasi juga sering disebut dengan
istilah market basket analysis. Analisis asosiasi dikenal juga sebagai salah satu
teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya.
Khususnya salah satu tahap dari analisis asosiasi yang disebut analisis pola
frequensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti
untuk menghasilkan algoritma yang efisien.
Penting tidaknya suatu aturan asosiatif dapat diketahui dengan dua
parameter, support (nilai penunjuang) yaitu persentase kombinasi item tersebut
dalam database dan confidence (nilai kepercayaan) yaitu kuatnya hubungan antar
item dalam aturan assosiatif.
Aturan assosiatif biasanya dinyatakan dalam bentuk :{roti, mentega} →
{susu} (support = 40%, confidence = 50%) yang artinya “50% dari transaksi di
database yang memuat item roti dan mentega juga memuat item susu. Sedangkan
40% dari seluruh transaksi yang ada di database memuat ketiga item itu.” Dapat
juga diartikan: “Seorang konsumen yang membeli roti dan mentega punya
kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena
mewakili 40% dari catatan transaksi selama ini.”
Analisa untuk menemukan semua aturan asosiatif harus memenuhi syarat
minimum untuk support (minimum support) dan syarat minimum confidence
(minimum confidence). Penting tidaknya suatu aturan asosiatif diketahui dari dua
parameter tersebut. Support (nilai penunjang) yaitu persentase kombinasi item
commit
to user(nilai kepercayaan) yaitu kuatnya
tersebut dalam database sedangkan
confidence
13
digilib.uns.ac.id
perpustakaan.uns.ac.id
hubungan antar item dalam aturan asosiatif. Nilai support dari 2 item diperoleh
dari Persamaan 2.1 (Larose, 2005) berikut :
Support (A ∩ B) =
𝑗𝑢𝑚𝑙𝑎 ℎ 𝑡𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖 𝑚𝑒𝑛𝑔𝑎𝑛𝑑𝑢𝑛𝑔 𝐴 𝑑𝑎𝑛 𝐵
𝑇𝑜𝑡𝑎𝑙 𝑡𝑟𝑎𝑛𝑠𝑎𝑘𝑠𝑖
(2.1)
Setelah semua nilai support ditemukan, barulah dicari aturan asosiatif yang
memenuhi syarat minimum untuk confidence dengan menghitung confidence
aturan assosiatif A→B dimana A adalah antecedent dan B adalah consequent.
Antecedent untuk mewakili bagian “jika” dan consequent untuk mewakili bagian
“maka”. Nilai confidence dari aturan A→B diperoleh dari Persamaan 2.2 (Larose,
2005) berikut :
Confidence A → B =
2.1.4
jumlah transaksi mengandung A dan B
Jumlah transaksi mengandung A
(2.2)
Algoritma Apriori
Algoritma Apriori adalah salah satu algoritma yang melakukan pencarian
frequent itemset dengan menggunakan teknik association rule (Han & Kamber,
2006). Dalam algoritma apriori ini menggunakan pengetahuan frekuensi atribut
yang telah diketahui sebelumnya untuk memproses informasi selanjutnya.
2.1.4.1 Kelebihan Algoritma Apriori
Algoritma apriori paling terkenal untuk menemukan pola frekuensi tinggi.
Pola frekuensi tinggi yaitu pola-pola item di dalam suatu database yang memiliki
frekuensi atau support di atas ambang batas tertentu yang disebut dengan istilah
minimum support atau disebut juga threshold (Han & Kamber, 2006). Threshold
adalah batas minimum transaksi. Jika dalam suatu transaksi jumlah transaksinya
kurang dari threshold, maka item atau kombinasi item tidak akan diikutkan
kembali dalam perhitungan selanjutnya. Fungsi dari threshold yaitu dapat
mempercepat perhitungan.
commit to user
perpustakaan.uns.ac.id
14
digilib.uns.ac.id
2.1.4.2 Tahap Algoritma Apriori
Algoritma Apriori dibagi menjadi beberapa tahap yang disebut iterasi.
Tiap iterasi menghasilkan pola frekuensi tinggi dengan panjang yang sama
dimulai dari pertama yang menghasilkan pola frekuensi tinggi dengan panjang
satu. Dalam menangani masalah asosiasi algoritma apriori mengurangi jumlah
set item yang dipertimbangkan. Minimum support ditentukan oleh pengguna.
Dengan diberikan nilai minimum support dan minimum confidence, pencarian
aturan-aturan asosiasi dengan menggunakan algoritma apriori ada dua tahap (Han
& Kamber, 2006) :
1. Join (penggabungan)
Pada proses penggabungan setiap item dikombinasikan dengan item yang
lainnya sampai tidak terbentuk kombinasi lagi.
2. Prune (pemangkasan)
Dalam proses pemangkasan, hasil dari item yang telah dikombinasikan
tersebut lalu dipangkas dengan menggunakan minimum support yang telah
ditentukan oleh pengguna.
Algoritma Apriori dibagi menjadi beberapa tahap yang disebut iterasi.
 Sistem men-scan database untuk mendapatkan kandidat 1-itemset
(himpunan item yang terdiri dari 1 item) dan menghitung nilai supportnya.
Misalnya T adalah himpunan dalam database. Support dari suatu itemset
(S) merupakan prosentase dari transaksi dalam T yang mengandung
S.Kemudian nilai support tersebut dibandingkan dengan minimum support
yang telah ditentukan, jika nilainya lebih besar atau sama dengan
minimum support maka itemset tersebut termasuk dalam large itemset.
 Itemset yang tidak termasuk dalam large itemset tidak diikutkan dalam
iterasi selanjutnya (di prune).
 Pada iterasi kedua sistem akan menggunakan hasil large itemset pada
iterasi pertama (L1) untuk membentuk kandidat itemset kedua (L2). Pada
iterasi selanjutnya sistem akan menggunakan hasil large itemset pada
iterasi sebelumnya (Lk-1) untuk membentuk kandidat itemset berikutnya
commit to user
(Lk). Sistem akan menggabungkan
(join) Lk-1 dengan Lk-1 untuk
15
digilib.uns.ac.id
perpustakaan.uns.ac.id
mendapatkan Lk, seperti pada iterasi sebelumnya sistem akan menghapus
(prune) kombinasi itemset yang tidak termasuk dalam large itemset.
 Setelah dilakukan operasi join, maka pasangan itemset baru dari hasil
proses join tersebut juga dihitung supportnya.
 Proses pembentukan kandidat yang terdiri dari proses join dan prune akan
terus dilakukan hingga himpunan kandidat itemsetnya null, atau sudah
tidak ada lagi kandidat yang akan dibentuk.
 Setelah itu, dari hasil frequent itemset tersebut dibentuk association rule
yang memenuhi nilai support dan confidence yang telah ditentukan.
 Association rule yang terbentuk harus memenuhi nilai minimum yang
telah ditentukan.
Algoritma Apriori mengambil keuntungan dari properti Apriori untuk
menyusutkan ruang pencarian. Untuk lebih jelasnya dapat dilihat dari contoh
berikut. Diketahui Database transaksi D sebagai berikut :
Tabel 2.1 Contoh Database Transaksi
ID Transaksi
ID Barang yang dibeli
T100
I1, I2, I5
T200
I2, I4
T300
I2, I3
T400
I1, I2, I4
T500
I1, I3
T600
I2, I3
T700
I1, I3
T800
I1, I2, I3, I5
T900
I1, I2, I3
1.
Pada iterasi pertama algoritma ini, setiap barang adalah anggota himpunan
kandidat 1-itemset, C1. Algoritma ini menscan seluruh transaksi untuk
menghitung jumlah kemunculan setiap barang.
commit to user
16
digilib.uns.ac.id
perpustakaan.uns.ac.id
2.
Misalkan jumlah kemunculan minimum yang dibutuhkan adalah 2. Himpunan
frequent 1-itemset, L1, maka dapat ditentukan yaitu terdiri dari kandidat 1itemset yang jumlah kemunculannyamemenuhi syarat..
3.
Untuk mencari himpunan frequent 2-itemset, L2, algoritma ini menggunakan
L1 untuk menghasilkan kandidat 2-itemset, C2.
4.
Berikutnya data dalam D dibaca untuk dicatat akumulasi kemunculan barang
di C2.
5.
Himpunan frequent 2-itemset, L2, kemudian ditentukan, terdiri dari kandidat
2-itemset dalam C2 yang memenuhi batas minimum.
6.
Berikutnya adalah mencari kandidat 3-itemset, C3. Seperti mencari kandidat
C2, C3= L2 x L2={{I1,I2,I3,I5},{I2,I4,I5}}.
7.
D discan untuk menentukan L3, yang terdiri dari kandidat 3-itemset dalam C3
yang memenuhi batas minimum yaitu {{I1,I2,I3}, {I1,I2,I5}}.
8.
L3 x L3 untuk menghasilkan kandidat 4-itemset, C4. Walaupun hasilnya adalah
{{I1,I2,I3,I4,I5}}, itemset ini tidak berlaku karena subset-nya {{I2,I3,I5}}
tidak frequent. Jadi, C4 = ɸ, dan algoritma berhenti.
commit to user
perpustakaan.uns.ac.id
17
digilib.uns.ac.id
G
a
Gambar 2.2 Contoh Menemukan Kandidat Itemset n Frequent itemsets
dengan Minimum Support 2 (Han & Kamber, 2006).
Setelah hasilnya diperoleh, dibuat association rule yang kuat dari hasil
tersebut (dimana association rule yang kuat memenuhi baik ambang minimum
support dan ambang minimum confidence).
Contoh :
Misalkan data-data yang ada berbentuk seperti pada contoh sebelumnya,
dan frequent itemset-nya adalah 1= {I1,I2,I5}. Apa saja association rule yang bisa
didapat dari 1? Subset dari 1 adalah {I1,I2}, {I1,I5}, {I2,I5}, {I1}, {I2}, dan {I5}.
Berikut association rule-nya dengan confidence :
I1^I2 →I5 confidence = 2/4 = 50%
I1^I5 →I2 confidence = 2/2 = 100%
I2^I5 →I1 confidence = 2/2 = 100%
I1→ I2^I5 confidence = 2/6 = 33%
I2→ I1^I5 confidence = 2/7 = 29%
I5→ I1^I2 confidence = 2/2 = 100%
commit to user
perpustakaan.uns.ac.id
18
digilib.uns.ac.id
Jika amabang minimum confidence (yang ditentukan) adalah 70% maka
hanya aturan kedua, ketiga, dan terakhir yang merupakan output, karena aturanaturan ini yang kuat
2.2 Penelitian Terkait
Penelitian sebelumnya yang pernah dilakukan antara lain :
1. “Penentuan Association Rule pada Pemilihan Program Studi Calon
Mahasiswa Baru Menggunakan Algoritma Apriori Studi Kasus pada
Universitas Widyatama Bandung (Rumaisa, 2012)”
Dalam penelitian ini penulis akan menggunakan algoritma apriori untuk
mengetahui asosiation rule pemilihan program studi calon mahasiswa. Data yang
digunakan dalam penelitian ini di dapat dari Unit PR dan Marketing mulai dari
tahun 2007 sampai dengan 2011. Namun informasi yang didapat tidak semua
dimasukkan dalam proses data mining hanya yang berperan sebegai referensi
identifikasi saja. Adapun atribut yang digunakan untuk data training yaitu Jenis
kelamin, Penghasilan Orangtua, Pilihan 1, pilihan 2, pilihan 3 dan Jurusan. Dalam
penelitian ini model association rules dibuat menggunakan tools dari Clementine.
Data training yang sudah disiapkan menggunakan Ms.Excel dikoneksikan ke tools
Clementine, dalam hal ini didefinisikan dalam objek data training. Kemudian
objek ini diteruskan pada objek type data untuk memastikan type data yang
diproses sudah sesuai dengan kebutuhan model. Setelah model algoritma apriori
dijalankan menghasilkan model association rules yang berkaitan dengan pola
pemilihan program studi calon mahasiswa baru.
2. “FpVAT : A visual Analytic Tool for Supporting Frequent Pattern Mining
(Leung & Carmichael, 2010) ”
Pada penelitian ini penulis mengembangkan alat analitik visual yang
sederhana untuk mendukung pertambangan pola yang sering disebut FpVAT. Alat
analitik visual tersebut terdiri dari dua modul yaitu satu modul memberikan
pandangan kepada pengguna sehingga mereka dapat memperoleh wawasan dari
usermemungkinkan pengguna untuk
analisis jumlah data tersebut. commit
Modul tolain
19
digilib.uns.ac.id
perpustakaan.uns.ac.id
melakukan penalaran analitik hasil pertambangan melalui visualisasi interaktif
sehingga pengguna dapat mendeteksi pola yang sering diharapkan dan
menemukan pola yang sering tak terduga. FpVAT juga dilengkapi dengan
beberapa fitur interaktif untuk mendukung visual yang efektif dalam analisis data
dan proses datamining untuk berbagai aplikasi kehidupan nyata.
3. “CloseViz: Visualizing Useful Patterns (Carmichael & Leung, 2010)”
Pada penelitian ini, penulis membahas tentang CloseViz. Ketika
menangani dataset yang sangat besar, jumlah pola yang sering ditampilkan bisa
menjadi banyak karena pola ledakan. Untuk memperbaiki situasi ini, penulis
mengusulkan sebuah visualisator yang disebut CloseViz. CloseViz ini berfungsi
untuk menunjukkan kepada pengguna, pola yang hanya berguna saja tetapi, tetap
mempertahankan semua informasi yang penting. Secara khusus, CloseViz hanya
menunjukkan pola yang sering tertutup. CloseViz sangat mengurangi jumlah pola
yang ditampilkan tetapi, tanpa kehilangan informasi frekuensi apapun. Dengan
demikian, pola tertutup yang ditampilkan ditambang dari dataset dapat disajikan
sebagai pengganti semua pola yang sering yang dapat ditambang dari dataset yang
sama. CloseViz juga menyediakan pengguna dengan fitur-fitur interaktif untuk
eksplorasi visual.
4.
“The Impact of Business Analytics on Supply Chain Performance
(Trkman, McCormack, Oliveria, & Ladeira, 2010)”
Pada penelitian ini penulis meneliti hubungan antara kemampuan analitik
dalam perencanaan, sumber, membuat dan memberikan daerah rantai pasokan dan
kinerjanya menggunakan dukungan sistem informasi.
Peneliti menggunakan
sampel sruktural model karyawan dari 310 perusahaan dari berbagai industri dari
Amerika Serikat, Eropa, Kanada, Brazil dan China. Dari sampel tersebut peneliti
menemukan temuan adanya hubungan yang signifikan secara statistik antara
kemampuan analitis dan kinerja. Hasil penelitian ini menunjukkan bahwa
pengunaan Business Analitycs di bidang proses dapat mempengaruhi kinerja
Supply Chain (SC). Temuan commit
ini dibenarkan
to user dalam sampel dari berbagai
perpustakaan.uns.ac.id
20
digilib.uns.ac.id
perusahaan industri yang berbeda dan berbagai negara tersebut. Hasil penelitian
ini juga memperkuat pentingnya penggunaan database pada perusahaan, dari
database tersebut dapat diperoleh model prediksi dan manajemen berdasarkan
fakta untuk mendorong keputusan dan tindakannya. Kemampuan analitis dapat
lebih mengarahkan keputusan secara eksklusif kepada manusia dan memberikan
keputusan dari beberapa tugas dalam organisasi.
5.
“Penerapan metode Association Rule Menggunakan Algoritma Apriori
untuk Analisa Pola Data Hasil Tangkapan Ikan (Tyas D, 2008)”
Dalam penelitian ini akan dilakukan pengujian dengan Metode Association
Rule yang digunakan untuk menyelesaikan masalah pada data hasil tangkapan
ikan. Penelitian ini menggunaka data daerah dan nama ikan dari data statistika
perikanan Dinas Kelautan dan Perikanan propinsi Jawa Timur. Cara penggunaan
aplikasi yang dibuat penulis yaitu memilih dataset dan menentukan nilai
minimum support dan minimum confidence yang akan digunakan dalam
prosesnya, selanjutnya baru dilakukan proses perhitungan association rule.
Setelah proses perhitungan selesai, akan diperoleh rule yang dihasilkan dan nilai
confidencenya. Rule yang dihasilkan menunjukkan pola hasil tangkapan ikan di
suatu daerah pada kwartal tertentu. Pola yang dimaksud yaitu jenis ikan yang
sering muncul dan mempunyai jumlah yang besar. Tujuan dari penelitian ini
adalah memberikan informasi kepada nelayan mengenai daerah penangkapan ikan
dan potensi sumber daya ikan di suatu perairan tertentu dan membantu para
nelayan dalam menentukan daerah yang akan dijadikaan sebagai tujuan
pendistribusian hasil tangkapan ikannya.
2.3 Rencana Penelitian
Dengan melihat tinjauan pustaka diatas, penelitian ini akan berkonsentrasi
pada implementasi business analytic dan algoritma apriori serta bagaimana
menganalisis hasil algoritma apriori tersebut yang berbentuk pola data atau rule.
Analisis pola data menggunakan dua parameter yaitu :
commit to user
21
digilib.uns.ac.id
perpustakaan.uns.ac.id
1. Parameter nilai pendukung atau support dan nilai kepercayaan atau
confidence yang dihasilkan oleh proses algoritma tersebut.
2. Parameter kualitas kelulusan yaitu IPK dan masa studi (tahun) yang
disimbolkan dengan A dan B. A merupakan Indeks Prestasi Komulatif
(IPK) dan B untuk masa studi (tahun).
commit to user
Download