sistem rekomendasi pada fitur iklan online menggunakan metode

advertisement
Seminar Nasional Teknologi Informasi 2016
A16
SISTEM REKOMENDASI PADA FITUR IKLAN ONLINE
MENGGUNAKAN METODE KLASIFIKASI DENGAN
ALGORITMA CHAID
1)
Feri Sulianta 1) Eka Angga Laksana 2)
Teknik Informatika Universitas Widyatama
Jl. Cikutra No. 204 A, Bandung, Indonesia
email : [email protected]
2)
Teknik Informatika Universitas Widyatama
Jl. Cikutra No. 204 A, Bandung, Indonesia
email : eka. [email protected]
belahan bumi manapun. Menurut internetworldstats.com
diperkirakan, bahwa pengguna internet di seluruh dunia
sudah mencapai lebih dari dua miliar orang yang akan
terus bertambah, dengan demikian penggunaan internet
sebagai media promosi sangatlah menjanjikan.
Setiap media sosial seperti televisi, radio, dan surat
kabar memiliki porsi yang luarbiasa besar untuk
dijadikan media informasi sebelum tahun 2000-an, tetapi
porsinya terus mengalami degradasi dan penyusutan
dengan diambil alihnya sebagian peran-peran dengan
teknologi yang lebih baru dan multi fitur. Di tahun 2009
saja, pengguna Internet di seluruh dunia sebesar 6,7
miliar orang, sehingga penggunaan Internet sebagai
media promosi penting peranannya[15][16].
Sehubungan dengan aplikasi yang hendak dibuat
yang melibatkan advertising, yang dalam hal ini adalah
online
advertising,
sangatlah beragam karena
menggunakan media internet. Penerapan data mining
terhadap iklan online merupakan strategi bisnis secara
langsung yang dialamati pada pelanggan atau calon
pelanggan dalam membuat keputusan membeli produk
yang ditawarkan secara spesifik. Kondisi ini didapat
karena sistem mempelajari pola perilaku pelanggan
terhadap barang-barang yang dibeli secara online.
Pembelajaran perilaku dilakukan pada data-data
transaksi dalam kurun waktu tertentu. Berbagai
karakteristik data yang dijadikan pembelajaran
mencakup berbagai atribut barang dan juga riwayat
pembelian pelanggan, misalnya saja seperti: harga
produk, fungsi barang, warna, bahan, juga waktu dan
prioritas konsumen dalam membeli barang. Semakin
banyak atribut yang secara seksama dipertimbangkan
dalam mempelajari pola, maka semakin tinggi tingkat
akurasi dalam membentuk data yang berpengetahuan.
ABSTRACT
Dengan
adanya perkembangnya teknologi
komputer, terutama Internet, memampukan perusahaan
untuk mengalamati manfaat bisnis terutama dalam
aspek pemasaran selain dari pada kegiatan transaksi
atau e-commerce secara general. Hal ini dalam terlihat
dengan adanya berbagai iklan online atau banner ads
yang disebarkan dalam berbagai portal dan kontenkonten internet. Iklan online pada dasarnya ditujukan
untuk menarik para pengunjung atau konsumen guna
bertransaksi pada situs-situs e-commerce.
Dalam kasus ini, iklan onine harus ditayangkan
secara selektif, sedemikian sehingga menarik bagi
orang-orang yang melihatnya. Dalam kasus ini, sistem
penunjang
keputusan
yang
dibuat,
akan
merekomendasikan barang bagi konsumen. Langkah ini
dapat dilakukan dengan menerapkan teknik data mining
menggunakan
metode
klasifikasi,
dan
mengimplementasikan algoritma Chi-Squared Automatic
Interaction Detector.
Key words
Data Mining, Sistem Pendukung Keputusan, Banner Ads,
Klasifikasi, Algoritma Chaid, Chi-Squared Automatic
Interaction Detector.
1. Pendahuluan
Iklan
atau
advertising
ditujukan
untuk
memperkenalkan produk dan jasa pada masyarakat luas
dan merupakan hal esensial dalam divisi pemasaran pada
sebuah perusahaan. Sedemikian hingga ragam inovasi
terus dilakukan agar iklan dapat menarik perhatian
konsumen atau calon konsumen. Implementasi teknologi
informasi pada dunia periklanan merupakan salah satu
inovasi yang dilakukan.
Internet merupakan teknologi informasi yang
berkembang pesat. Hal ini dikarenakan cakupannya
yang sangat luas dan mudah diakses oleh siapa saja dari
2. Metode
Teknik penambangan data guna menghasilkan pola
data merupakan informasi berharga yang dipandang
sebagai pengetahuan. Temuan data mining ini banyak
95
A16
Seminar Nasional Teknologi Informasi 2016
digunakan dalam banyak kepentingan dalam ruang
lingkupkecerdasan buatansemisal: analisis penjualan,
industri periklanan, prediksi bencana, mendeteksi
penyakit, mengelola pertanian dan lainnya [23][28].
Berbagai istilah menambangan data lain yang
dikembangkan terhadap ragam data menambang
pengetahuan, ekstraksi pengetahuan, analisa pola-pola
data, data arkeologikal, dan sebaginya. Meskipun
demikian banyak ahli menyatakan data mining sebagai
Knowledge Discovery Database[3][11][19][29][30].
2.1 Menambang Data
Menambang data atau data mining, merupakan
metoda yang ditujukan dalam menggali informasi yang
sifatnya implisit dan
tersembunyi pada database.
Teknologi ini efektif bagi organisasi dalam
memberdayakan data banyak, bisa berupa data yang
disimpan pada warehouse atau data mart. Data mining
mampu memprediksi tren, atau perilaku, sehingga
memampukan perusahaan untuk semakin proaktif dan
memperkaya pengetahuan dalam membuat keputusan.
Data mining menganalisa prospektifitas dengan
modus ‘riwayat masa lampau’ dengan tool retrospektif
(yang melibatkan korelasi masa lampau/historis ) yang
biasanya digunakan dalam sistem penunjang keputusan.
Data mining dapat menjawab pertanyaan bisnis dengan
cepat dan efisien jika dibandingkan dengan cara-cara
tradisional. Tool ini akan menjelajahi pola-pola
tersembunyi dari basis data guna menemukan informasi
prediktif yang bisa jadi seorang manajer atau pakar akan
melewatkan informasi tersebut karena diluar jangkauan
ekspektasi mereka.
Fungsi data mining yang digunakan untuk keperluan
implementatif mencakup [3][29][30]:
 Mendeteksi pola kecurangan bertransaksi, klaim
kartu kredit, dsb.
 Memodelkan pola dan perilaku pembeli/konsumen.
 Mengoptimasi performasi produk barang/jasa.
 Mendeteksi kejadian pada perilaku, seperti
menelusuri riwayat akvitas yang unik atau tidak
wajar.
 Memperlengkapi perusahaan dalam menemukan pola,
dan korelasi data, yang menuntun pada pengetahuan
dan temuan bernilai lainnya.
Gambar 1. Menambang data ditujukan mengungkap pola dan
pengetahuan dari data banyak[15][16]
Sistem penunjang keputusan merupakan salah satu
dari ragam jenis sistem informasi berbasiskan komputer
(Computer Base Information System) yang ditujukan
guna mendukung pembuat keputusan pada organisasi.
Dalam kasus ini sistem penunjang keputusan ditujukan
untuk membuat pertimbangan bagi pembuat keputusan
yang sifatnya semi tertruktur bahkan tidak terstruktur,
dalam arti sistem dibuat untuk menangani kondisi atau
masalah dan kebutuhan yang spesifik non administratif.
Sistem terkomputerisasi tersebut ditujukan untuk
membuat keputusan dalam bereksperimen dengan data
dan model untuk mengalamati masalah yang semi
terstruktur atau tidak terstruktur. Sistem demikian
umumnya digunakan oleh manejemen level menengah
atau manajemen level puncak. Secara teknis, fitur ini
memiliki kemampuan untuk menggabungkan data, basis
data, model-model dan fitur analitik.
Berbeda dengan sistem informasi lainnya, sistem
penunjang keputusan memiliki fase sebagai berikut[3]:
 Penelusuran: Tahap ini ditujukan untuk mengalamati
dan mendefinisikan masalah terkait solusi terhadap
masalah yang saat ini terjadi.
 Perancangan: Pada tahap ini, dilakukan proses
memodelkan sistem informasi menggunakan ragam
perangkat
permodelan
terstruktur
ataupun
permodelan berbasiskan objek. Model yang
dirancang harus terlebih dahulu diuji kemudian
dilakukan proses validasi.
 Pemilihan: Tahap ini ditujukan untuk memilih
berbagai karakteristik teknis sehubungan dengan
model yang sudah divalidasi. Aspek teknis misalnya,
memilih sistem operasi, bahasa pemrograman,
kebutuhan processor bahkan hal-hal teknis lainnya
yang terintegrasi menjadi sistem komputer yang
bekerja.
 Implementasi: Tahap ini merupakan tahap akhir dan
ditujukan untuk merealisasikan pilihan yang sudah
dibuat. Berbagai proses uji dan pilot dilakukan pula
pada tahap ini.
Komputer semakin berkemampuan dan murah.
Tekanan para pesaing semakin meningkat, dalam hal ini
perusahaan perlu menciptakan sistem-sistem baru
terkustomisasi untuk memampukan strategi bisnisnya
(Misalnya: Customer Relationship Management, Sistem
Informasi Manajemen, dsb) [15][16].
Analisis yang perihal pola berharga yang dilakukan
oleh data mining, menjadi bagian inti dari sistem
pendukung keputusan. Data Mining dapat memberikan
solusi dan kaus bisnis yang jika dilakuan dengan
mengandalkan cara-cara manual akan menyita banyak
waktu dan biaya yang mahal. Hal ini dikarenakan
kemampuan komputer dan teknik Data Mining yang
mampu mengeksplorasi basis data untuk mengalamati
pola-pola yang tersembunyi [2][8][18][29].
Data mining ditujukan untuk menemukan pola-pola
tertentu dari kumpulan data banyak sehingga dapat
diberdayakan untuk kemudian hari misalnya untuk
membuat strategi bisnis dan kebijkan yang sifatnya
strategis. Seiring fungsi dari data mining yang
membentuk pengeahuan, maka data mining kerap kali
dikenal dengan istilah Knowledge Discovery Databases
96
Seminar Nasional Teknologi Informasi 2016
A16
(KDD). Meskipun istilah data mining dan KDD dianggap
sama, tetapi keduanya memiliki konsep yang relatif
berbeda. Dalam kasu ini sistem penunjang keputusan
disebut pula sebagai recommerder system terhadap
konsumen sewaktu berbelanja lewat portal online store.
2.3 Bahasa pemrograman untuk membangun
aplikasi berbasis Web
Sistem penunjang keputusan yang dibuat ditujukan
pada online shop berbasis web. Banyak bahasa
pemrograman berbasis skrip yang dapat digunakan untuk
membangun website, misalnya: PHP. Hingga saat ini,
PHP paling banyak digunakan karena kesederhanaan
sintak dan kecepatan sewaktu dieksekusi.
Pada dasarnya, PHP yang adalah kepanjangan dari
Hypertext
Preprocessor,
merupakan
bahasa
pemrograman scripting yang dapat digunakan secara
umum dan berbasis web dan dijalankan pada web
browser sebagai antra muka aplikasi. Sedemikian
sehingga PHP memilki berbagai fungsi dan fitur yang
kaya untuk memprogram berbagai macam perangkat
lunak. Proses kerja dalam mengakses skrip PHP adalah
sebagai berikut:
1. Klien mengakses halaman web yang terdiri dari skrip
PHP.
2. Jika file yang diakses didapat selanjutnya server akan
meneruskannya ke PHP Interpreter (Penterjemah
PHP) untuk menciptakan listing program HTML
yang mengandung skrip PHP.
3. Jika didapati skrip yang meminta layanan basis data,
maka akan diteruskan pada server basis data.
4. Listing program HTML hasil penerjemahan PHP
Interpreter dikembalikan ke web server
5. Web server akan mengirimkan listing HTML ke
kompter klien.
Klasifikasi data dengan algoritma CHAID
Data
Transaksi
Data
Treatment
Retrieve Knowledge
Database oleh
Recomender System
Hasil Menambang
Data
Transformasi Flat
File ke Knowledge
Data Base
Data Engine Transforming
Gambar 2. Proses Menambang data hingga digunakan pada
recomender sistem online shop
2.2 Algoritma CHAID
Metode yang akan digunakan untuk menambang data
dengan teknik data mining adalah metode klasifikasi.
Dari berbagai algoritma data mining, CHAID (ChiSquared Automatic Interaction Detector) adalah salah
satu algoritma yang ditujukan untuk melakukan
klasifikasi data. Metode ini pun kerap kali disebut
dengan metode pohon pengkelasan (Bahasa Inggris:
Classification Tree Method) [1][4][27].
Dasar dari metode pohon klasifikasi ini adalah
membagi data menjadi banyak kelompok-kelompok kecil
berdasarkan keterhubungan antar variabel, yakni variabel
dependen dan variabel independen. Berdasarkan
penelitian terhadulu yang menggunakan metode CHAID,
dikatakan bahwa metode ini akan efektif
untuk
diterapkan pada data yang berasal dari contoh yang
sifatnya repetitif [16].
Algoritma ini akan melakukan teknik iterasi dengan
menguji setiap variabel independen yang digunakan pada
proses klasifikasi yang kemudian megalokasikannya
yang mengacu pada derajat signifikansi terhadap
variabel dependen. Proses inspeksi CHAID dijelaskan
pada tiga acuan yakni[4]:
 Uji signifikan chi-kuadrat.
 Koreksi Bonferroni.
 Mengkombinasikan variabel.
CHAID akan menciptakan fragmen yang akan
membagi kumpulan data-data kedalam dua atau lebih
kategori dengan spesifikasi tertentu, selanjutnya
membagi kelompok-kelompok kedalam kelompok yang
lebih kecil, mengacu pada variabel independen. Proses
ini akan terus dilakukan hingga tidak lagi didapati
variabel independen yang tidak konsisten terhadap
kelompoknya [12][13][17][23][32][33].
Selanjutnya, web browser akan mengeksekusi sekaligus
menampilkan skrip-skip HTML sebagai antarmuka
interaktif dengan pengguna.
3. Implementasi
Penelitian dilakukan dengan melakukan mining pada
data dengan menggunakan tools Rapid Miner untuk
membangun klasifikasi data menggunakan algoritma
CHAID. Data diambil dari data-data transaksional online
shop, dengan 19 atribut termasuk kelas atribut. yang
dengan kolom-kolom data sebagai berikut:
Tabel 1. Field yang terdapat pada database pelanggan
Kolom
userID;
latitude;
longitude;
smoker;
drink_level;
dress_preference;
ambience;
transport;
marital_status;
hijos;
birth_year;
97
Tipe Data
Nominal
Numeric
Numeric
Nominal
Nominal
Nominal
Nominal
Nominal
Nominal
Nominal
Nominal
A16
Seminar Nasional Teknologi Informasi 2016
Kolom
interest;
personality;
religion;
activity;
color;
weight;
budget;
height;
data latih yang juga sama dengan data uji, dengan tingkat
akurasi sebesar 97%. Hasil data klasifikasi ini akan
disimpan dalam bentuk flat file yang akan dijadikan
dasar oleh recommender system untuk memberikan
usulan produk pada konsumen sewaktu konsumen
mengakses portal online shop.
Dengan data yang disimpan dalam database MySQL.
Dalam database digunakan 4 fitur data, yaitu data
barang, rekomendasi, user dan user_detail, yang
digunakan dalam
menyanggga proses bisnis dan
rekomendasi terotomatisasi secara periodik untuk diretrive dan dimutakhirkan dari sistem yang berjalan
menggunakan bagian dari fitur aplikasi yakni Data
Engine Transforming.
Database yang digunakan adalah Mysql dengan
bahasa pemrograman PHP. Hasilnya ditampilkan pada
web browser. Setelah login user akan di tujukan ke
halaman utama web, dengan banner berisi produk yang
direkomendasikan untuk user . Hasilnya dapat dilihat
padaweb browser di area rekomendasi produk, beberapa
produk terpilih untuk konsmeumsn wanita atau produk
untuk pria. Pada tampilan home user, terdapat sugestion
dari pihak produsen. Sugestion ini bukan produk random
yang ditampilkan oleh sistem, bukan pula produk pilihan
admin. Sugestion ini merupakan hasil dari sistem
pendukung keputusan yang telah dibuat. Sugestion ini
ditampilkan berdasarkan beberapa faktor yang telah
dibahas sebelumnya.
Mengacu pada sistem rekomendasi iklan online,
dilakukan pengukuran secara kuantitatif, bahwa dari 45
konsumen yang melihat tayangan iklan online ini
berbasiskan profiling pelanggan, 89% menyatakan diri
tertarik akan rekomendasi yang ditawarkan dengan
mengklik dan menindaklanjutinya dengan membeli
produk yang ditawarkan dalam rekomendasi sistem.
Tipe Data
Nominal
Nominal
Nominal
Nominal
Nominal
Numeric
Nominal
Numeric
Setelah dilakukan mining, didapatkan decision tree
yang kemudian diambil beberapa variabel data semisal:
dress_preference, birth_year, color, budget, dsb karena
sistem pendukung keputusan ini terfokus pada produk
fashion.
Langkah pertama dalam proses mining menggunakan
rapid miner adalah menentukan data yang akan dipakai,
setelah itu set role dan terakhir melakukan validasi
menggunakan x-validation. Setelah itu dilanjutkan
dengan memilih metode yang akan digunakan pada rapid
miner.
Pada penelitian ini penulis menggunakan metode
CHAID. Pada proses ini dilakukan pengolahan data
dengan menggunakan metode CHAID untuk melihat
pembagian segmentasi konsumen secara spesifik
menggunakan tools rapid miner.Setelah mendapatkan
dicision tree, penulis mulai membuat web menggunakan
PHP. Dengan data yang disimpan dalam database
MySQL. Dalam database digunakan 4 tabel, yaitu tabel
barang, rekomendasi, user dan user_detail.
4. Kesimpulan
Manfaat dari penelitian membuat sistem rekomendasi
pada fitur iklan online menggunakan metode klasifikasi
dengan algoritma CHAID ini adalah:
 Menentukan produk yang tepat dalam iklan,
sehingga iklan yang ada tidak akan sia-sia dan dapat
tepat sasaran sesuai segmentasi konsumen
 Membantu bagian pemasaran dalam tugasnya
membuat iklan
 Meningkatkan profit perusahaan dari sisi pemasaran
 Mempermudah konsumen dalam melihat dan
memilih produk dalam iklan, karena ditampilkan
dalam segmentasi sesuai dengan konsumen.
Gambar 2. Hasil membangkitkan pengetahuan mengunakan algoritma
CHAID
Berdasarkan decision tree tersebut, dibuat suatu
contoh website yang menerapkan algoritma dari decision
tree.Terdapat empat tabel pada database untuk sistem
pendukung keputusan ini. Pada penelitian ini penulis
menggunakan metode CHAID. Pada proses ini dilakukan
pengolahan data dengan menggunakan metode CHAID
untuk melihat pembagian segmentasi konsumen secara
spesifik menggunakan tools rapid miner. Menggunakan
Hasil dari penelitian ini cukup mewakili konsep yang
menjadi tujuan penelitian. Pengguna login pada website,
dengan asumsi data profil user sudah tersimpan dalam
database.Pengguna menginputkan username dan
password untuk login. Ketika login dan masuk ke
98
Seminar Nasional Teknologi Informasi 2016
A16
[7]
homepage, banner ads yang ditampilkan dibagian kanan
website dipilih berdasarkan data profil pengguna.
Misalnya untuk pengguna berjenis kelamin wanita
dengan gaya berpakain casual, banner ads menampilkan
produk fashion yang bertipe casual juga.
Advertising Produk Fashion Pada Web ditujukan
untuk mengoptimalkan penayangan iklan rekomendasi
pada website sebagai media pemasaran produk fashion.
Dengan menggunakan sistem ini, produk yang
ditawarkan akan lebih tepat sasaran, karena produk yang
ditawarkan akan berdasarkan pada faktor-faktor yang ada
pada konsumen. Dengan seperti itu tidak akan ada iklan
produk yang salah sasaran kepada para konsumen,
seperti penawaran produk dewasa kepada anak remaja,
atau penawaran produk anak kecil kepada remaja. Sistem
ini akan secara otomatis memunculkan produk yang
sesuai dengan konsumen.
[8]
[9]
[10]
[11]
[12]
[13]
5. Saran
Mengacu pada hasil penelitian perihal implementasi
algoritma CHAID bagi iklan online, maka ada beberapa
saran yang ingin diajukan oleh peneliti, yakni:
 Kemampuan dalam menganalisa dan memahami
data pada saat melakukan data mining harus lebih
ditingkatkan.
 Kriteria data profil pengguna dapat ditambahkan lagi
macamnya agar banner ads yang ditampilkan bisa
semakin mendekati selera dari pengguna yang
sedang mengunjungi website tersebut.
 Rekomedasi barang yang ditawarkan dapat dibuat
lebih spesifik lagi terhadap konsumen tertentu.
 Hasil rekomendasi ini dapat diujikan lebih lanjut
secara kualitatif dan bukan kuantitatif saja minat
konsumen setelah melihat iklan online tersebut.
[14]
[15]
[16]
[17]
[18]
[19]
[20]
REFERENSI
[1]
[2]
[3]
[4]
[5]
[6]
[21]
A CHAID Based Performance Prediction Model in
Educational Data Mining. M. Ramaswami, Bhaskar. IJCSI
International Journal of Computer Science Issues, Vol 7,
Issue 1, No. 1, January 2010.
A. Motro. Accommodating Imprecision in Database
Systems: Issues and Solutions. SIGMOD Record. 1990.
Agrawal, R., Srikant, R., Fast Algorithms for Mining
Association Rules. IBM Almaden Research Center 650
Harry Road, San Jose, CA 95120. Proceedings of the 20th
VLDB Conference Santiago, Chile. 1994.
Baron, S., Phillips, D. (1994). Attitude survey data
reduction using CHAID: An example in shopping centre
market research. Journal of Marketing Management.
Belson, William A. Matching and prediction on the
principle of biological classification, Applied Statistics,
Vol. 8 (1959).
Brink, Susanne, Van Schalkwyk, Dirk J. Serum ferritin
and mean corpuscular volume as predictors of bone
marrow iron stores, South African Medical Journal,
Volume 61, (1982).
[22]
[23]
[24]
[25]
[26]
99
Campos, Marcos., Stengard,Peter. Milenova,Boriana.,
Data Centric Automated data Mining. Proceedings of the
Fourth International Conference on Machine Learning
and Applications. IEEE. 2005.
Codd, E.F. Providing OLAP to User Analysts: an it
Mandate. Technical Report, E.F. Codd and Associates.
1993.
D. T. Pham , S S Dimov, C. D. Nguyen. Selection of K in
K-means clusteringProc. J. Mechanical Engineering
Science, Cardiff University. UK. 2004.
D. Burdick, P. M. Deshpande, T. S. Jayram, R.
Ramakrishnan, and S. Vaithyanathan. OLAP over
uncertain and imprecise data. In VLDB 2005.
D.N, Goswami., Anshu, Chaturvedi., C.S, Raghuvanshi.,
D.N, Goswami. An Algorithm for Frequent Pattern
Mining Based On Apriori. (IJCSE) International Journal
on Computer Science and Engineering Volume. 02. 2010.
Evgeny Antipov, Elena Pokryshevskaya. Applying
CHAID for logistic regression diagnostics and
classication accuracy improvement. The State University
Higher School of Economics. MPRA Paper No.
21499.2010.
Evgeny, Antipov Elena, Pokryshevskaya; Applying
CHAID for logistic regression diagnostics and
classification accuracy improvement, Journal of
Targeting, Measurement and Analysis for Marketing 18.
2010.
Farajian, Moh Ali., Moh Shahriar., Mining the Banking
Customer Behaviour Using Clustering and Association
Rules Methods, International Journal of Industrial
Engineering and Production Research.Volume 21..2010.
Feri Sulianta. Excel Intelligent. Elexmedia Komputindo.
Jakarta. 2012.
Feri Sulianta. Data Mining. Elexmedia Komputindo.
Jakarta. 2010.
Gallagher, C.A. 2000. An Iterative Approach to
Classification Analysis. Casualty Actuarial Society. 2014.
Haery,
A.,
Salmasi,N.,
Modarres
Yazdi,M.,
Iranmanesh,H., Application of Association Rule Mining
in Supplier Selection Criteria. World Academy of
Science, Engineering and Technology. 2008.
Han, Jiawei., Kamber, Micheline., Data Mining:Concepts
& Techniques. Morgan Kaufmann Publishers 2006.
Hawkins, Douglas M.; Young, S. S. & Rosinko, A.;
Analysis of a large structure-activity dataset using
recursive partitioning, Quantitative Structure-Activity
Relationships, Volume 16. 1997.
Hooton, Thomas M. Haley, Robert W.; Culver, David H.;
White, John W.; Morgan, W. Meade; & Carroll, Raymond
J.; The Joint Associations of Multiple Risk Factors with
the Occurrence of Nosocomial Infections, American
Journal of Medicine, Volume 70. 1981.
Kass, Gordon V. An Exploratory Technique for
Investigating Large Quantities of Categorical Data,
Applied Statistics, Volume. 29. 1980.
Magidson, Jay. The CHAID approach to segmentation
modeling: chi-squared automatic interaction detection, in
Bagozzi, Richard P. (ed); Advanced Methods of
Marketing Research, Blackwell, Oxford, GB. 1994.
McKenzie, Dean P. McGorry, Patrick D.; Wallace, Chris
S.; Low, Lee H.; Copolov, David L.; & Singh, Bruce S.;
Constructing a Minimal Diagnostic Decision Tree,
Methods of Information in Medicine, Vol. 32 1993.
Morgan, John A.; & Sonquist, James N.; Problems in the
analysis of survey data and a proposal, Journal of the
American Statistical Association, Volume 58. 1963.
Press, Laurence I., Rogers, Miles S., Shure, Gerald H. An
interactive technique for the analysis of multivariate data,
Behavioral Science, Volume 14. 1969.
A16
Seminar Nasional Teknologi Informasi 2016
[27] Relational Databases. Data Knowledge. Eng., 7(3):239–
267. 1992.
[28] Sulianta, Feri. Mining Food Industry’s Multidimensional
[29]
[30]
[31]
[32]
Data to Produce Association Rules using Apriori
Algorithm as a basis of Business Strategy. IEEE. 2013.
Tan, P.-N., Steinbach, M., & Kumar, V. Introduction to
Data Mining. Boston: Pearson Education,Inc. 2006.
Witten,Ian., Frank, Eibe., Data Mining – Practical
Machine Learning Tool & techniques. Morgan Kaufmann
Publishers. 2005.
Yan-yan SONG, Ying LU. Decision tree methods:
applications for classification and prediction. Shanghai
Arch Psychiatry. 2015.
Yasmin Erika F. Metode Klasifikasi Berstruktur Pohon
Dengan Algoritma Cruise, Quest & CHAID. Forum
Statistika & Komputasi, April 2006, p:20-28.
100
Download