7 BAB 2 LANDASAN TEORI 2.1. Sewa Guna Usaha ( Leasing) 2.1.1

advertisement
BAB 2
LANDASAN TEORI
2.1. Sewa Guna Usaha (Leasing)
2.1.1.
Pengertian Leasing
Menurut Kieso (2003, p1086), sewa guna usaha (lease) adalah suatu
perjanjian bersifat kontraktual antara lessor (pihak yang menyewakan) dan
lessee (pihak
yang menyewa)
yang memberikan lessee hak
untuk
menggunakan properti tertentu, yang dimiliki oleh lessor, selama jangka waktu
tertentu sebagai ganti pembayaran uang sewa yang umumnya dibayar secara
periodik dan besarnya sudah ditetapkan. Sedangkan, menurut Stice (2005,
p294), sewa guna usaha (lease) adalah sebuah kontrak yang merinci
persyaratan-persyaratan di mana pemilik properti, yaitu lessor (yang
menyewakan) mentransfer hak penggunaan properti kepada lessee (penyewa).
Menurut Stice (2005, p295), terdapat beberapa keuntungan bagi lessee
daripada pembelian, seperti tanpa uang muka, lessee dapat menghindari resiko
kepemilikan, dan fleksibel karena perusahaan dapat dengan mudah mengganti
aktiva untuk menanggapi perubahan bisnis. Menurut Stice (2005, p296), lessor
mendapat beberapa keuntungan dari usaha sewa guna usaha (leasing), seperti
peningkatan penjualan, hubungan bisnis yang berkelanjutan melalui lease
antara lessor dan lessee, dan apabila kondisi ekonomi menghasilkan nilai sisa
yang signifikan pada akhir masa sewa, lessor dapat menyewakan properti ke
lessee lain atau menjual properti dan mendapat keuntungan.
Menurut Stice (2005, p298), untuk tujuan akuntansi, sewa guna usaha
dipisahkan menjadi dua bagian, sewa guna usaha modal (capital lease) dan
7
8
sewa guna usaha operasi (operating lease). Sewa guna usaha modal dicatat
seolah-olah perjanjian sewa guna usaha mengalihkan kepemilikan aktiva dari
lessor kepada lessee. Jika sewa guna usaha dicatat sebagai sewa guna usaha
modal, lessor mengakui adanya penjualan aktiva pada saat penandatanganan
sewa guna usaha, lessee akan mengakui aktiva yang disewagunausahakan, dan
juga kewajiban untuk pembayaran di masa depan, di neracanya.
Sedangkan, sewa guna usaha operasi dicatat sebagai perjanjian sewa,
tanpa transfer kepemilikan aktiva yang berkaitan dengan sewa guna usaha
tersebut. Lessor tidak mengakui adanya penjualan aktiva pada tanggal
penandatanganan sewa guna usaha, melainkan mengakui adanya pendapatan
sewa guna usaha setiap tahunnya saat pembayaran diterima. Lessee tidak
mengakui aktiva yang disewagunausahakan, dan tidak ada kewajiban sewa
guna usaha yang dilaporkan, tetapi hanya melaporkan beban sewa guna usaha
periodik yang jumlahnya sama dengan pembayaran tahunan sewa guna usaha.
2.1.2.
Karakteristik Sewa Guna Usaha
Menurut Stice (2005, pp299–302), sewa guna usaha memiliki beberapa
karakteristik, yaitu jenis-jenis syarat kontrak yang biasa terdapat dalam
perjanjian sewa guna usaha, di antaranya :
•
Syarat untuk pembatalan dan denda
Beberapa sewa guna usaha tidak dapat dibatalkan, kecuali yang
syarat pembatalan dan dendanya sangat mahal sehingga kemungkinan besar
pembatalan tidak akan terjadi.
9
•
Pembaruan kontrak dan opsi pembelian (opsi pembelian murah)
Sewa guna usaha sering memasukkan syarat yang memberikan
lessee hak untuk membeli properti yang disewagunausahakan pada suatu
saat di masa depan. Jika harga pembelian tertentu diperkirakan kurang dari
nilai pasar wajar pada tanggal opsi pembelian digunakan, maka opsi
tersebut disebut opsi pembelian murah (bargain purchase option).
Perjanjian sewa guna usaha yang memasukkan opsi pembelian umumnya
berakhir dengan perpindahan kepemilikan aktiva dari lessor ke lessee.
•
Persyaratan sewa guna usaha
•
Masa manfaat aktiva (masa sewa guna usaha / lease term)
Masa sewa guna usaha (lease term) adalah periode waktu dari
permulaan sampai akhir sewa guna usaha. Permulaan terjadi ketika properti
yang disewagunausahakan ditransfer kepada lessee. Akhir masa sewa guna
usaha lebih fleksibel karena banyak sewa guna usaha memasukkan syarat
yang memperbolehkan lessee memperpanjang periode sewa guna usaha.
•
Nilai sisa aktiva
Nilai pasar properti yang disewagunausahakan pada akhir masa
sewa guna usaha disebut dengan nilai sisa atau nilai residu (residual value).
Beberapa kontrak sewa guna usaha mengharuskan lessee menjamin nilai
sisa minimum. Jika nilai pasar pada akhir masa sewa guna usaha jatuh di
bawah nilai sisa yang dijamin (guaranteed residual value), lessee harus
membayar selisihnya. Syarat ini untuk melindungi lessor dari kerugian
karena penurunan yang tidak diharapkan atas nilai pasar aktiva.
10
•
Pembayaran minimum sewa guna usaha
Pembayaran minimum sewa guna usaha (minimum lease payment)
adalah pembayaran sewa yang diharuskan selama masa sewa guna usaha
ditambah setiap jumlah yang dibayarkan untuk nilai sisa termasuk lewat
suatu opsi pembelian atau suatu jaminan terhadap nilai sisa. Pembayaran
sewa guna usaha sering kali terdiri dari jumlah minimum yang tetap dengan
pembayaran yang didasarkan pada penjualan yang dilakukan oleh lessee,
dan biaya pelaksanaan atau biaya eksekusi (executory cost) yang tidak
dianggap sebagai bagian dari pembayaran minimum sewa guna usaha,
seperti asuransi, pemeliharaan, dan pajak yang terkait dengan properti yang
disewagunausahakan.
•
Tingkat bunga implisit dalam perjanjian sewa guna usaha
Tingkat bunga yang digunakan dalam menghitung pembayaran
sewa guna usaha disebut tingkat bunga implisit (implicit interest rate).
Tingkat pinjaman yang meningkat atau tingkat bunga pinjaman inkremental
(incremental borrowing rate), yaitu tingkat di mana lessee dapat meminjam
sejumlah
uang
yang
diperlukan
untuk
membeli
aktiva
yang
disewagunausahakan, dengan mempertimbangkan situasi keuangan lessee
dan kondisi yang terjadi di pasar.
•
Tingkat resiko yang diasumsikan oleh lessee, termasuk di dalamnya
pembayaran biaya-biaya tertentu, seperti pemeliharaan, asuransi, dan pajak.
11
2.2. Pemasaran
2.2.1.
Pengertian Pemasaran
Menurut Kotler (2004, p5), pemasaran adalah suatu proses sosial dan
manajerial dimana individual dan grup memenuhi kebutuhan dan keinginan
mereka melalui penciptaan dan pertukaran produk dan nilai dengan pihak lain.
Tujuan pemasaran adalah menarik pelanggan baru, menjaga pelanggan yang
sudah ada, dan menambah jumlah pelanggan dengan cara memberikan
kepuasan. Sedangkan, menurut Boer (1999, p170), pemasaran adalah suatu
bidang ilmu yang memposisikan produk dan semua atributnya, termasuk harga
dan saluran distribusinya.
2.2.2.
Proses-proses Pemasaran
Menurut Kotler (2004, pp53-62), proses pemasaran terdiri dari empat
tahap, yaitu:
1. Menganalisis peluang pemasaran
Dilakukan dengan cara segmentasi pasar, yaitu membagi pasar
menjadi grup-grup pembeli yang berbeda satu sama lain dengan kebutuhan,
karakteristik, dan kebiasaan serta memerlukan produk dan kegiatan
pemasaran yang berbeda satu sama lain. Segmen pasar merupakan
kumpulan pelanggan yang bereaksi sama terhadap suatu usaha pemasaran.
Sedangkan menurut Boer (1999, p178), segmentasi pasar adalah
pendefinisian
target
pasar.
Segmentasi
pasar
merupakan
proses
pengurangan pasar heterogen yang besar menjadi segmen-segmen pasar
homogen yang lebih kecil. Berdasarkan kompetensi, sumber daya, dan
saluran pemasaran yang sudah ada, perusahaan kemudian memutuskan
12
untuk meneliti dan mengembangkan produk-produk yang ditargetkan
khusus untuk satu atau lebih segmen pasar tersebut.
2. Memilih target pasar
Menetapkan target pasar adalah suatu proses mengevaluasi tiap-tiap
segmen pasar dan memilih satu atau lebih segmen pasar untuk dimasuki.
Setelah target pasar ditentukan, dilakukan positioning pasar, yaitu proses
penyesuaian produk agar dapat bersaing dengan produk yang ada di dalam
pola pikir pelanggan yang menjadi target pasar.
3. Mengembangkan bauran pemasaran
4. Me-manage usaha pemasaran
Terdapat empat fungsi manajemen pemasaran :
ƒ
Analisis pemasaran
Merupakan kegiatan menganalisis pasar dan lingkungan pemasaran
untuk menemukan peluang dan menghindari ancaman. Dalam kegiatan
ini kekuatan dan kelemahan perusahaan, termasuk kegiatan pemasaran
saat ini dan yang mungkin diterapkan akan dianalisis untuk menemukan
peluang mana yang dapat diambil.
ƒ
Perencanaan pemasaran
Pada tahap ini akan diputuskan strategi pemasaran apa yang dapat
membantu perusahaan mencapai semua tujuan strategisnya.
ƒ
Implementasi pemasaran
13
ƒ
Pengendalian pemasaran
Adalah proses mengukur dan mengevaluasi hasil strategi dan rencana
pemasaran dan mengambil tindakan perbaikan untuk menjamin tujuan
tetap tercapai. Pengendalian pemasaran terdiri dari dua jenis :
-
Pengendalian
operasi,
termasuk
di
dalamnya
pengecekan
performance yang ada dengan rencana tahunan dan melakukan
tindakan perbaikan jika diperlukan. Tujuannya adalah untuk
menjamin perusahaan mencapai penjualan, keuntungan, dan tujuan
lainnya yang telah ditentukan dalam rencana tahunan. Dan juga
termasuk menentukan tingkat keuntungan yang berbeda untuk tiap
produk, tempat, pasar, dan saluran pemasaran.
2.2.3.
Pengendalian strategis
Strategi Kompetitif Dasar
Menurut Kotler (2004, p574), terdapat tiga strategi pemenang :
-
Overall cost leadership
-
Diferensiasi
Membuat program pemasaran dan produk yang berbeda sehingga dapat
menjadi pemimpin dalam kelasnya di industri sehingga dalam kelompok
harga yang relative sama, pelanggan lebih menginginkan produk merk
perusahaan ini.
-
Fokus
Memfokuskan seluruh usaha perusahaan dalam melayani (memenuhi
kebutuhan) beberapa segmen pasar daripada memenuhi kebutuhan seluruh
pasar.
14
Ada tiga strategi kompetitif pemasaran baru yang menyarankan agar
perusahaan menjadi pemimpin dengan memberikan nilai maksimum kepada
pelanggannya. Strategi ini dikenalkan oleh Michael Treacy dan Fred Wiersema
(Kotler, 2004, pp574-575). Strategi ini terdiri dari :
-
Operational excellence
-
Customer intimacy
Dengan cara melakukan segmentasi pasar dan membuat produk atau
jasa yang sesuai dengan kebutuhan target pelanggan. Perusahaan
mengkhususkan dirinya untuk memenuhi kebutuhan pelanggan yang unik
melalui hubungan yang akrab dan pengetahuan yang mendetail mengenai
pelanggan. Perusahaan yang menerapkan strategi ini membangun database
pelanggan secara mendetail untuk keperluan segmentasi dan membuat
target pelanggan, dan mendukung orang-orang pemasarannya untuk
merespon secara cepat kebutuhan-kebutuhan pelanggan. Perusahaan
menerapkan strategi ini untuk melayani pelanggan yang ingin membayar
premium untuk mendapatkan secara tepat apa yang diinginkan.
-
Product leadership
2.3. Database
Menurut Connolly (2005, p15), database adalah kumpulan dari data yang
saling berhubungan secara logic di mana data tersebut didesain untuk memenuhi
kebutuhan informasi suatu organisasi dan juga termasuk deskripsi dari data yang
terdapat di dalam database. Database tidak hanya menyimpan data operasional
perusahaan, tetapi juga metadata. Metadata adalah suatu kumpulan data yang
15
terintegrasi yang mendeskripsikan data itu sendiri. Database terdiri dari entitas,
atribut, dan hubungan antar entitas yang ada. Suatu entitas adalah objek nyata
(orang, tempat, benda, konsep, atau kejadian) dalam perusahaan yang disimpan
dalam database. Atribut adalah property yang mendeskripsikan suatu objek yang
disimpan dalam database, dan relationship adalah hubungan antar entitas dalam
database.
DBMS (Database Management System) merupakan suatu sistem software
yang memungkinkan user mendefinisikan, membuat, memperbaharui, dan
mengontrol akses ke dalam database. DBMS merupakan software yang
menghubungkan program aplikasi dengan database (Connolly, 2005, p16).
Program aplikasi adalah program komputer yang dapat berhubungan dengan
database yang dilakukan dengan cara memberikan command (khususnya command
SQL) kepada DBMS (Connolly, 2005, p17). User berinteraksi dengan database
melalui program aplikasi yang digunakan untuk membuat dan me-maintain
database dan menghasilkan informasi.
2.4. Data Warehouse
2.4.1.
Definisi Data Warehouse
Menurut Connolly (2005, pp1151-1152), data warehousing adalah
kumpulan data yang bersifat subject oriented, integrated, time-variant, dan
non-volatile yang mendukung proses pengambilan keputusan bagi pihak
manajemen. Sedangkan, menurut Inmon (2005, p29), sebuah data warehouse
adalah kumpulan data yang mendukung manajemen pengambilan keputusan
yang bersifat subject-oriented, integrated, nonvolatile dan time-variant. Tujuan
16
akhir data warehousing adalah mengintegrasikan data yang terdapat pada
seluruh perusahaan ke dalam satu tempat penyimpanan di mana user dapat
dengan mudah melakukan query, membuat laporan, dan melakukan analisis.
2.4.2.
Karakteristik Data Warehouse
1. Subject Oriented
Menurut Inmon (2005, pp29-33), secara klasik sistem operasi
diorganisasikan seputar aplikasi fungsional dari perusahaan. Untuk
perusahaan asuransi, aplikasinya dapat berupa auto, health, life dan
casuality. Area subyek utama perusahaan asuransi dapat berupa customer,
policy, premium, dan claim. Setiap tipe perusahaan memiliki subyek
dengan keunikan tersendiri. Menurut Connolly (2005, pp1151-1152),
subject Oriented berarti data warehouse disusun berdasarkan subjek-subjek
penting pada perusahaan.
2. Integrated
Menurut Inmon (2005, pp29-33), data diambil dari banyak sumber
berbeda kemudian dimasukkan ke dalam data warehouse. Selama data
diambil data tersebut diubah, dilakukan format kembali, diurutkan, dan
diringkas. Hasilnya, data terletak dalam data warehouse yang memiliki
satu pandangan, yaitu sebagai data yang tergabung. Menurut Connolly
(2005, pp1151-1152), integrated
berarti data dalam data warehouse
berasal dari berbagai data dalam sistem aplikasi perusahaan.
3. Nonvolatile
Menurut Inmon (2005, pp29-33), data pada data warehouse di-load
dan diakses tetapi tidak di-update. Ketika data pada data warehouse di-
17
load, data di-load di dalam sebuah snapshot (static format). Ketika terjadi
perubahan selanjutnya, snapshot record yang baru ditulis. Menurut
Connolly (2005, pp1151-1152), non-volatile berarti data dalam data
warehouse diperoleh dari database operasional dan tidak dapat diubah.
4. Time Variant
Menurut Inmon (2005, pp29-33), time-variant menyatakan bahwa
setiap unit data dalam data warehouse adalah akurat. Dalam beberapa
kasus, record ditandai. Dalam kasus lain, sebuah record memiliki tanggal
transaksi. Tetapi pada setiap kasus, ada beberapa bentuk penanda waktu
untuk menunjukkan bahwa record itu akurat. Menurut Connolly (2005,
pp1151-1152), time-variant berarti data dalam data warehouse hanya
akurat pada periode waktu tertentu.
2.4.3.
Arsitektur Data Warehouse
Arsitektur Data Warehouse menggunakan dimensionality modeling.
Dimensionality modeling adalah teknik desain data secara logic yang bertujuan
untuk merepresentasikan data dalam bentuk yang memungkinkan performance
akses yang tinggi (Connolly, 2005, p1183). Star schema merupakan suatu
struktur data secara logic yang memiliki sebuah tabel fakta di tengah dan
dikelilingi oleh tabel dimensi yang berisi data referensi dari tabel fakta (yang
dapat didenormalisasi) (Connolly, 2005, p1183). Snowflake schema adalah
variasi dari star schema di mana tabel dimensi berisi data yang sudah
dinormalisasi. Snowflake schema memungkinkan tabel dimensi untuk memiliki
tabel referensi yang lain (Connolly, 2005, p1184). Starflake schema merupakan
18
suatu struktur gabungan dari star schema dan snowflake schema (Connolly,
2005, p1185).
2.4.4.
Hubungan Data Warehouse dan OLTP
Menurut Connolly (2005, p1153), OLTP dan data warehouse memiliki
karakteristik yang berbeda dan dibuat untuk tujuan yang berbeda. Walaupun
demikian, keduanya memiliki hubungan yang erat di mana data yang disimpan
dalam data warehouse berasal dari OLTP. Namun demikian, sebelum data
OLTP diekstrak ke dalam data warehouse, data tersebut harus melalui proses
cleaning data terlebih dahulu. Hal ini karena data yang disimpan dalam OLTP
tidak konsisten, terfragmentasi, dan mudah berubah. OLTP juga menyimpan
data yang bersifat duplikat.
Tabel 2.1. Perbedaan antara Sistem OLTP dan Sistem Data Warehouse
Sumber : Connolly (2005, p1153)
Sistem OLTP
Sistem data warehouse
Menyimpan data operasional perusahaan
Menyimpan data historis perusahaan
Menyimpan data yang detail
Menyimpan highly summarized data
Data bersifat dinamis (sering berubah)
Data bersifat statis (tidak berubah)
Proses dilakukan berulang
Proses ad hoc, tidak terstruktur, dan
heuristic.
Application oriented
Subject oriented
Pola penggunaan yang dapat diprediksi
Pola
penggunaan
diprediksi
yang
tidak
dapat
19
Dibuat dengan tujuan untuk membantu Dibuat dengan tujuan untuk kepentingan
dan mempermudah transaksi
Mendukung
pengambilan
analisis
keputusan Mendukung
harian
pengambilan
keputusan
strategis
Digunakan oleh operational user dalam Digunakan oleh managerial user yang
jumlah yang besar
jumlahnya relatif sedikit
Perusahaan dapat memiliki sejumlah Perusahaan umumnya hanya memiliki
OLTP untuk setiap proses bisnis
satu buah data warehouse
2.5. Data Mining
2.5.1.
Definisi Data Mining
Menurut Connolly (2005, p1233), data mining adalah proses
menghasilkan informasi yang tidak diketahui sebelumnya dari suatu database
yang besar, yang kemudian digunakan dalam proses pengambilan keputusan
bisnis. Sedangkan, menurut Tang (2005, p2), data mining merupakan kegiatan
menganalisis data dan menemukan pola tersembunyi secara otomatis atau
semiotomatis.
Data dalam jumlah besar telah dikumpulkan dan disimpan dalam
database dari software bisnis, seperti aplikasi keuangan, Enterprise Resource
Management (ERP), Customer Relationship Management (CRM), dan web log.
Kumpulan data dalam jumlah besar membuat organisasi memiliki data dalam
jumlah banyak, namun tanpa adanya pengolahan data, data tersebut belum
dapat menghasilkan informasi ataupun knowlegde yang berguna. Oleh karena
20
itu, data mining diperlukan untuk menemukan pola-pola dari data yang ada,
meningkatkan nilai intrinsik data, dan mengubah data menjadi knowledge
(Tang, 2005, p2).
2.5.2.
Masalah Bisnis untuk Data Mining
Beberapa jenis masalah yang dapat dipecahkan dengan menggunakan
data mining menurut Tang (2005, p5) :
•
Churn analysis
Industri telekomunikasi, perbankan, dan asuransi menghadapi persaingan
yang ketat saat ini. Setiap pelanggan mobile phone rata-rata menghabiskan
lebih dari 200 dolar dana pemasaran perusahaan telepon. Setiap bisnis tentu
ingin mendapatkan pelanggan sebanyak mungkin dan Churn analysis dapat
membantu manajer pemasaran untuk memahami alasan mengenai loyalitas
pelanggan.
•
Cross-selling
Cross-selling merupakan suatu tantangan bisnis bagi retailer. Retailer dan
online retailer menggunakan fitur ini untuk meningkatkan penjualannya.
Sebagai contoh, ketika terjadi pembelian buku pada Amazon.com atau
Barnes and Noble.com, website tersebut akan memberikan rekomendasi
mengenai buku-buku yang berhubungan dengan buku yang dipilih di mana
rekomendasi ini diperoleh dari analisis data mining.
•
Fraud detection
Setiap harinya perusahaan asuransi melakukan proses pemeriksaan
terhadap ribuan klaim, sehingga sulit bagi perusahaan untuk menyelidiki
21
lebih lanjut mengenai klaim-klaim tersebut. Dalam hal ini teknik data
mining dapat membantu mengidentifikasi penyimpangan pada klaim yang
ada.
•
Risk management
Dalam memutuskan diterima tidaknya permintaan peminjaman dari
pelanggan dan menilai tingkat resiko yang ditimbulkan dari peminjaman
tersebut, teknik data mining dapat digunakan untuk membantu dalam
penyelesaian masalah tersebut.
•
Customer segmentation
Teknik data mining dapat membantu manajer pemasaran dalam memahami
profil pelanggan yang bertujuan untuk pengambilan keputusan yang
bersifat strategis yang mendukung pemasaran produk.
•
Targeted ads
Teknik data mining dapat digunakan untuk mendapatkan sesuatu yang
digemari oleh customer dan menawarkannya kepada customer. Sebagai
contohnya adalah menelusuri pola urutan klik pada halaman web pembelian
online yang diakses oleh customer.
•
Sales forecast
Teknik data mining dapat digunakan untuk melakukan prediksi.
2.5.3.
Kegiatan dalam Data Mining
Menurut Tang (2005, pp6-10), kegiatan data mining dikelompokkan
menjadi:
22
•
Classification
Klasifikasi merupakan salah satu kegiatan data mining yang paling
banyak
digunakan.
Masalah
bisnis, seperti
churn
analysis,
risk
management, dan ad targeting dapat ditangani dengan klasifikasi.
Klasifikasi merupakan tindakan dalam menentukan apakah suatu data
termasuk ke dalam kategori tertentu atau tidak berdasarkan atribut class
(atribut yang diprediksi) yang dimiliki. Algoritma klasifikasi meliputi
decision tree, neural network, dan Naïve Bayes.
•
Clustering
Clustering disebut juga pengelompokan. Clustering membagi data
menjadi kelompok-kelompok tertentu berdasarkan kumpulan atribut yang
dimiliki. Data-data dengan nilai atribut yang sama akan masuk ke dalam
kelompok yang sama. Algoritma yang digunakan untuk clustering adalah
clustering.
Gambar 2.1. Clustering
Sumber : Tang (2005, p7)
23
Gambar 2.1 menggambarkan suatu dataset pelanggan sederhana
yang memiliki dua atribut, yaitu usia dan pendapatan. Cluster 1 terdiri dari
populasi yang usianya lebih muda dengan tingkat pendapatan yang rendah.
Cluster 2 terdiri dari pelanggan paruh baya dengan tingkat pendapatan yang
lebih tinggi. Cluster 3 terdiri dari kelompok yang usianya lebih tua dengan
tingkat pendapatan yang relatif rendah.
•
Association
Asosiasi merupakan kegiatan data mining yang juga banyak
digunakan. Asosiasi disebut juga market basket analysis. Tujuan asosiasi
adalah mengidentifikasi kumpulan item yang sering terjual bersama dalam
suatu transaksi (frequent item sets) dan aturan-aturan untuk cross-selling.
Dalam asosiasi, satu produk atau kumpulan beberapa produk dianggap
sebagai satu item. Algoritma yang dapat digunakan dalam asosiasi meliputi
Association Rules dan Decision Tree.
Gambar 2.2. Asosiasi Produk
Sumber : Tang (2005, p9)
24
Gambar 2.2 menunjukkan pola asosiasi produk. Node dalam gambar
menggambarkan
produk,
tanda
panah
menggambarkan
hubungan
antarproduk, dan arah tanda panah menggambarkan arah prediksi. Sebagai
contoh, panah dari Milk ke Cheese menandakan bahwa siapapun yang
membeli Milk memiliki kemungkinan untuk membeli Cheese juga.
•
Regression
Kegiatan regresi sama dengan klasifikasi. Perbedaan utamanya
adalah atribut yang diprediksi merupakan bilangan continuous. Linear
regression dan logistic regression merupakan contoh metode regresi yang
banyak digunakan. Contoh teknik regresi lainnya adalah regression tree
dan neural networks. Kegiatan regresi dapat memecahkan banyak masalah
bisnis. Contohnya, untuk memprediksi metode distribusi, volume distribusi,
atau memprediksi kecepatan angin berdasarkan temperatur, tekanan air, dan
kelembaban.
•
Forecasting
Forecasting merupakan kegiatan data mining yang penting.
Forecasting menggunakan time series dataset sebagai input. Time series
data merupakan data yang berurutan dan berkelanjutan. Teknik forecasting
berhubungan dengan tren umum dan periode waktu. Teknik time series
yang paling populer adalah ARIMA (AutoRegressive Integrated Moving
Average).
25
Gambar 2.3. Time Series
Sumber : Tang (2005, p9)
Gambar 2.3 terdiri dari 2 kurva. Kurva garis yang solid merupakan
time series data sebenarnya dari nilai stok Microsoft, sedangkan kurva
titik-titik merupakan model time series dari teknik forecasting dari
perubahan nilai rata-rata.
2.5.4.
Algoritma Data Mining
•
Algoritma Naive Bayes
Menurut Tang (2005, p132), algoritma Naïve Bayes dapat
digunakan untuk membuat model yang menyediakan kemampuan prediksi
dan juga menyediakan metode baru untuk menyelidiki data. Algoritma ini
belajar dari fakta dengan menghitung hubungan antara variabel yang
menarik dengan seluruh variabel lainnya. Berikut adalah contoh laporan
dari algoritma Naive Bayes :
26
Gambar 2.4. Contoh Laporan Algoritma Naive Bayes
Sumber : Tang (2005, p141)
•
Algoritma Decision Tree
Menurut Tang (2005, pp145-146), data mining untuk Decision Tree
yang paling banyak digunakan adalah classification. Prinsipnya adalah
memecah data secara rekursif ke dalam bagian-bagian di mana bagian itu
terdiri kurang lebih status target variabel yang sama. Decision Tree
terbentuk setelah proses rekursif selesai. Ada 3 keuntungan menggunakan
data mining, antara lain cepat, setiap cabang membentuk aturan, dan
prediksi lebih efisien. Microsoft Decision Tree adalah perpaduan algoritma
Decision Tree dengan penelitian Microsoft. Ini mendukung kegiatan
classification dan regression. Berdasarkan pengaturan parameter, hasil
pohon bisa berbeda tergantung pada pemecahan ujung dan bentuk pohon.
Berikut adalah contoh laporan dari algoritma Decision Tree :
27
Gambar 2.5. Contoh Laporan Algoritma Decision Tree
Sumber : Tang (2005, p164)
•
Algoritma Time Series
Menurut Tang (2005, p170), algoritma Time Series terdiri dari data
yang dikumpulkan melalui bertambahnya waktu. Banyak variabel yang
berubah seiring dengan waktu. Urutan nilai variabel membentuk Time
Series. Peningkatan waktu dalam Time Series bisa discrete atau continuous.
Tujuan utama dari mengumpulkan data berdasarkan urutan waktu adalah
untuk meramalkan atau membuat perkiraan nilai yang akan datang. Berikut
adalah contoh laporan dari algoritma Time Series :
28
Gambar 2.6. Contoh Laporan Algoritma Time Series
Sumber : Tang (2005, p185)
•
Algoritma Clustering
Menurut Tang (2005, p188), algoritma Clustering menemukan
kelompok alami di dalam data ketika pengelompokan tidak jelas. Dengan
kata lain, menemukan variabel tersembunyi yang disusun secara akurat.
Clustering bisa digunakan untuk mengetahui lebih banyak tentang
pelanggan. Kemampuan menentukan dan mengidentifikasi segmen pasar
merupakan alat yang sangat berguna untuk mengembangkan bisnis. Berikut
adalah contoh laporan dari algoritma Clustering :
29
Gambar 2.7. Contoh Laporan Algoritma Clustering 1
Sumber : Tang (2005, p205)
Gambar 2.8. Contoh Laporan Algoritma Clustering 2
Sumber : Tang (2005, p206)
30
•
Algoritma Association Rules
Menurut Tang (2005, p230), dengan menggunakan algoritma
Association Rules, analisis shopping chart pelanggan dapat mempelajari
produk apa yang umumnya dibeli secara bersama. Association rules
mencari kumpulan item paling banyak. Ada 2 langkah dalam algoritma ini,
yaitu tahap Calculation Intensive untuk menemukan kumpulan item yang
paling banyak. Dan tahap berikutnya adalah menghasilkan aturan
kumpulan berdasarkan kumpulan item yang paling banyak. Langkah ini
lebih cepat dari pada langkah pertama. Berikut adalah contoh laporan dari
algoritma Association Rules :
Gambar 2.9. Contoh Laporan Algoritma Association Rules
Sumber : Tang (2005, p245)
31
•
Algoritma Neural Network
Menurut Tang (2005, pp247-248), Neural Network pada dasarnya
mengacu pada classification dan regression. Seperti Decision Tree, Neural
Network bisa menemukan hubungan yang tidak sesuai diantara attribute
masukan dan attribute prediksi. Kekurangannya, biasanya diperlukan
pembelajaran lebih dalam menggunakan Neural Network daripada
menggunakan Decision Tree dan Naïve Bayes. Neural Network mendukung
hasil discrete dan continuous. Neural Network terdiri dari sekumpulan node
dan bagian yang membentuk sebuah jaringan. Berikut adalah contoh
laporan dari algoritma Neural Network :
Gambar 2.10. Contoh Laporan Algoritma Time Series
Sumber : Tang (2005, p264)
32
2.5.5.
Aliran Data
Gambar 2.11. Aliran Data
Sumber : Tang (2005, p12)
Gambar 2.11 menggambarkan aliran data pada aplikasi data mining.
Aplikasi bisnis menyimpan data transaksi dalam sebuah database Online
Transaction Processing (OLTP). Data OLTP kemudian diekstrak, diubah, dan
diisi ke dalam data warehouse. Setelah itu OLAP cubes dapat dibuat dari data
warehouse.
Pada umumnya data mining diaplikasikan pada data warehouse yang
sudah mengalami proses data cleaning dan transformation. Pola yang
ditemukan pada model data mining nantinya akan diberikan kepada manajer
pemasaran melalui laporan-laporan yang dihasilkan. Biasanya perusahaan
kecil tidak memiliki data warehouse. Oleh karena itu, data mining dilakukan
secara langsung pada tabel-tabel OLTP.
Prediksi dapat dilakukan secara langsung mengakses data
mining
melalui Web aplikasi. Dalam cross-selling, begitu pelanggan Web memasukkan
33
produk ke dalam shopping chart, query prediksi data mining langsung
dijalankan untuk mendapatkan daftar rekomendasi produk berdasarkan
association analysis.
Data mining juga dapat diaplikasikan untuk menganalisis OLAP cubes.
Cube adalah database multidimensi yang memiliki banyak dimensi dan
measures. Teknik data mining dapat digunakan untuk menemukan pola-pola
yang tersembunyi dalam suatu cube. Sebagai contoh, algoritma asosiasi dapat
diaplikasikan pada cube penjualan untuk menganalisis pola pembelian
pelanggan pada daerah dan periode waktu tertentu. Teknik data mining juga
dapat diaplikasikan untuk memprediksi measures, sebagai contohnya : besar
penjualan dan keuntungan toko. Contoh lainnya ialah clustering. Data mining
dapat mengelompokkan pelanggan berdasarkan properti dan measure dimensi.
Data mining tidak hanya dapat menemukan pola dalam cube, tetapi juga
menyusun ulang desain cube berdasarkan hasil model data mining. (Tang,
2005, pp11-12).
2.5.6.
Data Mining Project Cycle
Menurut Tang (2005, pp13-17), langkah-langkah proyek data mining
meliputi:
1. Data Collection
Data mengenai aktivitas bisnis disimpan dalam berbagai sistem
dalam perusahaan. Sebagai contoh: Microsoft memiliki ratusan database
OLTP dan lebih dari 70 data warehouse. Langkah pertama dalam data
mining adalah mengambil data yang diperlukan dan menyimpannya ke
dalam suatu database atau suatu data mart di mana analisis data akan
34
dilakukan. Data dalam data warehouse belum cukup untuk keperluan data
mining, sehingga data masih dikumpulkan dari sumber lainnya.
2. Data Cleaning dan Transformation
Tujuan Data Cleaning adalah untuk membuang informasi yang
tidak berhubungan dari dataset. Tujuan transformasi data adalah untuk
mengubah data sumber ke dalam bentuk format yang berbeda sesuai
dengan nilai dan tipe data yang ada. Ada beberapa teknik yang dapat
digunakan dalam Data Cleaning dan Transformation, antara lain:
ƒ
Data type transform
Merupakan transformasi data yang paling mudah. Contohnya
adalah mengubah tipe data Boolean menjadi integer. Alasan
transformasi ini adalah adanya beberapa algoritma data mining yang
berfungsi lebih baik pada data integer, sedangkan algoritma yang lain
berfungsi lebih baik pada data Boolean.
ƒ
Continuous column transform
Transformasi data berfungsi untuk membagi data continuous ke
dalam kelompok-kelompok tertentu. Selain mengelompokkan, teknik
seperti normalisasi juga biasanya digunakan untuk mengubah data
continuous. Normalisasi mengubah semua nilai numerik menjadi angka
antara 0 dan 1 (atau -1 sampai 1) agar angka-angka yang besar tidak
menominasi angka-angka yang lebih kecil selama proses analisis.
ƒ
Grouping
Biasanya terdapat banyak nilai yang berbeda pada kolom diskrit
sehingga diperlukan pengelompokan pada kolom ini ke dalam beberapa
35
kelompok untuk mengurangi kompleksitas model. Pengelompokan ini
membuat model lebih mudah diinterpretasikan.
ƒ
Aggregation
Misalkan terdapat sebuah tabel berisi catatan detail mengenai
panggilan telepon (Call Detail Record/CDR) untuk setiap pelanggan,
dan
akan
dilakukan
pengelompokan
pelanggan
berdasarkan
penggunaan telepon perbulannya. Karena informasi CDR terlalu detail
untuk model, maka perlu dilakukan agregasi untuk seluruh panggilan
menjadi beberapa atribut, seperti jumlah total panggilan dan rata-rata
durasi panggilan. Atribut inilah yang akan digunakan dalam model.
ƒ
Missing value handling
Ada beberapa penyebab hilangnya data. Sebagai contoh, tabel
demografis pelanggan dapat memiliki kolom umur, tetapi pelanggan
tidak selalu memberitahukan umurnya pada saat pendaftaran. Contoh
lainnya adalah terdapat tabel nilai penutupan harian bursa saham MSFT
dan bursa saham tutup setiap akhir minggu sehingga akan ada nilai null
pada tanggal-tanggal tersebut dalam tabel.
Ada beberapa cara untuk mengatasi masalah ini. Kita dapat
mengganti nilai yang hilang dengan nilai yang paling umum (tetap).
Jika kita tidak mengetahui umur pelanggan, kita dapat menggantinya
dengan umur rata-rata semua pelanggan. Jika suatu record memiliki
banyak nilai yang hilang, maka dapat dihapus. Untuk kasus yang lebih
tinggi tingkatannya, dapat dibuat mining model dengan menggunakan
data yang lengkap, dan kemudian menggunakan model untuk
36
memprediksikan nilai yang paling mendekati nilai dari tiap missing
case.
ƒ
Removing outliers
Outlier merupakan data abnormal dalam sebuah dataset. Data
abnormal akan mempengaruhi kulitas model. Outliers dapat dibuang
berdasarkan kumpulan atribut. Algoritma clustering dapat digunakan
untuk mengelompokkan outliers ke dalam beberapa cluster berbeda.
3. Model Building
Setelah memahami kegiatan dalam proses data mining, akan lebih
mudah untuk menentukan algoritma yang tepat, tetapi akan sulit untuk
menentukan algoritma data mining yang cocok sebelum dilakukan training
model. Tingkat akurasi algoritma tergantung pada data, seperti jumlah
status atribut prediksi, distribusi nilai tiap atribut, hubungan antar atribut,
dan lainnya. Sebagai contoh, jika hubungan di antara semua atribut input
dan atribut yg diprediksi sama, algoritma decision tree merupakan pilihan
yang baik. Jika hubungan antar atribut lebih rumit, algoritma neural
network adalah pilihan yang tepat.
Cara yang tepat adalah membuat berbagai model dengan
menggunakan algoritma yang berbeda kemudian membandingkan akurasi
tiap model dengan menggunakan tool, seperti lift chart. Untuk algoritma
yang sama, perlu dibangun beberapa model menggunakan parameter
setting yang berbeda untuk menemukan akurasi model yang terbaik.
37
4. Model Assessment
Terdapat beberapa tools yang digunakan untuk menilai model dan
yang paling sering digunakan adalah lift chart. Lift chart menggunakan
model yang sudah di-training untuk memprediksikan nilai testing dataset.
Berdasarkan nilai dan kemungkinan yang diprediksi, model digambarkan
dalam bentuk grafik.
5. Reporting
Reporting merupakan langkah penyajian hasil penemuan dari proses
data mining. Data mining tools memiliki fasilitas laporan yang
memungkinkan user untuk membuat laporan dari model data mining dalam
bentuk tekstual atau grafik. Ada dua tipe laporan, yaitu laporan tentang
penemuan (pola) dan laporan tentang prediksi atau ramalan.
6. Prediction (Scoring)
Tujuan akhir data mining adalah mengunakan model untuk
melakukan prediksi. Prediksi disebut juga scoring dalam istilah data
mining. Untuk melakukan prediksi, diperlukan trained model dan
sekumpulan data baru.
7. Application Integration
Memasukkan data mining ke dalam aplikasi bisnis berarti
menerapkan intelligence pada bisnis. Menggabungkan fasilitas data
mining, terutama prediksi secara real time ke dalam aplikasi merupakan
salah satu langkah penting dalam proyek data mining.
38
8. Model Management
Pada sebagian besar analisis bisnis, model yang telah dibuat harus
dilakukan training ulang. Contohnya pada toko buku online di mana setiap
harinya terbit buku baru. Seperti data lainnya, mining model juga memiliki
masalah keamanan sehingga perlu adanya pengaturan hak akses untuk
masing-masing user.
2.5.7.
Hubungan Data Mining dengan Data Warehouse
Menurut Connolly (2005, p1233), informasi yang banyak dan kompleks
dalam data warehouse menyebabkan data warehouse sulit mengidentifikasi
tren dan hubungan antar datanya dengan menggunakan query yang sederhana
dan reporting tools. Data mining merupakan cara terbaik untuk menemukan
tren dan pola yang ada dalam data warehouse. Data mining dapat menemukan
informasi yang tidak dapat dihasilkan secara efektif dengan menggunakan
query dan laporan. Walaupun demikian, data mining dan data warehouse tetap
berhubungan.
Menurut Connolly (2005, p1242), salah satu halangan organisasi dalam
mengembangkan data mining adalah menemukan data yang tepat untuk
digunakan dalam data mining. Data mining memerlukan data sumber yang
tunggal, clean, terintegrasi, dan konsisten. Berikut adalah alasan mengapa data
warehouse digunakan untuk menyediakan data untuk data mining:
ƒ
Konsistensi dan kualitas data merupakan prasyarat dalam data mining
untuk menjamin keakuratan model prediksi, dan data warehouse dibuat
dari data yang clean dan konsisten.
39
ƒ
Jika data yang digunakan berasal dari banyak sumber maka akan
mempermudah dalam mencari hubungan antar data, dan data warehouse
berisi data yang berasal dari sejumlah sumber.
ƒ
Memilih subset yang relevan dari records dan fields untuk data mining
memerlukan query yang digunakan dalam data warehouse.
ƒ
Penelusuran yang dilakukan pada uncovered pattern dapat digunakan agar
hasil data mining dapat dimanfaatkan secara maksimal. Data warehouse
dapat berhubungan dengan data source untuk mendukung hal ini.
2.6. Web – Based
Web-Based Application merupakan sebuah aplikasi yang memanfaatkan
teknologi World Wide Web sebagai interface-nya, yang berarti data yang
diinginkan dapat diakses dan diubah dengan menggunakan sebuah Web Browser.
Ini sangat menguntungkan sebuah perusahaan karena aplikasi ini dapat dijalankan
pada semua komputer yang memiliki Web Browser di dalamnya.
Beberapa keuntungan dari Web-Based Applications diantaranya:
1. Data dapat diakses kapan dan dari mana saja,
2. Mudah dipakai, pemakai cukup melakukan point & click,
3. Perusahaan tidak harus membeli program pengakses karena browser umumnya
tersedia secara gratis di Internet. Contoh browser yang gratis adalah Mozilla,
Netscape, dan Opera.
Download