BAB 4 PERANCANGAN APLIKASI DATA MINING 4.1 Kebutuhan

advertisement
BAB 4
PERANCANGAN APLIKASI DATA MINING
4.1
Kebutuhan Data
PROSES
UTAMA
Proses
Pengendalian
resiko
4.2
KEBUTUHAN
ANALISA
FAKTA / INFORMASI YANG DIANALISIS
Gagal serah dana
Pada data warehouse KPEI, KPEI mempunyai
data dan informasi tentang masing-masing
member/anggota
kliring,
macam-macam
securities, dan waktu. Namun KPEI memerlukan
analisa akan potensi kegagalan serah dana pada
suatu transaksi
Tipe sekuritas yang
beresiko
Pada data warehouse KPEI, KPEI mempunyai
data dan informasi macam-macam securities.
Namun KPEI memerlukan analisa resiko akan
tipe sekuritas yang mempunyai potensi
kegagalan serah dana pada suatu transaksi
Member yang
beresiko
Pada data warehouse KPEI, KPEI mempunyai
data dan informasi semua anggota kliring.
Namun KPEI memerlukan analisa resiko akan
member yang mempunyai potensi kegagalan
serah dana pada suatu transaksi
Tahapan dalam melakukan data mining
4.2.1
Data Cleaning
Tahap awal dari perancangan sistem data mining harus melewati tahap
pertama yang disebut tahap data cleaning. Tahap ini merupakan suatu proses
95
96
untuk pembersihan data yang kotor. Maksud data yang kotor adalah data yang
tidak konsisten, tidak mempunyai nilai, atau mengalami kesalahan waktu
penginputan. Fungsinya adalah supaya data yang akan diproses dalam data
mining adalah data yang bersih dan berkualitas. Namun pada penulisan ini,
penulis tidak perlu melakukan tahap data cleaning lagi, karena data yang penulis
ambil adalah data dari data warehouse. Data dari data warehouse lebih
berkualitas daripada data-data yang ada pada database biasa karena data dari data
warehouse telah melewati proses ETL. Sehingga data sudah bersih dan berkualitas
untuk dilakukan proses mining.
4.2.2
Data Integrasi
Tahap berikutnya adalah data harus melewati proses data integrasi. Proses
dari data integrasi adalah mengintegrasikan data-data yang sudah dipersiapkan
sebelumnya. Proses ini penting karena terkadang data-data yang akan dipakai
berada pada database yang berbeda, sistem yang berbeda, dan bahkan server yang
berbeda. Namun karena data yang kita pakai berada pada data warehouse, penulis
tidak perlu melakukan proses ini lagi karena data yang berada pada data
warehouse disimpan secara terpusat. Akan tetapi pada penelitian ini penulis tidak
memakai data yang asli dari KPEI karena alasan data tersebut sangat confidential
bagi perusahaan. Sehingga penulis memutuskan untuk memakai data dummy dari
KPEI. Dari pihak KPEI kami menerima data dummy dari file yang ber-tipe .xlsx
sehingga penulis harus melewati tahap proses integrasi file .xlsx kedalam data
warehouse pada Microsoft SQL Server 2008.
97
Langkah pertama dalam tahap integrasi data adalah penulis menjalankan
SQL Server Business Intelligence Development Studio 2008 untuk tahap integrasi
data yang akan dilakukan, yang perlu diperhatikan adalah dalam penginstalan MS
SQL Server 2008 harus meng-install pada bagian Inegrasi data service sehingga
tahap integrasi data dapat dilakukan pada Business Intelligence Development
Studio 2008. Untuk mulai melakukan tahap integrasi data, penulis membuat suatu
project baru yaitu Integration Service Project pada menu File.
Gambar 4.2.2.1 Langkah 1
Setelah project berhasil dibuat, langkah selanjutnya adalah pilih tool Data
Flow Task pada panel bagian kiri layar lalu letakkan kedalam layar control flow.
98
Gambar 4.2.2.2 Langkah 2
Setelah itu klik 2 kali pada icon Data Flow Task, lalu kemudian pilih tool
excel source dan letakkan kedalam layar data flow. Hal ini dilakukan karena data
source yang penulis terima berasal dari file .xlsx.
99
Gambar 4.2.2.3 Langkah 3
Setelah itu klik 2 kali pada icon Excel Source, Excel Source editor akan
muncul. Penulis lalu mengatur file yang akan digunakan untuk tahap integrasi
data. Dengan membuat baru OLE DB connection manager dan pilih file yang
ingin digunakan. Lalu dalah kolom data access model pilih pilihan table or view
dan pilih sheet yang akan digunakan. Klik button preview jika ingin melihat data
dari sheet yang telah dipilih. Setelah semua langkah sudah dilakukan klik ok.
100
Gambar 4.2.2.4 Langkah 4
Gambar 4.2.2.5 Langkah 5
101
Setelah itu pilih tool OLE DB Destination. Tool ini akan menghubungkan
file yang sebelumnya kita pilih kedalam data warehouse yang akan ditetapkan.
Caranya adalah dengan memilih tool OLE DB Destination pada sebelah kiri yang
terdapat pada kolom data flow destination, kemudian letakkan kedalam layar data
flow.
Gambar 4.2.2.6 Langkah 6
Setelah OLE DB Destination di masukkan ke layar. Sambungkan relasi
Excel source ke OLE DB Destination. Kemudian klik 2 kali pada OLE DB
Destination. Sehingga muncul OLE DB Destination editor.
102
Gambar 4.2.2.7 Langkah 7
Setelah itu buat OLE DB Connection yang baru, dan tetapkan kedalam
data warehouse yang sudah disiapkan sebelumnya. Lalu di kolom data access
mode pilih pilihan Table or View dan pada kolom name of the table of view pilih
table yang berhubungan dengan file yang ditetapkan sebelumnya. Jika ingin
melihat table yang dipilih sebelumnya klik tombol preview.
Gambar 4.2.2.8 Langkah 8
103
Lalu klik pilihan mappings pada kolom sebelah kiri. Kolom ini untuk
mengatur attribute yang akan dimasukkan. Atur attribute yang akan dimasukkan
kedalam data warehouse. Setelah semua langkah telah dilakukan klik ok.
Gambar 4.2.2.9 Langkah 9
Kemudian untuk menjalankan proses integrasi data. Klik tombol play di
dalam toolbar bagian tengah atas layar. Sistem akan secara otomatis
mengintegrasikan data dari file .xlsx ke dalam data warehouse yang sudah
ditetapkan sebelumnya.
104
Gambar 4.2.2.10 Langkah 10
Tahap data integrasi berhasil dilakukan dan data dari file .xlsx berhasil
terintegrasi ke dalam data warehouse KPEI. Lakukan proses dari awal lagi untuk
mengintegrasi data dari tabel lain.
4.2.3
Data Selection
Tahap data selection merupakan tahap pemilihan data yang relevant yang
berada di dalam data warehouse KPEI untuk dilakukannya proses analisis yang
sudah ditetapkan. Berikut merupakan table fact yang penulis pilih untuk
digunakan dalam melakukan penganalisaan:
105
4.2.3.1 Star Schema Fact Receiving Failure
Data pada table Fact Receiving Failure digunakan untuk
menganalisa akan suatu potensi kegagalan serah dana pada suatu transaksi
dari data-data yang sudah dikumpulkan dalam tabel fakta tersebut.
Gambar table Fact Receiving Failure adalah sebagai berikut:
Gambar 3.4 Star Schema Fact Receiving Failure
106
4.2.3.1.1
Deskripsi Database Table
Berikut ini merupakan deskripsi masingmasing database table yang ada di table Fact
Receiving Failure:
1. Dimensi Member
Tabel
dimensi
member
menjelaskan
mengenai profil member yang ada di KPEI, member
ini lebih dikenal sebagai anggota kliring.
Tabel 4.2.3.1.1 Struktur Dimensi Member
Tabel
Dimensi Member
Keterangan
Tabel ini berisi mengenai anggota kliring yang
berada di KPEI. Attribute yang disimpan
adalah berupa keterangan anggota.
Primary Key
MemberKey
Foreign Key
-
No.
Nama Field
Tipe Data
Keterangan
1
MemberKey
int
Key member
2
MemberCode
varchar(20)
kode member
3
MemberName
varchar(150)
Nama member
4
UpliftFactor
float
Angka faktor
kenaikan
5
Status
varchar(50)
Info status
6
BEJStatus
varchar(50)
Info Status BEJ
7
BESStatus
varchar(50)
Info Status BES
107
8
OwnershipStatus
varchar(50)
Status ownership
9
CutOffdate
Datetime
Tanggal Cut Off
10
AKEquity
char(3)
kode AKE quity
11
AKPME
char(3)
kode AKPME
12
AKKB
char(3)
kode AKKB
13
AKKOS
char(3)
Kode AKKOS
14
MemberType
15
OldMemberName
varchar(150)
Nama member
yang lama
16
ActiveDate
Datetime
Tanggal aktiv
17
SuspendDate
Datetime
Tanggal Suspend
18
ReActiveDate
Datetime
Tanggal aktif
kembali
19
InActiveDate
Datetime
Tanggal dalam
aktif
20
IsCustody
Char(3)
Apakah Custody
21
IsSLBEligible
Char(3)
Apakah
SLBEligble
22
Owner1Nominal
Money
Nominal owner
23
Owner1Percentage
Float
Persentase owner
24
Owner1Certificate
Number
varchar(50)
Nomer Certificate
owner
25
Owner1Certificate
Date
Datetime
Tanggal
Certificate owner
26
Owner1ModalDas
ar
Money
Modal dasar
owner
27
Owner1ModalDise
tor
Money
Modal disetor
owner
Tipe member
108
Dengan melihat dari table 4.2.3.1.1, penulis
memutuskan untuk mengambil beberapa attribute di
tabel dimensi member, yaitu
OwnershipStatus,
IsCustody
Owner1Nominal,
memberName,
,
IsSLBEligible,
Owner1Percentage,
Owner1ModalDasar , Owner1ModalDisetor, dan
Owner1Nationality.
2. Dimensi Securities
Tabel dimensi securities berisi mengenai
informasi sekuritas-sekuritas yang ada di KPEI,
attribute yang berada di tabel ini menjelaskan
tentang info suatu sekuritas.
Tabel 4.2.3.1.2 Struktur Dimensi Securities
Tabel
Dimensi Securities
Keterangan
Tabel ini berisi mengenai sekuritas yang
berada di KPEI. Attribute yang disimpan
adalah berupa keterangan sekuritas.
Primary Key
SecuritiesKey
Foreign Key
-
No.
Nama Field
Tipe Data
Keterangan
1
SecuritiesKey
Int
Key securities
2
SecuritiesCode
varchar(20)
Kode securities
3
SecuritiesName
varchar(100)
Nama securities
109
4
Instrument
Varchar(50)
Jenis instrument
5
Industry
Varchar(50)
Jenis industry
6
SubSector
Varchar(50)
Sector
7
Haircut
Numeric(3,2)
Potongan harga
8
UpliftFactor
Numeric(3,2)
Faktor kenaikan
9
DateOfScriptless
Smalldatetime
Tanggal waktu
scriptless
10
PreviousCP
Money
CP terdahulu
11
PreviousCPDate
Datetime
Tanggal CP
terdahulu
12
LatestCP
Money
CP yang
terakhir
13
LatestCPDate
Datetime
Tanggal CP
yang terakhir
14
PrevPriceAfterCA
Money
Harga terdahulu
sesudah CA
15
PrevPrceAfterCASe
ssion
Char(1)
Harga terdahulu
sesudah sesi CA
16
PrevPriceAfterCAD
ate
Smalldatetime
Tanggal harga
terdahlulu
sesudah CA
17
LatestPriceAfterCA
Money
Harga terakhir
sesudah CA
18
LatestPriceAfterCA
Session
Char(1)
Harga terakhir
sesudah sesi CA
19
LatestPriceAfterCA
Date
Smalldatetime
Tanggal harga
yang terakhir
sesudah CA
20
Status
Varchar(50)
Status
21
SLBColl
Varchar(1)
Apakah
SLBColl
110
22
ListedShare
Bigint
List dari
pemegang
saham
23
DicatatDiCBEST
Bigint
Info yang
dicatat di
CBEST
24
PemegangRekening
Bigint
Jumlah
pemegang
rekening
25
PemegangRekening
Kurang10
Bigint
Jumlah
pemegang
rekening kurang
10
26
EligibleDate
Datetime
Tanggal
Eligible
27
InRecallDate
Datetime
Tanggal
InRecall
28
InEligibleDate
Datetime
Tanggal
InEligible
29
SCDValidFrom
Datetime
Tanggal SCD
valid dari
30
SCDValidTo
Datetime
Tanggal SCD
valid sampai
Dengan melihat dari table 4.2.3.1.2, penulis
memutuskan untuk mengambil beberapa attribute di
tabel dimensi securities, yaitu
Instrument,
Industry
SecuritiesName,
,
SubSector,
PemegangRekening, PemegangRekeningKurang10,
UpliftFactor, dan LatestCP.
111
3. Dimensi Time
Tabel
dimensi
time
berisi
mengenai
informasi tentang waktu saat dilakukannya proses
bisnis yang ada di KPEI. Tabel dimensi time
terdapat banyak kategorisasi seperti date, month,
period, quarter, dan sebagainya.
4.2.3.1.3Struktur Dimensi Time
Tabel
Dimensi Time
Keterangan
Tabel ini berisi mengenai informasi waktu
saat dilakukannya proses bisnis yang ada di
KPEI.
Primary Key
TimeKey
Foreign Key
-
No.
Nama Field
Tipe Data
Keterangan
1
TimeKey
Int
Key time
2
AlternateTimeKey
3
Date
Datetime
Tanggal
4
Year
Datetime
Tahun
5
Semester
Int
Semester
6
SemesterName
String
Nama semester
7
Quarter
Int
Quarter
8
QuarterName
String
Nama quarter
9
Month
Datetime
Bulan
Alternatif untuk
key time
112
10
MonthName
String
Nama bulan
11
Week
Int
Minggu
12
WeekName
String
Nama minggu
13
T0
Int
Hari mulai
transaksi
14
T1
Int
Hari ke-1
15
T2
Int
Hari ke-2
16
T3
Int
Hari ke-3
Dengan melihat dari table 4.2.3.1.3, penulis
memutuskan untuk mengambil beberapa attribute di
tabel dimensi time, yaitu quarter dan month.
4. Tabel Fact Receiving Failure
Tabel fact Receiving Failure adalah tabel
fakta yang berisi mengenai informasi tentang gagal
transaksi yang mengalami gagal serah dana yang
ada di KPEI. Tabel fakta ini bisa dianalisa dengan
berbagai dimensi seperti dimensi time, member dan
securities.
113
4.2.3.1.4 Fact Receiving Failure
Tabel
Fact Receiving Failure
Keterangan
Tabel fact Receiving Failure adalah tabel
fakta yang berisi mengenai informasi tentang
gagal transaksi yang mengalami gagal serah
dana yang ada di KPEI.
Primary Key
-
Foreign Key
TimeKey, MemberBuyerKey, SecuritiesKey,
MemberSellerKey
No.
Nama Field
Tipe Data
Keterangan
1
TimeKey
Int
Key untuk time
2
MemberBuyerKey
Int
Key untuk member
yang membeli
3
SecuritiesKey
Int
Key untuk
securities
4
MemberSellerKey
Int
Key untuk member
yang menjual
5
ReceivingRights
Brigint
Hak serah dana
6
ReceivingRealtisat
ion
Brigint
Info serah dana
yang terealisasi
7
ReceivingFailure
Brigint
Info serah dana
yang gagal
8
ACSRight
Money
Hak ACS
Dengan melihat dari table 4.2.3.1.4, penulis
memutuskan untuk mengambil beberapa attribute di
table fact failure receive, yaitu ReceivingRights,
114
ReceivingRealtisation,
ReceivingFailure,
dan
ACSRight.
Setelah melakukan pemilihan data dari table dimensi member, dimensi
securities, dimensi time, dan fact failure receiving. Penulis mempunyai list
attribute sebagai berikut: memberName,
OwnershipStatus, IsCustody ,
IsSLBEligible, Owner1Nominal, Owner1Percentage, Owner1ModalDasar ,
Owner1ModalDisetor, Owner1Nationality , SecuritiesName, Instrument, Industry
, SubSector, PemegangRekening, PemegangRekeningKurang10,
LatestCP,
quarter,
month,
ReceivingRights,
UpliftFactor,
ReceivingRealtisation,
ReceivingFailure, dan ACSRight.
4.2.4
Data Transform
Pada tahap data transform, data yang sudah diseleksi pada tahap data
selection akan digunakan untuk
pembuatan model data mining. Model data
mining ini berguna untuk memproses data-data tersebut agar dapat digunakan
untuk proses penganalisaan yang menghasilkan informasi tersembunyi di
dalamnya dan sangat bermanfaat dalam pengambilan keputusan.
Model data mining dirancang dari proses penelitian data perusahaan yang
sudah terintegrasi dan menganalisis pola-pola yang tersembunyi di dalamnya
tanpa adanya perubahan penambahan data baru ke dalam data warehouse.
Prosesnya adalah dengan membuat view dari data warehouse , yang berisi datadata yang sudah diseleksi sebelumnya. Berdasarkan tujuan penelitian maka model
115
data mining yang akan dibuat adalah untuk menganalisa potensi kegagalan serah
dana pada suatu transaksi. Sehingga table fact yang digunakan adalah fact
receiving failure. Berikut merupakan view yang dibentuk dari fact receiving
failure yang sudah melewati tahap data selection:
ViewFactReceivingFailure
ViewFactReceivingFailure merupakan view yang dibuat dari tabel
fact receiving failure dan dimensi-dimensi yang berhubungan dengan fact
table tersebut. ViewFactReceivingFailure dibuat untuk mendukung
analisis potensi akan kegagalan serah dana pada suatu transaksi. Berikut
merupakan SQL pembuatan ViewFactReceivingFailure:
116
Gambar 4.2.4 Perintah SQL membuat ViewFactReceivingFailure
117
Tabel 4.2.4 Struktur Tabel View ViewFactReceivingFailure
Nama Field
Field sumber
Tabel Sumber
Keterangan
ROW_ID
ROW_NUMBER()
ViewFactReceiveFailure
Jumlah row
MemberName
MemberName
DimMember
Nama
Member
OwnershipStatus
OwnershipStatus
DimMember
Status
ownership
IsCustody
IsCustody
DimMember
Apakah
custody
IsEligible
IsEligible
DimMember
Apakah
memenuhi
syarat
Owner1Nominal
Owner1Nominal
DimMember
Nominal
Owner
Owner1Percentage
Owner1Percentage
DimMember
Percentage
Owner
Owner1ModalDasar Owner1ModalDasa
r
DimMember
Modal Dasar
Owner
118
Owner1ModalDiset
Owner1ModalDiset
or
or
Owner1Nationality
Owner1Nationality
DimMember
Modal Disetor
Owner
DimMember
Negara asal
Owner
SecuritiesName
SecuritiesName
DimSecurities
Nama
sekuritas
Instrument
Instrument
DimSecurities
Jenis
Instrument
Industry
Instrument
DimSecurities
Jenis Industri
SubSector
SubSector
DimSecurities
Jenis sektor
LatestCP
LatestCP
DimSecurities
Harga terakhir
PemegangRekening
PemegangRekening
DimSecurities
Jumlah
Pemegang
rekening
PemegangRekening
PemegangRekening
Kurang 10
Kurang10
DimSecurities
Jumlah
Pemegang
rekening
kurang 10
Quarter
Quarter
DimTime
Jenis Quarter
119
Month
Month
DimTime
Angka Bulan
ReceivingRight
ReceivingRight
FactReceivingFailure
Jumlah hak
serah
ReceivingRealisatio
ReceivingRealisatio FactReceivingRealisation
Jumlah yang
n
n
terealisasi
ReceivingFailure
ReceivingFailure
FactReceivingRealisation
Jumlah serah
yang gagal
ACSRight
4.2.5
ACSRight
FactReceivingRealisation
Hak ACS
Data Mining
Pada tahapan berikutnya merupakan tahapan yang paling penting
dalam tahapan perancangan sistem data mining yaitu tahap data mining itu
sendiri. Tahap ini merupakan proses untuk menganalisa data-data yang
sudah melewati tahap-tahap sebelumnya sehingga dari data-data tersebut
dapat ditemukan informasi tersembunyi di dalamnya yang sangat berguna
bagi perusahaan untuk membuat suatu keputusan. Pada tahap ini akan
dilakukan proses perancangan model data mining, yang terdiri dari teknik
–teknik yang biasanya dipakai dalam proses data mining.
120
Langkah pertama dalam merancang model data mining adalah
penulis menjalankan SQL Server Business Intelligence Development
Studio 2008 untuk merancang model yang akan dibuat, yang perlu
diperhatikan adalah dalam proses instalasi MS SQL Server 2008 harus
meng-install pada bagian analysis service sehingga perancangan model
data mining dapat dilakukan pada Business Intelligence Development
Studio 2008. Untuk mulai membuat model yang akan dirancang. Penulis
membuat suatu project baru yaitu Analysis Service Project pada menu
File.
Gambar 4.2.5.1 Langkah 1
121
Gambar 4.2.5.2 Langkah 2
Setelah melakukan proses di atas, maka akan menghasilkan
project analysis service , lanjutkan dengan menentukan data source
dengan klik option data source pada panel di daerah kanan. Data source
adalah tempat untuk menentukan data yang penulis pilih. Klik kanan dan
klik new data source. Lalu pilih data yang ingin dianalisa.
Gambar 4.2.5.3 Langkah 3
122
Gambar 4.2.5.4 Langkah 4
Setelah data source sudah ditetapkan, proses berikutnya adalah
mengatur data view source. Data view source berfungsi untuk
menampilkan data-data yang akan dipilih untuk proses analisis. Tetapkan
data source view yang sudah dibuat sebelumnya.
Gambar 4.2.5.5 Langkah 5
123
Gambar 4.2.5.6 Langkah 6
Setelah data source view telah ditetapkan, langkah selanjutnya adalah
membuat model data mining. Langkahnya adalah dengan klik kanan mining structure
pada panel sebelah kanan. Kemudian pilih option pada from existing relational database
or data warehouse lalu klik next dan pilih algoritma yang ingin digunakan, karena
penulis memakai teknis clustering maka penulis memilih algoritma microsoft clustering.
Klik next lalu pilih data source view yang sudah ditetapkan lalu klik next lagi 2 kali, Lalu
tentukan attribute yang ingin diproses untuk data mining. Setelah itu pilih tipe data tiap
attribute yang sebelumnya sudah ditetapkan. Setelah semua proses sudah dilakukan klik
finish, dan model data mining sudah berhasil dibuat.
124
Gambar 4.2.5.7 Langkah 7
Gambar 4.2.5.8 Langkah 8
125
Gambar 4.2.5.9 Langkah 9
Gambar 4.2.5.10 Langkah 10
126
Gambar 4.2.5.11 Langkah 11
Gambar 4.2.5.12 Langkah 12
127
Setelah klik finish, model data mining berhasil dibuat. Untuk menjalankan
model data mining yang sudah dirancang klik tombol play pada panel tengah atas.
Setelah tombol play diklik sistem akan dengan otomatis memproses data mining dan
menghasilkan hasil data mining yang telah dilakukan.
Gambar 4.2.5.13 Hasil Cluster 1
Gambar 4.2.5.13 Hasil Cluster 2
128
Gambar 4.2.5.14 Hasil Cluster 3
129
Gambar 4.2.5.15 Hasil Cluster 4
4.2.6
Pattern Evaluation
Sesudah melakukan proses data mining, tahapan selanjutnya adalah
melakukan pattern evaluation, pattern evaluation dilakukan untuk mengevaluasi
130
model data mining yang telah dibuat berserta hasil output yang dihasilkan dari
proses data mining yang telah dilakukan.
Model data mining yang telah dibuat oleh penulis mengambil data dari
tabel dimensi time, tabel dimensi member, tabel dimensi securities, dan tabel fakta
receiving failure. Pengambilan data ini mengambil data dari tabel tersebut karena
penulis ingin meneliti akan potensi kegagalan serah dana pada suatu transaksi dan
dalam tabel fakta receiving failure mempunyai data yang mendukung untuk
penelitian itu. Selain itu tabel fakta itu dibuat untuk meneliti akan potensi
kegagalan serah dana pada suatu transaksi. Attribute yang digunakan juga
diseleksi berdasarkan keterkaitan yang erat terhadap penelitian yang dilakukan
sehingga attribut yang akan dipakai adalah memberName,
IsCustody
,
IsSLBEligible,
Owner1ModalDasar
SecuritiesName,
,
Owner1ModalDisetor,
Owner1Percentage,
Owner1Nationality
,
Instrument, Industry , SubSector, PemegangRekening,
PemegangRekeningKurang10,
ReceivingRights,
Owner1Nominal,
OwnershipStatus,
UpliftFactor,
ReceivingRealtisation,
LatestCP,
ReceivingFailure,
Sehingga membentuk struktur sebagai berikut:
quarter,
dan
month,
ACSRight.
131
Gambar 4.2.6.1 Struktur Data yang Digunakan
Setelah atribut-atribut siap, dimulailah proses data mining. Proses data
mining yang akan dilakukan adalah dengan menggunakan teknik clustering.
Nantinya hasil output dari proses data mining ini adalah berupa 3 cluster. Cluster
ini adalah pemisahan 3 karakteristik yang berbeda berdasarkan pada isi atribut
receiving failure, dimana atribut receiving failure adalah angka yang menjelaskan
jumlah serah dana yang gagal, sehingga membentuk 3 cluster yaitu cluster yang
sangat mempunyai potensi terjadinya gagal serah dana (high risk) yang
132
mempunyai mean receiving failure 473.000 , cluster yang mempunyai potensi
terjadinya gagal serah dana(normal risk) yang mempunyai mean receiving failure
424.000 dan cluster yang mempunyai sedikit potensi terjadinya gagal serah
dana(low risk) yang mempunyai mean receiving failure 53.000.
133
Berikut merupakan gambaran lengkap model data mining yang dirancang:
Gambar 4.2.6.2 Model Data Mining
134
4.2.7
Knowledge Presentation
Setelah semua tahap proses data mining sebelumnya dilakukan semuanya,
tahap terakhir dalam perancangan sistem data mining merupakan tahap
knowledge
presentation.
Tahap
ini
bertujuan
untuk
visualisasi
dan
merepresentasikan pengetahuan yang sudah dihasilkan dari proses data mining
sebelumnya. Nantinya knowledge presentation ini akan digunakan untuk
menyajikan pengetahuan yang telah dihasilkan dari proses data mining
sebelumnya untuk digunakan oleh user. Proses dalam melakukan tahap
knowledge presentation akan dijelaskan lebih detail dalam sub-bab perancangan
aplikasi.
4.3
Perancangan Aplikasi yang Diusulkan
4.3.1 Project Planing
Berdasarkan proses bisnis yang sedang berjalan, sumber data yang akan
dipakai dalam proses perancangan data mining akan diambil dari sistem data
warehouse KPEI. Hal ini disebabkan karena data yang berada pada data warehouse
adalah data yang sudah melewati proses ETL. Sehingga data yang berada pada data
warehouse lebih siap untuk dilakukan proses data mining. Data dari data
warehouse bisa digunakan sebagai gambaran history dari proses bisnis yang sedang
berjalan beberapa tahun lamanya. Hal ini dapat terjadi karena data di dalam data
warehouse bersifat historical yaitu data di dalam datawarehouse yang
menggambarkan keseluruhan proses yang sudah terjadi dalam KPEI beberapa tahun
lamanya. Data di dalam datawarehouse KPEI juga dikelompokkan menjadi per-
135
tahun, hal ini dapat mempermudah proses dalam data mining untuk melakukan
pemilihan data yang dipilih dari tahun data itu tersimpan. Data dalam data
warehouse juga menggambarkan gambaran akhir dari proses bisnis yang terjadi
dalam KPEI. Data dalam data warehouse tersimpan secara terpusat sehingga tidak
ada data yang berbeda.
Sebelum dilakukannya proses data mining, data dalam data warehouse harus
melewati proses preprocessing data. Preprocessing data merupakan suatu proses
untuk mempersiapkan data sebelum dilakukannya proses data mining. Data harus
melalui proses preprocessing karena data masih merupakan data kotor yaitu
terkadang ada data yang tidak lengkap seperti kurangnya nilai dalam suatu atribut,
lalu data masih noisy yaitu data yang tidak sesuai dengan rule yang dibuat,
terkadang juga ada data yang tidak konsisten dalam pengisian nilai, contohnya pada
atribut rating ada yang mengisi nilai dengan A,B, atau C dan yang lain mengisi
nilai dengan 1,2 atau 3. Data yang masih kotor ini terjadi karena banyak macam
seperti human error, bug dalam software, data source yang berbeda-beda dan
sebagainya. Data preprocessing penting untuk dilakukan karena data yang ada
didalam data warehouse belum siap untuk langsung dilakukannya proses data
mining, sehingga kualitas data masih sangat kurang. Tidak adanya kualitas data
sama saja dengan tidak adanya kualitas dalam hasil data mining yang dilakukan.
Hal-hal yang penting dalam melakukan preprocessing data yaitu data cleaning,
integrasi data, data transformaton, data reduksi, dan data discretization bila
diperlukan.
136
Data pada data warehouse mempunyai banyak table fact dan dimensi yang
beragam, data tersebut juga dikelompokan pertahun sehingga diperlukan adanya
proses seleksi data. Proses ini bertujuan untuk memilih data-data apa saja yang akan
digunakan dalam proses data mining yang akan dilakukan. Dalam proses pemilihan
data, data yang dipilih harus berhubungan dengan tujuan dilakukannya proses data
mining.
Data warehouse yang ada di KPEI berada pada tools Microsoft SQL Server
2008, sehingga data mining yang akan dirancang akan dibangun dalam tools
Microsoft SQL Server 2008, menggunakan analysis service. Berikut ini merupakan
gambar struktur dari sistem data mining yang akan dibangun :
Gambar 4.3.1 Arsitektur Data Mining yang Diusulkan
137
Sistem aplikasi data mining yang dirancang akan dijalankan pada PC
(Personal Computer) yang memiliki Memory sebesar 4GB RAM, dan memiliki
Processor yang paling baru, sehingga respon sistem dalam komputer tidak lambat,
menggunakan tools Microsoft SQL Server 2008 sebagai sumber datannya (data
source), dan Microsoft SQL Server Bussiness Intelligence Development Studio
untuk perancangan sistem data mining yang akan dilakukan.
1.3.2 Analysis
1.3.2.1 Gather Information
Pada tahap analisis, langkah pertama yang harus dilakukan
adalah tahap gather information yaitu pengumpulan data. Tahap ini
bermanfaat untuk mengetahui proses bisnis pada perusahaan yang
akan diteliti, informasi yang diperlukan dan masalah yang dihadapi
oleh perusahaan. Pada tahap ini, penulis sudah melakukan prosesproses tersebut dan bisa dilihat pada bab 3.
1.3.2.2 Define System Requirement
Langkah selanjutnya adalah dengan menetapkan system
requirement. Langkah ini bertujuan untuk menjelaskan apa saja yang
dapat dilakukan oleh sistem sesuai dengan syarat yang sudah
ditentukan. Pada tahap ini, penulis sudah melakukan proses tersebut
dan bisa dilihat pada bab 3.
138
1.3.2.2.1 Activity Diagram
Gambar 4.3.2.2.1 Activity Diagram
139
1.3.2.2.2 Event Table
Event
Trigger
Login
Source
Use Case
Response
Destination
Enter the User
system
Login
Login
success
User
Pilih
Dashboard
Memilih
User
model yang
diinginkan
Choose
Choose
the
Dashboard
Dashboard success
User,System
Submit Model
Result
Data
Mining
Submit
model
User,System
User
Submit
success
4.3.2.2.3 Use Case
Gambar 4.3.2.2.3 Use Case Diagram
140
4.3.2.2.3 Use Case Description
1.
Login
Main Flow:
1. User membuka aplikasi
2. Layar untuk login muncul
3. User memasukkan user dan password
4. User klik tombol login
5. Login Success
Exceptional Conditions:
Jika user salah memasukkan nama user dan
password maka login gagal.
2.
Menu Dasboard
Main Flow:
1. System menampilkan pilihan dashboard
2. User klik menu dashboard yang diinginkan
Exceptional Conditions:
-
141
3.
Submit Model
Main Flow:
1. User klik submit model yang diinginkan
2. Sistem memproses model data mining dari data
source yang telah ditetapkan
3. Sistem menampilkan layar hasil output dari
proses data mining yang telah diproses
Exceptional Conditions:
-
142
4.3.2.2.4 System Sequence Diagram
Gambar 4.3.2.2.4 System Sequence Diagram
143
1.3.2.3 Prioritize Requirement
Langkah selanjutnya adalah dengan menetapkan syarat yang
utama dari system requirement yang dibuat sebelumnya. Setelah
melihat system requirement yang sebelumnya sudah ditetapkan,
penulis menetapkan prioritize requirement sebagai berikut:
No
Requirement
Status
1
Melalui aplikasi sistem data
Sangat Penting
mining yang akan dirancang,
PT KPEI dapat menganalisa
potensi akan kegagalan serah
dana pada suatu transaksi.
2
Melalui aplikasi sistem data Penting
mining yang dirancang , PT
KPEI dapat
mengatur
dan
memilih data yang diinginkan
untuk dianalisa oleh sistem.
3
Aplikasi sistem data mining Sangat Penting
yang
dirancang
dapat
membantu dalam melakukan
proses analisa data yang besar.
144
4
Melalui aplikasi sistem data Penting
mining yang dirancang, PT
KPEI dapat melakukan proses
analisa
melalui
clustering.
metode
Sehingga
memudahkan pihak managerial
dalam
transaksi
mengkarakteristik
yang
mempunyai
potensi akan kegagalan serah
dana.
5
Melalui aplikasi sistem data Penting
mining yang dirancang, PT
KPEI dapat menghasilkan hasil
analisis yang sudah diproses
dalam sistem dengan bentuk
visual maupun detail. Sehingga
mempermudah
pihak
managerial dalam memahami
hasil analisis yang dihasilkan
sistem.
6
Dengan dirancangnya aplikasi Penting
sistem
data
mining,
hasil
145
analisis yang dihasilkan dapat
digunakan PT KPEI sebagai
refrensi lain dalam melakukan
analisis akan potensi suatu
transaksasi dalam mengalami
kegagalan serah dana.
Tabel 4.3.2.3 Prioritize Requirement
1.3.3
Design
1.3.3.1 Design and Integrate The Network
Data layer merupakan layer yang menjelaskan tentang data
source yang akan digunakan dalam aplikasi. Data source yang
dipakai dalam perancangan sistem aplikasi data mining yang
dirancang berasal dari data warehouse KPEI. Tetapi tidak semua data
pada data warehouse tersebut digunakan sehingga diperlukan adanya
seleksi data yang berkatian erat dengan analisa yang dilakukan.
Sehingga perlu dibuatnya bussiness logic untuk memproses seleksi
data yang telah ditetapkan. Dari bussiness logic tersebut data-data
yang sudah diseleksi akan ditampilkan dalam view. View layer
berguna sebagai wadah untuk mempresentasikan hasil yang sudah
diproses sebelumnya pada business logic layer sehingga Arsitektur
146
network yang akan digunakan adalah three layer client/server
architecture.
Gambar 4.3.3.1 three layer client/server architecture
147
1.3.3.2 Design The Application Architecture and Software
4.3.3.2.1 Component Diagram
Gambar 4.3.3.2.1 Component Diagram
148
4.3.3.2.2 Deployment Diagram
Gambar 4.3.3.2.2 Deployment Diagram
149
1.3.3.3 Design The User Interface
4.3.3.3.1 Navigation Diagram
Gambar 4.3.3.2.2 Navigation Diagram
150
4.3.3.3.2 User Interface
Gambar 4.3.3.3.2.1 Login Page
151
Gambar 4.3.3.3.2.2 Home Page
152
Gambar 4.3.3.3.2.3 Menu Dashboard
153
Gambar 4.3.3.3.2.4 Loading Dashboard
154
Gambar 4.3.3.3.2.5 Data Mining Model Dashboard
155
Gambar 4.3.3.3.2.6 Data Mining Model Dashboard
Download