BAB 4 PERANCANGAN APLIKASI DATA MINING 4.1 Kebutuhan Data PROSES UTAMA Proses Pengendalian resiko 4.2 KEBUTUHAN ANALISA FAKTA / INFORMASI YANG DIANALISIS Gagal serah dana Pada data warehouse KPEI, KPEI mempunyai data dan informasi tentang masing-masing member/anggota kliring, macam-macam securities, dan waktu. Namun KPEI memerlukan analisa akan potensi kegagalan serah dana pada suatu transaksi Tipe sekuritas yang beresiko Pada data warehouse KPEI, KPEI mempunyai data dan informasi macam-macam securities. Namun KPEI memerlukan analisa resiko akan tipe sekuritas yang mempunyai potensi kegagalan serah dana pada suatu transaksi Member yang beresiko Pada data warehouse KPEI, KPEI mempunyai data dan informasi semua anggota kliring. Namun KPEI memerlukan analisa resiko akan member yang mempunyai potensi kegagalan serah dana pada suatu transaksi Tahapan dalam melakukan data mining 4.2.1 Data Cleaning Tahap awal dari perancangan sistem data mining harus melewati tahap pertama yang disebut tahap data cleaning. Tahap ini merupakan suatu proses 95 96 untuk pembersihan data yang kotor. Maksud data yang kotor adalah data yang tidak konsisten, tidak mempunyai nilai, atau mengalami kesalahan waktu penginputan. Fungsinya adalah supaya data yang akan diproses dalam data mining adalah data yang bersih dan berkualitas. Namun pada penulisan ini, penulis tidak perlu melakukan tahap data cleaning lagi, karena data yang penulis ambil adalah data dari data warehouse. Data dari data warehouse lebih berkualitas daripada data-data yang ada pada database biasa karena data dari data warehouse telah melewati proses ETL. Sehingga data sudah bersih dan berkualitas untuk dilakukan proses mining. 4.2.2 Data Integrasi Tahap berikutnya adalah data harus melewati proses data integrasi. Proses dari data integrasi adalah mengintegrasikan data-data yang sudah dipersiapkan sebelumnya. Proses ini penting karena terkadang data-data yang akan dipakai berada pada database yang berbeda, sistem yang berbeda, dan bahkan server yang berbeda. Namun karena data yang kita pakai berada pada data warehouse, penulis tidak perlu melakukan proses ini lagi karena data yang berada pada data warehouse disimpan secara terpusat. Akan tetapi pada penelitian ini penulis tidak memakai data yang asli dari KPEI karena alasan data tersebut sangat confidential bagi perusahaan. Sehingga penulis memutuskan untuk memakai data dummy dari KPEI. Dari pihak KPEI kami menerima data dummy dari file yang ber-tipe .xlsx sehingga penulis harus melewati tahap proses integrasi file .xlsx kedalam data warehouse pada Microsoft SQL Server 2008. 97 Langkah pertama dalam tahap integrasi data adalah penulis menjalankan SQL Server Business Intelligence Development Studio 2008 untuk tahap integrasi data yang akan dilakukan, yang perlu diperhatikan adalah dalam penginstalan MS SQL Server 2008 harus meng-install pada bagian Inegrasi data service sehingga tahap integrasi data dapat dilakukan pada Business Intelligence Development Studio 2008. Untuk mulai melakukan tahap integrasi data, penulis membuat suatu project baru yaitu Integration Service Project pada menu File. Gambar 4.2.2.1 Langkah 1 Setelah project berhasil dibuat, langkah selanjutnya adalah pilih tool Data Flow Task pada panel bagian kiri layar lalu letakkan kedalam layar control flow. 98 Gambar 4.2.2.2 Langkah 2 Setelah itu klik 2 kali pada icon Data Flow Task, lalu kemudian pilih tool excel source dan letakkan kedalam layar data flow. Hal ini dilakukan karena data source yang penulis terima berasal dari file .xlsx. 99 Gambar 4.2.2.3 Langkah 3 Setelah itu klik 2 kali pada icon Excel Source, Excel Source editor akan muncul. Penulis lalu mengatur file yang akan digunakan untuk tahap integrasi data. Dengan membuat baru OLE DB connection manager dan pilih file yang ingin digunakan. Lalu dalah kolom data access model pilih pilihan table or view dan pilih sheet yang akan digunakan. Klik button preview jika ingin melihat data dari sheet yang telah dipilih. Setelah semua langkah sudah dilakukan klik ok. 100 Gambar 4.2.2.4 Langkah 4 Gambar 4.2.2.5 Langkah 5 101 Setelah itu pilih tool OLE DB Destination. Tool ini akan menghubungkan file yang sebelumnya kita pilih kedalam data warehouse yang akan ditetapkan. Caranya adalah dengan memilih tool OLE DB Destination pada sebelah kiri yang terdapat pada kolom data flow destination, kemudian letakkan kedalam layar data flow. Gambar 4.2.2.6 Langkah 6 Setelah OLE DB Destination di masukkan ke layar. Sambungkan relasi Excel source ke OLE DB Destination. Kemudian klik 2 kali pada OLE DB Destination. Sehingga muncul OLE DB Destination editor. 102 Gambar 4.2.2.7 Langkah 7 Setelah itu buat OLE DB Connection yang baru, dan tetapkan kedalam data warehouse yang sudah disiapkan sebelumnya. Lalu di kolom data access mode pilih pilihan Table or View dan pada kolom name of the table of view pilih table yang berhubungan dengan file yang ditetapkan sebelumnya. Jika ingin melihat table yang dipilih sebelumnya klik tombol preview. Gambar 4.2.2.8 Langkah 8 103 Lalu klik pilihan mappings pada kolom sebelah kiri. Kolom ini untuk mengatur attribute yang akan dimasukkan. Atur attribute yang akan dimasukkan kedalam data warehouse. Setelah semua langkah telah dilakukan klik ok. Gambar 4.2.2.9 Langkah 9 Kemudian untuk menjalankan proses integrasi data. Klik tombol play di dalam toolbar bagian tengah atas layar. Sistem akan secara otomatis mengintegrasikan data dari file .xlsx ke dalam data warehouse yang sudah ditetapkan sebelumnya. 104 Gambar 4.2.2.10 Langkah 10 Tahap data integrasi berhasil dilakukan dan data dari file .xlsx berhasil terintegrasi ke dalam data warehouse KPEI. Lakukan proses dari awal lagi untuk mengintegrasi data dari tabel lain. 4.2.3 Data Selection Tahap data selection merupakan tahap pemilihan data yang relevant yang berada di dalam data warehouse KPEI untuk dilakukannya proses analisis yang sudah ditetapkan. Berikut merupakan table fact yang penulis pilih untuk digunakan dalam melakukan penganalisaan: 105 4.2.3.1 Star Schema Fact Receiving Failure Data pada table Fact Receiving Failure digunakan untuk menganalisa akan suatu potensi kegagalan serah dana pada suatu transaksi dari data-data yang sudah dikumpulkan dalam tabel fakta tersebut. Gambar table Fact Receiving Failure adalah sebagai berikut: Gambar 3.4 Star Schema Fact Receiving Failure 106 4.2.3.1.1 Deskripsi Database Table Berikut ini merupakan deskripsi masingmasing database table yang ada di table Fact Receiving Failure: 1. Dimensi Member Tabel dimensi member menjelaskan mengenai profil member yang ada di KPEI, member ini lebih dikenal sebagai anggota kliring. Tabel 4.2.3.1.1 Struktur Dimensi Member Tabel Dimensi Member Keterangan Tabel ini berisi mengenai anggota kliring yang berada di KPEI. Attribute yang disimpan adalah berupa keterangan anggota. Primary Key MemberKey Foreign Key - No. Nama Field Tipe Data Keterangan 1 MemberKey int Key member 2 MemberCode varchar(20) kode member 3 MemberName varchar(150) Nama member 4 UpliftFactor float Angka faktor kenaikan 5 Status varchar(50) Info status 6 BEJStatus varchar(50) Info Status BEJ 7 BESStatus varchar(50) Info Status BES 107 8 OwnershipStatus varchar(50) Status ownership 9 CutOffdate Datetime Tanggal Cut Off 10 AKEquity char(3) kode AKE quity 11 AKPME char(3) kode AKPME 12 AKKB char(3) kode AKKB 13 AKKOS char(3) Kode AKKOS 14 MemberType 15 OldMemberName varchar(150) Nama member yang lama 16 ActiveDate Datetime Tanggal aktiv 17 SuspendDate Datetime Tanggal Suspend 18 ReActiveDate Datetime Tanggal aktif kembali 19 InActiveDate Datetime Tanggal dalam aktif 20 IsCustody Char(3) Apakah Custody 21 IsSLBEligible Char(3) Apakah SLBEligble 22 Owner1Nominal Money Nominal owner 23 Owner1Percentage Float Persentase owner 24 Owner1Certificate Number varchar(50) Nomer Certificate owner 25 Owner1Certificate Date Datetime Tanggal Certificate owner 26 Owner1ModalDas ar Money Modal dasar owner 27 Owner1ModalDise tor Money Modal disetor owner Tipe member 108 Dengan melihat dari table 4.2.3.1.1, penulis memutuskan untuk mengambil beberapa attribute di tabel dimensi member, yaitu OwnershipStatus, IsCustody Owner1Nominal, memberName, , IsSLBEligible, Owner1Percentage, Owner1ModalDasar , Owner1ModalDisetor, dan Owner1Nationality. 2. Dimensi Securities Tabel dimensi securities berisi mengenai informasi sekuritas-sekuritas yang ada di KPEI, attribute yang berada di tabel ini menjelaskan tentang info suatu sekuritas. Tabel 4.2.3.1.2 Struktur Dimensi Securities Tabel Dimensi Securities Keterangan Tabel ini berisi mengenai sekuritas yang berada di KPEI. Attribute yang disimpan adalah berupa keterangan sekuritas. Primary Key SecuritiesKey Foreign Key - No. Nama Field Tipe Data Keterangan 1 SecuritiesKey Int Key securities 2 SecuritiesCode varchar(20) Kode securities 3 SecuritiesName varchar(100) Nama securities 109 4 Instrument Varchar(50) Jenis instrument 5 Industry Varchar(50) Jenis industry 6 SubSector Varchar(50) Sector 7 Haircut Numeric(3,2) Potongan harga 8 UpliftFactor Numeric(3,2) Faktor kenaikan 9 DateOfScriptless Smalldatetime Tanggal waktu scriptless 10 PreviousCP Money CP terdahulu 11 PreviousCPDate Datetime Tanggal CP terdahulu 12 LatestCP Money CP yang terakhir 13 LatestCPDate Datetime Tanggal CP yang terakhir 14 PrevPriceAfterCA Money Harga terdahulu sesudah CA 15 PrevPrceAfterCASe ssion Char(1) Harga terdahulu sesudah sesi CA 16 PrevPriceAfterCAD ate Smalldatetime Tanggal harga terdahlulu sesudah CA 17 LatestPriceAfterCA Money Harga terakhir sesudah CA 18 LatestPriceAfterCA Session Char(1) Harga terakhir sesudah sesi CA 19 LatestPriceAfterCA Date Smalldatetime Tanggal harga yang terakhir sesudah CA 20 Status Varchar(50) Status 21 SLBColl Varchar(1) Apakah SLBColl 110 22 ListedShare Bigint List dari pemegang saham 23 DicatatDiCBEST Bigint Info yang dicatat di CBEST 24 PemegangRekening Bigint Jumlah pemegang rekening 25 PemegangRekening Kurang10 Bigint Jumlah pemegang rekening kurang 10 26 EligibleDate Datetime Tanggal Eligible 27 InRecallDate Datetime Tanggal InRecall 28 InEligibleDate Datetime Tanggal InEligible 29 SCDValidFrom Datetime Tanggal SCD valid dari 30 SCDValidTo Datetime Tanggal SCD valid sampai Dengan melihat dari table 4.2.3.1.2, penulis memutuskan untuk mengambil beberapa attribute di tabel dimensi securities, yaitu Instrument, Industry SecuritiesName, , SubSector, PemegangRekening, PemegangRekeningKurang10, UpliftFactor, dan LatestCP. 111 3. Dimensi Time Tabel dimensi time berisi mengenai informasi tentang waktu saat dilakukannya proses bisnis yang ada di KPEI. Tabel dimensi time terdapat banyak kategorisasi seperti date, month, period, quarter, dan sebagainya. 4.2.3.1.3Struktur Dimensi Time Tabel Dimensi Time Keterangan Tabel ini berisi mengenai informasi waktu saat dilakukannya proses bisnis yang ada di KPEI. Primary Key TimeKey Foreign Key - No. Nama Field Tipe Data Keterangan 1 TimeKey Int Key time 2 AlternateTimeKey 3 Date Datetime Tanggal 4 Year Datetime Tahun 5 Semester Int Semester 6 SemesterName String Nama semester 7 Quarter Int Quarter 8 QuarterName String Nama quarter 9 Month Datetime Bulan Alternatif untuk key time 112 10 MonthName String Nama bulan 11 Week Int Minggu 12 WeekName String Nama minggu 13 T0 Int Hari mulai transaksi 14 T1 Int Hari ke-1 15 T2 Int Hari ke-2 16 T3 Int Hari ke-3 Dengan melihat dari table 4.2.3.1.3, penulis memutuskan untuk mengambil beberapa attribute di tabel dimensi time, yaitu quarter dan month. 4. Tabel Fact Receiving Failure Tabel fact Receiving Failure adalah tabel fakta yang berisi mengenai informasi tentang gagal transaksi yang mengalami gagal serah dana yang ada di KPEI. Tabel fakta ini bisa dianalisa dengan berbagai dimensi seperti dimensi time, member dan securities. 113 4.2.3.1.4 Fact Receiving Failure Tabel Fact Receiving Failure Keterangan Tabel fact Receiving Failure adalah tabel fakta yang berisi mengenai informasi tentang gagal transaksi yang mengalami gagal serah dana yang ada di KPEI. Primary Key - Foreign Key TimeKey, MemberBuyerKey, SecuritiesKey, MemberSellerKey No. Nama Field Tipe Data Keterangan 1 TimeKey Int Key untuk time 2 MemberBuyerKey Int Key untuk member yang membeli 3 SecuritiesKey Int Key untuk securities 4 MemberSellerKey Int Key untuk member yang menjual 5 ReceivingRights Brigint Hak serah dana 6 ReceivingRealtisat ion Brigint Info serah dana yang terealisasi 7 ReceivingFailure Brigint Info serah dana yang gagal 8 ACSRight Money Hak ACS Dengan melihat dari table 4.2.3.1.4, penulis memutuskan untuk mengambil beberapa attribute di table fact failure receive, yaitu ReceivingRights, 114 ReceivingRealtisation, ReceivingFailure, dan ACSRight. Setelah melakukan pemilihan data dari table dimensi member, dimensi securities, dimensi time, dan fact failure receiving. Penulis mempunyai list attribute sebagai berikut: memberName, OwnershipStatus, IsCustody , IsSLBEligible, Owner1Nominal, Owner1Percentage, Owner1ModalDasar , Owner1ModalDisetor, Owner1Nationality , SecuritiesName, Instrument, Industry , SubSector, PemegangRekening, PemegangRekeningKurang10, LatestCP, quarter, month, ReceivingRights, UpliftFactor, ReceivingRealtisation, ReceivingFailure, dan ACSRight. 4.2.4 Data Transform Pada tahap data transform, data yang sudah diseleksi pada tahap data selection akan digunakan untuk pembuatan model data mining. Model data mining ini berguna untuk memproses data-data tersebut agar dapat digunakan untuk proses penganalisaan yang menghasilkan informasi tersembunyi di dalamnya dan sangat bermanfaat dalam pengambilan keputusan. Model data mining dirancang dari proses penelitian data perusahaan yang sudah terintegrasi dan menganalisis pola-pola yang tersembunyi di dalamnya tanpa adanya perubahan penambahan data baru ke dalam data warehouse. Prosesnya adalah dengan membuat view dari data warehouse , yang berisi datadata yang sudah diseleksi sebelumnya. Berdasarkan tujuan penelitian maka model 115 data mining yang akan dibuat adalah untuk menganalisa potensi kegagalan serah dana pada suatu transaksi. Sehingga table fact yang digunakan adalah fact receiving failure. Berikut merupakan view yang dibentuk dari fact receiving failure yang sudah melewati tahap data selection: ViewFactReceivingFailure ViewFactReceivingFailure merupakan view yang dibuat dari tabel fact receiving failure dan dimensi-dimensi yang berhubungan dengan fact table tersebut. ViewFactReceivingFailure dibuat untuk mendukung analisis potensi akan kegagalan serah dana pada suatu transaksi. Berikut merupakan SQL pembuatan ViewFactReceivingFailure: 116 Gambar 4.2.4 Perintah SQL membuat ViewFactReceivingFailure 117 Tabel 4.2.4 Struktur Tabel View ViewFactReceivingFailure Nama Field Field sumber Tabel Sumber Keterangan ROW_ID ROW_NUMBER() ViewFactReceiveFailure Jumlah row MemberName MemberName DimMember Nama Member OwnershipStatus OwnershipStatus DimMember Status ownership IsCustody IsCustody DimMember Apakah custody IsEligible IsEligible DimMember Apakah memenuhi syarat Owner1Nominal Owner1Nominal DimMember Nominal Owner Owner1Percentage Owner1Percentage DimMember Percentage Owner Owner1ModalDasar Owner1ModalDasa r DimMember Modal Dasar Owner 118 Owner1ModalDiset Owner1ModalDiset or or Owner1Nationality Owner1Nationality DimMember Modal Disetor Owner DimMember Negara asal Owner SecuritiesName SecuritiesName DimSecurities Nama sekuritas Instrument Instrument DimSecurities Jenis Instrument Industry Instrument DimSecurities Jenis Industri SubSector SubSector DimSecurities Jenis sektor LatestCP LatestCP DimSecurities Harga terakhir PemegangRekening PemegangRekening DimSecurities Jumlah Pemegang rekening PemegangRekening PemegangRekening Kurang 10 Kurang10 DimSecurities Jumlah Pemegang rekening kurang 10 Quarter Quarter DimTime Jenis Quarter 119 Month Month DimTime Angka Bulan ReceivingRight ReceivingRight FactReceivingFailure Jumlah hak serah ReceivingRealisatio ReceivingRealisatio FactReceivingRealisation Jumlah yang n n terealisasi ReceivingFailure ReceivingFailure FactReceivingRealisation Jumlah serah yang gagal ACSRight 4.2.5 ACSRight FactReceivingRealisation Hak ACS Data Mining Pada tahapan berikutnya merupakan tahapan yang paling penting dalam tahapan perancangan sistem data mining yaitu tahap data mining itu sendiri. Tahap ini merupakan proses untuk menganalisa data-data yang sudah melewati tahap-tahap sebelumnya sehingga dari data-data tersebut dapat ditemukan informasi tersembunyi di dalamnya yang sangat berguna bagi perusahaan untuk membuat suatu keputusan. Pada tahap ini akan dilakukan proses perancangan model data mining, yang terdiri dari teknik –teknik yang biasanya dipakai dalam proses data mining. 120 Langkah pertama dalam merancang model data mining adalah penulis menjalankan SQL Server Business Intelligence Development Studio 2008 untuk merancang model yang akan dibuat, yang perlu diperhatikan adalah dalam proses instalasi MS SQL Server 2008 harus meng-install pada bagian analysis service sehingga perancangan model data mining dapat dilakukan pada Business Intelligence Development Studio 2008. Untuk mulai membuat model yang akan dirancang. Penulis membuat suatu project baru yaitu Analysis Service Project pada menu File. Gambar 4.2.5.1 Langkah 1 121 Gambar 4.2.5.2 Langkah 2 Setelah melakukan proses di atas, maka akan menghasilkan project analysis service , lanjutkan dengan menentukan data source dengan klik option data source pada panel di daerah kanan. Data source adalah tempat untuk menentukan data yang penulis pilih. Klik kanan dan klik new data source. Lalu pilih data yang ingin dianalisa. Gambar 4.2.5.3 Langkah 3 122 Gambar 4.2.5.4 Langkah 4 Setelah data source sudah ditetapkan, proses berikutnya adalah mengatur data view source. Data view source berfungsi untuk menampilkan data-data yang akan dipilih untuk proses analisis. Tetapkan data source view yang sudah dibuat sebelumnya. Gambar 4.2.5.5 Langkah 5 123 Gambar 4.2.5.6 Langkah 6 Setelah data source view telah ditetapkan, langkah selanjutnya adalah membuat model data mining. Langkahnya adalah dengan klik kanan mining structure pada panel sebelah kanan. Kemudian pilih option pada from existing relational database or data warehouse lalu klik next dan pilih algoritma yang ingin digunakan, karena penulis memakai teknis clustering maka penulis memilih algoritma microsoft clustering. Klik next lalu pilih data source view yang sudah ditetapkan lalu klik next lagi 2 kali, Lalu tentukan attribute yang ingin diproses untuk data mining. Setelah itu pilih tipe data tiap attribute yang sebelumnya sudah ditetapkan. Setelah semua proses sudah dilakukan klik finish, dan model data mining sudah berhasil dibuat. 124 Gambar 4.2.5.7 Langkah 7 Gambar 4.2.5.8 Langkah 8 125 Gambar 4.2.5.9 Langkah 9 Gambar 4.2.5.10 Langkah 10 126 Gambar 4.2.5.11 Langkah 11 Gambar 4.2.5.12 Langkah 12 127 Setelah klik finish, model data mining berhasil dibuat. Untuk menjalankan model data mining yang sudah dirancang klik tombol play pada panel tengah atas. Setelah tombol play diklik sistem akan dengan otomatis memproses data mining dan menghasilkan hasil data mining yang telah dilakukan. Gambar 4.2.5.13 Hasil Cluster 1 Gambar 4.2.5.13 Hasil Cluster 2 128 Gambar 4.2.5.14 Hasil Cluster 3 129 Gambar 4.2.5.15 Hasil Cluster 4 4.2.6 Pattern Evaluation Sesudah melakukan proses data mining, tahapan selanjutnya adalah melakukan pattern evaluation, pattern evaluation dilakukan untuk mengevaluasi 130 model data mining yang telah dibuat berserta hasil output yang dihasilkan dari proses data mining yang telah dilakukan. Model data mining yang telah dibuat oleh penulis mengambil data dari tabel dimensi time, tabel dimensi member, tabel dimensi securities, dan tabel fakta receiving failure. Pengambilan data ini mengambil data dari tabel tersebut karena penulis ingin meneliti akan potensi kegagalan serah dana pada suatu transaksi dan dalam tabel fakta receiving failure mempunyai data yang mendukung untuk penelitian itu. Selain itu tabel fakta itu dibuat untuk meneliti akan potensi kegagalan serah dana pada suatu transaksi. Attribute yang digunakan juga diseleksi berdasarkan keterkaitan yang erat terhadap penelitian yang dilakukan sehingga attribut yang akan dipakai adalah memberName, IsCustody , IsSLBEligible, Owner1ModalDasar SecuritiesName, , Owner1ModalDisetor, Owner1Percentage, Owner1Nationality , Instrument, Industry , SubSector, PemegangRekening, PemegangRekeningKurang10, ReceivingRights, Owner1Nominal, OwnershipStatus, UpliftFactor, ReceivingRealtisation, LatestCP, ReceivingFailure, Sehingga membentuk struktur sebagai berikut: quarter, dan month, ACSRight. 131 Gambar 4.2.6.1 Struktur Data yang Digunakan Setelah atribut-atribut siap, dimulailah proses data mining. Proses data mining yang akan dilakukan adalah dengan menggunakan teknik clustering. Nantinya hasil output dari proses data mining ini adalah berupa 3 cluster. Cluster ini adalah pemisahan 3 karakteristik yang berbeda berdasarkan pada isi atribut receiving failure, dimana atribut receiving failure adalah angka yang menjelaskan jumlah serah dana yang gagal, sehingga membentuk 3 cluster yaitu cluster yang sangat mempunyai potensi terjadinya gagal serah dana (high risk) yang 132 mempunyai mean receiving failure 473.000 , cluster yang mempunyai potensi terjadinya gagal serah dana(normal risk) yang mempunyai mean receiving failure 424.000 dan cluster yang mempunyai sedikit potensi terjadinya gagal serah dana(low risk) yang mempunyai mean receiving failure 53.000. 133 Berikut merupakan gambaran lengkap model data mining yang dirancang: Gambar 4.2.6.2 Model Data Mining 134 4.2.7 Knowledge Presentation Setelah semua tahap proses data mining sebelumnya dilakukan semuanya, tahap terakhir dalam perancangan sistem data mining merupakan tahap knowledge presentation. Tahap ini bertujuan untuk visualisasi dan merepresentasikan pengetahuan yang sudah dihasilkan dari proses data mining sebelumnya. Nantinya knowledge presentation ini akan digunakan untuk menyajikan pengetahuan yang telah dihasilkan dari proses data mining sebelumnya untuk digunakan oleh user. Proses dalam melakukan tahap knowledge presentation akan dijelaskan lebih detail dalam sub-bab perancangan aplikasi. 4.3 Perancangan Aplikasi yang Diusulkan 4.3.1 Project Planing Berdasarkan proses bisnis yang sedang berjalan, sumber data yang akan dipakai dalam proses perancangan data mining akan diambil dari sistem data warehouse KPEI. Hal ini disebabkan karena data yang berada pada data warehouse adalah data yang sudah melewati proses ETL. Sehingga data yang berada pada data warehouse lebih siap untuk dilakukan proses data mining. Data dari data warehouse bisa digunakan sebagai gambaran history dari proses bisnis yang sedang berjalan beberapa tahun lamanya. Hal ini dapat terjadi karena data di dalam data warehouse bersifat historical yaitu data di dalam datawarehouse yang menggambarkan keseluruhan proses yang sudah terjadi dalam KPEI beberapa tahun lamanya. Data di dalam datawarehouse KPEI juga dikelompokkan menjadi per- 135 tahun, hal ini dapat mempermudah proses dalam data mining untuk melakukan pemilihan data yang dipilih dari tahun data itu tersimpan. Data dalam data warehouse juga menggambarkan gambaran akhir dari proses bisnis yang terjadi dalam KPEI. Data dalam data warehouse tersimpan secara terpusat sehingga tidak ada data yang berbeda. Sebelum dilakukannya proses data mining, data dalam data warehouse harus melewati proses preprocessing data. Preprocessing data merupakan suatu proses untuk mempersiapkan data sebelum dilakukannya proses data mining. Data harus melalui proses preprocessing karena data masih merupakan data kotor yaitu terkadang ada data yang tidak lengkap seperti kurangnya nilai dalam suatu atribut, lalu data masih noisy yaitu data yang tidak sesuai dengan rule yang dibuat, terkadang juga ada data yang tidak konsisten dalam pengisian nilai, contohnya pada atribut rating ada yang mengisi nilai dengan A,B, atau C dan yang lain mengisi nilai dengan 1,2 atau 3. Data yang masih kotor ini terjadi karena banyak macam seperti human error, bug dalam software, data source yang berbeda-beda dan sebagainya. Data preprocessing penting untuk dilakukan karena data yang ada didalam data warehouse belum siap untuk langsung dilakukannya proses data mining, sehingga kualitas data masih sangat kurang. Tidak adanya kualitas data sama saja dengan tidak adanya kualitas dalam hasil data mining yang dilakukan. Hal-hal yang penting dalam melakukan preprocessing data yaitu data cleaning, integrasi data, data transformaton, data reduksi, dan data discretization bila diperlukan. 136 Data pada data warehouse mempunyai banyak table fact dan dimensi yang beragam, data tersebut juga dikelompokan pertahun sehingga diperlukan adanya proses seleksi data. Proses ini bertujuan untuk memilih data-data apa saja yang akan digunakan dalam proses data mining yang akan dilakukan. Dalam proses pemilihan data, data yang dipilih harus berhubungan dengan tujuan dilakukannya proses data mining. Data warehouse yang ada di KPEI berada pada tools Microsoft SQL Server 2008, sehingga data mining yang akan dirancang akan dibangun dalam tools Microsoft SQL Server 2008, menggunakan analysis service. Berikut ini merupakan gambar struktur dari sistem data mining yang akan dibangun : Gambar 4.3.1 Arsitektur Data Mining yang Diusulkan 137 Sistem aplikasi data mining yang dirancang akan dijalankan pada PC (Personal Computer) yang memiliki Memory sebesar 4GB RAM, dan memiliki Processor yang paling baru, sehingga respon sistem dalam komputer tidak lambat, menggunakan tools Microsoft SQL Server 2008 sebagai sumber datannya (data source), dan Microsoft SQL Server Bussiness Intelligence Development Studio untuk perancangan sistem data mining yang akan dilakukan. 1.3.2 Analysis 1.3.2.1 Gather Information Pada tahap analisis, langkah pertama yang harus dilakukan adalah tahap gather information yaitu pengumpulan data. Tahap ini bermanfaat untuk mengetahui proses bisnis pada perusahaan yang akan diteliti, informasi yang diperlukan dan masalah yang dihadapi oleh perusahaan. Pada tahap ini, penulis sudah melakukan prosesproses tersebut dan bisa dilihat pada bab 3. 1.3.2.2 Define System Requirement Langkah selanjutnya adalah dengan menetapkan system requirement. Langkah ini bertujuan untuk menjelaskan apa saja yang dapat dilakukan oleh sistem sesuai dengan syarat yang sudah ditentukan. Pada tahap ini, penulis sudah melakukan proses tersebut dan bisa dilihat pada bab 3. 138 1.3.2.2.1 Activity Diagram Gambar 4.3.2.2.1 Activity Diagram 139 1.3.2.2.2 Event Table Event Trigger Login Source Use Case Response Destination Enter the User system Login Login success User Pilih Dashboard Memilih User model yang diinginkan Choose Choose the Dashboard Dashboard success User,System Submit Model Result Data Mining Submit model User,System User Submit success 4.3.2.2.3 Use Case Gambar 4.3.2.2.3 Use Case Diagram 140 4.3.2.2.3 Use Case Description 1. Login Main Flow: 1. User membuka aplikasi 2. Layar untuk login muncul 3. User memasukkan user dan password 4. User klik tombol login 5. Login Success Exceptional Conditions: Jika user salah memasukkan nama user dan password maka login gagal. 2. Menu Dasboard Main Flow: 1. System menampilkan pilihan dashboard 2. User klik menu dashboard yang diinginkan Exceptional Conditions: - 141 3. Submit Model Main Flow: 1. User klik submit model yang diinginkan 2. Sistem memproses model data mining dari data source yang telah ditetapkan 3. Sistem menampilkan layar hasil output dari proses data mining yang telah diproses Exceptional Conditions: - 142 4.3.2.2.4 System Sequence Diagram Gambar 4.3.2.2.4 System Sequence Diagram 143 1.3.2.3 Prioritize Requirement Langkah selanjutnya adalah dengan menetapkan syarat yang utama dari system requirement yang dibuat sebelumnya. Setelah melihat system requirement yang sebelumnya sudah ditetapkan, penulis menetapkan prioritize requirement sebagai berikut: No Requirement Status 1 Melalui aplikasi sistem data Sangat Penting mining yang akan dirancang, PT KPEI dapat menganalisa potensi akan kegagalan serah dana pada suatu transaksi. 2 Melalui aplikasi sistem data Penting mining yang dirancang , PT KPEI dapat mengatur dan memilih data yang diinginkan untuk dianalisa oleh sistem. 3 Aplikasi sistem data mining Sangat Penting yang dirancang dapat membantu dalam melakukan proses analisa data yang besar. 144 4 Melalui aplikasi sistem data Penting mining yang dirancang, PT KPEI dapat melakukan proses analisa melalui clustering. metode Sehingga memudahkan pihak managerial dalam transaksi mengkarakteristik yang mempunyai potensi akan kegagalan serah dana. 5 Melalui aplikasi sistem data Penting mining yang dirancang, PT KPEI dapat menghasilkan hasil analisis yang sudah diproses dalam sistem dengan bentuk visual maupun detail. Sehingga mempermudah pihak managerial dalam memahami hasil analisis yang dihasilkan sistem. 6 Dengan dirancangnya aplikasi Penting sistem data mining, hasil 145 analisis yang dihasilkan dapat digunakan PT KPEI sebagai refrensi lain dalam melakukan analisis akan potensi suatu transaksasi dalam mengalami kegagalan serah dana. Tabel 4.3.2.3 Prioritize Requirement 1.3.3 Design 1.3.3.1 Design and Integrate The Network Data layer merupakan layer yang menjelaskan tentang data source yang akan digunakan dalam aplikasi. Data source yang dipakai dalam perancangan sistem aplikasi data mining yang dirancang berasal dari data warehouse KPEI. Tetapi tidak semua data pada data warehouse tersebut digunakan sehingga diperlukan adanya seleksi data yang berkatian erat dengan analisa yang dilakukan. Sehingga perlu dibuatnya bussiness logic untuk memproses seleksi data yang telah ditetapkan. Dari bussiness logic tersebut data-data yang sudah diseleksi akan ditampilkan dalam view. View layer berguna sebagai wadah untuk mempresentasikan hasil yang sudah diproses sebelumnya pada business logic layer sehingga Arsitektur 146 network yang akan digunakan adalah three layer client/server architecture. Gambar 4.3.3.1 three layer client/server architecture 147 1.3.3.2 Design The Application Architecture and Software 4.3.3.2.1 Component Diagram Gambar 4.3.3.2.1 Component Diagram 148 4.3.3.2.2 Deployment Diagram Gambar 4.3.3.2.2 Deployment Diagram 149 1.3.3.3 Design The User Interface 4.3.3.3.1 Navigation Diagram Gambar 4.3.3.2.2 Navigation Diagram 150 4.3.3.3.2 User Interface Gambar 4.3.3.3.2.1 Login Page 151 Gambar 4.3.3.3.2.2 Home Page 152 Gambar 4.3.3.3.2.3 Menu Dashboard 153 Gambar 4.3.3.3.2.4 Loading Dashboard 154 Gambar 4.3.3.3.2.5 Data Mining Model Dashboard 155 Gambar 4.3.3.3.2.6 Data Mining Model Dashboard