Data Mining dan Aplikasi untuk Knowledge Management

advertisement
Topik-Topik Lanjutan Sistem Informasi
DATA MINING DAN APLIKASI UNTUK KNOWLEDGE MANAGEMENT
Oleh :
Erlina Indra – 1501145713
Rendy Arsanto – 1501145770
Eva Budiarti – 1501147031
Monyca Gunawan – 1501147763
Tris Suseno – 1501152611
Kelas :
06 PFM
Binus University
Jakarta
2013/2014
1. Data Mining
Data mining adalah langkah utama dalam menemukan pengetahuan didalam proses
database (KDD) yang menghasilkan bentuk atau model yang berguna dari data. Istilah
dari KDD dan datamining sendiri memiliki arti yang berbeda dalam penerapannya. KDD
merupakan keseluruhan proses dalam menemukan pengetahuan yang berguna dari
data,sedangkan Data Mining merujuk untuk menemukan bentuk baru dari data yang ada
didalam database yang berfokus pada algoritma untuk menghasilkan pengetahuan yang
berguna.
Gambar 2 Data Mining dan KDD Process (Fayyad et. Al.)
KDD Process terdiri dari urutan secara berulang,antara lain :
a) Selection : Memilih data yang relevan dari database untuk dianalisis.
b) Preprocessing : Menghapus data yang tidak konsisten dengan menggabungkan beberapa
sumber data.
c) Transformation : Merubah data menjadi bentuk yang sesuai untuk melakukan datamining
d) Data mining : Memilih sebuah algoritma data mining yang sesuai dengan bentuk data.
e) Interpretation/Evaluation : Menafsirkan pola menjadi pengetahuan dengan menghapus
pola yang berulang atau pola yang tidak relvan.
Data Mining Task (Fayyad et.al. (1996))
a) Classification : adalah menemukan model yang dapat menganalisis dan
mengklasifikasikan sebuah data menjadi beberapa klas yang sudah dikenal.
b) Regression : adalah memetakan data kedalam prediksi variable yang memiliki nilai nyata.
c) Clusterring : adalah mengidentifikasikan serangkaian kategori yang terbatas untuk
mendeskripsikan data.
d) Dependency Modelling : adalah menemukan model yang mendeskripsikan
ketergantungan yang ada diantara variable
e) Deviation Detection : adalah mencari perubahan yang paling seimbang didalam data.
f) Summarization : adalah menemukan deskripsi yang pas untuk sebagian dari data.
Data Mining memiliki dua objektif utama yang menjadi focus dalam pengerjaannya,yakni :
a) Prediction : melibatkan penggunaan variable yang sama didalam serangkaian data yang
dibutuhkan untuk memprediksi nilai yang tidak diketahui dari variable relevan yang
lainnya. (Contoh : Classification,regression dan anomaly detection)
b) Description : Melibatkan pencarian pola yang dapat dimengerti oleh manusia dan tren
yang ada pada data. (Contoh : clustering,association rule learning,dan summarization)
2. Knowledge Management
(Mc Inerney (2002) adalah sebuah usaha untuk meningkatkan pengetahuan yang
berguna didalam sebuah perusahaan. Beberapa cara diantaranya adalah : mendorong
penggunaan komunikasi,menawarkan peluang untuk belajar,dan mempromosikan
pembagian pengetahuan yang sesuai dengan fakta.
Knowledge management process berfokus pada aliran pengetahuan dan proses
pembuatan, penyebaran dan pendistribusian pengetahuan. Setiap unit pengetahuan yang
di dapatkan, dibuat, dibagikan, disebarkan, dan diaplikasikan dengan menggunakan
Teknologi Informasi .
Karena teknologi memiliki peranan penting didalam KM,maka teknologi menjadi
alat yang sangat dibutuhkan untuk penerapan KM. KM membutuhkan teknologi untuk
memfasilitasi pengkomunikasian,kolaborasi dan isi untuk
pengambilan,pembagian,penyebaran dan aplikasi pengetahuan.
Knowledge Management : Capture and Creation Tools
Liao (2003) mengklasifikasikan Teknologi KM menggunakan tujuh kategori,antara lain :

KM Framework

Knowledge-Based System(KBS)

Data Mining

Informasi dan Teknologi komunikasi

Artificial Inteligence(AI)/Expert System (AS)

Database Teknologi

Modeling
3. Aplikasi Data Mining yang ada pada Knowledge Management
Terdiri dari 3 Grup Utama :
a. Knowledge Resources
b. Knowledge Types
c. Data Mining Techniques/ Aplication that used in KM
A. Knowledge Resources
Terbagi menjadi 8 grup dimana setiap pengetahuan dapat disimpan dan dapat
dimanipulasi :
a. Health Care Organization : Tools data mining digunakan untuk menjelajahi
penyebab,operasi dan hubungan antar tumor. Alat ini digunakan untuk
membangun KMS (Knowledge Management System) untuk mendukung ilmu
pengobatan klinik yang dibutuhkan untuk meningkatkan kualitas perawatan.
b. Retailing : Hal ini merupakan pengetahuan pelanggan yang berasal dari
pelanggan rumahan untuk jalur barang dan masalah nama brand. Datamining
dapat membantu dan mengajukan saran dan solusi untuk perusahaan perihal jalur
produk dan masalah nama brand. Hal itu dapat dilakukan dengan cara meng
ekstrak pengetahuan pasar dari pelanggan,brand,produk dan data pembelian untuk
memenuhi permintaan pelanggan.
c. Financial / Banking : Data mining dapat mendukung pengambilan keputusan
institusi bank dan proses pembagian pengetahuan.
d. Small and Middle Businesses(Perusahaan makanan dan Supply Chain nya) :
Data mining dan Knowledge Management yang terintergrasi dapat membantu
untuk pengambilan keputusan yang lebih baik. Seperti masalah Death-On-Arrival
(DOA) yang ditemui didalam “Food Supply Chain Networks”. Lie et Al (2010)
menyarankan untuk membangun Early Warning dan Proactive Control(EW/PC)
untuk mengatasi masalah tersebut. Dasar Pengetahuan (Knowledge Base) adalah
bagian yang penting dalam system EW/PC. Knowledge Base mengandung data
analisis dari manajer dan perusahaan yang akan menjadi langkah yang tepat untuk
manajer yang lainnya.
e. Entrepreneurial Science
Knowledge resource melakukan research asset didalam institusi pengetahuan.
Ada tiga tipe dari Asset

Research products

Intellectual Capital

Research program.
Datamining memfasilitasi peng-ekstrakan pengetahuan membantu dalam
menuntun manajer dalam menentukan strategi pada kompetisi organisasi yang
berorientasikan pengetahuan.
f. Business : Data didapatkan dari kuesionair dan literature yang intensif. Data
mining dapat menemukan pola yang tersembunyi diantara KM dan performanya
untuk penerapakan KM yang lebih baik kedepannya.
g. Collaboration and Teamwork : Catatan kerja dan dokumen dari para pekerja di
analisis untuk mengetahui kebiasaan refrensi dari tiap pekerja dan konstruksi
aliran pengetahuan para pekerja. Teknik Data Mining dapat menggali secara
dalam dan mengkonstruksikan prototype grup yang berbasiskan aliran
pengetahuan menjadi grup yang berbasiskan tugas.
h. Construction Industry : Sebuah bagian besar dari informasi perusahaan yang
tersedia dalam bentuk format data textual. Hal ini mengaju pada penyebaran
teknik penggalian text untuk menangani sumber informasi textual untuk
menemukan pengetahuan industrial dan solusi manajemen.
B. Knowledge Types
Tipe pengetahuan dalam 8 hunian organisasi untuk proses kolaborasi Data Mining
didalam pembuatan pengetahuan.
a. Health-Care System Domain :
Terdiri dari 3 database utama ;

Database pengembang Health-care

Database statistic pasien health-care yang sudah keluar

Database status medical.
b. Construction Industry Domain
Sebuah sample dataset yang ada didalam Post Project Reviews digunakan sebagai
penentu baik atau buruk nya informasi yang ada
c. Retailing Domain
Data pelanggan dan produk yang sudah dibeli di kumpulkan dan di simpan
didalam database untuk menentukan kebiasaan pembelian pelanggan perilaku
para pelanggan yang mempengaruhi jalur produk dan ekstensi merk atau tidak.
d. Financial Domain
Terdapat dua kumpulan data yang ada pada financial domain,yaitu :
 Untuk medefinisikan rating dari obligasi,kumpulan pengetahuan
mengandung data string,model,parameter dan laporan dari tiap
pembelajaran analisis
 Untuk memprediksi pergantian rating obligasi,kelompok fitur data dari
obligasi seperti model parameter yang disimpan,diklasifikasikan,dan di
terima untuk pem-prediksian rating.
e. Small and Middle businesses Modelling Domain
Untuk menyelsaikan masalah yang ada pada jaringan rantai pasokan, Lie et
al(2010) mengembangkan prototype EW/PC yang digabungkan dengan beberapa
komponen utama,yaitu :

Pengetahuan dasar

Pengklasifikasian tugas dan template pendekatan

User Interface.
f. Research Assets Domain
Menurut Cantu & Cellbos(2010) berfokus dalam mengelola Asset Knowledge
dengan penerapan jaringan informasi. Platform ini mengandung tiga komponen
penelitian produk,sumberdaya manusia atau intellectual capital serta program
penelitian.
g. Business Domain
Terdapat dua tipe atribut pengetahuan,yaitu : atribut kondisi dan atribut
pengambilan keputusan.
h. Collaboration and Teamwork Domain
Aliran dari tipe pengetahuan dideterminasikan untuk menentukan kebutuhan dari
para pekerja. Untuk mengumpulkan aliran pengetahuan dokumen yang terdapat
didalam sekumpulan data dikategorikan kedalam delapan kelompok dengan
pendekatan data mining.
C. Data Mini Techniques / Aplication used in knowledge Management
Beberapa Teknik yang ada :
a. Classification
Klasifikasi adalah salah satu hal yang paling umum untuk dipelajari didalam Data
Mining. Tugas utama dalam pengklasifikasian adalah dengan pemetaan sebuah
data kedalam beberapa kelas yang telah dikenal.
b. Clustering
Hal ini melibatkan pencarian untuk mengidentifikasi sekumpulan kategori yang
terbatas dan pengelompokan beberapa objek yang sama ke objek yang seharusnya
berada di kelompok yang lainnya.
c. Depedency Modeling
Hal ini berfokus pada menemukan sebuah model yang dapat mendeskripsikan
secara signifikan hubungan antar kumpulan atribut.
Referensi

International Journal of Data Mining & Knowledge Management Process (IJDKP) Vol.2,
No.5, September 2012
Download