Topik-Topik Lanjutan Sistem Informasi DATA MINING DAN APLIKASI UNTUK KNOWLEDGE MANAGEMENT Oleh : Erlina Indra – 1501145713 Rendy Arsanto – 1501145770 Eva Budiarti – 1501147031 Monyca Gunawan – 1501147763 Tris Suseno – 1501152611 Kelas : 06 PFM Binus University Jakarta 2013/2014 1. Data Mining Data mining adalah langkah utama dalam menemukan pengetahuan didalam proses database (KDD) yang menghasilkan bentuk atau model yang berguna dari data. Istilah dari KDD dan datamining sendiri memiliki arti yang berbeda dalam penerapannya. KDD merupakan keseluruhan proses dalam menemukan pengetahuan yang berguna dari data,sedangkan Data Mining merujuk untuk menemukan bentuk baru dari data yang ada didalam database yang berfokus pada algoritma untuk menghasilkan pengetahuan yang berguna. Gambar 2 Data Mining dan KDD Process (Fayyad et. Al.) KDD Process terdiri dari urutan secara berulang,antara lain : a) Selection : Memilih data yang relevan dari database untuk dianalisis. b) Preprocessing : Menghapus data yang tidak konsisten dengan menggabungkan beberapa sumber data. c) Transformation : Merubah data menjadi bentuk yang sesuai untuk melakukan datamining d) Data mining : Memilih sebuah algoritma data mining yang sesuai dengan bentuk data. e) Interpretation/Evaluation : Menafsirkan pola menjadi pengetahuan dengan menghapus pola yang berulang atau pola yang tidak relvan. Data Mining Task (Fayyad et.al. (1996)) a) Classification : adalah menemukan model yang dapat menganalisis dan mengklasifikasikan sebuah data menjadi beberapa klas yang sudah dikenal. b) Regression : adalah memetakan data kedalam prediksi variable yang memiliki nilai nyata. c) Clusterring : adalah mengidentifikasikan serangkaian kategori yang terbatas untuk mendeskripsikan data. d) Dependency Modelling : adalah menemukan model yang mendeskripsikan ketergantungan yang ada diantara variable e) Deviation Detection : adalah mencari perubahan yang paling seimbang didalam data. f) Summarization : adalah menemukan deskripsi yang pas untuk sebagian dari data. Data Mining memiliki dua objektif utama yang menjadi focus dalam pengerjaannya,yakni : a) Prediction : melibatkan penggunaan variable yang sama didalam serangkaian data yang dibutuhkan untuk memprediksi nilai yang tidak diketahui dari variable relevan yang lainnya. (Contoh : Classification,regression dan anomaly detection) b) Description : Melibatkan pencarian pola yang dapat dimengerti oleh manusia dan tren yang ada pada data. (Contoh : clustering,association rule learning,dan summarization) 2. Knowledge Management (Mc Inerney (2002) adalah sebuah usaha untuk meningkatkan pengetahuan yang berguna didalam sebuah perusahaan. Beberapa cara diantaranya adalah : mendorong penggunaan komunikasi,menawarkan peluang untuk belajar,dan mempromosikan pembagian pengetahuan yang sesuai dengan fakta. Knowledge management process berfokus pada aliran pengetahuan dan proses pembuatan, penyebaran dan pendistribusian pengetahuan. Setiap unit pengetahuan yang di dapatkan, dibuat, dibagikan, disebarkan, dan diaplikasikan dengan menggunakan Teknologi Informasi . Karena teknologi memiliki peranan penting didalam KM,maka teknologi menjadi alat yang sangat dibutuhkan untuk penerapan KM. KM membutuhkan teknologi untuk memfasilitasi pengkomunikasian,kolaborasi dan isi untuk pengambilan,pembagian,penyebaran dan aplikasi pengetahuan. Knowledge Management : Capture and Creation Tools Liao (2003) mengklasifikasikan Teknologi KM menggunakan tujuh kategori,antara lain : KM Framework Knowledge-Based System(KBS) Data Mining Informasi dan Teknologi komunikasi Artificial Inteligence(AI)/Expert System (AS) Database Teknologi Modeling 3. Aplikasi Data Mining yang ada pada Knowledge Management Terdiri dari 3 Grup Utama : a. Knowledge Resources b. Knowledge Types c. Data Mining Techniques/ Aplication that used in KM A. Knowledge Resources Terbagi menjadi 8 grup dimana setiap pengetahuan dapat disimpan dan dapat dimanipulasi : a. Health Care Organization : Tools data mining digunakan untuk menjelajahi penyebab,operasi dan hubungan antar tumor. Alat ini digunakan untuk membangun KMS (Knowledge Management System) untuk mendukung ilmu pengobatan klinik yang dibutuhkan untuk meningkatkan kualitas perawatan. b. Retailing : Hal ini merupakan pengetahuan pelanggan yang berasal dari pelanggan rumahan untuk jalur barang dan masalah nama brand. Datamining dapat membantu dan mengajukan saran dan solusi untuk perusahaan perihal jalur produk dan masalah nama brand. Hal itu dapat dilakukan dengan cara meng ekstrak pengetahuan pasar dari pelanggan,brand,produk dan data pembelian untuk memenuhi permintaan pelanggan. c. Financial / Banking : Data mining dapat mendukung pengambilan keputusan institusi bank dan proses pembagian pengetahuan. d. Small and Middle Businesses(Perusahaan makanan dan Supply Chain nya) : Data mining dan Knowledge Management yang terintergrasi dapat membantu untuk pengambilan keputusan yang lebih baik. Seperti masalah Death-On-Arrival (DOA) yang ditemui didalam “Food Supply Chain Networks”. Lie et Al (2010) menyarankan untuk membangun Early Warning dan Proactive Control(EW/PC) untuk mengatasi masalah tersebut. Dasar Pengetahuan (Knowledge Base) adalah bagian yang penting dalam system EW/PC. Knowledge Base mengandung data analisis dari manajer dan perusahaan yang akan menjadi langkah yang tepat untuk manajer yang lainnya. e. Entrepreneurial Science Knowledge resource melakukan research asset didalam institusi pengetahuan. Ada tiga tipe dari Asset Research products Intellectual Capital Research program. Datamining memfasilitasi peng-ekstrakan pengetahuan membantu dalam menuntun manajer dalam menentukan strategi pada kompetisi organisasi yang berorientasikan pengetahuan. f. Business : Data didapatkan dari kuesionair dan literature yang intensif. Data mining dapat menemukan pola yang tersembunyi diantara KM dan performanya untuk penerapakan KM yang lebih baik kedepannya. g. Collaboration and Teamwork : Catatan kerja dan dokumen dari para pekerja di analisis untuk mengetahui kebiasaan refrensi dari tiap pekerja dan konstruksi aliran pengetahuan para pekerja. Teknik Data Mining dapat menggali secara dalam dan mengkonstruksikan prototype grup yang berbasiskan aliran pengetahuan menjadi grup yang berbasiskan tugas. h. Construction Industry : Sebuah bagian besar dari informasi perusahaan yang tersedia dalam bentuk format data textual. Hal ini mengaju pada penyebaran teknik penggalian text untuk menangani sumber informasi textual untuk menemukan pengetahuan industrial dan solusi manajemen. B. Knowledge Types Tipe pengetahuan dalam 8 hunian organisasi untuk proses kolaborasi Data Mining didalam pembuatan pengetahuan. a. Health-Care System Domain : Terdiri dari 3 database utama ; Database pengembang Health-care Database statistic pasien health-care yang sudah keluar Database status medical. b. Construction Industry Domain Sebuah sample dataset yang ada didalam Post Project Reviews digunakan sebagai penentu baik atau buruk nya informasi yang ada c. Retailing Domain Data pelanggan dan produk yang sudah dibeli di kumpulkan dan di simpan didalam database untuk menentukan kebiasaan pembelian pelanggan perilaku para pelanggan yang mempengaruhi jalur produk dan ekstensi merk atau tidak. d. Financial Domain Terdapat dua kumpulan data yang ada pada financial domain,yaitu : Untuk medefinisikan rating dari obligasi,kumpulan pengetahuan mengandung data string,model,parameter dan laporan dari tiap pembelajaran analisis Untuk memprediksi pergantian rating obligasi,kelompok fitur data dari obligasi seperti model parameter yang disimpan,diklasifikasikan,dan di terima untuk pem-prediksian rating. e. Small and Middle businesses Modelling Domain Untuk menyelsaikan masalah yang ada pada jaringan rantai pasokan, Lie et al(2010) mengembangkan prototype EW/PC yang digabungkan dengan beberapa komponen utama,yaitu : Pengetahuan dasar Pengklasifikasian tugas dan template pendekatan User Interface. f. Research Assets Domain Menurut Cantu & Cellbos(2010) berfokus dalam mengelola Asset Knowledge dengan penerapan jaringan informasi. Platform ini mengandung tiga komponen penelitian produk,sumberdaya manusia atau intellectual capital serta program penelitian. g. Business Domain Terdapat dua tipe atribut pengetahuan,yaitu : atribut kondisi dan atribut pengambilan keputusan. h. Collaboration and Teamwork Domain Aliran dari tipe pengetahuan dideterminasikan untuk menentukan kebutuhan dari para pekerja. Untuk mengumpulkan aliran pengetahuan dokumen yang terdapat didalam sekumpulan data dikategorikan kedalam delapan kelompok dengan pendekatan data mining. C. Data Mini Techniques / Aplication used in knowledge Management Beberapa Teknik yang ada : a. Classification Klasifikasi adalah salah satu hal yang paling umum untuk dipelajari didalam Data Mining. Tugas utama dalam pengklasifikasian adalah dengan pemetaan sebuah data kedalam beberapa kelas yang telah dikenal. b. Clustering Hal ini melibatkan pencarian untuk mengidentifikasi sekumpulan kategori yang terbatas dan pengelompokan beberapa objek yang sama ke objek yang seharusnya berada di kelompok yang lainnya. c. Depedency Modeling Hal ini berfokus pada menemukan sebuah model yang dapat mendeskripsikan secara signifikan hubungan antar kumpulan atribut. Referensi International Journal of Data Mining & Knowledge Management Process (IJDKP) Vol.2, No.5, September 2012