DATA AND INFORMATION MANAGEMENT TIM DOSEN MATRIKULASI TI-S1 FAKULTAS ILMU KOMPUTER UNIVERSITAS DIAN NUSWANTORO OUTLINE DATA - DEFINISI PERKEMBANGAN DATA POTENSI BIG DATA DATA MINING APLIKASI DATA MINING DATA | INFORMASI - PENGETAHUAN Data : sesuatu yang belum mempunyai arti bagi penerimanya jadi hanya berupa fakta-fakta yang belum diolah. Data adalah sekumpulan fakta yang dapat berupa angka, huruf, gambar, dan gambar bergerak yang belum mempunyai arti / makna. Informasi : hasil pengolahaan dari sebuah model, formasi, dll. jadi informasi adalah Data yang sudah diolah dan mempunyai maksud tertentu. Pengetahuan : adalah informasi yang diketahui atau disadari dari seseorang. Pengetahuan juga merupakan hasil analisis seseorang dari sebuah informasi. jadi Pengetahuan merupakan informasi yang sudah dianalisis sebelumnya untuk menghasilkan fakta yang akurat dan teruji. Data – Informasi – Pengatahuan Data Informasi Pengetahuan: Jadi dari informasi diatas bisa kita ketahui bahwa blog saya telah dikunjungi oleh orang lain dengan menggunakan berbagai browser, dengan informasi diatas kita bisa mengetahui perbanding diantaranya, dan kita bisa mengambil sikap untuk mencari tahu kenapa perbandingan itu bisa terjadi. DATA | INFORMASI - PENGETAHUAN Contoh 1 : Pengguna Laptop Merek ASUS di Indonesia Data : angka banyaknya pengguna laptop ASUS di Indonesia Informasi : Jumlah pengguna laptop ASUS di Indonesia Pengetahuan : Berdasarkan informasi jumlah pengguna, kita mengetahui laptop ASUS di Indonesia adalah laptop terlaris di Indonesia dibandingkan laptop merek lain. DATA | INFORMASI - PENGETAHUAN Contoh 2 : Gunung Meletus di Indonesia Data : angka banyaknya gunung meletus di Indonesia selama satu tahun Informasi : Frekuensi rata-rata terjadi gunung meletus di Indonesia selama satu tahun Pengetahuan : Berdasarkan informasi diketahui bahwa, di Indonesia memiliki frekuensi gunung meletus terbesar di Asia Tenggara. DATA | INFORMASI - PENGETAHUAN Contoh 3 : Pengguna Smartphone di Indonesia Data : angka banyaknya pengguna smartphone di Indonesia Informasi : Jumlah pengguna Smartphone di Indonesia Pengetahuan : Berdasarkan informasi jumlah pengguna, kita mengetahui bahwa pengguna smartphone di Indonesia adalah pengguna paling banyak dibandingkan Handphone versi lainnya. PERKEMBANGAN DATA Pada tahun 2000 – 2013 pertumbuhan dan perkembangan data menjadi sangat pesat, hal ini juga didukung dengan berbagai penelitian dan produk hardware khususnya media storage (media penyimpanan misal: hardisk), yang bertambah tahun kapasitasnya semakin meningkat, bahkan diikuti dengan harga yang semakin terjangkau. PERKEMBANGAN DATA Beberapa fakta mengenai perkembangan data (Budi Santoso, 2009): Very Long Baseline Interferometry (VLBI) sebuah badan antariksa Eropa yang memiliki 16 Teleskop untuk penelitian mereka, dalam tiap detiknya mampu menghasilkan data sampai sebesar 1 Gigabit untuk setiap teleskopnya. Sehingga total data untuk semua teleskopnya mencapai 16 Gigabit/detik. AT&T sebuah perusahaan operator telepon di Eropa (Telkomsel, Indosat, kalau di Indonesia), setiap harinya harus berurusan dengan milyaran panggilan telepon. Pada tahun 2003 Winter Corp melakukan survey ukuran data yang digunakan di berbagai perusahaan telepon, diantaranya: France Telecom mempunyai Database Decision Support dengan ukuran data mencapai 30 Terrabytes, sedangkan perusahaan AT&T memiliki data sebesar 26 Terabyte. Google Corp. dengan anak perusahaannya Google Search mencapai milyaran pages (halaman), dimana besaran datanya sekitar ratusan Terabyte. Pada tahun 2003 UC Berkeley mengestimasi data yang dihasilkan pada tahun 2002 mencapai 5 exabytes (5 juta terabytes). BIG DATA Facebook Server Vs Google Server Salah satu server Google di Council Bluffs, Iowa, yang menyediakan lebih dari 115.000 kaki persegi ruang untuk server menjalankan layanan seperti Search dan YouTube. Facebook sekarang diperkirakan sudah mencapai 180.900 server computer. http://content.time.com/time/photogallery/0,29307,203692 8_2218542,00.html http://www.daeindologistics.com/FrmArticle.aspx?title=Berkunjung %20ke%20Server%20Pusat%20Data%20Google POTENSI BIG DATA Big Data adalah sebuah teknologi baru di dunia teknologi informasi dimana memungkinan proses pengolahan, penyimpanan dan analisis data dalam beragam bentuk/format, berjumlah besar dan pertambahan data yang sangat cepat GROUP ASSIGNMENT PLEASE CREATE SEVERAL GROUP (PER GROUP CONSIST OF MAX. 5 PERSON) DISCUSS WITH TOPIC : DATA & INFORMATION, DEVELOPMENT IN THE NEXT DECADE SUBMITT YOUR WORK ON PAPER, WITH FORMAT: TITLE – MEMBERS GROUP OUTLINE – CONTENT REFERENCES PRESENT YOUR WORK WITHIN 5 MINUTES. THE ASESSMENT OF YOUR WORK INCLUDE : RELIABLE INFORMATION 50% PRESENTATION TECHNIQUE 50% TIME DURATION FOR DISCUSSING 30 MINUTES From Data to Data Mining Decision Models Decision Support Data Mining Preprocessing Database Knowledge Information Data DATA MINING Beberapa fakta tentang pesatnya perkembangan data menjadikan perhatian besar bagi para peneliti, para analisis data, manajer perusahaan dan semua orang yang memiliki keterkaitan dengan kepentingan pengolahan data. Salah satu teknologi yang muncul dari pesatnya perkembangan data dan kepentingan untuk memanfaatkan besarnya data tadi adalah Data Mining. DATA MINING |DEFINISI PAKAR Ian H. Witten, seorang profesor di fakultas computer science Universitas Waikato di New Zaeland mengatakan dalam bukunya Data Mining adalah suatu proses yang bertujuan untuk menemukan pola secara otomatis atau semi otomatis dari data yang sudah ada di dalam data warehouse (gudang basis data) yang dimanfaatkan untuk menyelesaikan suatu permasalahan yang memiliki nilai manfaat, umumnya dalam segi ekonomi (Witten, 2011). Data mining adalah suatu proses untuk menemukan hubungan baru dengan cara memilah-milah data yang sudah ada di dalam database menggunakan teknologi pengenalan pola dan statistik (Larose, 2005). Machine Learning Artificial Intelligence Data Mining Statistics Pattern Recognition DATA MINING |DEFINISI & TUJUAN Machine Learning Dari beberapa pengertian data mining yang dikemukakan oleh beberapa pakar, dapat kita simpulkan beberapa point mengenai apa itu data mining, Sebuah disiplin ilmu yang terbentuk dari irisan beberapa disiplin ilmu, diantaranya ilmu statistic, kecerdasan buatan, machine learning, dan basis data. Artificial Intelligence Data Mining Adanya data besar yang akan diolah dan dianalisa untuk dicari pola hubungan antar atributnya sehingga mengasilkan sebuah knowledge atau representasi pengetahuan. Tujuan analisa data adalah untuk menghasilkan pengetahuan yang akan digunakan untuk pendukung keputusan bagi sebuah instansi atau perusahaan. Statistics Pattern Recognition DATA MINING |STANDAR PROSES 1. Pemahaman Bisnis(Business Understanding) Merupakan tahap awal yaitu pemahaman penelitian, penentuan tujuan dan rumusan masalah data mining. 2. Pemahaman Data(Data Understanding) Dalam tahap ini dilakukan pengumpulan data, mengenali lebih lanjut data yang akan digunakan. 3. Pengolahan Data(Data Preparation) Tahap ini adalah pekerjaan yang perlu dilaksanakan secara intensif. Memilih kasus atau variable yang ingin dianalisis, melakukan perubahan pada beberapa variable jika diperlukan sehingga data siap untuk dimodelkan. Gambar 2.1. Siklus CRISP-DM (Larose, 2005). DATA MINING |STANDAR PROSES 4. Pemodelan(Modeling) Memilih teknik pemodelan yang sesuai dan sesuaikan aturan model untuk hasil yang maksimal. Dapat kembali ke tahap pengolahan untuk menjadikan data ke dalam bentuk yang sesuai dengan model tertentu. 5. Evaluasi (Evaluation) Mengevaluasi satu atau model yang digunakan dan menetapkan apakah terdapat model yang memenuhi tujuan pada tahap awal. Kemudian menentukan apakah ada permasalahan yang tidak dapat tertangani dengan baik serta mengambil keputusan hasil penelitian. 6. Penyebaran (Deployment) Menggunakan model yang dihasilkan seperti pembuatan laporan atau penerapan proses data mining pada departemen lain. Gambar 2.1. Siklus CRISP-DM (Larose, 2005). APLIKASI PEMANFAATAN BIG DATA DENGAN DATA MINING OLAP (Online Analytical Processing) Big Data Business Intelligent Decision Support System Decision Support Data Analytics Sentiment Analysis Opinian Mining Text Mining Data Mining Business Intelligence Data Mining Customer Relationship Management It is all about data … Financial Institutions DATA MINING APPLICATION Beberapa permasalahan dalam berbagai aspek kehidupan (pendidikan, ekonomi, kesehatan, dll) yang memanfaatkan teknologi data mining dalam pemecahannya diantaranya adalah : Memprediksi ketepatan waktu lulus seorang mahasiwa, dari history data nilai indeks prestasi kumulatifnya (IPK) pada semester 1 sampai dengan semester 4. Memprediksi harga saham pada sebuah perusahaan pialang saham, untuk menentukan apakah akan membeli atau menjual saham, berdasarkan data-data ekonomi dan performa perusahaan dalam beberapa bulan terakhir. Memprediksi penyakit jantung seorang pasien, berdasarkan catatan-catatan medis pasien. Menentukan apakah seorang pelanggan sebuah perusahaan operator telepon seluler memiliki potensi atau kecenderungan untuk berganti layanan ke operator lain atau tidak. Memutuskan apakah seorang nasabah Bank layak diberikan privilege untuk mendapatkan fasilitas pinjaman kredit ataukah tidak layak berdasarkan catatan transaksi dan data diri nasabah. Dalam binis retail, pasangan barang apakah yang dapat direkomendasikan untuk juga dibeli oleh seorang pelanggan jika sebelumnya telah membeli produk Susu atau Softdrink? , sehingga dapat meningkatkan trafik penjualan barang. INDIVIDUAL ASSIGNMENT Buatlah sebuah essay artikel tentang Data Mining dan Perkembangannya Artikel memuat contoh-contoh pemanfaatan data mining dengan big data Tugas Dikumpulkan via EDMUDO dengan tajuk Assignment “Data Mining” paling lambat tanggal 7 Agustus 2015 Jam 10.00 WIB Question and Answer