Manajemen Data dan Informasi - Universitas Dian Nuswantoro

advertisement
DATA AND INFORMATION
MANAGEMENT
TIM DOSEN MATRIKULASI TI-S1
FAKULTAS ILMU KOMPUTER
UNIVERSITAS DIAN NUSWANTORO
OUTLINE
 DATA - DEFINISI
 PERKEMBANGAN DATA
 POTENSI BIG DATA
 DATA MINING
 APLIKASI DATA MINING
DATA | INFORMASI - PENGETAHUAN
 Data : sesuatu yang belum mempunyai arti bagi penerimanya jadi
hanya berupa fakta-fakta yang belum diolah. Data adalah
sekumpulan fakta yang dapat berupa angka, huruf, gambar, dan
gambar bergerak yang belum mempunyai arti / makna.
 Informasi : hasil pengolahaan dari sebuah model, formasi, dll. jadi
informasi adalah Data yang sudah diolah dan mempunyai maksud
tertentu.
 Pengetahuan : adalah informasi yang diketahui atau disadari dari
seseorang. Pengetahuan juga merupakan hasil analisis seseorang dari
sebuah informasi. jadi Pengetahuan merupakan informasi yang sudah
dianalisis sebelumnya untuk menghasilkan fakta yang akurat dan teruji.
Data – Informasi – Pengatahuan
Data
Informasi
Pengetahuan:
Jadi dari informasi diatas bisa kita ketahui bahwa blog saya telah dikunjungi
oleh orang lain dengan menggunakan berbagai browser, dengan informasi
diatas kita bisa mengetahui perbanding diantaranya, dan kita bisa mengambil
sikap untuk mencari tahu kenapa perbandingan itu bisa terjadi.
DATA | INFORMASI - PENGETAHUAN
Contoh 1 : Pengguna Laptop Merek ASUS di Indonesia
 Data : angka banyaknya pengguna laptop ASUS di Indonesia
 Informasi : Jumlah pengguna laptop ASUS di Indonesia
 Pengetahuan : Berdasarkan informasi jumlah pengguna, kita
mengetahui laptop ASUS di Indonesia adalah laptop terlaris
di Indonesia dibandingkan laptop merek lain.
DATA | INFORMASI - PENGETAHUAN
Contoh 2 : Gunung Meletus di Indonesia
 Data : angka banyaknya gunung meletus di
Indonesia selama satu tahun
 Informasi : Frekuensi rata-rata terjadi gunung
meletus di Indonesia selama satu tahun
 Pengetahuan : Berdasarkan informasi
diketahui bahwa, di Indonesia memiliki
frekuensi gunung meletus terbesar di Asia
Tenggara.
DATA | INFORMASI - PENGETAHUAN
Contoh 3 : Pengguna Smartphone di Indonesia
 Data : angka banyaknya pengguna
smartphone di Indonesia
 Informasi : Jumlah pengguna Smartphone di
Indonesia
 Pengetahuan : Berdasarkan informasi jumlah
pengguna, kita mengetahui bahwa pengguna
smartphone di Indonesia adalah pengguna
paling banyak dibandingkan Handphone versi
lainnya.
PERKEMBANGAN DATA
 Pada tahun 2000 – 2013 pertumbuhan dan
perkembangan data menjadi sangat pesat,
hal ini juga didukung dengan berbagai
penelitian dan produk hardware khususnya
media storage (media penyimpanan misal:
hardisk), yang bertambah tahun
kapasitasnya semakin meningkat, bahkan
diikuti dengan harga yang semakin
terjangkau.
PERKEMBANGAN DATA
Beberapa fakta mengenai perkembangan data (Budi Santoso, 2009):
 Very Long Baseline Interferometry (VLBI) sebuah badan antariksa Eropa yang memiliki 16
Teleskop untuk penelitian mereka, dalam tiap detiknya mampu menghasilkan data sampai
sebesar 1 Gigabit untuk setiap teleskopnya. Sehingga total data untuk semua teleskopnya
mencapai 16 Gigabit/detik.
 AT&T sebuah perusahaan operator telepon di Eropa (Telkomsel, Indosat, kalau di Indonesia),
setiap harinya harus berurusan dengan milyaran panggilan telepon.
 Pada tahun 2003 Winter Corp melakukan survey ukuran data yang digunakan di berbagai
perusahaan telepon, diantaranya: France Telecom mempunyai Database Decision Support
dengan ukuran data mencapai 30 Terrabytes, sedangkan perusahaan AT&T memiliki data
sebesar 26 Terabyte.
 Google Corp. dengan anak perusahaannya Google Search mencapai milyaran pages
(halaman), dimana besaran datanya sekitar ratusan Terabyte.
 Pada tahun 2003 UC Berkeley mengestimasi data yang dihasilkan pada tahun 2002 mencapai
5 exabytes (5 juta terabytes).
BIG DATA
Facebook Server
Vs
Google Server
Salah satu server Google di Council Bluffs, Iowa,
yang menyediakan lebih dari 115.000 kaki persegi
ruang untuk server menjalankan layanan seperti
Search dan YouTube.
Facebook sekarang diperkirakan sudah mencapai
180.900 server computer.
http://content.time.com/time/photogallery/0,29307,203692
8_2218542,00.html
http://www.daeindologistics.com/FrmArticle.aspx?title=Berkunjung
%20ke%20Server%20Pusat%20Data%20Google
POTENSI BIG DATA
Big Data adalah sebuah teknologi baru
di dunia teknologi informasi dimana
memungkinan proses pengolahan,
penyimpanan dan analisis data dalam
beragam bentuk/format, berjumlah
besar dan pertambahan data yang
sangat cepat
GROUP ASSIGNMENT
 PLEASE CREATE SEVERAL GROUP (PER GROUP
CONSIST OF MAX. 5 PERSON)
 DISCUSS WITH TOPIC : DATA & INFORMATION,
DEVELOPMENT IN THE NEXT DECADE
 SUBMITT YOUR WORK ON PAPER, WITH FORMAT:
 TITLE – MEMBERS GROUP
 OUTLINE – CONTENT
 REFERENCES
 PRESENT YOUR WORK WITHIN 5 MINUTES.
 THE ASESSMENT OF YOUR WORK INCLUDE :
 RELIABLE INFORMATION 50%
 PRESENTATION TECHNIQUE 50%
 TIME DURATION FOR DISCUSSING 30 MINUTES
From Data to Data Mining
Decision Models
Decision Support
Data Mining
Preprocessing
Database
Knowledge
Information
Data
DATA MINING
 Beberapa fakta tentang
pesatnya perkembangan data
menjadikan perhatian besar
bagi para peneliti, para analisis
data, manajer perusahaan dan
semua orang yang memiliki
keterkaitan dengan
kepentingan pengolahan data.
 Salah satu teknologi yang
muncul dari pesatnya
perkembangan data dan
kepentingan untuk
memanfaatkan besarnya data
tadi adalah Data Mining.
DATA MINING |DEFINISI PAKAR
 Ian H. Witten, seorang profesor di fakultas
computer science Universitas Waikato di New
Zaeland mengatakan dalam bukunya Data
Mining adalah suatu proses yang bertujuan
untuk menemukan pola secara otomatis atau
semi otomatis dari data yang sudah ada di
dalam data warehouse (gudang basis data)
yang dimanfaatkan untuk menyelesaikan
suatu permasalahan yang memiliki nilai
manfaat, umumnya dalam segi ekonomi
(Witten, 2011).
 Data mining adalah suatu proses untuk
menemukan hubungan baru dengan cara
memilah-milah data yang sudah ada di
dalam database menggunakan teknologi
pengenalan pola dan statistik (Larose, 2005).
Machine
Learning
Artificial
Intelligence
Data
Mining
Statistics
Pattern
Recognition
DATA MINING |DEFINISI & TUJUAN
Machine
Learning
Dari beberapa pengertian data mining yang
dikemukakan oleh beberapa pakar, dapat kita
simpulkan beberapa point mengenai apa itu data
mining,
 Sebuah disiplin ilmu yang terbentuk dari irisan
beberapa disiplin ilmu, diantaranya ilmu statistic,
kecerdasan buatan, machine learning, dan basis
data.
Artificial
Intelligence
Data
Mining
 Adanya data besar yang akan diolah dan
dianalisa untuk dicari pola hubungan antar
atributnya
sehingga
mengasilkan
sebuah
knowledge atau representasi pengetahuan.
 Tujuan analisa data adalah untuk menghasilkan
pengetahuan yang akan digunakan untuk
pendukung keputusan bagi sebuah instansi atau
perusahaan.
Statistics
Pattern
Recognition
DATA MINING |STANDAR PROSES
1. Pemahaman Bisnis(Business Understanding)
 Merupakan tahap awal yaitu pemahaman penelitian,
penentuan tujuan dan rumusan masalah data mining.
2. Pemahaman Data(Data Understanding)
 Dalam tahap ini dilakukan pengumpulan data, mengenali
lebih lanjut data yang akan digunakan.
3. Pengolahan Data(Data Preparation)
 Tahap ini adalah pekerjaan yang perlu dilaksanakan secara
intensif. Memilih kasus atau variable yang ingin dianalisis,
melakukan perubahan pada beberapa variable jika
diperlukan sehingga data siap untuk dimodelkan.
Gambar 2.1. Siklus CRISP-DM (Larose, 2005).
DATA MINING |STANDAR PROSES
4. Pemodelan(Modeling)
 Memilih teknik pemodelan yang sesuai dan sesuaikan aturan
model untuk hasil yang maksimal. Dapat kembali ke tahap
pengolahan untuk menjadikan data ke dalam bentuk yang
sesuai dengan model tertentu.
5. Evaluasi (Evaluation)
 Mengevaluasi satu atau model yang digunakan dan
menetapkan apakah terdapat model yang memenuhi tujuan
pada tahap awal. Kemudian menentukan apakah ada
permasalahan yang tidak dapat tertangani dengan baik
serta mengambil keputusan hasil penelitian.
6. Penyebaran (Deployment)
 Menggunakan model yang dihasilkan seperti pembuatan
laporan atau penerapan proses data mining pada
departemen lain.
Gambar 2.1. Siklus CRISP-DM (Larose, 2005).
APLIKASI PEMANFAATAN BIG DATA DENGAN DATA MINING
 OLAP (Online Analytical Processing)
Big Data
 Business Intelligent
 Decision Support System
Decision
Support
Data Analytics
 Sentiment Analysis
 Opinian Mining
 Text Mining
 Data Mining
Business
Intelligence
Data
Mining
Customer
Relationship
Management
It is all about data …
Financial Institutions
DATA MINING APPLICATION
Beberapa permasalahan dalam berbagai aspek kehidupan (pendidikan, ekonomi, kesehatan, dll)
yang memanfaatkan teknologi data mining dalam pemecahannya diantaranya adalah :
 Memprediksi ketepatan waktu lulus seorang mahasiwa, dari history data nilai indeks prestasi
kumulatifnya (IPK) pada semester 1 sampai dengan semester 4.
 Memprediksi harga saham pada sebuah perusahaan pialang saham, untuk menentukan
apakah akan membeli atau menjual saham, berdasarkan data-data ekonomi dan performa
perusahaan dalam beberapa bulan terakhir.
 Memprediksi penyakit jantung seorang pasien, berdasarkan catatan-catatan medis pasien.
 Menentukan apakah seorang pelanggan sebuah perusahaan operator telepon seluler memiliki
potensi atau kecenderungan untuk berganti layanan ke operator lain atau tidak.
 Memutuskan apakah seorang nasabah Bank layak diberikan privilege untuk mendapatkan
fasilitas pinjaman kredit ataukah tidak layak berdasarkan catatan transaksi dan data diri
nasabah.
 Dalam binis retail, pasangan barang apakah yang dapat direkomendasikan untuk juga dibeli
oleh seorang pelanggan jika sebelumnya telah membeli produk Susu atau Softdrink? ,
sehingga dapat meningkatkan trafik penjualan barang.
INDIVIDUAL ASSIGNMENT
 Buatlah sebuah essay artikel tentang Data Mining dan Perkembangannya
 Artikel memuat contoh-contoh pemanfaatan data mining dengan big data
 Tugas Dikumpulkan via EDMUDO dengan tajuk Assignment “Data Mining” paling lambat
tanggal 7 Agustus 2015 Jam 10.00 WIB
Question and Answer
Download