ANALISIS PERUBAHAN KELOMPOK BERDASARKAN PERUBAHAN NILAI JUAL PADA BLOOMBERG MARKET DATA DENGAN MENGGUNAKAN FORMAL CONCEPT ANALYSIS Dyah Anggraini Universitas Gunadarma, Jl. Margonda Raya No. 100, Pondok Cinia – Depok 16424 ([email protected]) ABSTRAK Para pelaku bisnis memiliki kebutuhan-kebutuhan untuk memanfaatkan gudang data yang sudah dimiliki untuk pengambilan keputusan. Salah satunya adalah perubahan nilai jual pada kelompok komoditi dalam pasar dunia karena sangat mempengaruhi dalam rumah tangga perusahaan maupun pasar. Teknologi yang menjawab kebutuhan ini, yaitu data mining. Bloomberg penyedia data, berita dan analitika untuk pasar keuangan yang mendunia terutama data nilai jual kelompok komoditi dunia yang bersifat terbuka dan diinformasi secara online serta uptodate. Dan data Bloomberg ini digunakan sebagai media informasi diberbagai kantor berita negara salah satunya kantor berita Antara sebagai kantor berita Indonesia. Alat yang digunakan adalah Lattice Miner, merupakan salah satu tools dari formal concept analysis prototype untuk membuat, memvisualisasikan dan mengeksplor konsep Lattice. Dengan Laticce Miner memungkinkan digeneralisasinya formal concepts and association rules sebagai salah satu konsep data mining. Dalam penulisan ini menggunakan tingkat confidence adalah 100%. Dengan formal context mendefinisikan 5 objek dan 24 kelompok komoditi sebagai atribut. Hasil dari penelitian ini menggunakan Association rules yang dihasilkan dari formal concept dan context lattice berjumlah 788 rules, dengan confidence 100% dan formal concept dari 4 periode waktu menghasilkan 24 rules. Kata kunci : Formal Context, Formal Concept, Lattice Miner PENDAHULUAN Para pelaku bisnis memiliki kebutuhan-kebutuhan untuk memanfaatkan gudang data yang sudah dimiliki, teknologi yang menjawab kebutuhan ini, yaitu data mining. Sejarah Data mining bukanlah suatu bidang yang sama sekali baru. Data mining mewarisi banyak aspek dan teknik dari bidang-bidang ilmu yang sudah mapan terlebih dulu. data mining memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik, basis data dan juga information retrieval. Hasil utama dari data mining adalah untuk membuat prediksi dan deskripsi. Prediksi menggunakan beberapa variabel atau field-field basis data untuk memprediksi 1 nilai-nilai variabel masa mendatang yang diperlukan, yang belum diketahui saat ini. Deskripsi berfokus pada penemuan pola-pola tersembunyi dari data yang ditelaah. Data Mining dapat digunakan untuk mengekstrak knowledge yang tersembunyi didalam sebuah database yang besar. Knowledge yang di esktrak merupakan hasil analisa yang biasanya di lakukan oleh manusia. Sangatlah sulit menganalisa data dari seluruh atribut yang ada pada suatu data set yang besar, sehingga komputer sangat dibutuhkan untuk menganalisa data set tersebut secara otomatis namun tetap mempertahankan apek pola pikir manusia (Machine Learning). Salah satu teknik yang digunakan dalam data mining adalah Formal Concept Analysis. Formal Concept Analysis dapat diterapkan di berbagai bidang; psychology, sociology, anthropology, medicine, biology, linguistics, computer sciences, mathematics dan industrial engineering [11]. Dengan FCA data set akan diuraikan menjadi elemenelemen data yang akan dicek keterhubungannya menjadi assosiation rule. Assosiation rule merupakan suatu metode yang digunakan untuk menganalisa keterhubungan antara variables (atribut-atribut) dari suatu data set yang besar. Dalam bidang ekonomi, data mining dapat diterapkan untuk menganalisa pasar dan manajemen serta digunakan untuk menganalisa perusahaan dan manajemen resiko. Beberapa solusi analisa pasar dan manajemen yang dapat diselesaikan dengan data mining adalah menebak target pasar, melihat pola beli pamakai dari waktu ke waktu, cross market analysis, profil customer, identifikasi kebutuhan customer, menilai loyalitas customer, informasi summary. Sedangkan bagi bidang analisa perusahaan dan manajemen resiko, data mining digunakan untuk merencanakan keuangan dan evaluasi asset, merencanakan sumber daya (resources planning) dan memonitor persaingan (kompetisi). Dalam penulisan ini kasus yang akan diteliti adalah perubahan nilai penjualan terhadap kelompok komoditi dunia yang dirangkum oleh bloomberg New York. Perubahan nilai jual pada kelompok komoditi pada pasar dunia, bagi para pelaku bisnis sangat berpengaruh dalam pengambilan keputusan untuk menentukan strategi bisnis. Karena hal ini akan mempengaruhi rumah tangga perusahaan dan pasar. Bloomberg adalah penyedia berita keuangan dan informasi 24 jam terbesar di dunia yang menyediakan data harga, data keuangan, berita perdagangan berikut dengan ulasan analisa termasuk berita umum dan olah raga. Akan tetapi yang menjadi permasalahan adalah data-data yang terdapat didalam bloomberg tidak menjelaskan keterhubungan antara perubahan pada tiap-tiap kelompok komoditinya, seperti contohnya kenaikan harga minyak mentah apakah akan mempengaruhi nilai dari gas alam. Data yang terdapat di dalam website Bloomberg selalu berubah setiap saat. Berdasarkan perubahan inilah yang akan dianalisa pada penelitian ini.Data yang diambil adalah data nilai penjualan kelompok komoditi pada Bloomberg periode dari tanggal 27 Januari 2009 jam 02.40, 28 Januari 2009 jam 10.10, 28 Januari 2009 jam 14.55 dan 29 Januari 2009 jam 06.55. Data tersebut didapat secara online dari http://www.bloomberg.com/markets/commodities/cfutures.html. Data – data tersebut akan diolah dengan menggunakan salah satu tools yaitu Lattice Miner dengan menggunakan Market Basket Analysis, Formal Concept Analysis dan Association Rules. Hasil akhir dari penelitian ini adalah list rules kelompok komoditi berdasarkan perubahan nilai jual yang berpengaruh terhadap para pelaku bisnis. 2 TINJAUAN PUSTAKA Sekilas Tentang Data Mining Data Mining telah menarik perhatian industri informasi dan masyarakat pada tahun tahun terakhir ini, hal ini disebabkan oleh ketersediaan data yang sangat besar dan kebutuhan untuk mengubah data menjadi informasi dan pengetahuan yang bermanfaat [5]. Data Mining umumnya didefinisikan sebagai pola penemuan pada himpunan data kasar dalam jumlah yang besar sehingga beberapa pengetahuan yang tersembunyi didalam data tersebut dapat ditemukan. Data mining dianggap sebagai langkah utama dalam proses penemuan pengetahuan di dalam database (KDD). Gambar 1. Menunjukkan proses penemuan pengetahuan ini. Proses penemuan pengetahuan merupakan rangkaian dari langkah-langkah berikut ini: 1. 2. 3. 4. 5. Data cleaning and integration: Data cleaning berarti memindahkan noise dan data yang tidak konsisten dan menangani data yang hilang. Tujuan dari integrasi data ini adalah untuk memadukan data yang berasal dari sumber data yang berbeda (database yang berbeda, flat files). Data selection and transformation: Data selection adalah tugas untuk memperoleh data yang relevan sampai ke tahap analisis dan transformasi data yang bertujuan untuk mentransformasikan data sampai ke bentuk yang sesuai untuk proses mining. Data Mining: Data Mining adalah langkah utama dalam penemuan knowledge dan tujuan dari data mining adalah untuk mengekstrak pola data dengan cara menerapkan algoritma intelligent. Pattern Evaluation: Pada langkah ini beberapa ukuran diterapkan untuk mengevaluasi pola dan mengidentifikasi pola yang sangat menarik. Knowledge Presentation: Tujuan dari langkah ini adalah untuk memvisualisasikan pola yang digali sampai kepada end user dalam bentuk yang sesuai dan bermanfaat. Knowledge Pattern Evaluation Data Mining Patterns Task-relevant Data Selection Data Cleaning Data Warehouse Data Integration Databases Gambar 1.Data Mining as a step in the process of knowledge discovery Metode Data Mining Secara umum, metode data mining dapat diklasifikasikan kedalam 2 pendekatan: pendekatan supervised dan pendekatan non-supervised, tergantung dari pengetahuan global mana dari data itu yang digunakan atau tidak. Pendekatan supervised berasumsi bahwa representasi data parametric sudah diketahui sebelumnya dan tugas data mining yang terkait menjadi masalah dalam estimasi parameter. Pendekatan non-supervised sangat tergantung pada analisa keseringan atau prakiraan data di dalam identifikasi pola, misalnya, association rule mining merupakan salah satu dari contoh yang mewaliki analisa statistic co-occurrrence dari atribut dalam repository 3 data (misalnya database relational). Hal utama pada pendekatan supervised dan nonsupervised ini adalah kemampuannya didalam meninterpolasi ke data training. Untuk data clustering, seperti clustering dokumen, umumnya menggunakan metode supervised seperti k-means [5], ketika seseorang mengambil pendekatan supervised untuk menunjukan himpunan data dengan sebuah model yang sangat kompleks, proses estimasi parameter-parameter ini akan membutuhkan waktu yang lama bahkan terkadang menyebabkan menjadi tidak terlihat. Oleh karena itu, mengontrol kompleksitas model secara tepat menjadi sangat penting [5]. Dalam thesis ini, pendekatan non-supervised untuk proses data mining dengan Formal Concept Analysis digunakan. Tugas Data Mining Tugas yang paling umum didalam data mining adalah classification, clustering dan association rules mining. Classification adalah proses menemukan sebuah model yang menggambarkan dan membedakan kelas data atau konsep, dengan cara ini, sesorang akan mampu menggunakan model ini untuk memprediksi kelas obyek yang label kelas nya tidak diketahui. Algoritma klasifiksai yang umum meliputi klasifikasi dengan decision tree induction dan neural network. Clustering, merupakan sebuah klasifikasi dengan kelas yang tidak didefinisikan sebelumnya sehingga algoritmanya akan mengelompokan obyek yang sama secara bersamaan berdasarkan prinsip maximizing persamaan intraclass dan miminizing persamaan interclass. Algoritma yang umum digunakan clustering ini meliputi k-means dan k- medoids. Association rule mining terdiri dari proses pencarian keterhubungan hubungan antar variable. Misalnya, sebuah supermarket akan mengumpulkan data yang akan dibeli oleh setiap pelanggaan. Dengan menggunakan association rule learning supermarket tersebut dapat menentukan produk mana yang sering dibeli oleh pelanggan. Hal ini sangat bermanfaat dalam bidang pemasaran, dan sering disebut dengan “market basket analysis “. Association rule Misalnya A merupakan himpunan dari item (himpunan item disebut sebagai item set) dan D merupakan database transaksi, dimana setiap transaksi T bersifat unik dan berisi himpunan item (T adalah subset dari A). Association rule ini merupakan hubungan asosiasi dari bentuk XY dimana X A, Y A dan X Y =. Support dari aturan XY ini didefinisikan sebagai prosentasi transaksi yang berisi X dan Y didalam D. Confidence dari aturan XY definisikan sebagai prosentasi transaksi yang mengandung X dan juga mengandung Y didalam D. Jika aturan memiliki 90% confidence maka ini berarti 90% dari item set mengandung X dan juga mengandung Y. Tugas dari association rule mining ini untuk menemukan semua aturan strong association rule yang memenuhi threshold minimum support (min_sup) dan threshold confidence minimum (min_conf). Mining association rule terdiri dari 2 fase. 1. Semua item set yang sering muncul yang memenuhi min_sup dapat ditemukan 2. Fase kedua, strong association rule diperoleh dari item set yang sering muncul yang ditemukan di fase pertama. Kebanyakan penelitian hanya 4 mempertimbangkan fase pertama saja hal ini disebabkan ketika item set dapat ditemukan, maka mining association rule menjadi sangat mudah. Dengan kata lain , dalam term probability, sebuah support merupakan probabilitas pada suatu transaksi yang mengandung X Y dan sebuah confidence adalah conditional probability dimana suatu transaksi yang memiliki X juga mengandung Y. Pernyataan tersebut dapat ditulis dengan: Support(XY) = P(X Y) Confidence (XY) = P (Y|X) P (Y|X) adalah conditional probability Hal ini dapat ditulis dengan P(Y|X) = support(X Y) / support (X). Contoh berikut ini menggambarkan bagaimana menghitung association rule, support dan confidence untuk setiap association rule. Contoh: Tabel 2.1 Database Transaksi Transaction-id Items bought 10 A, B, D 20 A, C, D 30 A, D, E 40 B, E, F 50 B, C, D, E, F Database of transactions: we have 5 transactions and a total of 6 items. Let min_sup = 50%, min_conf = 50% oleh user) Langkah pertama: min_sup = 2 ( 50%) (Ini merupakan Threshold yang didefinikan Menemukan seluruh frequent itemsets that respect the Tabel 2.2 Support dibawah 50% Itemset lain dihapus karena support mereka kurang 2 (50%). Itemset support A 3 B 3 D 4 E 3 Langkah kedua : Cari semua association rules 5 Kita hanya mempunyai satu itemset {A,D} yang mempunyai support lebih dari 50%. Dengan itemset ini kita hanya dapat mempunyai 2 association rules, A D dan D A. A D : support = 3/5 = 60% confidence = 3/3 = 100% D A : support = 3/5 = 60% confidence = 3/4 = 75% Tantangan utama di dalam mining frequent itemsets dari dataset yang besar adalah fakta bahwa mining tersebut kadang menghasilkan jumlah yang sangat besar dari itemsets yang memenuhi batas minimum support (min_sup), terutama ketika min_sup diset rendah. Ini dikarenakan jika sebuah itemset frequent, setiap subset juga akan frequent. Itemset yang panjang akan mengandung angka kombinatorial yang pendek, sub itemset frequent. Latar Belakang Sejarah Formal Concept Analysis Formal Concept Analysis mendapatkan fondasi dari hasil pekerjaan matematis dari Birkhoff [11] pada tahun 1941. Berdasarkan teori lattice, Birkhoff berhasil membuktikan bahwa lattice dapat dibangun untuk semua relasi biner antar obyek dan attribut yang mengungkap struktur dari hubungan awal yang implisit. Kekuatan dari teori lattice dibawa dari kesederhanaan konsep dasarnya dan perilaku umum yang meliputi seluruh aljabar modern. Selanjutnya, proyek FCA dimulai pada awal 80an ketika grup riset di Universitas Darmstadt di Jerman memulai pengembangan sistematis framework aplikasi teori lattice. Istilah FCA dikenalkan oleh Rudolf Wille di tahun 1981. Rudolf Wille adalah ahli matematika asal jerman dan seorang profesor Aljabar dari tahun 1970 sampai tahun 2003. Rudolf menjelaskan pada tulisan pertamanya tentang FCA, bahwa konsep sangat penting untuk mengekspresikan pengetahuan manusia dan FCA adalah formulasi matematika dari konsep “concept”. FCA bertujuan untuk mendefinisikan konsep dan menganalisa hirarkinya. Hirarki dari konsep disebut konsep lattice. Sejak 1981, beberapa ratus artikel telah dipublish pada Formal Concept Analysis dan Grup Darmstadt telah bepartisipasi di banyak proyek kolaborasi. Sepanjang 10 tahun, FCA telah tumbuh ke dalam komunitas penelitian internasional dengan aplikasi-aplikasi di banyak disiplin ilmu, seperti bahasa, rekayasa perangkat lunak, psikologi, AI dan Information Retrieval. Formal Context Formal Concept Analysis (FCA) memodelkan dunia data ke dalam penggunaan obyek dan atribut. Kumpulan obyek, kumpulan atribut dan relasi antara obyek dan atribut di dalam sebuah data set membentuk Formal Context FCA. Ini direpresentasikan ke dalam bentuk triple (O, A, R) dimana R memetakan hubungan antara himpunan O dan A dari Obyek dan Atributs. Relasi R adalah bagian dari produk Cartesian antara obyek dan atributs : R O X A. Jika obyek o O mempunyai atribut a A, relasi diberikan oleh : (o,a) R atau oRa. Context di dalam FCA biasanya ditampilkan ke dalam bentuk tabel silang (matriks 2 dimensi) dimana kolom pertama dan baris pertama daftar obyek dan atribut dari context. Tanda silang di dalam tabel mengindikasikan bahwa obyek o mempunya atribut a. Tabel 3 menampilkan contoh dari sebuah formal context. 6 Table 2.3. Contoh dari Formal Context Merkur Venus Earth Mars Jupiter Saturn Uranus Neptune Pluto Small X X X X Medium X X X Context (O,A,R) Atributs A Large Near X X X X X X Distant Moon X X X X X X X X X X X X No moon X X Formal Concept Formal concept dari suatu context (O, A, R) adalah pasangan (X, Y) dengan X O dan Y A artinya semua atribut yang serupa ke obyek di X dan semua obyek serupa ke atribut di Y harus sama. Relasi dua arah diberikan oleh : 1. Himpunan atributs serupa ke obyek di X X’ = {a A | oRa o X} 2. Himpunan obyeks serupa ke atributs di Y Y’ = {o O | oRa a Y} Dengan kata lain, X’ menunjukkan himpunan semua atribut serupa ke obyek di X dan Y’ menunjukkan semua himpunan obyek yang mempunyai semua atribut di Y. Jadi (X,Y) adalah concept dari formal context (O,A,R) jika dan hanya jika X O, Y A, X’ = Y dan Y’ = X. X disebut extent dan Y adalah intent dari concept (X,Y). Tabel 4 melist semua concept dari context yang ditampilkan pada tabel 3. Setiap concept adalah himpunan obyek dengan atribut yang sama. Sebagai contoh, concept 3 adalah sepasang himpunan obyek {Uranus, Neptune}, dan himpunan atributs mengandung {moon, medium, distant}. Ini dapat diartikan bahwa bulan, medium dan distant adalah semua anggota dari himpunan atribut baik Uranus maupun Neptune. Seperti concept 8 adalah ({Earth, Mars, Pluto},{Moon, small}) mengindikasikan bahwa himpunan atribut Earth, Mars dan Pluto semua mengandung moon dan small. Tabel 2.4. Set dari seluruh konsep dari context table 3 Concept 1 Concept 2 Concept 3 Concept 4 Concept 5 Concept 6 Concept 7 Concept 8 Concept 9 Concept 10 Concept 11 Concept 12 ({},{moon, medium, distant, small, large, near, nomoon}) ({Pluto},{moon, distant, small}) ({Uranus, Neptune},{moon, medium, distant}) ({Merkur, Venus },{small, near, nomoon}) ({Jupiter, Saturn},{moon, distant, large}) ({Jupiter, Saturn, Uranus, Neptune, Pluto},{moon, distant}) ({Earth, Mars},{small, near, moon}) ({Earth, Mars, pluto},{small, moon}) ({Merkur, Venus, Earth, Mars},{small, near}) ({Merkur, Venus, Earth, Mars, Pluto},{small}) ({Earth, Mars, Jupiter, Saturn, Uranus, Neptune, Pluto},{moon}) ({Merkur, Venus, Earth, Mars, Jupiter, Saturn, Uranus, Neptune, Pluto},{}) Concept Lattice Salah satu keuntungan terbesar dari FCA adalah kemampuan untuk memvisualisasikan hubungan antara concept sebagai graph hierarki atau concept lattice. 7 Di dalam concept lattice, setiap node merepresentasikan concept yang berbeda. Concepts di dalam concept lattice adalah urut berdasarkan relasi ≤ antar concepts. Concept (X1, Y1) adalah subconcept dari concept (X2, Y2) jika X1X2 atau Y2 Y1. Lattice memetakan urutan dari konsep yang paling umum sampai yang paling spesifik (atas ke bawah). Concept teratas, subconcept terbesar disebut supremum dan concept terbawah , concept terkecil disebut infimum. Banyak algoritma diajukan untuk mengekstrak semua concept dari context yang diberikan, dan satu yang paling efisien adalah algoritma Ganter’s “next closure” [7]. Algoritma “next closure” dapat secara efisien memproses semua concept dari context (O, A, R) dengan waktu O(|O|2 x|A|x |C(O,A,R)|) Gambar 2. Contoh diagram concept lattice Gambar 2. menggambarkan contoh dari diagram concept lattice yang dibuat dari tabel context di tabel 3. Pada himpunan concept dari lattice, beberapa concept mempunyai satu subconcept terbesar dan satu superconcept terbesar yang sama. Pada gambar 2, elemen terbawah, concept 1, ({}, {moon, medium, distant, small, large, near, nomoon}) menunjukkan subconcept terbesar (disebut infimum) yang mengandung himpunan kosong dari pasangan obyek dengan semua atribut. Elemen teratas, concept 12 ({Merkur, Venus, Earth, Mars, Jupiter, Saturn, Uranus, Neptune, Pluto}, {}) merepresentasikan superconcept terbesar (suprimum) yang mengandung himpunan kosong dari pasangan atribut dengan semua obyek. Secara garis besar, concept lattice dapat direpresentasikan dengan redundant labelling ataupun dengan non-redundant labelling. Cocept lattice dengan redundant labelling dapat dilihat pada gambar di bawah ini. Gambar 2 menggambarkan list obyeks dan atributs dari tiap tiap concepts secara lengkap. Meskipun redundant labelling dari lattice memastikan bahwa setiap obyeks dan setiap atributs untuk setiap concepts diperlihatkan, hal ini dapat mengakibatkan permasalahan kelebihan informasi. Permasalahan ini dapat terlihat dengan digunakannya non-redundant labelling yang dipresentasikan oleh tiap obyek dan tiap atribut hanya satu kali. Gambar 3 menunjukkan concept lattice dari gambar 2 yang telah dikurangi labellingnya. Ketika suatu concept lattice diartikan, seluruh atributs akan digambarkan ke bawah dan seluruh objct dgambarkan ke atas. Sebagai contoh, Tabel 4 dapat di 8 gambarkan dengan meletakan atributs small, near dan moon, dan untuk diatas obyek Earth dan Mars Gambar 3. Contoh dari concept lattice graph with reduced labelling Context dengan Banyak Nilai Pada dunia nyata, obyek dapat memiliki atribut-atribut yang memiliki banyak nilai nilai yang berbeda. Nilai yang merepresentasikan atribut-atribut ini dapat berkisar antara nol hingga angka yang tidak terbatas. Dalam FCA, atribut-atribut ini sangat bebeda dengan keberadaan dan kekurangan dari atribut-atribut dalam binary-atribut FCA. Sebuah context dengan nilai banyak direpresentasikan dengan (O, A, V, R)[4], dimana O adalah set dari obyek dan A adalah set dari atributs dengan nilai set V dan R O x A x V adalah relasi untuk (o,a,v1) R and (o, a, v2) R ==> v1=v2 Batasan ini serupa dengan dugaan nilai atomic di dalam database relasional, setiap atribut untuk tiap obyek mempunyai hanya satu nilai. Seringkali ditulis a(0) = v daripada (o,a,v) R. Himpunan semua nilai yang memungkinkan untuk atribut semua nilai yang diberikan mengacu ke domain dari atribut tersebut, Karena itu dom(a). Ini didefinisikan dari : dom(a) = { o O | (o, a, v) R for some v V }. Atribut a disebut komplit jika dom(a) = O. context yang mempunyai banyak nilai disebut komplit jika semua atribut nya komplit. Scaling Agar dapat mengolah concept dari context yang mempunyai banyak nilai, tiap atribut harus di “scaled”. Skala untuk atribut dari context bernilai banyak diberikan dari : Sm = (Om, Am, Rm) Dimana a(O) Om, Am adalah himpunan atribut baru dan Rm adalah relasi antar atribut. Om dan atributs baru Am. Skala itu sendiri merupakan formal contex. Gambar 2 mengilustrasikan contoh dari konseptual skala (transformasi dari contact bernilai banyak ke context bernilai satu). Tabel pada sebelah kiri mengilustrasikan context harga buku, sementara pada sisi kanan adalah skala untuk atributs. Skala dari kategorisasi harga buku berdasarkan apakah harganya lebih besar dari atau sama dengan nol dolar atau lebih besar dari dan sama dengan dua puluh lima dollar. 9 Tabel 2.5. Conceptual Scale (right) for the `Price' atribut (left) Book Price Price Book A $0 $25.95 Book B $25 $25.95 X $19.80 $19.80 X Book C $74.25 $74.25 X Pemilihan dari skala konseptual berdasarkan pada penerjemahan seseorang akan suatu context. Oleh sebab itu, tugas ini biasanya di berikan untuk seseorang yang memang ahli dalam bidangnya. Langkah terakhir pada proses transformasi meliputi pemakaian skala konseptual pada atribut. Context yang diperoleh untuk attribut harga menggunakan skala dari tabel 2.5 dapat dilihat pada tabel dibawah ini : Tabel 2.6. Derived contexts resulting from applying the scales to the manyValued context Book Price $0 Book A Book B Book C $25 X X X Survey dari Beberapa Alat Bantu Formal Concept Analysis Beberapa alat Bantu Formal Concept Analysis telah dikembangkan khususnya untuk kebutuhan penelitian dan juga sebagai alat pembelajaran pada materi-materi ilmu komputer. Kebanyakan alat-alat tersebut berguna sebagai editor context, kalkulator concept dan alat gambar concept lattice. Alat Bantu dari FCA berupa ToscanaJ [12], ConExp atau Concept Explorer , Galicia [15] dan Lattice Miner. Lattice Miner adalah prototype FCA untuk membuat, memvisualiasikan dan mengeksplor concept lattice. Lattice Miner memungkinan beberapa generasi formal concept dan association rules. Sifatnya open source dan dapat didownload dari website sourceforge [8]. Dikembangkan di laboratorium LARIM [7] Universitas Quebec di Outaouis (UQO) dibawah pimpinan Prof. Rokia Missaoui yang merupakan pelopor di bidang Data Mining dan FCA yang paling aktif. Input yang dibutuhkan lattice miner adalah formal context, formal context dapat dibuat dari alat eksternal seperti ConExp, Galicia, ToscanaJ dan alat FCA lainnya. Lattice Miner menyediakan interface yang ramah bagi user untuk mengedit formal context secara manual. Dari inputan lattice miner dapat membuat diagram lattice (concept lattice) dan association rules. Pada gambar 4 dan 5 interface utama dari lattice miner ditampilkan. 10 Gambar 4. Main interface of lattice miner: editing a formal context Gambar 5. Main interface of lattice miner: generating the concept lattice Aplikasi formal concept analysis FCA telah diaplikasikan di beberapa bidang seperti kedokteran, bahasa, psikologi, matematika, teknik industri dan ilmu komputer. Lebih spesifik, aplikasi berbasiskan FCA digunakan untuk clustering, teknik ontology, information retrieval dan rekayasa perangkat lunak [2] [1]. Batasan dari Formal concept analysis FCA mempunyai banyak keunggulan di dalam memproses knowledge termasuk eksplorasi concept dan data mining. Ketika FCA berhubungan dengan aplikasi yang mempunyai obyek dan atribut dalam jumlah kecil, kompleksitas dari algoritma yang digunakan untuk mengindex dan memanggil data tidak menjadi isu yang penting. Bagaimanapun, ketika FCA diaplikasikan untuk mengeksplor data dengan obyek dan atribut yang besar, ukuran data membuat isu kompleksitas dan skalabilitas menjadi krusial [3]. Ini sebabnya konsep scaling memperlihatkan kegunaannya. Batasan lain termasuk kurangnya cara menangkap relasi terdahulu antara titik sementara dan interval yang ditampilkan oleh lattice sementara. Dengan kata lain, FCA dapat berhubungan dengan struktur data statis tetapi tidak dapat menganalisa perilaku dinamis dari data. FCA merupakan Penggambaran dari association rules Banyak penelitian yang telah dilakuakan untuk mengekstraksi association rule dari concepts lattice. Formal Concept Analysis dapat secara efisien digunakan untuk memproses association rule. Suatu association rule X Y (with X, Y A) dikatakan exact jika conf(XY) = 1 dan approximate bila sebaliknya. Suatu exact association rule dapat pula disebut dengan suatu implication. Untuk X, Y A, suatu implication XY dikatakan seperti itu jika dan hanya jika concepts terbesar yang berada dibawah 11 seluruh concepts yang di generate oleh atributs X dibawah seluruh concepts yang di generate oleh atributs Y. Dengan kata lain, implication terjadi bila tiap obyek yang memiliki seluruh atributs di X juga memiliki seluruh atributs di Y; suatu implication adalah sebuah association rule dengan 100% confidence. Pada concepts lattice, exact association rule dapat secara langsung di baca dan di visualisasikan dalam diagram. Gambar 2.6 merupakan contoh dari implications yang degenerate secara otomatis oleh Lattice Miner tools (Gambar ini berdasarkan data sebelumnya). Gambar 6. Implications in concept lattice Metode Formal Concept Analysis hanya menghitung concept hierarki yang terhubung dalam struktur lattice. Selain itu, metode FCA juga dapat mengurangi jumlah dari association rule METODE PENELITIAN Untuk memperoleh data yang dibutuhkan guna mendukung penelitian yang akan dilakukan, metode yang digunakan penulis dengan metode penelitian kepustakaan. Metode penelitian ini digunakan untuk mendapatkan landasan teori yang digunakan untuk memecahkan masalah secara teori. Bahan bacaan yang digunakan adalah buku dan fasilitas internet yang ada hubungannya dengan objek penulisan tesis. Disini penulis melakukan studi literatur tentang teori dan konsep Data Mining, Market Formal Concept Analysis dan Lattice Miner. Selain itu metode penelitian lapangan juga digunakan. Disini penulis mengadakan pengamatan pada data online yang disediakan oleh Boomberg Market periode 27 Januari sampai dengan 29 Januari 2009. Tempat dan Waktu Penelitian Data dalam penelitiaan ini diperoleh oleh penulis dengan melakukan pengamatan data terhadap penyedia data, berita dan analitika untuk pasar keuangan yang mendunia terutama data nilai jual kelompok komoditi dunia yang bersifat terbuka dan diinformasi secara online serta uptodate. Dan akhirnya penulis menggunakan data Bloomberg yang memang juga informasi pada Bloomberg ini digunakan sebagai media informasi diberbagai kantor berita negara salah satunya kantor berita Antara sebagai kantor berita Indonesia. Data Bloomberg dapat diakses secara online dan free melalui alamat http://www.bloomberg.com/markets/commodities/cfutures.html. dan waktu penelitian dilakukan pada bulan Januari 2009. 12 Analisis Data Penelitian Pada penulisan ini yang menjadi fokus penulis adalah perubahan dan keterhubungan antara nilai jual kelompok komoditi dunia pada data Bloomberg. Teknik penganalisaan data yang dilakukan oleh penulis dalam penyusunan penulisan ini adalah dengan menggunakan analisis kualitatif dikarenakan sampling merupakan pilihan penulis, dalam hal ini data yang dianalisis adalah perubahan nilai jual kelompok komoditi dunia yang terdapat pada Bloomberg. Dengan data ini bertujuan untuk mencakup sebanyak mungkin informasi yang bersifat holistic kontekstual atau merepresentatif terhadap informasi holistik. Dalam merencanakan sampling yang mempengaruhi terhadap harga komoditi dipertimbangkan langkah-langkah berikut; a. Menyiapkan identifikasi unsur - unsur awal b. Menyiapkan munculnya sample secara teratur dan purposif c. Menyiapkan penghalusan atau pemfokusan sample secara terus-menerus d. Menyiapkan penghentian sampling. Berdasarkan langkah tersebut diatas data dalam penelitian ini terbagi dalam 2 kategori yaitu : a. Data Bloomberg sebagai objek dan data Bloomberg sebagai property dari objek (atribut), meliputi; raise > 10 , raise <= 10, not change, down >= -10 dan down <= 10 b. Data Bloomber sebagai property dari objek (atribut) terdiri dari ; Brent Crude Futr, Gas oil Fut (ICE), Gasoline RBOB FUT, Heating Oil FUTR, Natural Gas FUTR, WTI Crude Future, Cocoa Future – LI, Cocoa Future, Coffee ’C’ Future , Corn Future, Cotton No.2 FUTR, Live Cattle FUTR , FCOJ-A Future, Soybean Future, Soybean Meal FUTR, Soybean Oil FUTR, Sugar #11 , Wheat Future (CBT), Wheat Future (KCB), Copper Future, Gold 100 OZ FUTR, Silver Future dan Cattle Feeder FUT Penggunaan Alat Perancangan Alat yang digunakan untuk memvisualusasikan keterhubungan dengan jelas dan mudah adalah Lattice Miner. Lattice Miner adalah salah satu tools dari formal concept analysis prototype untuk membuat, memvisualisasikan dan mengeksplor konsep Lattice. Laticce Miner memungkinkan di generalisasinya formal concepts and association rules. Lattice Miner merupakan open source dan dapat di download dari website source forge [03]. Lattice Miner di kembangkan di laboratory LARIM [7] pada university of Quebec in Outaouais dibawah pimpinan Professor Missaoui Rokia. Professor Rokia adalah salah seorang pelopor di bidang data mining dan formal concept analysis. Tahapan Penelitian Tahapan penelitian yang dilakukan dalam penulisan ini sebagai berikut : a. Studi Literatur dan Pengumpulan Data - Penulis melakukan studi literatur tentang teori dan konsep Data Mining, Market Basket Analysis, Formal Concept Analysis dan Lattice Miner Pada tahap ini penulis melakukan mengadakan pengamatan pada data secara online yang disediakan oleh Boomberg. Data yang digunakan berupa 4 periode waktu. b. Pendefinisian 13 Penulis melakukan pendefinisian dengan lattice miner membuat Formal Context terhadap data Bloomberg dengan metode scaling. Pendefinisian yang dilakukan ada 2 yaitu : - Objek dengan menentukan objek - objek yang mempengaruhi harga pasar komoditi dunia. - Variabel dengan merubah data ke dalam bentuk tabel biner. c. Pengelompokan (clustering) Penulis melakukan pengelompokan data pada Lattice Miner dengan membuat Formal Concept berdasarkan keterhubungan antar data set. d. Visualisasi Formal lattice divisualisasikan agar mempermudah dalam proses analisa dengan concept lattice dalam bentuk diagram hasse. e. Pengambilan kesimpulan dari hasil Lattice Miner Hasil (output) dari Lattice Miner berupa list rules yang dihasilkan dari tipa – tiap diagram lattice. List Rules yang dihasilkan dari Lattice Miner menggunakan Association Rules. Terdapat dua ukuran kepercayaan (interestingness measure) yang digunakan dalam menentukan suatu association rule. yang menghasilkan list rules yaitu support dan confidence. Support dan confidence merupakan indikator dalam menentukan sebuah rules. HASIL DAN PEMBAHASAN Sekilas Tentang Bloomberg Bloomberg adalah penyedia data, berita dan analitika untuk pasar keuangan yang mendunia. Bloomberg Professional memberikan pelayanan dan jasa, seperti data keuangan dan pasar, harga, perdagangan, berita serta peralatan komunikasi yang seketika dan terarsipkan dalam paket tunggal dan terpadu kepada perusahaan, organisasi berita, profesional bidang keuangan dan hukum dan perorangan di seluruh dunia. Layanan media Bloomberg mencakup jasa mendunia; Bloomberg News, Bloomberg Television dan Bloomberg Radio. Di samping itu, Bloomberg menerbitkan majalah Bloomberg Markets dan buku Bloomberg Press bagi para profesional bidang penanaman modal [2]. Data Bloomberg ini juga digunakan sebagai media informasi diberbagai kantor berita negara salah satunya kantor berita Antara sebagai kantor berita Indonesia. Analisa Permasalahan Asosiasi dan korelasi antar nilai data komoditi pada Bloomberg tidak dapat dilihat dengan detail secara kasat mata. Pengaruh atas kenaikan atau penurunan harga dari satu komoditi tidak dapat terlihat apakah akan mempengaruhi harga komoditi yang lain; apakah komoditi yang lain tersebut menjadi akan meningkat harga jualnya, balance atau menurun. Selain itu, ide yang tersembunyi dari trend pasar juga tidak terlihat (sebagai contoh; perusahaan atau individu yang membeli alumunium pasti akan membeli live_cattle). Hal ini sesuai dengan teori Market Basket Analysis yang merupakan suatu analisis terhadap kebiasaan customer berbelanja pada supermarket dengan cara menemukan asosiasi dan korelasi diantara berbagai item yang dimasukan customer di dalam shopping basket mereka. Secara lebih spesifik, Market Basket Analysis bertujuan untuk mengetahui item (pengertian item disini adalah berbagai 14 macam produk atau barang pada supermarket) apa saja yang sering dibeli bersamaan oleh customer. Formal Context Data dari Bloomberg Market yang digunakan diambil www.bloomberg.com, untuk 4 periode waktu, yaitu : - Tanggal 27 Januari 2009 jam 02.40 - Tanggal 28 Januari 2009 jam 10.10 - Tanggal 28 Januari 2009 jam 14.55 - Tanggal 29 Januari 2009 jam 06.55 dari Tujuan formal context ini adalah menentukan objek dan atribut untuk mendapatkan data set relasi antara objek dan atribut. Dalam hal ini merepresentasikan triple (O, A, R) dimana R merupakan pemetaan-pemetaan relasi antara sets O and A dari objek dan atribut. Relasi R merupakan subset Cartesian product antara objek dan atribut: R O x A. Jika object oO dengan atribut a A, maka relasi ini dinyatakan: (o,a) R or oRa. Dalam pembuat formal context menggunakan lattice miner dengan metode scaling. Dalam pembuat formal context menggunakan lattice miner dengan metode scaling. Agar menghasilkan concept dari berbagai macam context, setiap atribut adalah "scaled". Scale sebuah atribut dari berbagai macam context dinyatakan Sm = (Om, Am, Rm) Dimana a(O) Om, Am adalah set atribut baru dan Rm relasi antar atribut Om and atribut baru Am. Dengan menggunakan lattice miner langkah utama yang dilakukan adalah mengkonversi data dikonversi ke dalam bentuk tabel biner, dengan ketentuan sebagai berikut : 1. Kolom pada tabel biner merupakan Atribut (A), dari data bloomberg diambil data jenis kelompok komoditi sebagai atribut. Terdapat 24 kelompok komoditi yang akan dianalisa. 2. Baris pada tabel biner merupakan Object (O), data yang digunakan adalah perubahan nilai harga jual kelompok komoditas (change), dengan scaling didapat 5 obyek. 3. Relasi antara atribut dan objek yang mempunyai nilai – nilai yang mempunyai keterhubungan diberi tanda silang (cross) Berikut ini merupakan salah satu contoh tabel berdasarkan waktu pengambilan dari Bloomberg tabel yang dibuat menurut waktu pengambilan data dikonvesi ke tabel biner dengan lattice miner. 15 Gambar 7. Konversi Tabel Biner Data Bloomberg Market tanggal 26 January 2009 2009 jam 21:40 Formal Concept Tujuan dari Formal Concept Analysis adalah untuk menganalisa keterhubungan dengan clustering (unsupervised clasiffication). Dalam metode ini ada pola tersembunyi dari pengelompokan data. Data akan dikelompokan secara otomatis tanpa didefinisikan terlebih dahulu (berdasarkan indikatornya, dalam hal ini berdasarkan objeknya). Relasi yang ada dalam tabel biner pada formal context menunjukan hubungan/relasi antara komoditi dan indikatornya. Setiap formal konsep dari komoditas yang saling berhubungan membentuk satu node pada diagram lattice. Node pada diagram lattice menunjukan clustering. Didalam tiap node itu terdapat objek dan atribut, semua objek yang mempunyai atribut-atrbut yang sama akan saling mengumpul dalam satu node, sehingga keterhubungan antara perubahan nilai komoditas dapat dilihat pada node tersebut. Berikut ini adalah Lattices dari formal context yang telah dijelaskan sebelumnya : Gambar 8. Lattice pada Komoditi 1 Node teratas dari lattice merupakan kumpulan semua objek dan node terbawah merupakan kumpulan dari semua atribut. Semakin suatu node menurun, objeknya akan semakin berkurang (spesification) dan semakin node merangkak naik ke atas maka atributnya yang akan bertambah (generalization). Node teratas terdiri dari ke 5 objek dan node paling bawah terdiri dari 24 atribut. Ke semua object dan atribut ini telah didefinisikan terlebih dahulu. Kalimat yang tertulis dengan warna biru menunjukan atribut sedangkan yang berwarna merah menunjukkan objek. Node yang berada dibawah merupakan node yang objeknya merupakan bagian dari objek diatasnya. 16 Association Rules Dari diagram lattice yang terbentuk, selanjutnya mengenerate association rule. Association rule analysis adalah suatu prosedur dalam market basket analysis untuk mencari hubungan antara item dalam suatu data set. Association rule meliputi dua tahap yaitu : 1. Mencari kombinasi yang paling sering terjadi dari suatu itemset. 2. Mendefinsikan Condition dan Result (untuk conditional association rule). Dalam association rule yang dihasilkan dari tiap - tiap diagram lattice, terdapat dua ukuran kepercayaan (interestingness measure) yang digunakan dalam menentukan suatu association rule, yaitu : - Support: suatu ukuran yang menunjukkan seberapa besar tingkat dominasi suatu item / itemset dari keseluruhan transaksi. Ukuran ini menentukan apakah suatu item / itemset layak untuk dicari confidence factor-nya. Support (A → B[ s,c ]) = p(A B) = support({A,B}) - Confidence: suatu ukuran yang menunjukkan hubungan antar 2 item secara conditional (misal, seberapa sering item B terjadi perubahan jika terjadi juga perubahan item A). Confidence (A → B[ s,c ]) = p(B|A) = p(AB) / p(A) = support ({A,B}) / support({A}) Kedua ukuran ini diguna dalam menentukan interesting association rules, yaitu untuk dibandingkan dengan batasan (treshold) yang ditentukan oleh user. Batasan tersebut pada penelitian ini menggunakan nilai confidence yang akan dianalisa adalah ketergantungan nilai dari kelompok komoditi. Bila memenuhi batasan maka sebuah rule dapat disebut interesting rule. Dengan tingkat confidence yang digunakan adalah 100%. Semua association rule yang mempunyai confidence 100% disebut dengan fix rule, artinya keterhubungan antar tiap datanya pasti. Keterhubungan yang terjadi bila suatu single atau kombinasi dari atribut tertentu naik maka ada beberapa atribut yang lain yang akan naik pula nilai jual dan perubahannya, begitu pula sebaliknya, Dan pasangan item apa yang dapat menyebabkan suatu komoditi tersebut dapat naik. Untuk lebih jelas mengenai keterhubungan antar item dapat dilihat pada lampiran. Dengan diketahuinya behaviour yang terjadi di pasar, maka para pelaku bisnis dapat memiliki informasi untuk menentukan langkah bisnisnya. Karena hal ini akan mempengaruhi rumah tangga perusahaan dan pasar. Hasil akhir dari penelitian ini menggunakan Association rules yang dihasilkan dari formal concept dan context lattice berjumlah 788 rules, dengan confidence 100% dan formal concept dari 4 periode waktu menghasilkan 24 rules. Berikut ini merupakan contoh dari association rule viewer dari lattice miner dari komoditi 1. 17 Gambar 9. Association Rule Komoditi 1 dalam Lattice Miner KESIMPULAN DAN SARAN Perubahan nilai jual pada kelompok komoditi dalam pasar dunia, bagi para pelaku bisnis sangat berpengaruh dalam pengambilan keputusan untuk menentukan strategi bisnis mereka. Karena hal ini akan mempengaruhi rumah tangga perusahaan dan pasar. Bloomberg penyedia data, berita dan analitika untuk pasar keuangan yang mendunia terutama data nilai jual kelompok komoditi dunia yang bersifat terbuka dan diinformasi secara online serta uptodate. Dan data Bloomberg ini digunakan sebagai media informasi diberbagai kantor berita negara salah satunya kantor berita Antara sebagai kantor berita Indonesia. Analisa dilakukan terhadap perubahan data nilai jual kelompok komoditi pada bloomberg. Data yang digunakan berupa 4 periode waktu yang terjadi pada tanggal 27 sampai dengan 29 Januari 2009. Alat yang digunakan untuk memvisualisasikan keterhubungan dengan jelas dan mudah adalah Lattice Miner. Lattice Miner adalah salah satu tools dari formal concept analysis prototype untuk membuat, memvisualisasikan dan mengeksplor konsep Lattice. Laticce Miner memungkinkan di generalisasinya formal concepts and association rules. Dalam penulisan ini menggunakan tingkat confidence adalah 100%. Dengan formal context mendefinisikan 6 objek dan 24 kelompok komoditi sebagai atribut. Hasil dari penelitian ini menggunakan Association rules yang dihasilkan dari formal concept dan context lattice berjumlah 788 rules, dengan confidence 100% dan formal concept dari 4 periode waktu menghasilkan 24 rules. Saat ini penelitian ini hanya menggunakan data Bloomberg Market yang terdiri dari 4 waktu yang berbeda. Diharapkan periode data yang lebih lama (seperti data Bloomberg Market selama 1 tahun) dapat dianalisa untuk memastikan tingkat keterhubungan antar komoditi dari suatu data set (dalam hal ini pangsa pasar) secara lebih jelas dan pasti. FCA dapat pula dapat diterapkan untuk menganalisa pasar dan manajemen seperti memprediksi target pasar, melihat pola pembelian dari waktu ke waktu, cross market analysis, profil customer, identifikasi kebutuhan customer, menilai loyalitas customer, dan informasi summary. Selain itu bagi bidang analisa perusahaan dan manajemen resiko, dengan formal concept analysis digunakan untuk merencanakan keuangan dan evaluasi asset, merencanakan sumber daya (resources planning) dan memonitor persaingan (kompetisi) dan bidang lainnya. 18 DAFTAR PUSTAKA [1] A Formal Concept Analysis Homepage: http://www.upriss.org.uk/fca/fca.html [2] Claudio Carpineto, Giovanni Romano, Concept data Analysis: theory and application, willy, 2004 [3] Cole, R. and Eklund, P.W. Scalability in formal concept analysis., computational intelligence, vol.15, no.1 Blackwell Publishers, USA, pp.11-27, 1999 [4] cole, R.J., and Eklund, P. W.. Text retrieval for medical discharge summaries using SNOMED and formal concept analysis. In Australian Document Computing Symposium (ADCS), pp.50-58, 1996. [5] Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques, Second Edition, Morgan Kaufmann, 2006. [6] Gerd Stumme, Efficient Data Mining Based on Formal Concept Analysis, 2002 [7] Ganter, B. and Wille, R. Formal Concept Analysis: Mathematical [8] Lattice Miner, http://sourceforge.net/project/showfiles.php?group_id=203563 [9] LARIM, http://larim.uqo.ca/index.html Foundations , Springer, Berlin, Germany.1999 [10] Uta Priss, Formal Concept Analysis in Information Science, 2004 [11]R. Wille, "Formal Concept Analysis as Mathematical Theory Concepts and Concept Hierarchies," in Formal Concept Analysis, Benhard Ganter et.al LNAI 3626 ed, 2005, pp. 1-33. [12] ToscanaJ project web site: http://toscanaj.sourceforge.net/ [13] Valtchev, P., Grosser, D., Roume, C., and Hacene, M. R. GALICIA: an open platform for lattices. In Using Conceptual Structures: Contributions to the 11th International Conference on Conceptual Structures (ICCS’03) (Dresde (DE)), ShakerVerlag, pp. 241–254. http://www.iro.umontreal.ca/~galicia/ 19