Seminar Nasional Informatika 2009 (semnasIF 2009) UPN ”Veteran” Yogyakarta, 23 Mei 2009 ISSN: 1979-2328 TEKNIK VISUALISASI DALAM DATA MINING Sri Mulyana, Edi Winarko Program Studi Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Gadjah Mada Email: {smulyana, ewinarko}@ugm.ac.id Abstrak Kemajuan teknologi informasi, khususnya di bidang pengumpulan dan penyimpanan data, mengakibatkan perusahaan-perusahaan, lembaga pemerintah maupun non pemerintah memiliki koleksi data dalam jumlah yang cukup besar. Salah satu tantangan dari keberadaan data yang besar ini adalah bagaimana menemukan informasi dari data tersebut. Data mining adalah cabang ilmu baru di bidang ilmu komputer yang ditujukan untuk menjawab tantangan ini. Dua pendekatan yang sering digunakan dalam data mining adalah pendekatan berbasis algoritma dan berbasis visualisasi. Pendekatan berbasis algoritma antara lain menggunakan aturan induksi, analisa asosiasi, pohon keputusan, jaringan saraf tiruan, dan lain-lain. Tujuan dari pendekatan ini adalah untuk memprediksi suatu variabel dari variabel yang lain atau mencari pola yang menunjukkan hubungan antar variabel. Pendekatan berbasis visualisasi menggunakan teknik visualisasi untuk menggali informasi yang terkandung dalam data. Banyak teknik visualisasi yang sudah dikembangkan untuk keperluan data mining. Dalam paper ini disajikan survei atau review tentang teknik-teknik visualisasi tersebut. Secara garis besar teknik-teknik visualisasi ini dapat dikelompokkan ke dalam dua kelompok, yaitu teknik untuk visualisasi data dan teknik untuk visualisasi pengetahuan. Kata kunci: Data mining, visualisasi data, visualisasi pengetahuan 1. PENDAHULUAN Dalam membuat keputusan yang tepat sangat dibutuhkan dukungan informasi yang benar dan pada waktu yang tepat. Ketersediaan informasi sebagai pendukung pengambilan keputusan telah meningkat dengan cepat sebagai dampak perkembangan teknologi yang sangat cepat. Salah satu sebab terjadinya peningkatan data adalah adanya automatisasi aktifitas pada berbagai area yang meliputi kegiatan bisnis, rekayasa, ilmu pengetahuan maupun pemerintah. Pada saat ini, berbagai aktifitas telah dapat direkam dengan menggunakan komputer seperti pembayaran dengan kartu kredit dan penggunaan telepon. Berbagai penelitian pada bidang fisika, kimia maupun kesehatan yang menghasilkan sejumlah data telah dikumpulkan secara otomatis dengan menggunakan sensor dan sistem monitoring. Bahkan data dalam jumlah yang besar telah dikumpulkan dengan sistem pengamatan satelit yang mungkin dapat menghasilkan data dalam ukuran terabyte per harinya. Namun, bagaimana memperoleh makna (value) dari data tersebut merupakan masalah yang masih perlu dicari solusinya. Jumlah data yang sangat besar sebenarnya merupakan sumberdaya yang sangat penting, namun sangatlah sulit bagaimana menggali informasi yang relevan [Keim dan Kreigel, 1996]. ‘Data Mining’ dapat didefinisikan sebagai rangkaian proses eksplorasi dan analisis data untuk mendapatkan informasi potensial yang tersembunyi [Frawly, 1991]. Pada konteks yang lebih luas, ‘data mining’ tidak hanya mencakup pekerjaan pada area data mining dan knowledge discovery saja tetapi juga berhubungan dengan penelitian lain, yang meliputi statistik multivariat (komponen analisis utama, analisis klaster dan penskalaan multidimensi [Dunn, 1982]), antarmuka pada database (cooperative database interfaces [Gasterland, 1992], interfaces for imprecise querying [Anwar, 1992], intelligent data browsing [Motto, 1990]) dan penyampaian kembali informasi (approximate matching algorithm [Salton, 1988] [Frei, 1991]). Pambahasan permasalahan data mining difokuskan pada eksplorasi pengetahuan secara semi otomatis. Pada beberapa tahun terakhir, telah dilakukan berbagai penelitian sehingga mencapai kemajuan penting, bahkan teknik-teknik data mining serta beberapa sistem berbasis data mining telah diimplementasikan (Frawly, 1991; Matheus, 1993). Pada paper ini disajikan konsep dasar visualisasi dan beberapa teknik visualisasi pada data multidimensi. Teknik-teknik tersebut meliputi teknik visualisasi berbasis pixel, visualisasi dengan teknik proyeksi geometri, visualisasi dengan teknik berbasis icon dan visualisasi dengan teknik hirarki dan teknik berbasis graf beserta karakteristik masing-masing. 2. KONSEP DASAR Menurut Olivera (2003), terdapat dua konsep visualisasi, yaitu scientific visualisation dan information visualisation. Keduanya membuat model grafis dan menyajikan data secara visual yang berinteraksi langsung dengan pengguna untuk melakukan eksplorasi dan memperoleh informasi yang terdapat dalam data. Pada scientific visualisation, model grafis biasanya dibangun dari pengukuran atau simulasi data yang mewakili objek E-100 Seminar Nasional Informatika 2009 (semnasIF 2009) UPN ”Veteran” Yogyakarta, 23 Mei 2009 ISSN: 1979-2328 atau konsep yang terkait dengan fenomena yang sebenarnya. Pada information visualization, model grafis menyatakan konsep abstrak dan hubungan yang tidak selalu memiliki keterkaitan di dunia nyata (Olivera, 2003). Data mentah dapat berasal dari berbagai format, dan untuk memetakan sekumpulan data menjadi format visual cukup dengan mentransformasi menjadi sebuah relasi terstuktur atau kumpulan relasi (tupples). Card dkk mendefinisikan ‘tabel model data’ sebagai sebuah format data terstruktur yang tersusun dalam baris dan kolom yang menunjukkan relasi [Card at all, 1999]. Dalam hal ini baris menyatakan variabel dan kolom menyatakan sebuah kasus. Hoffman menggunakan istilah ‘tabel visualisasi’ untuk mendefinisikan visualisasi atas himpunan data yang disajikan dalam tabel-tabel [Hoffman, 1999]. Istilah ‘dimensi’ digunakan untuk merujuk pada variabel independen yang dinyatakan dalam tupel, sedangkan ‘variat’ merujuk pada variabel dependen [Wong dan Bergeron, 1997]. Pada paper ini digunakan istilah ‘data item’ untuk mendefinisikan sebuah tupel yang menyatakan hubungan antar banyak variabel dan ‘atribut’ dari dimensi untuk mendefinisikan varibel-variabel baik dependen maupun independen. ‘Nilai atribut’ merujuk pada informasi yang berhubungan dengan variavel tertentu. ‘Atribut range’ merujuk pada range nilai yang diasumsikan oleh atribut tertentu dalam himpunan data. Untuk karakterisasi himpunan data berdimensi tinggi merupakan hal yang tidak mudah. Sebagai sebuah konsep, batas antara data berdimensi rendah dan berdimensi tinggi adalah sekitar 3 sampai 4 atribut data. Pada umumnya, pembahasan di luar dimensi 3 atau 4 sudah merupakan permasalahan yang sangat kompleks. Sebagai panduan, dimensi data dibedakan sebagai berikut, ‘rendah’ untuk dimensi 1 sampai 4, ‘sedang’ untuk dimensi 5 sampai 9 dan ‘tinggi’ untuk yang dimensi 10 ke atas, namun demikian hal ini hanya merupakan sebuah pilihan. Hal yang sama juga terjadi pada istilah ‘besar’, ‘sangat besar’ dan ‘masif’ yang digunakan untuk kualifikasi himpunan data. Sebagai panduan, kualifikasi data tersebut dibedakan sebagai berikut : ‘besar’ untuk item data dengan ukuran hingga 100.000, ‘sangat besar’ untuk item data dengan ukuran hingga 1.000.000 dan ‘masif’ untuk data yang berukuran ratusan juta. Sasaran pada DM biasanya adalah pada himpunan data ‘masif’ [Oliveira, 2003]. Metode-metode DM mempunyai tujuan yang berbeda dan beberapa metode telah diterapkan sebelumnya untuk mencapai hasil yang dikehendaki. Kebanyakan aplikasi DM ditujukan untuk hal-hal sebagai berikut : pemrosesan data, prediksi, regresi, klasifikasi, klastering, penentuan makna hubungan antas atribut, visualisasi model, dan analisis data eksplorasi [Goebel dan Gruenwald, 1999]. 3. TEKNIK-TEKNIK VISUALISASI DATA MULTIDIMENSI Visualisasi data pada struktur dua atau tiga dimensi telah dibuat sebelum komputer digunakan untuk membuat visualisasi. Dalam buku-bukunya Edward R. Tufte memberikan beberapa contoh teknik visualisasi dan telah digunakan dalam kurun beberapa tahun [Tufte, 1983] [Tufte, 1990]. Sejak komputer digunakan untuk membuat visualisasi, banyak teknik visualisasi yang dikembangkan, dengan teknik-teknik yang telah diperluas untuk mengolah sekumpulan data dalam jumlah yang besar dan menampilkannya secara interaktif. Kebanyakan data yang disimpan dalam database, tidak memiliki standard pemetaan dengan sistem koordinat Cartesian, karena data tidak lagi dalam bentuk dua atau tiga dimensi. Secara umum, database relasional dapat merepresentasikan himpunan data multidimensi, yang mana atribut-atribut dari database berhubungan dengan dimensi dari basisdata tersebut. Terdapat teknik-teknik yang sudah terkenal untuk visualisasi sekumpulan data multidimensi antara lain : scatterplot matrices and coplots, prosection matrice, parallel coordinates, projection pursuite, dan teknik-teknik proyeksi geometik (misalnya: hyperbox, hyperslice), teknik-teknik berbasis icon, teknik-teknik hierarki, teknik-teknik berbasis graph, teknik-teknik dinamik), teknik-teknik berorientasi pixel, dan kombinasi dari beberapa teknik yang ada. Penelitian-penelitian lain juga telah dihasilkan dalam ekplorasi data dan analisis sistem yang mengimplementasikan beberapa teknik yang telah disebutkan. Teknik-teknik visualisasi data mining tersebut merupakan teknik visualisasi yang kebanyakan diaplikasikan pada tahap pre-processing pada data mining. Sedangkan teknik visualisasi pada tahap postprosessing tidak dibahas. 3.1 Teknik-teknik berbasis pixel Ide dasar dari teknik-teknik yang berorientasi pixel adalah memetakan tiap-tiap data value ke titik tertentu dan setiap data value memiliki satu atribut dalam jendela terpisah seperti pada gambar-1 berikut : E-101 Seminar Nasional Informatika 2009 (semnasIF 2009) UPN ”Veteran” Yogyakarta, 23 Mei 2009 ISSN: 1979-2328 Gambar-1 : Pengaturan jendela atribut untuk data dengan enam atribut Secara umum teknik ini menggunakan satu titik setiap satu data value, maka teknik ini dapat mengalokasikan visualisasi data dalam ukuran yang sangat besar, yaitu memungkinkan untuk menampilkan lebih dari 1.000.000 data value. Atribut yang berbeda ditampilkan pada sub jendela yang berbeda dan range nilai data yang mungkin dipetakan pada titik sesuai warna tertentu [Keim, 2000] [Keim dan Kreigel, 1996] [Keim dan Kreigel, 1994] seperti pada gambar-2 berikut : Gambar-2 : Visualisasi berbasis pixel menggunakan spiral(kiri) dan sumbu(kanan) [Keim dan Kreigel, 1994] Jika pengguna ingin memvisualisasi data yang besar, maka harus menggunakan teknik visualisasi query-independent, yaitu mengurutkan data berdasarkan beberapa atribut dan menggunakan pencocokan pola layar untuk mengatur data value pada tampilan. Teknik visualisasi query-independent ini sangat bermanfaat khususnya pada data yang terurut secara alamiah berdasarkan satu atribut (misalnya data runtun waktu). Namun, apabila terdapat data yang tidak terurut secara alamiah dan tujuan utamanya adalah ekplorasi interaktif pada database, maka yang lebih diperhatikan adalah umpan balik untuk beberapa query. Dalam masalah ini, harus dikembalikan pada teknik visualisasi query-independent yang memvisualisasikan item data yang sesuai. Gambar-2 di atas mengilustrasikan visualisasi menggunakan metode pengaturan pixel yang disebut pengaturan spiral dan pengaturan sumbu. Pengaturan tersebut dihasilkan dari sekumpulan data dengan distribusi seragam dan lima klaster yang terdiri atas 7000 item data dengan delapan atribut. Warna diambil dari rentang kuning cerah hingga hijau, biru, merah tua dan beberapa hitam, bergantung pada jarak dari item data dengan jawaban query yang benar. Item data yang lebih baik dalam suatu query diberi warna kuning cerah dan yang paling tidak sesuai diberi warna hitam. Semua teknik yang berorientasi pixel, membagi layar menjadi banyak jendela. Untuk kelompok data dengan m attribut/dimensi, layar akan terbagi dalam m jendela, masing-masing untuk satu atribut. Untuk teknik visualisasi query-dipendent, ditambah jendela ke (m+1) yang disediakan untuk jarak secara keseluruhan. Di dalam jendela-jendela tersebut, data value diatur berdasarkan urutan seluruh data yang diberikan. Karakteristik Teknik berbasis Pixel : • Dapat menangani himpunan data yang besar dan sangat besar dengan tampilan beresolusi tinggi. • Dapat menangani secara wajar untuk data menengah dan dimensi yang tinggi • Tiap-tiap data item dipetakan secara tunggal dengan sebuah titik, sehingga tidak terjadi record yang overlap dan kekacauan secara visual. 3.2 Teknik Proyeksi Geometri Tujuan dari teknik proyeksi geometri adalah memperoleh proyeksi yang menarik atas sekumpulan data multidimensi. Klas dari teknik proyeksi geometri mencakup teknik pengujian statistik seperti komponen utama analisis, analisis faktor dan penskalaan multidimensional, yang merupakan bagian dari istilah ‘projection pursuit’ [Hurber, 1985] [Friedman dan Turkey, 1974]. Karena terdapat jumlah kemungkinan yang tak hingga untuk memproyeksikan data berdimensi tinggi ke tampilan dua dimensi, sistem ‘projection pursuit’ sebagaimana E-102 Seminar Nasional Informatika 2009 (semnasIF 2009) UPN ”Veteran” Yogyakarta, 23 Mei 2009 ISSN: 1979-2328 tujuan dari ‘the grand tour systems’ [Asimov, 1985] adalah pada otomasi dalam perolehan proyeksi yang penting atau paling tidak membantu pengguna untuk memperoleh proyeksi tersebut. Teknik proyeksi geometri yang lain adalah teknik visualisasi koordinat paralel [Inselberg, 1985] [Inselberg dan Dimsdale, 1990]. Teknik koordinat paralel, memetakan ruang berdimensi k ke tampilan dua dimensi dengan menggunakan k sumbu yang berjarak sama dan saling paralel dengan sumbu tampilan. Sumbusumbu tersebut disesuaikan dengan dimensinya dan diberi skala dari nilai terkecil hingga terbesar. Tiap-tiap data item dinyatakan sebagai garis poligon, tiap-tiap sumbu akan berpotongan pada suatu titik sesuai dengan nilai dimensi yang dikehendaki, seperti pada gambar-3 berikut ini : Gambar-3 : Teknik koordinat paralel Meskipun ide dasar dari teknik visualisasi koordinat paralel cukup sederhana, tetapi sangat bagus untuk mengungkapkan berbagai karakteristik data seperti perbedaan sebaran data dan kebertgantungan fungsional. Karena garis poligon sering kali overlap, maka jumlah data item yang dapat divisualisasi pada layar pada saat yang sama adalah terbatas, kira-kira hanya 1000 data item. Contoh visualisasi data berdimensi tiga dapat dilihat pada gambar-4 berikut : Gambar-4 : Contoh visualisasi data berdimensi tiga Karakteristik teknik Geometri : • Dapat menangani himpunan data yang besar dan sangat besar ketika dipasangkan dengan teknik-teknik interaksi yang sesuai, tetapi kekacauan secara visual dan record yang overlap sangat parah untuk himpunan data yang besar. • Dapat menangani secara wajar untuk data menengah dan dimensi yang tinggi • Semua dimensi data dianggap sama, namun urutan sumbu yang ditampilkan mempengaruhi apa yang dapat dirasakan. • Sangat efektif untuk menentukan data pencilan dan hubungan antara dimensi-dimensi yang berbeda. 3.3 Teknik-teknik berbasis icon Klas lain dari teknik visualisasi data mining adalah teknik berbasis icon (iconic display techniques) atau iconographic. Idenya adalah memetakan setiap data item multidimesi ke sebuah icon. Pendekatan pertama tampilan iconic yang terkenal adalah ‘wajah Chernoff’ [Tufte, 1983] [Chernoff, 1973]. Pada visualisasi ‘wajah Chernoff’, dua atribut data dipetakan pada tampilan dua dimensi icon wajah. Sedangkan dimensi sisanya dipetakan ke berbagai bagian dari wajah (bagian hidung, mulut, mata dan bagian wajah itu sendiri). Visualisasi ‘wajah Charnoff’ memberi modal kepekaan manusia pada wajah dan fitur wajah. Banyaknya data item yang dapat divisualisasi dengan teknik ‘wajah Carnoff’ hanya terbatas. Sebuah teknik tampilan berbasis icon yang memungkinkan untuk visualisasi data yang besar dan lebih memadai untuk data mining adalah teknik ‘stick figure’ [Pickett dan Greintein, 1988] [Pickett, 1970] [Greinstein dkk, 1991]. Sesuai dengan namanya, icon merupakan beberapa tipe dari ‘stick figure’. Dalam teknik ini, dua atribut data dipetakan ke tampilan dua dimensi dan dimensi yang lain dipetakan ke sudut dan panjang sayap dari icon ‘stick figure’ seperti pada gambar-5 berikut : E-103 Seminar Nasional Informatika 2009 (semnasIF 2009) UPN ”Veteran” Yogyakarta, 23 Mei 2009 ISSN: 1979-2328 Gambar-5 : Icon ‘stick figure’ Jika data item relatif padat dibandingkan dengan dimensi tampilan, hasil visualisasi menunjukkan tekstur pola yang sangat sesuai dengan karakteristik data dan dapat terdeteksi berdasarkan persepsi sebelumnya. Beberapa Icon ‘stick figure’ yang berbeda dengan berbagai ukuran dimensi dapat pula digunakan seperti yang ditampilkan pada gambar-6 berikut : Gambar-6 : Sebuah himpunan ‘stick figure’ Gambar-7 berikut menunjukkan visualisasi ‘stick figure’ dari data sensus berdimensi lima berdasarkan hasil sensus di Amerika tahun 1980. Selain untuk pendapatan dan umur, maka tribut pekerjaan, tingkat pendidikan, status perkawinan dan jenis kelamin dapat divisualisasian dengan ‘stick figure’. Gambar-7 : Visualisasi ‘stick figure’ dari data sensus Yang menarik adalah perubahan tekstur yang jelas pada layar yang mengindikasikan kebergantungan fungsional atribut-tribut yang lain terhadap penghasilan dan umur. Banyak pemikiran lain tentang visualisasi berbasis icon yang telah dikembangkan dalam beberapa tahun teakhir. Satu pendekatan yang menyediakan visualisasi sembarang dimensi adalah pendekatan shape-coding [Beddow, 1990]. Icon yang digunakan pada pendekatan shape-coding memetakan setiap dimensi dengan sebuah larik kecil dari titik/pixel dan mengatur semua larik pixel dari setiap data item menjadi bentuk kotak. Kotakkotak kecil yang berhubungan dengan data item diatur dalam mode baris demi baris. Karakteristik teknik Visualisasi Iconographic : • Dapat menangani himpunan data kecil hingga menengah dengan ribuan item data, sebagai icon cenderung hanya menggunakan ruang tampilan yang terdiri dari beberapa piksel saja. E-104 Seminar Nasional Informatika 2009 (semnasIF 2009) UPN ”Veteran” Yogyakarta, 23 Mei 2009 • • • ISSN: 1979-2328 Dapat diterapkan pada himpunan data yang berdimensi tinggi, tetapi interpretasinya tidak mudah dan memerlukan pelatihan. Dimensi dianggap berbeda, beberapa penampilan atribut dari icon lebih menarik perhatian daripada yang lain. Dimensi data yang dipetakan ke atribut icon sangat ditentukan dari tampilan yang dihasilkan dari visualisasi. Penentuan pemetaan yang sesuai mungkin sangat sulit dan untuk dimensi data yang lebih tinggi dapat menyebabkan kemacetan proses. Record yang overlap hanya terjadi jika dimensi data dipetakan ke posisi tampilan dari icon. 3.4 Teknik Hirarki dan Teknik Berbasis Graf Selain proyeksi geometri dan visualisasi berbasis icon, terdapat dua klas lagi dalam teknik visualisasi, yaitu teknik hirarki dan teknik berbasis graf. Representasi yang terkenal dari teknik hirarki adalah teknik nVision [Beshers dan Feiner, 1990], dimensional stacking [LeBlanc dkk, 1990] dan treemaps [Shneiderman, 1992]. Teknik hirarki membagi ruang k-dimensi dan menyajikan sub ruang dalam sebuah mode hirarki. Sebagi contoh adalah teknik dimensional stacking yang membagi ruang k-dimensi ke dalam sub ruang 2 dimensi. Kecuali treemaps, teknik hirarki memfokuskan pada visualisasi fungsi multivariat, hal ini menjadi suatu yang tidak menarik untuk aplikasi data mining. Ide dasar dari teknik berbasis graf adalah mengefektifkan penyajian graf yang besar dengan menggunakan algoritma layout khusus, bahasa query dan teknik abstraksi. Contoh dari teknik berbasis graf adalah Hy+ [Consens dan Mendelzon, 1993], Margritte [Vesudevan, 1994] dan SeeNet [Becker dkk, 1995]. Gambar-8 berikut meberi gambaran sebuah pendekatan pada himpunan yang terdiri atas 100 objek tunggal yang diambil dari hasil query dokumen dalam sebuah intranet. Sebuah hirarki klastering obyek dokumen dengan 20 kluster disajikan pada pohon hiraraki kluster dengan tingkat yang berbeda. Pada tingkat paling atas, satu pengamatan terhadap seluruh himpunan data yang disajikan dalam satu klaster, gambar selanjutnya menunjukkan tingkat yang lebih rendah dari pohon hirarki dan yang paling rendah terdiri atas 20 klaster seperti terlihat di bagian kanan bawah. Gambar-8 : Visualisasi pada klastering dengan Hierarki [Sprenger dkk, 2000] Karakteristik teknik Hierarki dan Graf : • Dapat menangani himpunan data dengan ukuran kecil hingga sedang • Lebih sesuai untuk penanganan himpunan data dengan dimensi rendah hingga sedang. • Atribut-atribut dianggap berbeda, pemetaan yang berbeda menghasilkan tampilan data yang berbeda. • Interpretasi dari gambar yang dihasilkan membutuhkan palatihan 4. KESIMPULAN Dari Survey yang dilakukan berkenaan dengan Visual Data Mining dapat diambil kesimpulan antara lain : • Usaha untuk menampilkan hasil eksplorasi data mining secara visual terus mengalami peningkatan. Hal tersebut ditujukan untuk memberikan dukungan yang kuat untuk meningkatkan interpretasi dari pengguna. • Penggabungan berbagai teknik eksplorasi data secara visual dan algoritma-algoritma analisis pada data mining dalam sebuah tool yang komprehensif akan menghasilkan sebuah strategi DM yang lebih kuat. 5. DAFTAR PUSTAKA Anwar T.M., Beck H.W., Navathe S.B., 1992, Knowlwdge Mining by Imprecise Querying : A ClassificationBased Approach, Proc. 8th Int. Conf. On Data Engineering, Tempe, AZ. Pp. 622-630 Becker R.A., Eick S.G., Wills G.J., 1995, Visualization Network Data, IEEE Transactions on Visualizations graphics, Vol. 1, No. 1, pp. 16-28 E-105 Seminar Nasional Informatika 2009 (semnasIF 2009) UPN ”Veteran” Yogyakarta, 23 Mei 2009 ISSN: 1979-2328 Beshers C.G., Feiner S., 1990, Visualization n-Dimensional Virtual Worlds with n-Vision, Computer Graphics, Vol. 24, No. 2, pp. 37-38 Card S.K., Mackinlay J.D. Shneiderman B. (eds), 1999, Reading in Information Visualization – Using Vision to Think, San Francisco : Morgan Kaufmann Chernoff H., 1973, The Use of Faces to Represent Point in k-Dimensional Space Graphically, Journal American Statistical Association, Vol. 68, pp. 361-368 Consens M.P., Mondelzon A.O., 1993, Hy+ : A Hygraph-bases Query and Visualization Systems, Proc. ACM SIG-MOD Inn. Conf. on Management of Data, Washington, DC, pp. 511-516 Dunn G., Everitt B., 1982, An Introduction to Mathematical Taxonomy, Cambridge University Press, Cambridge, MA Fawley W.J, Shapiro G.P., Matheus C.J., 1991, ‘Knowledge Discovery in Database : An Overviw’, in Knowledge Discovery in Database, AAAI Press, Menlo Park, CA, pp. 1-27 Frei H.P., Meienderg S., 1991, Evaluation Weighted Search Terms as Boolean Qeuries, Proc. GI/GMDWorkshop Darmstadt, in : Informatik-Fachberichte, Vol. 289, pp. 11-22 Friedman J., Turkey J., 1974, A Projection Pursuit Algorithm for Exploratory Data Analysis, IEEE Transactions on Computer, Vol. 23, pp. 881-890 Gasterland T., Godfrey P., Minker J., 1992, An Overview of Cooperative Answering, Journal of Intelligent Information Systems, Vol. 1, pp. 123-157 Goebel M., Gruenwald L., 1999, A Survey of Data Mining and Knowledge Discovery Software Tools, ACM SIGKDD Exploration, Vol. 1, No. 1, pp. 20-23 Greinstein G., Sieg J.C., Smith S., Williams G.M., 1991, Visualization for Knowledge Discovery, Technical Report, Computer Science Department, University of Massachusetts at Lowell, MA Hoffman P.E., 1999, Table Visualizations : A Formal Model and Its Applications, doctoral dissertation, Computer Science Dept., Univ. Of Massachusette at Lowel Huber P.J., 1985, Projection Pursuit, The Annals of Statistics, Vol. 13, No. 2, pp. 435-474 Inselberg A., 1985, The Plane with Parallel Coordinates, The Visual Computer, Vol. 1, special issue on computational geometry, pp. 69-91 Inselberg A., Domsdale B., 1990, Parallel Coordianates : A Tool for Visualizing Multi-Dimensional Geomety, Proc. Visualization ’90, San Francisco, CA, pp. 361-370 Keim D.A., Kreigel H.P., 1994, Databases Exploration using Multidimensional Visualization, Computer Graphics & Applications, pp. 40-49 Keim D.A., Kreigel H.P., 1996, Visualization Techniques for Mining Large Databases : A Comparison, IEEE Transactions on Knowledge and Data Engineering, Vol. 8, No. 6, pp. 923-936 Keim D.A., 2000, Designing Pixel-Oriented Visualization Techniques : Theory and Applications, IEEE Transactions Visualization and Computer Graphics, Vol. 6, No. 1, pp. 59-78 LeBlanc J., Ward M.O., Wittels N., 1990, Exploring N-Dimensional Databases, Proc. Visualization ’90, San Francisco, CA, pp. 230-237 Matheus C.J., Chan P.K., Shapiro G.P., 1993, Systems for Knowledge Discovery in databases, IEEE IEEE Transaction on Knowledge and Data Engineering, Vol. 5, No. 6, pp. 903-913 Motto A., 1990, FLEX : A Tolerant and Cooperative User Interface to Database, IEEE Transaction on Knowledge and Data Engineering, Vol. 2, No. 2, pp. 231-246 Oliveira M.C.F., Levkowitz H., 2003, From Visual Data Exploration to Visual Data Mining : A Survey, IEEE Transactions on Visualization and Computer Graphics, Vol. 9, No.3 Pickett R.M., 1970, Visual Analysis of Texture in the Detection and Recognition of Object, in : Picture Precessing ang Psyco-Pictorics, Lipkin B.S., Rosenfeld A. (eds), Academic Press, New York Pickett R.M., Greinstein G.G., 1988, Iconographic Displays for Visualizing Multidimensional Data, Proc. IEEE Conf. on Systems, Man and Cybernetics, IEEE Press, Piscataway, NJ, pp. 514-519 Salton G., Buckley C., 1988, Term Weighting Approaches in Automatic Text Retrieval, Information Processing and Management, Vol. 4, No. 5, pp. 513-523 Shnedermann B., 1992, Tree Visualization with Treemaps : A 2D Space-Filling Approach, ACM Transactions on Graphis, Vol. 11, No. 1, pp. 92-99 Sprenger T.C., Brunella R., Gross M.H., 2000, A Hierarchical Visual Clustering Method Using Implicit Surface, CS Tech. Report #341, Computer Science Dept. ETH Zurich, Switzerland Tufte E.R., 1983, The Visual Display of Quantitative Information, Graphics Press, Cheshire, CT Tufte, E.R., 1990, Envisioning Information, Graphics Press, Cheshire, CT Vasudevan V., 1994, Supporting High Bandwidth Navigation on Object Bases, Proc. 10th Int. Conf. on Data Engineering, Houston, TX, pp. 294-301 Wong P.C., Bergeron R.D., 1997, 30 Years of Multidimensional Multivariate Visualization, Scientific Visualization Overviews, Methodologies and Techniques, Nelson G.M., at all, eds., pp. 3-33. Los Alamitos, Calif. : IEEE CS Pres E-106