Multi-Dimensional Data Visualization JUDUL : MULTI-DIMENSIONAL DATA VISUALIZATION FOR POWER SYSTEMS USING AI AND BIG DATA APPROACHES Tim Mahasiswa : Fadiah Arika Nafiliyah (Departemen Teknik Instrumentasi/FV/ITS) Syafira Aurelia Ariefianty (Departemen Teknik Instrumentasi/FV/ITS) Tim dosen : Ir. Dwi Oktavianto Wahyu Nugroho, S.T., M.T. (Departemen Teknik Instrumentasi/FV/ITS) DEPARTEMEN TEKNIK INSTRUMENTASI FAKULTAS VOKASI INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA 2025/2026 BAB I PENDAHULUAN 1.1. Analisa Situasi IDENTIFIKASI PERMASALAHAN No 1 Permasalahan Sistem tenaga listrik modern, khususnya pada smart grid, menghasilkan data multidimensi yang sangat besar, mencakup parameter waktu, lokasi, tegangan, arus, daya, frekuensi, dan status peralatan. Kompleksitas ini menyebabkan metode visualisasi konvensional dua dimensi tidak mampu merepresentasikan hubungan antar variabel secara efektif, sehingga menyulitkan operator dan analis dalam memahami kondisi sistem secara menyeluruh serta mendeteksi pola dan anomali operasional. 2 Visualisasi data tradisional seperti grafik garis atau diagram batang hanya mampu menampilkan sedikit dimensi data secara bersamaan. Pada sistem tenaga listrik yang kompleks, keterbatasan ini menyebabkan informasi penting seperti korelasi antar variabel dan dinamika sistem tidak teridentifikasi dengan baik, sehingga dapat menurunkan situational awareness operator dan meningkatkan risiko kesalahan analisis. 3 Hingga saat ini, belum terdapat standar visualisasi multidimensi yang terintegrasi dan secara khusus dirancang untuk sistem tenaga listrik skala besar. Akibatnya, banyak penelitian dan implementasi menggunakan pendekatan visualisasi yang berbeda-beda, sehingga menyulitkan integrasi sistem, perbandingan hasil analisis, serta penerapan secara operasional di pusat kendali tenaga listrik. Lokasi Sumber (P/M/D) Smart Grid / Power System Modern (Global, 2020–2024) Jurnal Ilmiah / Konferensi Ilmiah Power System & Power IoT Applications (Global, 2019– 2023) Sistem Distribusi dan Transmisi Tenaga Listrik (Global, 2018–2024) Prosiding Konferensi / Jurnal Internasional Jurnal Ilmiah *P : Perangkat Desa, M : Masyarakat, D : Dinas Instansi Vertikal / Stakeholder PRIORITAS PEMILIHAN PERMASALAHAN No 1. Permasalahan Alasan Pemilihan* Permasalahan ini diprioritaskan karena sistem tenaga listrik modern menghasilkan data yang bersifat multidimensi dan kompleks, sehingga visualisasi dua dimensi tidak lagi mampu menyajikan informasi secara komprehensif. Keterbatasan Keterbatasan visualisasi konvensional dalam tersebut dapat menyulitkan merepresentasikan data multidimensi pada sistem tenaga operator dan analis dalam listrik, sehingga menyulitkan analisis kondisi sistem, memahami kondisi sistem, deteksi anomali, dan pengambilan keputusan operasional. mendeteksi pola maupun anomali, serta mendukung pengambilan keputusan operasional secara cepat dan akurat. Dengan demikian, pengembangan visualisasi data multidimensi menjadi penting untuk meningkatkan efektivitas analisis dan keandalan sistem tenaga listrik. *Uraikan secara rinci mengapa permasalahan diprioritaskan penanganannya 1.2. Perumusan Program No 1 Nama Program Tujuan Program Data Power System Multi-Dimensional yang kompleks dapat Data Visualization disajikan secara for PLN Power lebih jelas, sehingga System memudahkan proses analisis, identifikasi pola, serta deteksi anomali pada sistem tenaga listrik. Waktu Jumlah Dana Unsur yang terlibat 2 Bulan Rp. 300.000 Mahasiswa, Industri 1.3. Penelitian sebelumnya Berdasarkan studi [1], penelitian ini membahas penerapan visualisasi data multidimensi pada sistem tenaga listrik dengan memanfaatkan teknik dimensionality reduction untuk menganalisis data kelistrikan berskala besar. Data yang digunakan mencakup parameter tegangan, arus, daya, dan beban yang dikumpulkan dari sistem monitoring jaringan listrik. Metode t-Distributed Stochastic Neighbor Embedding (t-SNE) digunakan untuk memproyeksikan data berdimensi tinggi ke ruang dua dimensi sehingga pola dan keterkaitan antar variabel dapat divisualisasikan secara lebih intuitif. Hasil penelitian menunjukkan bahwa t-SNE mampu mengungkap pola operasional dan indikasi anomali yang sulit diidentifikasi menggunakan visualisasi konvensional. Studi lain juga dilakukan oleh [2] yang berfokus pada penggunaan Uniform Manifold Approximation and Projection (UMAP) sebagai metode reduksi dimensi untuk visualisasi data sistem tenaga. UMAP diterapkan pada data smart grid dengan volume besar dan dimensi tinggi, serta dibandingkan dengan t-SNE dari sisi kecepatan komputasi dan preservasi struktur data. Hasil penelitian menunjukkan bahwa UMAP lebih efisien dalam pemrosesan data berskala besar dan mampu mempertahankan hubungan global antar data, sehingga lebih sesuai untuk aplikasi visualisasi sistem tenaga listrik secara real-time. Serta di sisi lain, terdapat juga penelitian yang dilakukan oleh [3]. mengombinasikan teknik reduksi dimensi dengan metode clustering Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN) untuk mengelompokkan kondisi operasional sistem tenaga. Data yang telah direduksi menggunakan UMAP kemudian dikelompokkan untuk mengidentifikasi kondisi normal dan anomali. Hasil penelitian menunjukkan bahwa kombinasi UMAP dan HDBSCAN mampu meningkatkan kejelasan visualisasi klaster serta membantu analis dalam mendeteksi anomali sistem tenaga secara lebih akurat. Penelitian terbaru [4] mengangkat pemanfaatan arsitektur Big Data dan Delta Lake dalam pengelolaan data sistem tenaga listrik. Delta Lake digunakan sebagai storage layer untuk menyimpan data kelistrikan dalam jumlah besar dengan konsistensi dan keandalan tinggi. Integrasi Delta Lake dengan proses analisis dan visualisasi multidimensi memungkinkan pengolahan data historis dan real-time secara efisien, serta mendukung pembuatan dashboard visualisasi untuk analisis sistem tenaga listrik. 1.4. Teori 1.4.1 Visualisasi Data Multidimensi Visualisasi data multidimensi merupakan pendekatan untuk merepresentasikan data dengan banyak variabel ke dalam bentuk visual yang lebih mudah dipahami. Pada sistem tenaga listrik, visualisasi ini berperan penting dalam menampilkan hubungan kompleks antar parameter kelistrikan seperti tegangan, arus, daya, waktu, dan lokasi. Dengan visualisasi multidimensi, analis dan operator dapat memahami kondisi sistem secara menyeluruh serta mendeteksi pola dan anomali yang tidak terlihat pada visualisasi dua dimensi konvensional. 1.4.2 Dimensionality Reduction (t-SNE dan UMAP) Dimensionality reduction adalah teknik untuk mengurangi jumlah dimensi data tanpa menghilangkan informasi penting. t-SNE merupakan metode non-linear yang efektif dalam memvisualisasikan struktur lokal data berdimensi tinggi, sedangkan UMAP menekankan keseimbangan antara struktur lokal dan global serta memiliki performa komputasi yang lebih baik pada data berskala besar. Kedua metode ini banyak digunakan dalam visualisasi data sistem tenaga untuk membantu eksplorasi dan pemahaman data kompleks. 1.4.3 Dimensionality Reduction (t-SNE dan UMAP) HDBSCAN merupakan metode density-based clustering yang mampu mengelompokkan data tanpa menentukan jumlah klaster di awal serta mampu menangani noise. Dalam konteks sistem tenaga listrik, HDBSCAN digunakan untuk mengelompokkan kondisi operasional sistem berdasarkan hasil reduksi dimensi, sehingga memudahkan identifikasi kondisi normal dan anomali. 1.4.4 Big Data dan Delta Lake pada Power System Big Data pada sistem tenaga listrik mencakup data dalam volume besar, kecepatan tinggi, dan variasi yang beragam. Delta Lake berfungsi sebagai lapisan penyimpanan data yang mendukung transaksi yang andal, versioning data, dan integrasi dengan analitik lanjutan. Penggunaan Delta Lake memungkinkan pengelolaan data sistem tenaga secara terstruktur dan mendukung proses visualisasi data multidimensi secara efisien. BAB II PELAKSANAAN PROGRAM 2.1. Pelaksanaan Program Sasaran Program Multi-dimensional Data Visualization for PLN Power System Membantu industri dalam proses analisis, identifikasi pola, serta deteksi anomali pada sistem tenaga listrik. Bisnis dan Industri Tempat Departemen Teknik Instrumentasi Nama Program Tujuan Program Jumlah Jam 2 BULAN Waktu Pelaksanaan Kegiatan Peran Mahasiswa Jumlah Dana Sumber Dana Hasil Hambatan Solusi Potensi Daerah 2.2. Merancang sistem kemanan sebagai proteksi ancaman tidak terduga Memberikan ide dan berkontribusi langsung dalam merancang sebuah sistem proteksi keamanan Rp. 300.000PribadiTelah berhasil dirancangnya sistem keamanan dengan menggunakan t-SNE dan UMAP sebagai modelnya Terdapat sedikit error saat proses clustering HDBSCAN Mengembangkan sistem multi-dimensional data visual menjadi lebih terikat akan parameter yang lebih detail Seluruh daerah industri yang memungkinkan Pembahasan Program a) Rencana pelaksanaan kegiatan Rencana pelaksanaan kegiatan pada program Multi-Dimensional Data Visualization for Power System dilakukan secara bertahap, dimulai dari pengumpulan data sistem tenaga listrik yang mencakup parameter kelistrikan dan waktu pengukuran, kemudian data dikelola dalam arsitektur Big Data menggunakan Delta Lake. Selanjutnya dilakukan pra-pemrosesan data untuk memastikan kualitas dan keterpaduan data, diikuti dengan penerapan metode reduksi dimensi t-SNE dan UMAP untuk memvisualisasikan data multidimensi. Hasil visualisasi kemudian dianalisis menggunakan metode HDBSCAN untuk mengelompokkan pola operasional dan mengidentifikasi potensi anomali, sebelum akhirnya dilakukan evaluasi dan penyajian hasil sebagai bahan pendukung analisis dan pengambilan keputusan pada sistem tenaga listrik.. b) Perkiraan Hambatan, tantangan dan cara penyelesaian Hambatan dan tantangan dalam pelaksanaan program ini meliputi kompleksitas dan volume data sistem tenaga listrik yang tinggi, kualitas data yang tidak seragam, serta keterbatasan metode visualisasi dalam menjaga interpretabilitas hasil. Selain itu, pemilihan parameter yang tepat pada metode reduksi dimensi t-SNE dan UMAP serta proses clustering HDBSCAN juga menjadi tantangan karena dapat memengaruhi hasil visualisasi. Untuk mengatasi hal tersebut, dilakukan pra-pemrosesan data secara menyeluruh, penyesuaian parameter secara bertahap, serta pemanfaatan Delta Lake untuk pengelolaan data yang konsisten dan terstruktur, sehingga hasil visualisasi yang dihasilkan tetap akurat, informatif, dan mudah dianalisis.. c) Rancangan Arsitektur Sistem Gambar 2. 1 Arsitektur System Arsitektur sistem ini dirancang untuk memvisualisasikan data berdimensi tinggi dari sistem tenaga listrik menggunakan metode t-SNE, UMAP, dan HDBSCAN. Sistem berbasis Big Data Spark ini memungkinkan pengolahan data dalam dua mode: batch dan streaming. Data dari sensor dan perangkat SCADA dikumpulkan dan disimpan ke dalam Delta Lake, yang berfungsi sebagai data lakehouse untuk penyimpanan efisien dan konsisten. Spark bertanggung jawab atas pemrosesan besar-besaran, baik untuk data historis (batch) maupun data real-time (streaming). Setelah data diproses, pipeline AI menggunakan metode t-SNE dan UMAP untuk melakukan reduksi dimensi, sehingga pola dan anomali dalam sistem tenaga dapat divisualisasikan secara lebih mudah. HDBSCAN kemudian digunakan untuk melakukan clustering otomatis terhadap hasil reduksi dimensi, mendeteksi kondisi operasi sistem seperti normal, overload, atau fault. Hasil analisis divisualisasikan melalui antarmuka HMI dengan dukungan teknologi multi-dimensional visualization, memungkinkan operator untuk memantau status sistem secara interaktif dan intuitif. Arsitektur ini sangat relevan untuk penelitian atau publikasi di jurnal IEEE TVCG atau Information Visualization karena berfokus pada integrasi AI, Big Data, dan visualisasi canggih untuk sistem industri kompleks. d) Hasil Dashboard Dashboard yang dikembangkan menampilkan data overview untuk memberikan gambaran umum karakteristik data sistem tenaga listrik, seperti distribusi parameter kelistrikan dan jumlah data yang dianalisis. Visualisasi t-SNE dan UMAP digunakan untuk merepresentasikan data multidimensi ke dalam ruang berdimensi rendah sehingga pola dan hubungan antar data dapat diamati secara visual. Hasil clustering menggunakan HDBSCAN ditampilkan untuk mengelompokkan kondisi operasional sistem serta mengidentifikasi data yang berpotensi sebagai anomali. Seluruh data yang ditampilkan pada dashboard dikelola menggunakan Delta Lake, sehingga data historis dan data terbaru dapat diakses secara konsisten, terstruktur, dan mendukung analisis berkelanjutan pada sistem tenaga listrik. Keterkaitan ini dapat dilihat pada Gambar 2.2 Gambar 2. 2 Hasil Dashboard e) Hasil t-SNE dan UMAP Hasil visualisasi data menggunakan metode t-SNE dan UMAP yang telah diklaster dengan HDBSCAN menunjukkan adanya pemisahan pola data yang jelas berdasarkan karakteristik operasional sistem tenaga listrik. Klaster yang terbentuk merepresentasikan kondisi operasi yang memiliki kemiripan parameter kelistrikan, sedangkan data yang teridentifikasi sebagai noise menunjukkan potensi kondisi anomali atau penyimpangan dari pola normal. Visualisasi berbasis t-SNE lebih menonjolkan struktur lokal antar data, sehingga klaster tampak terpisah dengan baik, sementara UMAP mampu mempertahankan struktur global data dengan lebih stabil dan efisien. Penerapan HDBSCAN memungkinkan pengelompokan data tanpa penentuan jumlah klaster di awal serta meningkatkan kejelasan interpretasi pola dan anomali pada sistem tenaga listrik. Gambar 2. 3 Hasil t-SNE Gambar 2. 4 Hasil UMAP BAB III KEGIATAN HARIAN No. Tanggal Agenda Kegiatan Jam Pelaksanaan Nama Mahasiswa Jumlah Dana Yang dibutuhkan Sumber Dana Kendala yang dihadapi 1 23 Oktober 2025 Penentuan tematik SCADA dan anggota secara daring 21.41-22.41 All team Rp. 0 - Skema penentuan tematik secara war membuat spreadsheet penuh ricuh 2 25 Oktober 2025 Studi pustaka untuk mencari topik yang relevan terhadap tematik yang dipilih 1x24 jam All team Rp. 0 - - 3 26 Oktober 2025 Merancang arsitektur sistem dan konsep yang akan digunakan 15.00-19.00 All team Rp. 0 - - 4 5 November 2025 Melakukan presentasi konsepan pada Mata Kuliah SCADA secara luring 08.00-08.30 All team Rp. 0 - - 5 15 November 2025 Membeli AI pro untuk membantu Promt pemrograman 1x24 jam Fadiah Arika Nafiliyah Rp. 300.000 Pribadi - 6 7 23 November 2025 Melakukan proses pemrograman awal untuk desain UI 19.00-00.00 26 November 2025 Merancang program untuk t-SNE dan UMAP 13.00-14.00 27 November 2025 Melalkukan penambahan HBD scan untuk Clustering 16.00-22.00 Melakukan presentasi progress pada Mata Kuliah SCADA secara luring 08.00-11.00 8 11 28 November 2025 29 November 2025 Memperbaiki hasil evaluasi presentasi progress 1x24 jam Merancang program dan trial error untuk Big Data 12 4 Desember 2025 13 Rp. 0 Fadiah Arika Nafiliyah Rp. 0 Syafira Aurelia Ariefianty 9 10 All team Pemesanan di hari weekend yang mengakibatkan waktu sedikit terbuang Sensor AS608 tidak berfungsi sebagaimana mestinya - - - - Pribadi - - - - - - - Rp. 0 All Team Rp. 0 All team Rp. 0 - Dirubahnya sedikit konsepan dalam sistem UBA sehingga memakan waktu untuk memperbaiki konsepan Fadiah Arika Nafiliyah Rp. 0 - - Syafira Aurelia Ariefianty Rp. 0 - - 20.00-00.00 Membuat paper menggunakan software La-Tex Agenda Kegiatan Jam Pelaksanaan Nama Mahasiswa Jumlah Dana Yang dibutuhkan Sumber Dana Kendala yang dihadapi Memperbaiki PPT dan melengkapi isi 03.00-05.00 All team Rp. 0 - - 15 Presentasi dan pembuatan video 08.00-11.00 All team Rp. 0 - - 16 Pembuatan Laporan dan Logbook 16.00-19.00 Rp. 0 - - Pembuatan HKI Desain 19.00-19.47 Rp. 0 - - Pembuatan HKI Pemrograman 22.00-22.23 Rp. 0 - - Pengumpulan Flexible Rp. 0 - - No. Tanggal 14 5 Desember 2025 17 14 Desember 2025 Syafira Aurelia Ariefianty Fadiah Arika Nafiliah 18 19 - 16 Desember 2025 All team DAFTAR PUSTAKA Daftar pustaka disusun dan ditulis berdasarkan sistem nomor sesuai urutan pengutipan. Hanya pustaka yang disitasi pada usulan yang dicantumkan dalam Daftar Pustaka. [1] [2] [3] [4] Y. Zhang, T. Huang, and E. F. Bompard, “Big data analytics in smart grids: A review,” IEEE Transactions on Industrial Informatics, vol. 14, no. 6, pp. 2759–2771, Jun. 2018, doi: 10.1109/TII.2018.2810187. L. McInnes, J. Healy, and J. Melville, “UMAP: Uniform manifold approximation and projection for dimension reduction,” arXiv preprint arXiv:1802.03426, 2018. L. van der Maaten and G. Hinton, “Visualizing data using t-SNE,” Journal of Machine Learning Research, vol. 9, pp. 2579–2605, Nov. 2008. R. J. G. B. Campello, D. Moulavi, and J. Sander, “Density-based clustering based on hierarchical density estimates,” in Proc. Pacific-Asia Conf. on Knowledge Discovery and Data Mining (PAKDD), Gold Coast, Australia, 2013, pp. 160–172, doi: 10.1007/978-3-642-374562_14. LAMPIRAN 1. DAFTAR MAHASISWA No*) NAMA MAHASISWA NRP MHS No Kontak MHS 1 Fadiah Arika Nafiliyah 2042221067 +62 853-3473-2461 2 Syafira Aurelia Ariefianty 2042221087 +62 858-8803-2792 Departemen Teknik Instrumentasi Teknik Instrumentasi Fadiah Arika Nafiliyah merupakan mahasiswa angkatan 2022 Teknik Instrumentasi, Fakultas Vokasi, ITS Surabaya. Penulis merupakan salah satu asisten dari Laboratorium Instrumentasi dan kontrol. Penulis memiliki ketertarikan akan minat penelitiannya meliputi kontrol proses, commisioning dan troubleshooting. Penulis dapat dihubungi melalui email : [email protected]. Syafira Aurelia Ariefianty merupakan mahasiswa angkatan 2022 Teknik Instrumentasi, Fakultas Vokasi, ITS Surabaya. Penulis merupakan salah satu asisten dari Laboratorium Instrumentasi dan kontrol. Penulis memiliki ketertarikan akan minat penelitiannya meliputi kontrol proses, commisioning dan troubleshooting. Penulis dapat dihubungi melalui email : [email protected].