Rimba candra krsitiyono 171810301007 Tugas : merangkum dan pertanyaan ( kemometri) Mesin Learning Menurut arthur ( 1959) Mesin learning adalah cabang ilmu yang mempelajari cara membuat komputer dapat belajar tanpa memprogramnya secara eksplisit. Disini di jelaskan bahwa komputer dapat pintar dengan 2 cara yaitu secara eksplisit ( komputer dibuatkan kode) dan secara dinamis ( kode komputer tidak dibuat secara eksplisit) . sedangkan menurut tom mitchell (1998) mesin learning adalah sebuah komputer yang belajar dari pengalaman (E) dengan mempertimbangkan sebuah tugas ( T) dan kemampuannya terukur ( P). Dalam hal ini Tom Mitchell menjelaskan sebuah komputer menjadikan pengalaman atau data yang pernah dimasukkan kedalamnya digunakan untuk menjalankan tugas yang nantinya akan diukur. Ada 3 pembelajaran dalam mesin learning : a. Supervised learning ( pembelajaran terawasi) Supervised learning dalam hal ini komputer diberikan sebuah data atau label. Komputer nanti ditugaskan untuk mengenali objek yang ditunjukkan yang nantinya komputer ditanyakan kembali. b. Unsupervised learning ( pembelajaran tanpa pengawasan) Unsupervised learning dalma hal ini komputer tidak berikan data akan tetapi komputer ditugaskan untuk mengenali objek tersebut. c. Reinforment learning Pada pembelajaran ini pada komputer diberikan sebuah agen yang dimana agen ini memilki lingkungan, pada saat agen ini dapat mengetahui target dengan tepat maka akan diberikan reward positif sedangkan jika agen tidak mampu menujukkan dengan tepat maka akan mendapatkan tanda negatif. Adapun contoh aplikasi E-mail spam filtering Face recognition Image generator Consumer analysis Stock prediction Bidang ilmu dalam mesin learning Kecerdasan buatan Statistika dan probalitas Aljabar linear Metode numerik Deep learning LDA: Reduksi Dimensi Tujuan utama dari reduksi dimensionalitas adalah mereduksi dimensi a set data dengan menghapus fitur redundan dan mengubah fitur dari ruang dimensi yang lebih tinggi ke ruang dengan dimensi yang lebih rendah.Teknik transformasi linier yang populer terutama digunakan untuk reduksi dimensi adalah Analisis Diskriminan Linier (LDA) dan Analisis Komponen Utama (PCA) .PCA adalah algoritme "tanpa pengawasan", dan mencoba menemukan komponen utama yang memaksimalkan varians data tanpa mempertimbangkan label kelas.Berbeda dengan PCA, LDA adalah algoritme "diawasi" dan mencoba menemukan linier diskriminan yang memaksimalkan pemisahan antar kelas. Contoh dari LDA Misalkan kita diberi data dua dimensi c kelas (dua dalam kasus ini). Kelas c1 dan c2 memiliki N1 dan sampel N2. Data X memiliki dua fitur dilambangkan sebagai (x1, X2). Tujuan: Temukan transformasi linier dari X ke y dengan memproyeksikan sampel dalam X ke hyperplane dengan dimensi c -1: y = wTX Dalam kasus data 2D yang ditunjukkan pada gambar, kita membutuhkan untuk memproyeksikan data ke garis yang memaksimalkan keterpisahan linier kelas. Dari data yang disajikan diatas maka perlu memisahkan kedua kelas (hijau, merah) oleh dua fitur di sumbu x1 dan x2. Maka dicoba memproyeksikan fitur ke salah satu dari dua sumbu. Memproyeksikan data ke sumbu X1 akan menghasilkan wilayah yang tumpang tindih dengan sampel yang salah diklasifikasikan. Hal yang sama juga berlaku untuk memproyeksikan data ke sumbu X2 Oleh karena itu, diperlukan sumbu baru untuk membagi sampel ke dalam kelas yang sesuai dengan lebih baik pemisahan. Proyeksi ke sumbu baru memisahkan dua kelas dengan akurasi tinggi dan memproyeksikan data 2D ke 1D. Tetapi bagaimana menemukan sumbu ini? LDA menangani masalah menemukan sumbu ini. Dua kriteria yang digunakan oleh LDA adalah dengan Maksimalkan jarak r antara rata-rata dari dua kelas. Minimalkan variasi s1 dan s2 dalam setiap kelas. Penting untuk memenuhi kedua kriteria tersebut. Maka dengan hal itu dapat dicari tahu cara menghitung LDA. LDA dapat menghasilkan kinerja yang buruk jika jumlah sampel pelatihan terbatas untuk dataset dengan jumlah fitur yang tinggi. LDA lebih mengandalkan mean dari kelas-kelas dalam data set sebagai yang utama determinan, bukan varians data. LDA mengasumsikan bahwa data memiliki distribusi Gaussian, jika asumsi ini adalah tidak benar, struktur kompleks dari kumpulan data tidak dipertahankan. LDA memiliki batasan keputusan linier, sedangkan batas keputusan untuk Diskriminan Kuadrat Analysis (QDA) lebih fleksibel dan bisa menangkap beberapa nonlinier dalam data. Namun, parameter tambahan di QDA melambat menurunkan algoritme dibandingkan dengan LDA dan dapat mengakibatkan over fitting jika jumlah sampel terbatas Pada vidio tersebut membahas bagaimana LDA dapat digunakan untuk reduksi dimensi. Sekarang yang dilakukan adalah cara menggunakan LDA sebagai pengklasifikasi Dengan memberikan contoh input data x, untuk menemukan kelas mana, skor diskriminan dihitung untuk masing-masing kelas: Pi adalah probabilitas sebelumnya yang dimiliki sampel yang dipilih secara acak untuk kelas i, µi rata-rata fitur kelas i, Q- adalah matriks kovarians (sama untuk semua kelas). Kelas dengan skor determinan maksimum dipilih sebagai korespondensi kelas keluaran untuk masukan. Pertanyaan : 1. Apakah Ada perbedaan mesin learning dengan AI, dikarenakan AI sendiri dijalankan dengan teknik yang pendekatannya dari mesin learning ? 2. Bagaimana Cara mempersiapkan data untuk LDA , agar mendapatkan hasil yang maksimal dari model LDA ? 3. Apakah teknik LDA hanya bergantung pada class saja ?