Uploaded by User90786

tugas kemometri

advertisement
Rimba candra krsitiyono
171810301007
Tugas : merangkum dan pertanyaan ( kemometri)
Mesin Learning
Menurut arthur ( 1959) Mesin learning adalah cabang ilmu yang mempelajari cara membuat
komputer dapat belajar tanpa memprogramnya secara eksplisit. Disini di jelaskan bahwa
komputer dapat pintar dengan 2 cara yaitu secara eksplisit ( komputer dibuatkan kode) dan
secara dinamis ( kode komputer tidak dibuat secara eksplisit) . sedangkan menurut tom mitchell
(1998) mesin learning adalah sebuah komputer yang belajar dari pengalaman (E) dengan
mempertimbangkan sebuah tugas ( T) dan kemampuannya terukur ( P). Dalam hal ini Tom
Mitchell menjelaskan sebuah komputer menjadikan pengalaman atau data yang pernah
dimasukkan kedalamnya digunakan untuk menjalankan tugas yang nantinya akan diukur.
Ada 3 pembelajaran dalam mesin learning :
a. Supervised learning ( pembelajaran terawasi)
Supervised learning dalam hal ini komputer diberikan sebuah data atau label.
Komputer nanti ditugaskan untuk mengenali objek yang ditunjukkan yang nantinya
komputer ditanyakan kembali.
b. Unsupervised learning ( pembelajaran tanpa pengawasan)
Unsupervised learning dalma hal ini komputer tidak berikan data akan tetapi komputer
ditugaskan untuk mengenali objek tersebut.
c. Reinforment learning
Pada pembelajaran ini pada komputer diberikan sebuah agen yang dimana agen ini
memilki lingkungan, pada saat agen ini dapat mengetahui target dengan tepat maka
akan diberikan reward positif sedangkan jika agen tidak mampu menujukkan dengan
tepat maka akan mendapatkan tanda negatif.
Adapun contoh aplikasi
 E-mail spam filtering
 Face recognition
 Image generator
 Consumer analysis
 Stock prediction
Bidang ilmu dalam mesin learning
 Kecerdasan buatan
 Statistika dan probalitas
 Aljabar linear
 Metode numerik
 Deep learning
LDA: Reduksi Dimensi
Tujuan utama dari reduksi dimensionalitas adalah mereduksi dimensi a set data dengan
menghapus fitur redundan dan mengubah fitur dari ruang dimensi yang lebih tinggi ke ruang
dengan dimensi yang lebih rendah.Teknik transformasi linier yang populer terutama digunakan
untuk reduksi dimensi adalah Analisis Diskriminan Linier (LDA) dan Analisis Komponen
Utama (PCA) .PCA adalah algoritme "tanpa pengawasan", dan mencoba menemukan
komponen utama yang memaksimalkan varians data tanpa mempertimbangkan label
kelas.Berbeda dengan PCA, LDA adalah algoritme "diawasi" dan mencoba menemukan linier
diskriminan yang memaksimalkan pemisahan antar kelas.
Contoh dari LDA
Misalkan kita diberi data dua dimensi c kelas (dua dalam kasus ini). Kelas c1 dan c2 memiliki
N1 dan sampel N2. Data X memiliki dua fitur dilambangkan sebagai (x1, X2). Tujuan:
Temukan transformasi linier dari X ke y dengan memproyeksikan sampel dalam X ke
hyperplane dengan dimensi c -1:
y = wTX
Dalam kasus data 2D yang ditunjukkan pada gambar, kita membutuhkan untuk
memproyeksikan data ke garis yang memaksimalkan keterpisahan linier kelas.
Dari data yang disajikan diatas maka perlu memisahkan kedua kelas (hijau, merah) oleh dua
fitur di sumbu x1 dan x2. Maka dicoba memproyeksikan fitur ke salah satu dari dua sumbu.
Memproyeksikan data ke sumbu X1 akan menghasilkan wilayah yang tumpang tindih dengan
sampel yang salah diklasifikasikan. Hal yang sama juga berlaku untuk memproyeksikan data
ke sumbu X2 Oleh karena itu, diperlukan sumbu baru untuk membagi sampel ke dalam kelas
yang sesuai dengan lebih baik pemisahan. Proyeksi ke sumbu baru memisahkan dua kelas
dengan akurasi tinggi dan memproyeksikan data 2D ke 1D. Tetapi bagaimana menemukan
sumbu ini? LDA menangani masalah menemukan sumbu ini. Dua kriteria yang digunakan oleh
LDA adalah dengan Maksimalkan jarak r antara rata-rata dari dua kelas. Minimalkan variasi
s1 dan s2 dalam setiap kelas. Penting untuk memenuhi kedua kriteria tersebut. Maka dengan
hal itu dapat dicari tahu cara menghitung LDA.
LDA dapat menghasilkan kinerja yang buruk jika jumlah sampel pelatihan terbatas
untuk dataset dengan jumlah fitur yang tinggi. LDA lebih mengandalkan mean dari kelas-kelas
dalam data set sebagai yang utama determinan, bukan varians data. LDA mengasumsikan
bahwa data memiliki distribusi Gaussian, jika asumsi ini adalah tidak benar, struktur kompleks
dari kumpulan data tidak dipertahankan. LDA memiliki batasan keputusan linier, sedangkan
batas keputusan untuk Diskriminan Kuadrat Analysis (QDA) lebih fleksibel dan bisa
menangkap beberapa nonlinier dalam data. Namun, parameter tambahan di QDA melambat
menurunkan algoritme dibandingkan dengan LDA dan dapat mengakibatkan over fitting jika
jumlah sampel terbatas
Pada vidio tersebut membahas bagaimana LDA dapat digunakan untuk reduksi
dimensi. Sekarang yang dilakukan adalah cara menggunakan LDA sebagai pengklasifikasi
Dengan memberikan contoh input data x, untuk menemukan kelas mana, skor diskriminan
dihitung untuk masing-masing kelas:
Pi adalah probabilitas sebelumnya yang dimiliki sampel yang dipilih secara acak untuk kelas i,
µi rata-rata fitur kelas i, Q- adalah matriks kovarians (sama untuk semua kelas). Kelas dengan
skor determinan maksimum dipilih sebagai korespondensi kelas keluaran untuk masukan.
Pertanyaan :
1. Apakah Ada perbedaan mesin learning dengan AI, dikarenakan AI sendiri dijalankan
dengan teknik yang pendekatannya dari mesin learning ?
2. Bagaimana Cara mempersiapkan data untuk LDA , agar mendapatkan hasil yang
maksimal dari model LDA ?
3. Apakah teknik LDA hanya bergantung pada class saja ?
Download