BAB I PENDAHULUAN 1.1 Latar Belakang Kesejahteraan umum

advertisement
BAB I
PENDAHULUAN
1.1 Latar Belakang
Kesejahteraan umum merupakan salah satu tujuan dari pembangunan nasional
Negara Indonesia. Hal ini disebutkan dengan jelas pada Pembukaan Undang-Undang
dasar 1945 di alinea keempat. Kesejahteraan merupakan dambaan setiap menusia
dalam hidupnya. Kesejahteraan dapat dikatakan sebagai suatu kondisi ketika seluruh
kebutuhan manusia terpenuhi. Terpenuhinya kebutuhan manusia dari kebutuhan yang
bersifat paling dasar seperti makan, minum dan pakaian hingga kebutuhan untuk
diakui dalam kehidupan masyarakat. Kesejahteraan umum di Indonesia dapat
digambarkan salah satunya berdasarkan tingkat kemiskinan penduduk di Indonesia.
Terdapat hubungan negatif antara kesejahteraan umum dengan tingkat kemiskinan,
semakin rendah tingkat kemiskinan di Indonesia menggambarkan semakin tinggi
kesejahteraan penduduk di Indonesia.
Kemiskinan menjadi salah satu penyakit dalam perekonomian di hampir
setiap negara, terlebih lagi di negara berkembang seperti Indonesia yang masih
memiliki tingkat kemiskinan cukup tinggi dibandingkan dengan beberapa negara di
sekitarnya. Permasalahan kemiskinan merupakan permasalahan yang kompleks dan
bersifat multidimensional. Oleh karena itu, upaya-upaya pengentasan kemiskinan
harus dilakukan secara benar, mencakup berbagai aspek kehidupan masyarakat dan
dilaksanakan secara terpadu.
Kemiskinan merupakan masalah kompleks yang dipengaruhi oleh berbagai
faktor yang saling berkaitan. Untuk menanggulangi kemiskinan khusus nya di
Indonesia, terlebih dulu ditentukan faktor-faktor yang mempengaruhinya. Masalah
kemiskinan yang dihadapi di setiap negara akan selalu dibarengi dengan masalah laju
pertumbuhan penduduk yang kemudian menghasilkan pengangguran, tingkat
pemenuhan kesehatan masyarakat yang berimbas pada rata-rata harapan hidup suatu
negara dan pendidikan yang menjadi modal utama untuk dapat bersaing di dunia
kerja dewasa ini. Karena itu dalam makalah ini, penulis akan banyak membahas
ketiga masalah tersebut sebagai beberapa faktor faktor pemicu kemiskinan yang
terjadi di Indonesia.
Untuk mengetahui pengaruh faktor faktor tersebut dalam mempengaruhi
persentase kemiskinan di Indonesia diperlukan suatu metode atau model yang baik.
Terdapat beberapa metode atau model yang dapat digunakan untuk mengestimasi
persentase kemiskinan berdasarkan faktor faktor yang telah ditentukan oleh peneliti.
Model yang sering digunakan adalah dengan menggunakan regresi konvensional.
Namun, dewasa ini sering dijumpai beberapa kendala pada data penelitian yang bila
digunakan dengan menggunakan metode regresi konvensional menjadi melanggar
asumsi yang telah ada sehingga berimbas pada keakuratan hasil estimasinya. Apalagi
untuk data regresi semiparametrik, metode yang selama ini ada untuk menyelesaikan
kasus ini adalah dengan menggunakan teknik smoothing yang cenderung memiliki
banyak aturan dan perhitungan yang rumit.
Dengan melihat kondisi-kondisi di atas, maka penulis akan membahas cara
mengestimasi
persentase
kemiskinan
dengan
menggunakan
metode
yang
menawarkan kemudahan dan fleksibilitas yaitu dengan menggunakan metode regresi
random forest yang merupakan pengembangan dari teknik bootstrap pada pohon
keputusan. Dari penelitian pengaruh faktor faktor tersebut terhadap persentase
kemiskinan di Indonesia, maka akan didapatkan solusi penanggulangan yang lebih
efisien dan tepat.
1.2 Pembatasan Masalah
Dalam penulisan ini, pembatasan masalah sangat diperlukan untuk menjamin
keabsahan dalam kesimpulan yang diperoleh. Pembatasan skripsi ini difokuskan pada
penyelesaian regresi semiparametrik dengan menggunakan metode yang lebih mudah
dan fleksibel yaitu regresi random forest. Data yang digunakan pada penelitian ini
adalah data sekunder yang memuat empat prediktor. Data pada penelitian ini
merupakan data persentase kemiskinan yang terdapat pada kabupaten kabupaten yang
terdapat pada berbagai provinsi di pulau Jawa tahun 2012. Dengan variabel yang
mepengaruhi persentase kemiskinan yaitu rata-rata harapan hidup, rata-rata lama
sekolah, angka melek huruf dan kepadatan penduduk.
1.3 Tujuan Penelitian
Adapun tujuan yang ingin dicapai dalam penelitian ini adalah :
1. Sebagai langkah untuk penyusunan dan penulisan skripsi yang merupakan
salah satu syarat untuk memperoleh gelar sarjana sains di Program Studi
Statistika FMIPA UGM
2. Memperluas wawasan keilmuan terutama teknik penyelesaian regresi dengan
cara yang berbeda dari biasanya yaitu dengan menggunakan regresi random
forest.
3. Menjelaskan algoritma pengerjaannya secara runtut dan jelas serta
membandingkan berbagai nilai m yang dicobakan untuk menghasilkan nilai
MSE terkecil.
4. Mengaplikasikan analisis tersebut ke dalam suatu contoh kasus, yaitu untuk
menduga pola hubungan dan seberapa besar pengaruh prediktor prediktor
terrsebut terhadap persentase kemiskinan di kabupaten kabupaten yang ada
di provinsi pada pulau Jawa.
1.4 Manfaat Penelitian
1. Mengaplikasikan ilmu statistika dalam metode regresi yang baru, dengan
menggunakan regresi random forest.
2. Menambah ilmu pengetahuan
3. Memberikan pengembangan pertimbangan untuk analisa mengetahui faktor
penyebab kemiskinan sehingga dapat lebih bijak dalam menentukan solusi
untuk menanggulanginya.
1.5 Tinjauan Pustaka
Decision tree atau pohon keputusan merupakan suatu metode klasifikasi yang
menggunakan struktur pohon, dimana setiap simpulnya merepresentasikan atribut,
cabangnya merepresentasikan nilai dari atribut dan daunnya digunakan untuk
merepresentasikan kelas.
Decision tree adalah metode klasifikasi yang paling populer dan sering
digunakan untuk data yang berjumlah besar atau data dengan variabel independen
yang sangat banyak. Metode decision tree ini mengubah fakta yang sangat besar
menjadi suatu pohon keputusan yang merepresentasikan aturan. Aturan yang
dibangun pun dapat dengan mudah dipahami oleh pengguna. Banyak algoritma yang
dapat dipakai dalam pembentukan pohon keputusan, antara lain ID3, CART dan
C4.5.
CART merupakan metode eksplorasi data yang didasarkan pada teknik
decision tree. Pohon klasifikasi dihasilkan saat respon berupa data kategorik,
sedangkan pohon regresi dihasilkan saat respon berupa data numerik. Pohon
terbentuk dari proses pemilahan rekursif biner pada suatu gugus data sehingga nilai
peubah respon pada setiap gugus data hasil pemilahan akan lebih homogen (Breiman
et al. 1984)
Metode random forest mulai diperbincangkan sejak Breiman menerbitkan
metode ini pada machine learning. Dalam tulisannya ini, Breiman berupaya untuk
memperbaiki proses pendugaan yang sebelumnya dilakukan oleh decision tree dan
CART. Random forest adalah teknik klasifikasi yang terdiri dari kumpulan pohon
klasifikasi yang ditumbuhkan * (
)
+ dimana *
+ adalah vektor
random i.i.d dan masing – masing pohon yang ada digunakan untuk menguji kelas
yang paling popular dari data x yang diinputkan (Breiman, 2001).
Konferensi dunia untuk pembangunan sosial mendefinisikan kemiskinan
sebagai rendahnya tingkat pendapatan dan sumber daya produktif yang menjamin
kehidupan berkesinambungan, kelaparan dan kekurangan gizi, rendahnya tingkat
kesehatan, keterbatasan dan kurangnya akses pada pendidikan dan layanan-layanan
pokok lainnya, kondisi tak wajar akibat penyakit yang terus meningkat, kehidupan
bergelandang dan tempat tinggal yang tidak memadai, lingkungan yang tidak aman,
serta diskriminasi dan keterasingan sosial dan dicirikan juga oleh rendahnya tingkat
partisipasi dalam proses pengambilan keputusan dan dalam kehidupan sipil, sosial
dan budaya. (United Nations, 2006)
World Bank mendefinisikan kemiskinan itu merupakan kondisi dimana
seseorang tidak dapat menikmati segala macam pilihan dan kesempatan dalam
pemenuhan kebutuhan dasarnya seperti tidak dapat memenuhi kesehatan, standar
hidup layak, kebebasan, harga diri dan rasa dihormati seperti orang lain.
1.6 Metode Penulisan
Metode yang digunakan dalam melakukan penulisan skripsi ini adalah studi
literatur. Studi literatur adalah metode pengumpulan data dengan cara mengumpulkan
bahan-bahan yang diperoleh dari mempelajari buku-buku literature yang menyangut
hal-hal yang akan dibahas serta membandingkan dan menerapkan pada permasalahan
yang ada. Sumber literatur yang diperoleh penulis adalah sumber-sumber resmi yang
didapatkan dari perpustakaan, buku teori yang berkaitan, jurnal atau review dan
informasi dari situs-situs yang mendukung yang diperoleh dari internet. Dalam
menyelesaikan penelitian ini, penulis menggunakan bantuan dari beberapa software,
yakni R 2.11.1, SPSS 17.0 dan Microsoft Excel 2010.
1.7 Sistematika Penulisan
Skripsi ini disusun dengan sistematika penulisan sebagai berikut :
BAB I
PENDAHULUAN
Bab ini berisikan latar belakang masalah, pembatasan masalah, tujuan
penulisan, manfaat penulisan, metode penulisan dan sistematika
penulisan yang memberikan arahan terhadap penulisan skripsi ini.
BAB II
DASAR TEORI
Bab ini membahas teori-teori penunjang yang akan digunakan dalam
pembahasan estimasi persentase kemiskinan dengan menggunakan
metode regresi random forest. Teori-teori penunjang tersebut
diantaranya adalah variabel random, fungsi densitas, ekspektasi dan
variansi variabel random, distribusi peluang bersama, distribusi
bersyarat, ekspektasi dan variansi bersyarat, analisis regresi,
pertidaksamaan chebychev, konvergensi pada probabilitas, decision
tree dan kemiskinan dan factor penyebabnya.
BAB III
PEMBAHASAN
Bab ini membahas secara jelas dan runtut tentang bagaimana
algoritma dari random forest dapat menyelesaikan kasus regresi.
Dimulai pada penjelasan algoritma CART sampai pada algoritma
penggabungan pada random forest. Di bab ini juga dijelaskan
bagaimana keakurasian pada regresi random forest.
BAB IV
STUDI KASUS
Bab ini membahas tentang deskripsi data dan juga penerapan aplikasi
metode yang digunakan untuk menganalisis faktor faktor yang
menyebabkan kemiskinan dan mengestimasi persentase kemiskinan.
BAB V
KESIMPULAN DAN SARAN
Bab ini berisikan kesimpulan dari hasil pembahasan bab-bab
sebelumnya dan juga saran atas kekurangan atau kelebihan dari hasil
yang telah dilakukan untuk digunakan sebagai bahan perbaikan
penelitian selanjutnya.
DAFTAR PUSTAKA
LAMPIRAN
Download