Riset Operasi Probabilistik Teori Permainan (Game Theory) Nughthoh Arfawi Kurdhi, M.Sc Departement of Mathematics FMIPA UNS Lecture 2: Pure Strategy A. Strategy Optimum Hal pokok yang sesungguhnya menjadi inti dari teori permainan adalah menentukan solusi optimum bagi kedua pihak yang saling bersaing tersebut yang bersesuaian dengan strategi optimumnya. Ada dua macam strategi optimum, yaitu: a. Strategi Murni (Pure Strategy) b. Strategi Campuran (Mixed Strategy) B. Permainan dengan Strategi Murni Strategi murni adalah strategi dimana setiap pemainnya hanya mempunyai tepat satu strategi atau langkah yang terbaik. P1 : Pemain I (pemain baris), yaitu pemain yang berusaha memaksimumkan kemenangan (keuntungan) yang minimum, sehingga kriteria strategi optimum adalah kriteria maximin. P2 : Pemain II (pemain kolom), yaitu pemain yang berusaha meminimumkan kekalahan (kerugian) yang maksimum, sehingga kriteria strategi optimumnya adalah kriteria minimax. Apabila maximin = minimax, maka permainan ini dapat diselesaikan dengan strategi murni, dimana titik keseimbangan (equilibrium point) telah tercapai. Titik keseimbangan ini dikenal sebagai titik pelana (sadle point). Jika dalam matriks pembayaran ( a ij ) sedemikian sehingga berlaku : max min ( a ij ) min max ( aij ) a rs i j j i (1.1) maka matriks pembayaran tersebut dikatakan mempunyai titik pelana pada (r,s) dan elemen ars merupakan nilai permainan yang bersesuaian dengan strategi optimum bagi pemain pertama (P1), yaitu i = r dan strategi optimum bagi pemain kedua (P2), yaitu j = s. Definisi 2.1. Dalam permainan berjumlah nol dari dua orang, pilihan strategi oleh masing-masing pemain merupakan titik ekuilibrium jika tidak ada pemain yang dapat meningkatkan pembayaran dengan mengganti strategi secara sepihak. Jadi, titik pelana (saddle point) dapat dipandang sebagai titik ekuilibrium (equilibrium point) jika tidak ada pemain yang mendapatkan tambahan pembayaran dengan mengganti strateginya secara sepihak. Catatan: Jika Persamaan (1.1) tidak dipenuhi, maka permainan dengan matriks pembayaran tersebut tidak mempunyai titik pelana dan harus diselesaikan dengan strategi campuran (Mixed Strategy). Contoh 1. Dua perusahaan, A dan B, menjual dua jenis obat flu. Perusahaan A mengadakan promosi produknya melalui radio (A1), televisi (A2), dan surat kabar (A3). Perusahaan B, selain melalui radio (B1), televisi (B2), dan surat kabar (B3), juga menggunakan brosur (B4) untuk mempromosikan produk miliknya. Berdasarkan tingkat efektifitas dari masing-masing media promosi di atas, salah satu perusahaan dapat merebut proporsi pasar dari perusahaan lain. Matriks pembayaran berikut merepresentasikan persentase pasar yang direbut atau hilang oleh perusahaan A. Riset Operasi Probabilistik Teori Permainan (Game Theory) Pemain P1 Max/kolom i/j A1 A2 A3 Nughthoh Arfawi Kurdhi, M.Sc Departement of Mathematics FMIPA UNS B1 8 6 -2 8 Pemain P2 B2 B3 -2 9 5 6 4 -9 5 9 Min/Baris B4 -3 8 5 8 -3 5 -9 Max dari Min Min dari Max Solusi dari permainan di atas berdasarkan pada prinsip “the best of the worst” (pilihan terbaik dari yang terburuk) untuk setiap pemain. Jika perusahaan A memilih strategi A1, maka tanpa memperhatikan strategi pilihan B, kondisi terburuk yang dapat terjadi adalah A kehilangan 3% penguasaan pasar (market share) yang pindah ke B. Hal ini direpresentasikan dengan nilai minimum pada baris 1. Kondisi terburuk jika perusahaan A memilih strategi A2 adalah merebut 5% market share dari B, sedangkan Kondisi terburuk jika perusahaan A memilih strategi A3 adalah kehilangan market share sebesar 9% yang pindah ke B. Hasil ini disusun pada kolom min/baris. Untuk mencapai prinsip the best of the worst, perusahaan A harus memilih strategi A2, yang berkorespondensi dengan nilai maximin, yaitu nilai terbesar pada kolom min/baris. Selanjutnya, perhatikan strategi-strategi perusahaan B. Karena matriks pembayaran yang diberikan adalah pembayaran untuk perusahaan A, maka prinsip the best of the worst untuk perusahaan B berkebalikan dengan perusahaan A, yaitu bersesuaian dengan kriteria minimax. Sehingga perusahaan B harus memilih strategi B2. Solusi optimal dari permainan di atas diperoleh dengan memilih strategi A2 dan B2, yaitu kedua perusahaan harus memilih televisi sebagai media promosi. Pada kondisi ini, market share dari perusahaan A meningkat sebesar 5%. Pada kasus ini, nilai permainan adalah 5%, dan perusahaan A dan B menggunakan solusi titik pelana (saddle-point solution). Dengan solusi titik pelana, dapat menghindarkan pemilihan strategi yang lebih baik bagi perusahaan lain (Perhatikan Definisi 2.1). Jika perusahaan B memilih strategi lain (B1, B3, atau B4), perusahaan A dapat bertahan menggunakan strategi A2, yang mengakibatkan perusahaan B akan semakin kehilangan market share (6% atau 8%). Dengan kondisi yang sama, perusahaan A tidak mau menggunakan strategi lain, karena jika A memilih strategi A3, B dapat berpindah strategi B3 untuk merebut market share 9% dari A. Demikian juga jika A memilih strategi A1, B dapat berpindah ke strategi B4 untuk meningkatkan market share sebesar 3%. Riset Operasi Probabilistik Teori Permainan (Game Theory) Nughthoh Arfawi Kurdhi, M.Sc Departement of Mathematics FMIPA UNS Contoh 2. Diberikan matriks pembayaran sebagai berikut. Pemain P1 i/j 1 2 3 1 5 3 2 5 Max/kolom Pemain P 2 2 -4 1 3 3 Min/Baris 3 -2 -1 -3 -1 4 -1 2 -2 2 -4 -1 -3 Max dari Min Min dari Max Jika nilai minimum tiap barisnya diperhatikan, maka nilai maksimum dari yang minimum tersebut sebesar -1. Demikian juga jika nilai maksimum dari setiap kolomnya diperhatikan, maka nilai minimum dari yang maksimum tersebut sebesar -1 juga. Terlihat bahwa max min ( a ij ) min max ( a ij ) 1 i j j i Jadi, permainan dengan matriks pembayaran di atas mempunyai titik pelana pada (2,3) dan permainan itu dapat diselesaikan dengan strategi murni, yaitu: strategi optimum bagi pemain P1 adalah i = 2, dan strategi optimum bagi pemain P2 adalah j = 3, dengan nilai permainan sebesar -1. Dengan demikian, berarti bahwa pemain P2 memenangkan permainan sebesar 1 (pemain P1 harus membayar sebesar 1 kepada P2 ). Contoh 3. Dua pemain I dan II sedang bermain lempar koin. Setiap pemain, tanpa sepengetahuan yang lain, memilih Gambar (G) atau Angka (A). Kedua pemain tersebut akan membuka pilihan mereka secara serentak. Jika keduanya sama (GG atau AA), pemain A menerima $1 dari B. Sebaliknya, jika keduanya tidak sama (AG atau GA), pemain A harus membayar $1 ke B. Sehingga diperoleh matriks pembayaran untuk pemain I sebagai berikut. Pemain I Max/kolom i/j G A Pemain II G 1 -1 1 Min/baris A -1 1 1 -1 -1 Nilai maximin dan minimax dari permainan di atas berturut-turut adalah -$1 dan $1. Karena nilai maximin tidak sama dengan nilai minimax, maka permainan tidak mempunyai titik pelana atau solusi strategi murni. Sekarang perhatikan, jika pemain I memilih G, pemain II akan memilih A agar memperoleh $1 dari I. Jika hal ini terjadi, pemain I dapat pindah memilih A untuk membalikkan keadaan (permainan) dan menerima $1 dari pemain II. Kecenderungan terus-menerus untuk beralih ke strategi lain menunjukkan bahwa solusi strategi murni tidak dapat diterima. Hal ini juga menunjukkan bahwa permainan tidak mempunyai titik ekuilibrium. Pada kasus ini, nilai optimal permainan berada di antara nilai maximin dan minimax max(min) nilai permainan min(max) −1 ≤ ≤ 1 Riset Operasi Probabilistik Teori Permainan (Game Theory) Nughthoh Arfawi Kurdhi, M.Sc Departement of Mathematics FMIPA UNS Contoh 4. Diberikan matriks pembayaran sebagai berikut. Pemain P1 Max/kolom i/j 1 2 3 4 1 4 3 1 -2 4 Pemain P2 2 3 -2 -3 1 2 -3 -1 4 3 4 3 Min/Baris 4 -1 1 4 5 5 5 0 -4 6 -1 6 -3 -4 -3 -2 Max dari Min Min dari Max Terlihat bahwa Nilai maximin = -2 dan Nilai minimax = 3, sehingga nilai maximin tidak sama dengan nilai minimax. Akibatnya, permainan di atas tidak dapat diselesaikan dengan strategi murni, melainkan dengan strategi campuran. C. Aturan Dominansi Sebelum menyelesaikan suatu permainan, perlu dipertimbangkan apakah ada baris atau kolom dalam matriks pembayarannya yang tidak efektif pengaruhnya di dalam penentuan strategi optimum dan nilai permainan. Jika ada, maka baris atau kolom tersebut dapat dihapus. Hal ini berarti bahwa probabilitas untuk memilih strategi sesuai baris atau kolom tersebut sama dengan nol. Dengan demikian ukuran matriks pembayaran yang tersisa akan lebih kecil. Hal ini akan lebih mempermudah untuk penyelesaiannya. Aturan demikian disebut aturan dominansi, yaitu Pemain P1 : memaksimumkan kemenangan/keuntungan. Jika terdapat suatu baris dengan semua elemen dari baris tersebut adalah sama atau lebih kecil (sekolom) dari baris yang lain, maka baris tersebut dikatakan didominasi dan baris itu dapat dihapus. Pemain P2 : meminimumkan kekalahan/kerugian. Jika terdapat suatu kolom dengan semua elemen dari kolom tersebut adalah sama atau lebih besar (sebaris) dari kolom yang lain, maka kolom tersebut dikatakan didominasi dan kolom itu dapat dihapus. Catatan: Aturan dominansi dapat dimulai dari pemain sebarang. Aturan dominansi dapat diulang jika masih ada baris/kolom yang didominansi oleh baris/ kolom yang lain. Dan ini memungkinkan matriks pembayaran semula akan tersisa menjadi matriks pembayaran dengan satu elemen saja. Jika hal ini terjadi, maka permainan dapat diselesaikan dengan strategi murni dengan nilai permainan = elemen tersisa. Tidak semua permainan yang mempunyai titik pelana dapat diselesaikan dengan aturan dominansi yang berulang-ulang tersebut (tersisa satu elemen). Contoh 5. Diberikan matriks pembayaran berikut ini. Riset Operasi Probabilistik Teori Permainan (Game Theory) Pemain P1 Nughthoh Arfawi Kurdhi, M.Sc Departement of Mathematics FMIPA UNS i/j 1 2 3 4 Pemain P2 2 3 -9 7 -8 4 8 9 1 8 1 4 2 -2 5 4 -2 -4 2 0 5 1 0 3 2 Bagi Pemain P1 : Perhatikan elemen-elemen pada baris ke 1, 2 dan 4. Untuk setiap j = 1, 2, 3, 4, 5, berlaku a1j < a4j dan a2j < a4j. Dengan demikian, pemain P1 tidak akan memilih strategi sesuai baris ke 1 dan 2 apapun strategi dari pemain P2. Dari sini baris ke 1 dan 2 dapat dihapus, sehingga matriks pembayaran menjadi Pemain P1 i/j 3 4 Pemain P2 2 3 8 9 1 8 1 -2 5 4 2 0 5 3 2 Untuk pemain P1 sudah tidak ada baris yang dapat didominansi oleh baris yang lain. Bagi Pemain P2 : Perhatikan kolom ke 2, 3, 4, dan 5. Untuk setiap i = 3, 4 berlaku ai2 > ai4, ai3 > ai4, dan ai5 > ai4. Dengan demikian, pemain P2 tidak akan memilih strategi ke 2, 3, dan 5 apapun strategi dari pemain P1. Dari sini, maka kolom ke 2, 3, dan 5 dapat dihapus, sehingga matriks pembayaran menjadi Pemain P1 i/j 3 4 Pemain P2 1 4 -2 2 5 0 Pada tabel tersebut, ternyata aturan dominansi tidak dapat diulang lagi. Tampak bahwa matriks pembayaran pada akan lebih mudah untuk diselesaikan.