Uploaded by User34255

fungsiimplisit

advertisement
BAB 5
INVERS DAN FUNGSI IMPLISIT
5.2 Teorema Fungsi Terbalik
5.2.1 (Teorema Fungsi Terbalik). Biarkan f : A → Rn (di mana A Ϲ Rn)
menjadi
pemetaan, biarkan a menjadi titik interior A, dan biarkan f terus
terdiferensiasi pada beberapa Ɛ-bola tentang a.(Ini berarti yang pertama
bahwa pemetaan turunan Dfx ada untuk setiap x dalam bola, dan yang kedua
bahwa entri dari turunan matriks f'(x), yaitu, turunan parsial Djfi (x), adalah
fungsi kontinyu dari x pada bola) Misalkan det f'(a) † 0. Kemudian ada
bagian terbuka V Ϲ A yang berisi dan bagian terbuka W C Rn "berisi f(a)
sedemikian rupa sehingga f: V → W memiliki pembalikan terdiferensialkan
secara terus menerus f-1: W → V. Untuk setiap y - f (x) ← W, turunan dari
inverse adalah turunan terbalik,
D(f-1)y – (Dfx)-1
Perlu dicermati bahwa formula untuk turunan dari invers lokal, dan fakta bahwa
turunan dari invers lokal adalah kontinu. Jika invers lokal f-1 dari f diketahui ada
dan dapat terdiferensiasi, maka untuk setiap x ɛ V, fakta bahwa pemetaan
identitas adalah turunannya sendiri menggabungkan dengan aturan rantai untuk
mengatakan bahwa
idn – D(idn)x – D(f-1 о f)n – D(f-1)y о Dfx dimana y – f(x)
dan juga idn-Dfx, di mana waktu ini idn adalah pemetaan identitas pada ruang y.
Rumus terakhir dalam teorema berikut. Dalam hal matriks, rumusnya adalah
(f-1)’ (y) – f’(x)-1 dimana y - f(x).
Rumus ini menggabungkan dengan Corollary 3.7.3 (entri dari matriks invers
adalah fungsi kontinu dari entri matriks) untuk menunjukkan bahwa pemetaan
terus terdiferensiasi dan invers lokal dapat terdiferensiasi, invers lokal terus
terdiferensiasi.
Jadi kita perlu menunjukkan hanya bahwa kebalikan lokal itu ada dan dapat
terdiferensiasi.
5.3 Teorema Fungsi Implisit
Pada materi-materi sebelumnya, penulisan variabel � dan � dalam nilai fungsi berada
pada ruas yang berbeda atau dituliskan sebagai � = (�). Fungsi yang nilai fungsinya
disajikan dalam ruas yang berbeda yaitu � = (�) disebut fungsi eksplisit.
fungsinya tidak seperti itu disebut fungsiimplisit, sebagaicontoh
,
,
. Untuk menentukan turunan dari � dari suatufungsi
dan
implisit dilakukan dengan melakukan proses penurunan pada kedua ruas dan gunakan
teorema turunan yang sesuai. Perhatikan contoh berikut.
Contoh 6.
Tentukan persamaan garis singgung di titik (3,4) pada lingkaran dengan persamaan
.
Penyelesaian:
Jelas
.
Tulis �: Gradien garis singgung.
Jadi PGS di
Gambar situasinya dapat dilihat pada Gambar2.
Dengan menggunakan aturan turuan fungsi implisit dapat diperoleh teorema perumuman
turunan dari
sebagai berikut.
5.4 Lagrange Pengganda: Motivasi Geometris dan ContohSpesifik
Seberapa dekat persimpangan dari bidang x + y + z = 1 dan x − y + 2z = −1 di
R3datang ke titik asal? Pertanyaan ini adalah contoh dari masalah optimisasi lem dengan
batasan.Tujuannya adalah untuk memaksimalkan atau meminimalkan beberapa fungsi, tetapi
dengan hubungan yang dikenakan pada variabel-variabelnya.Setara dengan itu, the masalah
adalah untuk mengoptimalkan beberapa fungsi yang domainnya adalah levelset.
Solusi geometrik dari masalah sampel yang baru diberikan adalah bahwa pesawat
berpotongan dalam garis melalui titik p = (0, 1, 0) dalam arah d = (1, 1, 1) × (1, −1, 2),
sehingga rumus jarak point-to-line dari latihan 3.10. 11 jawaban pertanyaan.Metode ini
mudah dan efisien.
Metode solusi yang lebih umum melalui substitusi. Persamaan persamaan bidang
yang menghambat adalah x + y = 1 - z dan x - y = −1 - 2z; menambahkan memberi x = −3z /
2, dan pengurangan memberikan y = 1 + z / 2. Untuk menyelesaikan masalah, minimalkan
fungsi d2 (z) = (−3z / 2) 2 + (1 + z / 2) 2 + z2, di mana d2 menunjukkan jarak kuadrat dari asal.
Meminimalkan d2 daripada menghindari akar kuadrat.
Tidak semua masalah yang terbatas dengan mudah menghasilkan salah satu metode
ini.Itu kondisi yang lebih tidak teratur, semakin kurang mereka berubah menjadi geometri,
dan semakin banyak variabel yang kusut, semakin tidak mudah mereka menyuling. Hanya
menambahkan lebih banyak variabel untuk masalah sebelumnya menghasilkan gangguan:
Seberapa dekat hubungannya persimpangan dari pesawat v + w + x + y + z = 1 dan v - w +
2x− y + z = −1 di R5 datang ke asal? Sekarang tidak ada prosedur geometrik yang terletak
dengan nyaman tangan. Adapun substitusi, aljabar linier menunjukkan itu
Karena fungsi yang dihasilkan d2 (x, y, z) = (−3x / 2 - z)2+ (1 + x / 2 - y)2 + x2 + y2+ z2
adalah kuadrat, diferensiasi parsial dan aljabar linear akan ditemukan titik-titik kritisnya.
Tetapi prosesnya semakinmembosankan.
Mari kita mundur dari hal-hal spesifik (tetapi kita akan kembali ke yang saat ini
belum terpecahkan contoh segera) dan mempertimbangkan secara umum sifat penting yang
penting titik dalam masalah yang terbatas. Diskusi akan berlangsung dalam dua tahap:
pertama kami mempertimbangkan domain masalah, dan kemudian kami menganggap yang
kritis titik
Domain masalah adalah titik-titik dalam n-space yang memenuhi satu himpunan c
kendala. Untuk memenuhi kendala adalah dengan memenuhi syarat
g (x) = 0c
dimana g: A - → Rc adalah pemetaan C1, dengan A ⊂ Rn himpunan terbuka. Itu adalah
himpunan dibatasi membentuk domain dalam masalah adalah tingkat yang ditetapkan L,
persimpangan dari himpunan tingkat fungsi komponen gi dari g. (Lihat angka 5.15 dan
5.16.Gambar pertama menunjukkan dua himpunan tingkat individu untuk skalar bernilai
fungsi pada R3, dan gambar kedua menunjukkannya bersama-sama dan kemudian
ditampilkan persimpangan mereka, tingkat yang ditetapkan untuk pemetaan yang dihargai
vektor.)
Pada titik tertentu p ∈ L, himpunan L harus secara lokal ortogonal terhadap setiap
gradien ∇ gi (p).(Lihat gambar 5.17 dan 5.18. Gambar pertama menunjukkan himpunan level
untuk fungsi komponen dari pemetaan kendala, dan gradien dari fungsi komponen pada p,
sedangkan angka kedua menunjukkan garis singgung dan bidang normal ke tingkat yang
ditetapkan pada p. Pada gambar pertama, tidak ada gradien bersinggungan dengan permukaan
lain, dan sebagainya pada gambar kedua dua gradien tersebut tidak normal satu sama lain.)
Oleh karena itu:
• L ortogonal pada p untuk setiap kombinasi linear darigradien,
Gambar 5.15. Tingkat ditetapkan untuk dua fungsi bernilai skalar pada R3
Gambar 5.16. Perpotongan adalah tingkat yang ditetapkan untuk pemetaan bernilai vektor
pada R3
Setara:
• Setiap kombinasi linear gradien adalah ortogonal terhadap L pada p.
Tapi kami ingin mengubah ide ini dan menegaskan sebaliknya,bahwa:
• Setiap vektor yang ortogonal terhadap L pada p adalah kombinasilinear.
Namun, sebaliknya tidak selalu mengikuti. Secara intuitif, argumennya adalah itu jika gradien
∇ g1 (p),. . . , ∇ gc (p) bebas linear (yaitu, mereka menunjuk
dalam arah nonredundant) maka Teorema Fungsi Implisit harus mengatakan bahwa level
himpunan L karena itu terlihat (n − c) -dimensi dekat p, sehingga ruang vektor ortogonal ke L
pada p adalah c-dimensi, dan vektor semacam itu memang ada kombinasi linear dari gradien.
Argumen intuitif ini bukan buktinya, tetapi untuk sekarang ini adalah heuristik yang baik.
Gambar 5.17. Gradien ke tingkat himpunan di titik persimpangan
Gambar 5.18. Garis singgung dan bidang normal ke persimpangan
Melanjutkan ke tahap kedua dari diskusi, sekarang anggaplah bahwa p adalah titik
kritis dari pembatasan untuk L dari beberapa fungsi C1 f: A → R. (Dengan demikian f
memiliki domain yang sama A ⊂ Rn as g.) Kemudian untuk setiap vektor satuan d
menggambarkan arah dalam L pada p, DFI derivatif arah (p) harus 0. Tetapi Ddf (p) = h∇ f
(p), di, jadi ini berarti bahwa:
• ∇ f (p) harus ortogonal terhadap L padahal.
Pengamatan ini menggabungkan dengan deskripsi kita tentang vektor yang paling umum
orthogonal ke L at p, di peluru ketiga di atas, untuk memberi kondisi Lagrange:
Anggaplah bahwa p adalah titik kritis dari fungsi f terbatas pada level yang diatur L
= {x: g (x) = 0c} dari g. Jika gradien ∇ gimp) secara linear independen, lalu
dan karena p berada di level yang ditetapkan, juga
g (p) = 0c.
Mendekati masalah terbatas dengan menyiapkan kondisi ini dan kemudian bekerja
dengan variabel baru λ1,. . . , λc terkadang lebih mudah dari yang lain metode. Λi adalah
konstanta yang berguna tetapi tidak relevan.
Diskusi ini telah menghasilkan kriteria pengali Lagrange untuk linier versi masalah
yang dibatasi. Bagian selanjutnya akan menggunakan Teorema Fungsi Tersirat untuk
menurunkan kriteria untuk yang sebenarnya dibatasi masalah, dan kemudian akan
memberikan beberapa contoh umum. Sisa dari ini bagian didedikasikan untuk contoh
spesifik,
Kembali ke contoh kedua yang belum terselesaikan di awal bagian,fungsi yang
dimaksud adalah
f(v,w, x, y, z) = v2 + w2 + x2 + y2 + z2
g1(v,w, x, y, z) = v + w + x + y + z − 1
g2(v,w, x, y, z) = v − w + 2x − y + z + 1
dan kondisi dan batasan Lagrange yang sesuai adalah (setelah menyerap a 2 ke λ, yang nilai
khususnya tidak relevan)
(v, w, x, y, z) = λ1 (1, 1, 1, 1, 1) + λ2 (1, −1, 2, −1, 1)
= (λ1 + λ2, λ1 - λ2, λ1 + 2λ2, λ1 - λ2, λ1 + λ2)
v+w+x+y+z=1
v - w + 2x - y + z = −1.
Ganti ekspresi dari kondisi Lagrange menjadi kendala untuk mendapatkan 5λ1 + 2λ2 = 1 dan
2λ1 + 8λ2 = −1. Itu adalah,
=
dan sebagainya, membalikkan matriks untuk memecahkan sistem,
=
=
Perhatikan betapa lebih nyaman kedua λ untuk bekerja daripada lima variabel asli. Nilai-nilai
mereka adalah tambahan untuk masalah asli, tetapi mengganti kembali sekarang memberikan
titik terdekat ke asal,
(v, w, x, y, z) =
dan jaraknya dari asal adalah
(3, 17, −4, 17,3),
/ 36. Contoh ini hanyalah satu contoh masalah umum
menemukan titik terdekat ke asal dalam subjek Rn untuk c kendala affine. Kami akan
menyelesaikan masalah umum di bagianselanjutnya.
Contoh dari geometri adalah Euclid’s Least Area Problem. Diberikan sebuah sudut
ABC dan titik P interior ke sudut seperti yang ditunjukkan pada gambar 5.19, garis apa
melalui P memotong dari sudut segitiga daerah terkecil?
Gambar 5.19. Pengaturan untuk Masalah Area Least Euclid
Gambarkan garis L melalui P sejajar dengan AB dan biarkan D menjadi
perpotongannya dengan AC. Biarkan menunjukkan jarak AD dan biarkan h melambangkan
ketinggian dari AC ke P. Baik a dan h adalah konstanta. Diberikan setiap baris lain L ′
melalui P, biarkan x menunjukkan persimpangannya dengan AC dan H menunjukkan
ketinggian dari AC ke perpotongan L ′ dengan AB. (Lihat gambar 5.20.) Segitiga berarsir dan
subtriangle pada gambar serupa, memberikan relasi x / H = (x - a) /h.
Masalahnya sekarang adalah meminimalkan fungsi f (x, H) = 1/2xH dikenakan
kendala g (x, H) = 0 di mana g (x, H) = (x - a) H - xh = 0. Lagrange kondisi ∇ f (x, H) = λ∇ g
(x, H) dan kendala g (x, H) = 0 menjadi, setelah menyerap 2 ke λ
(H, x) = λ (H - h, x - a),
(x - a) H = xh.
Hubungan pertama dengan cepat menghasilkan (x - a) H = x (H - h).
Menggabungkan ini dengan yang kedua menunjukkan bahwa H - h = h, yaitu, H = 2h. Solusi
Euclid's masalah adalah, oleh karena itu, untuk mengambil segmen yang dibelah oleh P
antara dua sisi dari sudut.(Lihat gambar5.21.)
Contoh dari optik adalah Hukum Snell. Sebuah partikel bergerak melalui medium 1
pada kecepatan v, dan melalui medium 2 pada kecepatan w. Jika partikel itu berasal
Gambar 5.20. Konstruksi untuk Masalah Area Minimal Euclid
Gambar 5.21. Solusi Masalah Area Least Euclid
titik A ke titik B seperti yang ditunjukkan dalam jumlah waktu yang paling mungkin, apa itu
hubungan antara sudut α dan β? (Lihat gambar 5.22.)
Karena waktu adalah jarak kecepatan, sedikit trigonometri menunjukkan bahwa ini
masalah setara dengan meminimalkan f (α, β) = a dt α / v + b detik β / w subjek ke kendala g
(α, β) = tan α + b tan β = d. (g mengukur jarak lateral bepergian.) Kondisi Lagrange ∇ f (α, β)
= λ∇ g (α, β) adalah
Oleh karena itu λ = sinα / v = sin β / w, memberikan hubungan terkenal Snell,
=
Gambar 5.22. Geometri Hukum Snell
Untuk contoh geometri analitik, biarkan fungsi f mengukur kuadrat jarak antara titik
x = (x1, x2) dan y = (y1, y2) di pesawat,
f (x1, x2, y1, y2) = (x1 - y1)2 + (x2 - y2) 2.
Perbaiki titik a = (a1, a2) dan b = (b1, b2) di pesawat, dan perbaiki bilangan positif r dan s.
Menetapkan
g1(x1, x2) = (x1 − a1)2 + (x2 − a2)2 − r2,
g2(y1, y2) = (y1 − b1)2 + (y2 − b2)2 − s2
g(x1, x2, y1, y2) = (g1(x1, x2), g2(y1, y2)).
Kemudian himpunan empat tuple (x1, x2, y1, y2) seperti itu
g(x1, x2, y1, y2) = (0, 0)
dapat dilihat sebagai himpunan pasangan titik x dan y yang terletak pada lingkaran berpusat
pada a dan b dengan r jari-jari dan s. Dengan demikian, untuk mengoptimalkan fungsi f
tunduk pada kendala g = 0 adalah untuk mengoptimalkan jarak antara pasangan menunjuk
pada lingkaran. Deretan matriks 2-oleh-4
g′(x, y) = 2
bebas linear karena x 6 = a dan y 6 = b. Kondisi Lagrange berhasil
(x1 − y1, x2 − y2, y1 − x1, y2 − x2) = λ1(x1 − a1, x2 − a2, 0, 0)− λ2(0, 0, y1 − b1, y2 − b2),
Atau (x − y, y − x) = λ1(x − a, 02) − λ2(02, y − b).
Paruh kedua dari vektor di sebelah kiri adalah inversi aditif pertama, jadi kondisi
penulisan ulang sebagai
x − y = λ1(x − a) = λ2(y − b).
Jika λ1 = 0 atau λ2 = 0 maka x = y dan keduanya λi adalah 0. Jika tidak λ1 dan λ2 adalah
bukan nol, memaksa x dan y menjadi titik-titik berbeda seperti itu
x − y k x − a k y − b,
dan jadi poin x, y, a, dan b adalah collinear. Memang, hasil ini sudah jelas geometris, tetapi
menyenangkan untuk melihat mereka mengikuti begitu mudah dari Lagrange kondisi
pengganda.Di sisi lain, tidak semua titik x dan y seperti x, y, a, dan b adalah collinear adalah
solusi untuk masalah ini.Misalnya, jika keduanya lingkaran dibelah oleh sumbu x dan tidak
ada lingkaran yang berada di dalam lingkaran lainnya x dan y bisa menjadi titik paling kiri
dari lingkaran, baik yang paling dekat maupun yang tidak pasangan terjauh.
Contoh terakhir dari bagian ini dimulai dengan memaksimalkan nilai geometrik dari
n angka non-negatif,
f(x1, . . . , xn) = (x1 · · · xn)1/n, setiap xi ≥ 0,
tunduk pada kendala bahwa mean aritmatika mereka adalah 1,
= 1, setiap xi ≥0.
Himpunan seperti (x1,..., Xn) -vektor kompak, menjadi bagian tertutup dari [0, n]n. Karena f
kontinyu pada domainnya [0, ∞) n, itu terus menerus pada yang dibatasi set, sehingga
dibutuhkan nilai minimum dan maksimum pada himpunan yang dibatasi. Di setiap himpunan
point yang dibatasi memiliki beberapa xi= 0, fungsi-nilai f = 0 adalah minimum. Semua poin
dibatasi lainnya, memiliki masing-masing xi> 0, terletak di interior dari domain f. Hasilnya
adalah kita dapat mengasumsikan bahwa semua xipositif dan mengharapkan metode pengali
Lagrange untuk menghasilkan nilai maksimum dari f di antara nilai-nilai yang dihasilkannya.
Terutama, jika pengganda Lagrange metode hanya menghasilkan satu nilai (seperti yang
akan) maka nilai itu harus menjadimaksimum.
Fungsi pembatasnya adalah g (x1,.... Xn) = (x1 + · · · + x n) / n, dan gradien dari f dan
gadalah
∇ f(x1, . . . , xn)=
∇ g(x1, . . . , xn) = (1, . . . ,1).
Kondisi Lagrange ∇ f = λ∇ g menunjukkan bahwa semua xi adalah sama, dan kendala g = 1
memaksa nilainya menjadi 1. Oleh karena itu, nilai maksimum dari mean geometrik ketika
mean aritmetik adalah 1 adalahnilainya
f(1, . . . , 1) = (1 · · · 1)1/n = 1.
Argumen pengganda Lagrange ini menyediakan sebagian besar bukti
Teorema 5.4.1 (Aritmatika – Ketimpangan Geometris Berarti)
Nilai geometrik dari n bilangan positif paling banyak berarti aritmatiknya:
(a1 · · · an)1/n ≤
for all nonnegative a1, . . . ,an.
Bukti. Jika ada ai = 0 maka ketidaksetaraannya jelas. Diberikan angka positif a1, . . . , an,
biarkan a = (a1 + · · · + a n) / n dan biarkan xi = ai / a untuk i = 1,. . . , n. Kemudian (x1 + · · ·
+ xn) / n = 1 dan karenanya
(a1 · · · an)1/n = a(x1 · · · xn)1/n ≤ a =
Meskipun contoh-contoh ini menyenangkan, pengganda Lagrange secara umum
tidak ada obat mujarab komputasional.Beberapa masalah optimasi dengan kendala adalah
dipecahkan setidaknya dengan mudah oleh geometri atau substitusi.Meskipun demikian,
Lagrange metode memberikan ide pemersatu yang membahas berbagai jenis pengoptimalan
masalah tanpa mengacu pada geometri atau pertimbangan fisik. Dalam latihan berikut,
gunakan metode apa pun yang Anda anggap nyaman.
5.5 Lagrange Pengganda: Bukti Analitik Dan ContohUmum
Ingat bahwa lingkungan untuk optimasi dengan kendala terdiri dari
• himpunan terbuka
,
• penghambatpemetaan
,
• himpunan level yangsesuai
• dan
-fungsi
untuk mengoptimalkan padaL.
Kami berpendapat secara geometris, dan tidak sepenuhnya ketat, bahwa jika
dioptimalkan pada titik
maka gradien
pada
adalah ortogonal terhadap L pada p. Juga,
setiap kombinasi linear dari gradien fungsi komponen g adalah ortogonal terhadap L pada p.
Kami ingin menegaskan sebaliknya, bahwa setiap vektor yang ortogonal terhadap L pada p
adalah kombinasi linear. Pernyataan sebaliknya yang diinginkan tidak selalu berlaku, tetapi
ketika itu memberikan kondisi Lagrange,
Berikut adalah justifikasi analitik yang ketat bahwa metode pengali Lagrange
biasanya bekerja. Teorema Fungsi Tersirat akan melakukan pengangkatan yang
berat, dan ini akan menegaskan kembali bahwa metode dijamin hanya jika
gradien fungsi komponen g adalah bebas linear. Teorema membuat bukti ketat
kriteria Lagrange lebih mudah dan lebih persuasif
— setidaknya menurut pendapat penulis — daripada argumen heuristik yang
diberikan sebelumnya.
Teorema 5.5.1 (Kondisi Pengali Lagrange).Biarkan n dan c menjadi bilangan
bulat positif dengan
.Biarkan
(di mana
) menjadi
pemetaan yang terus terdiferensiasi di setiap titik interior A. Pertimbangkan
level yangditetapkan
Biarkan
menjadi fungsi. Anggaplah bahwapembatasan
ke
memiliki nilai ekstrimpadatitik
yang merupakan titik interior A.Anggaplahbahwa
terdiferensiasi
pada
, dan anggap bahwa matriks derivatif c-oleh-n
berisi blok c-by-c
yang dapat dibalik. Kemudian kondisi berikut iniberlaku:
Buktinya akan memuncak ide-ide dalam bab ini sebagai berikut. Teorema
Fungsi Terbalik mengatakan:
Jika masalah inversi yang dilinearisasi dipecahkan maka masalah inversi
yang sebenarnya dapat dipecahkan secara lokal.
Meskipun grafik adalah ruang melengkung, di mana teknik-teknik bab 4 tidak
berlaku, domainnya adalah ruang lurus, di mana mereka melakukannya.
Yaitu, Fungsi Implisit Teorema memungkinkan kita mengurangi pengoptimalan pada grafik
untuk optimalisasi pada domain, yang kita tahu bagaimana melakukannya.
Bukti. Kondisi kedua berlaku sejak
Misalkan
adalah titik di
. Kondisi pertama perlu dibuktikan.
, jumlah variabel yang harus tetap bebas di bawah kendala
dan notatetitik sebagai
dimana
notasi ini,kitamemiliki
dan
dan
,
. Denganmenggunakan
di mana M adalah c-by-r
dan N adalah c-by-c dan dapat dibalik. (Kita dapat mengasumsikan bahwa N adalah blok
yang dapat dibalik dalam hipotesis teorema karena kita dapat dengan bebas mengubah
variabel). Fungsi Implis Teoremamemberikanpemetaan
dan a adalah titikinterior
dekat
Buatlah
(di mana
)dengan
, dan untuksemuatitik
,
jika dan hanyajika
hanya bergantung pada variabel bebas denganmendefinisikan
(Lihat gambar 5.23.) Karena domain
tidak melengkung di dalamruang yang lebihbesar,
dioptimalkan oleh teknik-teknik dari bab 4. Artinya, Teoritik Fungsi Implisit telah
mengurangioptimalisasipadahimpunanmelengkunguntukoptimasidalamruangEuclidean
. Secara khusus, Teorema Titik Kritis multivariabel mengatakan bahwa
memiliki titik
kritis padaa,
Tugas kita adalah untuk mengekspresikan tampilan sebelumnya dalam hal data yang
diberikan dan .
Melakukannya akan menghasilkan kondisi Lagrange.
Karena
kondisi
adalah komposisi, Aturan Rantai mengatakan bahwa
adalah
,atau
.
Biarkan
di
dan
adalah vektor baris, dan ingatbahwa
. Tampilan sebelumnya menjadi
memberi
. Ungkapan ini untuk
dan identitas sepele
digabungkan
untuk memberigiliran
Tetapi
dan
dan
(vektor baris dalam
. Jadi tetapkan
), dan tampilan sebelumnya persis kondisiLagrange,
.
Kami telah melihat bahwa Kondisi Pengali Lagrange diperlukan tetapi tidak cukup untuk
nilai ekstrim. Artinya, ia dapat melaporkan positif palsu, seperti dalam masalah dua lingkaran
di bagian sebelumnya. Positif palsu bukanlah masalah serius karena memeriksa semua poin
yang memenuhi kondisi Lagrange akan menentukan mana dari mereka yang memberikan
ekstrem sebenarnya dari
. Negatif palsu akan menjadi situasi yang lebih buruk, memberi
kita tidak ada indikasi bahwa nilai ekstrem mungkin ada, apalagi cara menemukannya.
Contoh berikut menunjukkan bahwa skenario negatif palsu dapat muncul tanpa blok c-by-c
yang dapat dibalikkan yang diperlukan dalam Teorema5.5.1.
Biarkan suhu di pesawat diberikan oleh Gambar 5.23. Kriteria Pengganda Lagrange dari
Teorema Fungsi Implisit
dan mempertimbangkan satu himpunan pesawat didefinisikan oleh satu kendala pada dua
variabel,
.
(Lihat gambar 5.24.) Karena suhu meningkat ketika kita bergerak ke kanan, titik terdingin
adalah titik paling kiri, titikpuncakpada
Namun, kondisi Lagrange tidak menemukan
titik ini. Memang, fungsi penghambatadalah
(yang memang memiliki
turunan terus-menerus, meskipun himpunan levelnya memiliki titik puncak: grafik dari fungsi
halus mulus, tetapi level himpunan fungsi yang halus perlu tidak mulus — inilah masalah
yang dibahas oleh Teorema Fungsi Implisit). Oleh karena itu kondisi Lagrange dan
batasannya adalah
Persamaan ini tidak memiliki solusi. Masalahnya adalah bahwa gradien di titikpuncak adalah
, dan tak satu pun dari subblocks 1-oleh-1 yang dapat dibalik.Secara
umum, Kondisi Pengali Lagrange tidak akan melaporkan negatif palsu selama kita ingat
bahwa itu hanya mengklaim untuk memeriksa ekstrema pada titik nonsingular dari
sehingga
, poin
memiliki sebuah c-by-c yang dapat dibalik sub block.
Bagian sebelumnya memberikan contoh spesifik dari metode pengali Lagrange.
Bagian ini sekarang memberi beberapa keluarga contoh umum.
Ingat bahwa bagian sebelumnya membahas masalah mengoptimalkan jarak antara dua
titik di pesawat, setiap titik tergeletak di lingkaran terkait. Sekarang, sebagai contoh umum
pertama dari metode pengali Lagrange,biarkan
titik masing-masing dari
tersebut,
, danbiarkanfungsi
menunjukkansepasang
mengukur kuadrat jarak antara pasangan
Gambar 5.24. Kurva dengan titik puncak
Perhatikan bahwa
, melihat
Diberikanduapemetaan
dan
dan
sebagaivektor baris.
,definisikan
,
Untuk mengoptimalkan fungsi
tunduk pada kendala
mengoptimalkan jarak antara pasangan titik
dari
oleh kondisi
adalah untuk
dan pada tingkat himpunan yang ditetapkan
dan kondisi
. Dengan asumsi bahwa
kondisi Lagrange berlaku untuk pasangan yang mengoptimalkan, itu
di mana
dan
adalah vektor baris. Simetri
mengurangi persamaan
-
vektor ini ke persamaan n-vektor,
Yaitu, baik
atau garis melalui dan
normal ke tingkat pertama yang ditetapkan pada
dan normal ke tingkat kedua yang ditetapkan pada
, generalisasi hasil dari masalah dua
lingkaran. Dengan hasil ini dalam pikiran, Anda mungkin ingin meninjau kembali latihan
0,0.1 dari kata pengantar ke catatanini.
Metode Lagrange multiplier umum lainnya mengoptimalkan fungsi linear atau fungsi kuadrat
yang tunduk pada kendala afinitas atau batasan kuadrat.Kami mengumpulkan hasilnya dalam
satu teorema.
Teorema 5.5.2 (Low-Degree Optimization With Constraints).
(1) Misalkan
(dimana
)tundukpadabatasan
(di mana
memiliki baris linear yang independen,dengan
Periksaapakah
.Jikademikianmaka
identikdengan
(2) Misalkan
;jika tidak,
,dan
).
dikenakan contraint
pada kendala tidak memilikioptima.
(dimana simetris dan dapat dibalikkan)tunduk
padabatasan
(di mana
independen,dengan
,dan
memiliki baris linearyang
).The
yang
tunduk
pada
kendala dan nilai optimaladalah
Terutama ketika A =I,titik
sedemikiansehingga
paling dekat dengan asal
dan jarak kuadratnya dari titikasal
.
(3) Biarkan
(di mana
) tunduk pada kendala
simetris dan dapat dibalik, dan
(di mana
adalah nol). Periksaapakah
. Jika demikian maka input dan nilai optimal mengoptimalkannya
Jika tidak, tunduk pada kendala tidak memiliki optima.
(4) Biarkan
(di mana
simetris) tunduk pada kendala (di
mana M ∈ Mn (R) simetris dan dapat dibalik, dan b ∈ R adalahnol).
Nilai optimal yang mungkin dari subjek f ke kendala adalah
(Istilah "nilai eigen" akan dijelaskan dalam bukti.) Terutama ketika A = I, jarak
kuadrat terdekat dari asal pada permukaan kuadrat
di mana λ merupakan nilai eigen dari.
mengambil bentuk λb
Bukti. (1) Data adalah (melihat vektor sebagai kolom)
Di sini kita mengasumsikan bahwa
, i.e., ada lebih sedikit kendala daripada variabel.
Juga, kami mengasumsikan bahwa baris-baris M secara linier independen dalam
ekivalen(memohonhasildarialjabarlinier),bahwabeberapakolomcdariMadalahbasis
, atau
,
atau
ekuivalen, bahwa beberapa sub-blok c-by-c M (kolom tidak selalu berdekatan) memiliki
determinan bukan nol. Kondisi Lagrange dan batasannyaadalah
Sebelum menyelesaikan masalah, kita perlu mempertimbangkan dua relasi pada tampilan
sebelumnya.
• Kondisi Lagrange
dapat dipecahkan untuk λ tepat ketika
adalah kombinasi
linear dari baris M. Karena M memiliki c baris, masing-masing merupakan vektor dalam
dan karena
, umumnya
,
bukan kombinasi linear dari barisan M, sehingga kondisi
Lagrange tidak dapat dipenuhi. Ituadalah:
Umumnya fungsi dibatasi tidak memiliki optimal.
Namun, kita akan mempelajari kasus luar biasa, ketika
adalah kombinasi linear dari
deretan M. Dalam kasus ini, kombinasi linear dari baris yang memberikan
adalah unik
karena baris tersebut bebas linear. Artinya, ketika λ ada, ia ditentukan secaraunik.
Untuk menemukan satu-satunya kandidat λ, perhatikan bahwa kondisiLagrange
memberikan
, dan dengan demikian
Langkah
pertama kalkulasi ini tidak dapat dibatalkan, sehingga perhitungan tidak menunjukkan bahwa
λ ada untuk ditemukan dalam semua kasus. Tetapi ini menunjukkan bahwa untuk memeriksa
apakah
adalahkombinasilineardaribarisanM,seseorangmemeriksaapakah
, dalam hal ini
Perhatikan bahwa lebih lanjut, kondisi Lagrange
.
tidak mengacu padax
• Kondisi penghambatan Mx = b memiliki solusi x hanya jika b adalah kombinasi linear dari
kolom M. Asumsi kita tentang M menjamin bahwa ini adalahkasusnya.
Dengan
menjadi kombinasi linear dari baris M dan dengan b menjadi kombinasi linear
dari kolom M, kondisi Lagrange dan kendala segera menunjukkan bahwa untuk setiap x
dalam himpunanterbatas,
Yaitu, f tunduk pada kendala g = b adalah konstanta =
.
Untuk wawasan geometrik ke dalam perhitungan, bayangkan ruang kombinasi linier dari
) sebagai bidang, dan bayangkan ruang vektor ˜x
baris M (subruang dimensi AC dari
(an (n − c ) -dimensi subruang dari
sehingga
pesawat.Kondisi
) sebagai sumbu orthogonal ke
mengatakan bahwa kebohongan dalam pesawat, dankondisi
mengatakan bahwa x terletak pada sumbu sejajar dengan sumbu ˜x. (Dari aljabar
linier, solusi dari Mx = b adalah vektor
,
di mana
adalah kombinasi linear unik dari baris-baris M seperti itu
vektor apa saja yang M˜x =
.) Nilai konstanta f adalah
Secara khusus,nilainyaadalah
di mana
= b, dan ˜x adalah
x untuk setiap x pada sumbu.
adalah titik di mana sumbu bertemu dengan
pesawat.
(2) Sekarang kami mengoptimalkan fungsi kuadrat yang tunduk pada kendala afinitas. Di sini
datanya
Seperti pada (1), kita mengasumsikan bahwa
baris M secara linear bebas dalam
, dan kita mengasumsikan bahwa baris-
, yaitu, beberapa kolom c dari M adalah basis dari
,
yaitu, beberapa sub-blok c-by-c M memiliki determinan non-nol. Dengan demikian kendala
Mx=b memiliki solusi x untuk setiap b∈
,.
Untuk mengatur kondisi Lagrange, kita perlu membedakan fungsi kuadrat f. Hitung itu
dan perkiraan linear terbaik dari perbedaan ini adalah
. Itu mengikutiitu
Kembali ke masalah pengoptimalan, kondisi Lagrange dan batasannya
Jadi kemungkinan nilai optimal dari f mengambil bentuk
yang akan kita ketahui segera setelah kita menemukan kemungkinan nilai λ, tanpa perlu
mencari x. Asumsikan bahwa A dapat dibalik. Transpose kondisi Lagrange untuk
mendapatkan
,
dari
mana
λ dan dengan demikian
x
λ sehingga (juga mengasumsikan bahwa matriksc-byc
dapatdibalik)
. Yaitu, nilai
darif
Juga, nilai-x di mana f dioptimalkan adalah
Secara khusus, membiarkan A = I, titik terdekat x dengan asal seperti Mx = b adalah
dan kuadrat jaraknya dari asalnya adalah
(3) Selanjutnya kita mengoptimalkan fungsi linear yang tunduk pada batasan kuadrat.
Datanya adalah
Kondisi Lagrange dan batasannya adalah
Oleh karena itu kemungkinan nilai-nilai f yang dioptimalkan
dan untuk menemukan nilai-nilai ini, sudah cukup untuk menemukan kemungkinan nilai λ.
Dengan asumsi M dapat dibalik, kondisi Lagrange adalah aTM − 1 = λxT, dan karenanya
Jadi (dengan asumsi bahwa) nilai optimalnya
Tampilan kedua dari belakang juga menunjukkan bahwa
, sehingga
kondisi Lagrange memberikan nilai-x yangoptimal,
.
Satu dengan mudah menegaskan bahwa memang
untuk xini.
(Sebagai ilustrasi geometrik kecil dari masalah tanda dalam konteks ini, anggaplah bahwa
dan
, sehingga kendalakuadratikadalah
.Untuk
masalahmengoptimalkandemikiandiaturpadahiperboladikuadranpertamadanketigadari
pesawat
Fungsi yang akan dioptimalkan adalah untuk beberapa
. Karena M adalah inversnya sendiri,kuantitas di bawah akarkuadrat
adalah
, dan dengan demikian masalah optimasi yang dibatasi memiliki solusi hanya
ketika
.Sementaraitu,levelhimpunanfadalahgariskemiringan
,yang
berarti bahwa masalah hanya memiliki solusi ketika level himpunan memiliki kemiringan
negatif. Dalam hal ini, solusi akan berada di dua titik di mana hiperbola bersinggungan
dengan himpunan level: sepasang titik yang berlawanan, satu di kuadran pertama dan satu di
ketiga. Untuk
hiperbola menghambat bergerak ke kuadran kedua dan keempat, dan
masalah memiliki solusi ketika tingkat himpunan f memiliki kemiringanpositif.)
(4) Akhirnya, kami mengoptimalkan fungsi kuadrat yang tundukpada batasan kuadrat.
Datanya adalah
Kondisi Lagrange dan batasannya adalah
Dengan kondisi Lagrange dan kendala, kemungkinan nilai optimal dari f mengambil bentuk
yang akan kita ketahui segera setelah kita menemukan kemungkinan nilai λ, tanpa perlu
mencari x. Dengan asumsi bahwa M dapat dibalik, kondisi Lagrange memberi
Dengan kata lain, x harus memenuhi kondisi yang mengalikan x dengan
memberikan
kelipatan skalar x. Setiap vektor bukan nol x yang memenuhi kondisi ini disebut vektoreigen
dari
. Faktor multiple skalar λ adalah nilai eigen yang sesuai. Kami akan mengakhiri
bagian ini dengan diskusi singkat tentang nilaieigen.
Nilai eigen dari matriks B persegi ditemukan oleh prosedur yang sistematis. Langkah pertama
adalah mengamati bahwa kondisi Bx = λx adalah
Karena setiap eigenvector x tidak nol menurut definisi, B −λI tidak dapat dibalik, yaitu,
Sebaliknya, untuk setiap λ ∈ R yang memenuhi persamaan ini setidaknya ada satu vektor
eigen x dari B karena persamaan
memiliki solusi bukan nol. Jadi nilai eigen
adalah akar sebenarnya dari polinomial
Polinomial ini adalah polinomial karakteristik B, yang telah dibahas dalam latihan 4.7.10.
Sebagaicontoh,bagian(a)darilatihanitumencakupkasusn=2,menunjukkanbahwajika
kemudian
Diskriminan dari polinomial kuadrat ini adalah
Karena
bersifat non-negatif, semua akar dari polinomial karakteristik adalah nyata.Dan
hasil dari aljabar linear mengatakan bahwa untuk setiap n positif, semua akar dari polinomial
karakteristik dari matriks n-by-n simetris adalah nyata juga. Namun, kembali ke contoh kami,
meskipun matriks kuadrat A dan M diasumsikan simetris, produk
tidakperlu.
Sebagai kasus khusus Teorema 5.5.2, bagian (4), jika A = Saya kemudian menemukan vektor
eigen dari M mencakup menemukan titik-titik permukaan kuadrat yang paling dekat dengan
asal atau paling jauh dari titik asal. Misalnya, jika n = 2 dan
mengoptimalkan pada himpunan poin
sehingga,katakanlah,
maka kita
Persamaan yang ditampilkan adalah persamaan dari bagian berbentuk kerucut. Ketika b = 0
kita memiliki elips yang tidak diputar atau hiperbola, dan satu-satunya titik optimal yang
mungkin adalah kelipatan skalar dari
dan
yang terletak pada kurva. Untuk elips,
sepasang titik pada satu sumbu paling dekat dengan titik asal, dan sepasang pada sumbu
lainnyapalingjauh;untukhiperbola,sepasangpadasatusumbuterdekatdantidakadatitik
pada sumbu lainnya. Dalam kasus lingkaran, matriks M adalah kelipatan skalar dari matriks
identitas, dan jadi semua vektor adalah vektor eigen yang sama dengan geometri yang semua
titiknya berjarak sama dari asal. Demikian pula jika n = 3 maka L adalah permukaan seperti
ellipsoid atau hiperboloid.
Download