Lagrange-multiplicator

De methode van de lagrange-multiplicatoren is een techniek uit de wiskunde, in het bijzonder uit de wiskundige optimalisatie, om een optimaliseringsprobleem met nevenvoorwaarden op te lossen. Daarbij is een lagrange-multiplicator een bepaald soort hulpvariabele die bij deze techniek wordt ingevoerd, waarmee zowel de formulering als de oplossing van het optimalisatieprobleem sterk vereenvoudigd wordt. De methode is genoemd naar de Italiaanse wiskundige Joseph Louis Lagrange.

 
Afbeelding 1: Zoek de   en   waarvoor de functie   maximaal is, en waarvoor de eis   (weergegeven in het rood) voldaan is.

Veel optimaliseringsproblemen zijn van de vorm:

maximaliseer de functie  
onder de voorwaarde  .

In woorden: zoek het punt   dat op de kromme   ligt en waarvoor de functie   maximaal is. Dit probleem is geschetst op de afbeeldingen rechts.

Als uit de voorwaarde afgeleid kan worden hoe een van de variabelen afhankelijk is van de andere, bijvoorbeeld  , kan deze relatie gesubstitueerd worden in de te maximaliseren functie, zodat het probleem slechts één variabele heeft:

maximaliseer  .

Als dit niet het geval is kan het probleem soms opgelost worden door de invoering van een nieuwe variabele  , de zogeheten Lagrange-multiplicator, en de functie   Lagrangefunctie genoemd, te beschouwen, gedefinieerd door:

 

Het blijkt nu dat er voor een oplossing   van het oorspronkelijke probleem, noodzakelijk een   bestaat waarvoor   een stationair punt is van de functie  .

Deze nieuwe formulering van het probleem heeft twee voordelen: het oorspronkelijke probleem wordt herleid tot een volkomen standaard en goed bestudeerd probleem, namelijk het zoeken naar de stationaire punten van een functie, en verder blijken de op te lossen vergelijkingen in deze formulering in veel gevallen eenvoudiger dan in de oorspronkelijke verwoording.

Intuïtieve uitleg

bewerken
 
Afbeelding 2: Alternatieve weergave van afbeelding 1. De rode lijn in het xy-vlak geeft weer de punten die aan de eis   voldoen, en de waarde van de functie   is nu als hoogte weergegeven. De blauwe lijnen zijn hoogtelijnen, dus lijnen waarlangs de waarde van   constant is. De oplossing is gegeven door de plaats waar de rode lijn raakt aan de blauwe hoogtelijn.

Hierboven werd gesteld dat elke oplossing van het oorspronkelijke variatieprobleem gegeven is door een stationair punt van de Lagrangefunctie  . (Andersom is dit niet waar: niet elk stationair punt van   geeft een oplossing van het oorspronkelijke variatieprobleem.) Om deze uitspraak intuïtief te begrijpen, kan men de volgende redenering houden. Beschouw de lijnen waarlangs de functie   een constante waarde heeft:  . Als men de functiewaarden van   op de z-as aangeeft, zijn deze lijnen de hoogtelijnen. Er zijn er zo twee getekend op de afbeelding rechts (dat wil zeggen, voor twee verschillende functiewaarden   en  ). Stel nu dat we wandelen langs de rode kromme  . Dat is de verzameling punten die aan het vereiste voldoen. In het algemeen zal (gedurende dit wandelen) de waarde van   aan het toe-, dan wel afnemen zijn. Dat wil zeggen dat op die plaatsen de kromme de hoogtelijnen snijdt. Echter, op het punt van de kromme waar   extreem is, verandert de hoogte niet meer (bereikt zijn minimum/maximum), en dus raakt de hoogtelijn daar de kromme  . Aangezien de gradiënt van een functie loodrecht staat op de lijnen waarlangs deze functie constant is, impliceert de vorige zin dat ter hoogte van het gezochte punt – d.w.z. het punt waar   extremaal en   geldt – de gradiënten van   en   evenwijdig zijn. De oplossing van het probleem heeft dus als bijzondere eigenschap

 

Hier drukt de constante   uit dat de loodrecht op de hoogtelijnen staande vectoren (de gradiënten) evenwijdig aan elkaar zijn, maar niet noodzakelijk even groot zijn/in dezelfde richting wijzen.

Nu zien we dat de uitspraak in de voorgaande sectie inderdaad steek houdt. Daar werd gesteld dat de oplossing van het probleem gegeven is door stationaire punten van de Lagrangefunctie, dus punten waarvoor

 

(de notatie   slaat weer op de gradiënt, dus zowel de afgeleiden naar  , en naar  , als die naar   moeten nul zijn.) Als we de uitdrukking voor de Lagrangefunctie   invullen, zien we dat de afgeleiden naar   en   impliceren dat

 

Dat is precies de bovenstaande uitspraak dat ter hoogte van de oplossing, de loodrechte vectoren op de hoogtelijnen van   en   evenwijdig zijn. Anderzijds, de afgeleide naar   geeft het oorspronkelijke vereiste, namelijk

 .

Dit bevestigt (ten minste intuïtief) dat elke oplossing   van het oorspronkelijke probleem overeenkomt met een   die voldoet aan  .

Typisch vindt men echter een aantal oplossingen voor  , waarvan dan slechts een of enkele oplossingen voldoen aan het oorspronkelijke probleem. (Dit is analoog aan het zoeken naar extrema van een functie. De punten waar de afgeleide van de functie nul worden zijn lokale extrema, en typisch zijn daarvan slechts een of twee punten globale extrema.)

Eenvoudig voorbeeld

bewerken
 
Afbeelding 3: eenvoudig voorbeeld.

Voor welk(e) punt(en) op de eenheidscirkel is de som van de coördinaten maximaal? Voor dit probleem is   de functie die gemaximaliseerd moet worden, onder de voorwaarde  . Aangezien de lijnen van constante   gegeven zijn door rechtes, met richtingscoëfficiënt  , kan men vrijwel op het eerste gezicht zien dat de raakpunten tussen een van deze hoogtelijnen en de cirkel zijn gegeven door de punten   en  . Het eerste van de twee is het punt waarin   maximaal is.

De oplossing met een Lagrange-multiplicator gaat als volgt.

De Lagrange-functie is

 

Stel de afgeleiden van   naar   en naar   gelijk aan 0:

 
 

De afgeleide naar   levert weer de voorwaarde

 

De eerste twee vergelijkingen impliceren dat  , en als men dit in de voorwaarde invult, volgt dat  ; dus  .

De punten waarin   een extreme waarde aanneemt, zijn dus   en  . Niet elk extremaal van de Lagrange-functie is een oplossing van het oorspronkelijke probleem. Het maximum van   wordt bereikt voor de eerste van deze twee mogelijkheden.

Betekenis van de multiplicatoren, toepassingen in de economie

bewerken

Bij veel problemen heeft de concrete waarde van de Lagrange-multiplicator ook een betekenis. Bedenk eerst dat:

 

  drukt uit in welke mate het maximum verandert indien men in de voorwaarde   de waarde van   verandert. In de economie gebuikt men Lagrange-multiplicatoren voor vraagstukken van de vorm: gegeven een bepaald budget, hoe kan een bepaalde grootheid (bijv. het economisch nut) dit maximaliseren. De Lagrange-multiplicator geeft dan aan in welke mate de grootheid verandert als men de voorwaarde wijzigt.

Zie ook

bewerken

Referenties

bewerken

(Veralgemenen ook naar de situatie met meerdere opgelegde eisen, wat meerdere Lagrange-multiplicatoren vereist.)

bewerken

Interactief

bewerken
  • (en) Video-les over Langrange-multiplicatoren, toegepast op een concreet voorbeeld uit de economie.