Lagrange-multiplicator

De term Lagrange-multiplicator is een begrip en techniek uit de wiskunde (en de studie van wiskundige optimalisatie) genoemd naar de wiskundige Joseph Louis Lagrange. De naam verwijst naar een bepaald soort hulpvariabele die bij deze techniek wordt ingevoerd, waarmee zowel de formulering als de oplossing van het optimalisatieprobleem sterk vereenvoudigd wordt.

UitlegBewerken

 
Afbeelding 1: Zoek de   en   waarvoor de functie   maximaal is, en waarvoor de eis   (weergegeven in het rood) voldaan is.

Veel optimaliseringsproblemen zijn van de vorm:

maximaliseer de functie  
onder de voorwaarde  .

In woorden: zoek het punt   dat op de kromme   ligt en waarvoor de functie   maximaal is. Dit probleem is geschetst op de afbeeldingen rechts.

Als uit de voorwaarde afgeleid kan worden hoe een van de variabelen afhankelijk is van de andere, bijvoorbeeld  , kan deze relatie gesubstitueerd worden in de te maximaliseren functie, zodat het probleem slechts één variabele heeft:

maximaliseer  .

Als dit niet het geval is kan het probleem soms opgelost worden door de invoering van een nieuwe variabele  , de zogeheten Lagrange-multiplicator, en de functie   Lagrangefunctie genoemd, te beschouwen, gedefinieerd door:

 

Het blijkt nu dat er voor een oplossing   van het oorspronkelijke probleem, noodzakelijk een   bestaat waarvoor   een stationair punt is van de functie  .

Deze nieuwe formulering van het probleem heeft twee voordelen: het oorspronkelijke probleem wordt herleid tot een volkomen standaard en goed bestudeerd probleem, namelijk het zoeken naar de stationaire punten van een functie, en verder blijken de op te lossen vergelijkingen in deze formulering in veel gevallen eenvoudiger dan in de oorspronkelijke verwoording.

Intuïtieve uitlegBewerken

 
Afbeelding 2: Alternatieve weergave van Afbeelding 1. De rode lijn geeft wederom de eis   weer, en de waarde de functie   is nu als hoogte weergegeven. De blauwe lijnen zijn hoogtelijnen, dus lijnen waarlangs de waarde van   constant is. De oplossing is gegeven door de plaats waar de rode lijn raakt aan de blauwe hoogtelijn.

Hierboven werd gesteld dat elke oplossing van het oorspronkelijke variatieprobleem gegeven is door een stationair punt van de Lagrangefunctie  . (Andersom is dit niet waar: niet elk stationair punt van   geeft een oplossing van het oorspronkelijke variatieprobleem.) Om deze uitspraak intuïtief te begrijpen, kan men de volgende redenering houden. Beschouw de lijnen waarlangs de functie   een constante waarde heeft:  . Als men de functiewaarden van   op de z-as aangeeft, zijn deze lijnen de hoogtelijnen. Er zijn er zo twee getekend op de afbeelding rechts (dat wil zeggen, voor twee verschillende functiewaarden   en  ). Stel nu dat we wandelen langs de rode kromme  . Dat is de verzameling punten die aan het vereiste voldoen. In het algemeen zal (gedurende dit wandelen) de waarde van   aan het toe-, dan wel afnemen zijn. Dat wil zeggen dat op die plaatsen de kromme de hoogtelijnen snijdt. Echter, op het punt van de kromme waar   extreem is, verandert de hoogte niet meer (bereikt zijn minimum/maximum), en dus raakt de hoogtelijn daar de kromme  . Aangezien de gradiënt van een functie loodrecht staat op de lijnen waarlangs deze functie constant is, impliceert de vorige zin dat ter hoogte van het gezochte punt –   extremaal en   – de gradiënten van   en   evenwijdig zijn. De oplossing van het probleem heeft dus als bijzondere eigenschap

 

Hier drukt de constante   uit dat de loodrechte vectoren (de gradiënten) evenwijdig zijn, maar niet noodzakelijk even groot zijn/in dezelfde richting staan.

Nu zien we dat de uitspraak in de voorgaande sectie inderdaad steekhoudt. Daar werd gesteld dat de oplossing van het probleem gegeven is door stationaire punten van de Lagrangefunctie, dus punten waarvoor

 

(de notatie   slaat weer op de gradiënt, dus zowel de afgeleiden naar  , en naar  , als die naar   moeten nul zijn.) Als we de uitdrukking voor de Lagrangefunctie   invullen, zien we dat de afgeleiden naar   en   impliceren dat

 

Dat is precies de bovenstaande uitspraak dat ter hoogte van de oplossing, de loodrechte vectoren op de hoogtelijnen van   en   evenwijdig zijn. Anderzijds, de afgeleide naar   geeft het oorspronkelijke vereiste, namelijk

 .

Dit bevestigt (ten minste intuïtief) dat elke oplossing   van het oorspronkelijke probleem overeenkomt met een   die voldoet aan  .

Typisch vindt men echter een aantal oplossingen voor  , waarvan dan slechts een of enkele oplossingen voldoen aan het oorspronkelijke probleem. (Dit is analoog aan het zoeken naar extrema van een functie. De punten waar de afgeleide van de functie nul worden zijn lokale extrema, en typisch zijn daarvan slechts een of twee punten globale extrema.)

Eenvoudig voorbeeldBewerken

 
Afbeelding 3: eenvoudig voorbeeld.

Voor welk(e) punt(en) op de eenheidscirkel is de som van de coördinaten maximaal? Voor dit probleem is   de functie die gemaximaliseerd moet worden, onder de voorwaarde  . Aangezien de lijnen van constante   gegeven zijn door rechtes, met richtingscoëfficiënt  , kan men vrijwel op het eerste gezicht zien dat de raakpunten tussen een van deze hoogtelijnen en de cirkel zijn gegeven door de punten   en  . Het eerste van de twee is het punt waarin   maximaal is.

De oplossing met een Lagrange-multiplicator gaat als volgt.

De Lagrange-functie is

 

Stel de afgeleiden van   naar   en naar   gelijk aan 0:

 
 

De afgeleide naar   levert weer de voorwaarde

 

De eerste twee vergelijkingen impliceren dat  , en als men dit in de voorwaarde invult, volgt dat  ; dus  .

De punten waarin   een extreme waarde aanneemt, zijn dus   en  . Niet elk extremaal van de Lagrange-functie is een oplossing van het oorspronkelijke probleem. Het maximum van   wordt bereikt voor de eerste van deze twee mogelijkheden.

Betekenis van de multiplicatoren, toepassingen in de economieBewerken

Bij veel problemen heeft de concrete waarde van de Lagrange-multiplicator ook een betekenis. Bedenk eerst dat:

 

  zegt dus in welke mate de waarde van het bereikte maximum verandert indien men de eis   verandert door een andere waarde voor   toe te laten. Een typische situatie in economie waarbij Lagrange-multiplicatoren gebruikt worden is een vraagstuk van de vorm: gegeven een bepaald budget, hoe kunnen we een bepaalde grootheid (het economisch nut) maximaliseren. In dat geval zal (bij het oplossen van het probleem), de waarde van de Lagrange-multiplicator aangeven in welke mate het nut verandert als men het budget aanpast.

Zie ookBewerken

ReferentiesBewerken

(Veralgemenen ook naar de situatie met meerdere opgelegde eisen, wat meerdere Lagrange-multiplicatoren vereist.)

Externe linksBewerken

InteractiefBewerken

  • (en) Video-les over Langrange-multiplicatoren, toegepast op een concreet voorbeeld uit de economie.