Voetballer schiet op doel in een stadion tijdens een wedstrijd

Laden...

Wie de afgelopen jaren ook maar een wedstrijdsamenvatting heeft bekeken, is het tegengekomen: die mysterieuze afkorting xG die naast de eindstand verschijnt. Commentatoren strooien ermee, analisten bouwen hele betogen erop en bookmakers gebruiken het achter de schermen al jaren. Maar wat zegt expected goals nu eigenlijk, en belangrijker: hoe gebruik je het als wedder om betere beslissingen te nemen?

Wat is expected goals precies?

Expected goals is een statistisch model dat aan elk schot in een voetbalwedstrijd een waarschijnlijkheidswaarde toekent. Die waarde drukt uit hoe groot de kans is dat een gemiddelde speler vanuit die specifieke positie, onder die specifieke omstandigheden, scoort. Een penalty krijgt doorgaans een xG-waarde van ongeveer 0,76, wat betekent dat gemiddeld 76 van de 100 strafschoppen erin gaan. Een kopbal vanuit de zestien na een corner krijgt misschien 0,06, en een volley van dertig meter wellicht 0,03.

De kracht van het model zit in de aggregatie. Door alle schotten van een team op te tellen, krijg je een verwacht doelpuntenaantal dat los staat van geluk, briljante keepersreddingen of palen. Een team dat 2,4 xG produceert maar slechts een keer scoort, heeft waarschijnlijk ongelukkig afgerond. Andersom kan een team met 0,6 xG dat drie keer scoort rekenen op een regressie naar het gemiddelde in komende wedstrijden.

Het cruciale inzicht voor wedders is dat xG een betere voorspeller is van toekomstige prestaties dan werkelijke doelpunten. Teams die structureel boven hun xG scoren zijn niet per se beter, ze hebben simpelweg een afronding die onhoudbaar boven het gemiddelde ligt. Dat patroon corrigeert zichzelf vrijwel altijd over een langere periode.

Hoe wordt xG berekend?

De meeste xG-modellen beginnen met historische schotdata, vaak honderdduizenden schotten uit de grote Europese competities. Elk schot wordt geanalyseerd op een reeks variabelen en vergeleken met vergelijkbare situaties uit het verleden. Het resultaat is een kansinschatting die uitdrukt hoe waarschijnlijk een doelpunt is op basis van die specifieke omstandigheden.

De basisvariabelen die vrijwel elk model gebruikt zijn de afstand tot het doel en de hoek ten opzichte van de doelpalen. Een schot van dichtbij, recht voor het doel, krijgt logischerwijs een hogere waarde dan een poging vanuit een scherpe hoek. Daarnaast speelt het lichaamsdeel een rol: schoten met de voet scoren gemiddeld vaker dan kopballen, en die scoren weer vaker dan pogingen met andere lichaamsdelen.

Geavanceerdere modellen, zoals die van StatsBomb, voegen extra dimensies toe. Ze kijken naar het type aanval dat aan het schot voorafging, of het via een snelle counter kwam of uit opgebouwd positiespel. De positie van de keeper wordt meegenomen, evenals het aantal verdedigers tussen bal en doel. Sommige modellen houden zelfs rekening met de snelheid van de aanval en de hoogte waarop de bal arriveert. Dit levert nauwkeurigere schattingen op, maar maakt de modellen ook complexer en minder transparant.

Belangrijk om te weten is dat niet alle xG-modellen gelijk zijn. Opta, StatsBomb, Understat en FBref hanteren elk hun eigen methodologie. De waarden die ze produceren voor dezelfde wedstrijd kunnen daardoor onderling afwijken, soms aanzienlijk. Als wedder doe je er goed aan om consistent dezelfde bron te gebruiken, zodat je vergelijkingen over tijd kloppen.

Welke factoren wegen het zwaarst?

Onderzoek naar xG-modellen laat steeds opnieuw zien dat drie factoren het leeuwendeel van de voorspellende kracht dragen. De afstand tot het doel is veruit de belangrijkste variabele, op afstand gevolgd door de hoek ten opzichte van de doellijn en het type kans dat ontstaat: een een-op-een met de keeper, een vrij schot na een steekpass of een poging uit de tweede lijn.

Wat veel mensen verrast, is dat variabelen als competitiedruk, minuut van de wedstrijd of de naam van de schutter in de meeste modellen niet worden meegenomen, of nauwelijks gewicht krijgen. Dat is een bewuste keuze. Het model meet de kwaliteit van de kans, niet de kwaliteit van de speler die schiet. Lionel Messi krijgt voor een identiek schot dezelfde xG-waarde als een middenvelder uit de Eredivisie. Het verschil tussen hen zit in hoeveel van die kansen ze daadwerkelijk benutten, en dat meet je met een andere statistiek: post-shot xG of doelpunten minus xG over een langere periode.

Voor wedders is dit onderscheid essentieel. Een team met hoge xG-waarden creëert systematisch goede kansen, ongeacht wie er speelt. Dat is structureel en dus voorspelbaar. Een team dat hoog scoort door individuele briljantie van een enkele aanvaller is kwetsbaarder: als die speler geblesseerd raakt, droogt de productie waarschijnlijk op.

xG toepassen bij het wedden

De meest directe toepassing van xG voor wedders is het identificeren van teams die boven of onder hun verwachte niveau presteren. Een club die na tien speelronden acht punten heeft maar een xG-verschil draait dat bij een middenmoot hoort, wordt door de markt waarschijnlijk onderschat. De odds zullen gebaseerd zijn op de magere puntentotalen, terwijl de onderliggende prestaties suggereren dat betere resultaten aankomen.

Dit werkt ook andersom. Teams die bovenaan staan met een flatterend verschil tussen gescoorde doelpunten en xG zijn kandidaten om te faden, jargon voor het wedden tegen hun voortgezette succes. De bookmaker past odds langzaam aan op basis van resultaten, maar als wedder kun je met xG-data sneller inschatten wanneer een ploeg op het punt staat om terug te vallen.

Een andere krachtige toepassing is de Over/Under-markt. Als twee teams met allebei een hoog xG-gemiddelde tegenover elkaar staan, maar hun recente wedstrijden toevallig weinig doelpunten opleverden, biedt de Over-lijn mogelijk waarde. De markt reageert namelijk op recente uitslagen, terwijl xG het onderliggende kansenprofiel blootlegt. Combineer de xG For en xG Against van beide teams en je hebt een redelijke verwachting van het totale doelpuntenaantal, ongeacht de scorelijnen van de laatste weken.

De beperkingen van xG

Wie xG tot het ultieme wapen verheft, maakt een denkfout. Het model kent serieuze beperkingen die je als wedder moet kennen. Ten eerste zijn niet alle modellen even nauwkeurig. De gratis beschikbare xG-data op platforms als Understat is gebaseerd op minder variabelen dan de betaalde modellen die topclubs en geavanceerde bookmakers gebruiken. Je speelt dus altijd met een informatieachterstand ten opzichte van de scherpste partijen in de markt.

Ten tweede houdt xG geen rekening met contextuele factoren die een wedstrijd sterk kunnen beïnvloeden. Wedstrijdstatus is zo’n factor: een team dat met 3-0 voorstaat in de zeventigste minuut, schakelt vaak bewust terug. De xG Against in die laatste twintig minuten is daardoor kunstmatig laag, niet omdat de verdediging briljant is, maar omdat de tegenstander niet meer vol aandrukt. Seizoensfase, onderlinge rivaliteit en vermoeidheid door een druk schema worden evenmin gevangen in het getal.

Tot slot is er het probleem van de steekproefomvang. Na drie speelronden is xG-data nauwelijks betrouwbaar. Eén buitenkansje of gemiste strafschop verstoort het beeld volledig. De meeste analisten beschouwen tien tot vijftien wedstrijden als het minimum om xG-trends serieus te nemen. In de beginfase van een seizoen is het verstandiger om terug te grijpen op data van het voorgaande seizoen, gecorrigeerd voor transfers en trainerswissels.

Het getal achter het getal

Er bestaat een hardnekkig misverstand dat xG je vertelt wat de uitslag had moeten zijn. Dat is niet wat het doet. Het beschrijft een kansverdeling, geen voorspelling. Als een team 1,5 xG heeft en 0,8 xG tegen, wint het die wedstrijd niet automatisch. Er is een aanzienlijke kans op een gelijkspel of zelfs een nederlaag, simpelweg omdat voetbal een sport is met weinig doelpunten en veel variantie.

Juist die variantie maakt xG waardevol voor wedders. Omdat de meeste mensen, inclusief bookmakers in hun prijsvorming, te sterk reageren op uitslagen en te weinig op het onderliggende kansenbeeld, ontstaan er structurele marktinefficiënties. De wedder die leert om door de ruis van willekeurige resultaten heen te kijken naar de kansenproductie, heeft een informatievoordeel dat op lange termijn rendement oplevert.

Dat vereist wel discipline. Het betekent weddenschappen plaatsen op teams die slecht presteren maar goed creëren, en je geld inzetten tegen ploegen die fantastisch draaien op papier maar fragiel zijn onder de motorkap. Dat voelt oncomfortabel, en precies daarom werkt het. De markt beloont mensen die bereid zijn om kortstondig ongelijk te hebben in ruil voor structureel gelijk.