Coefficient of Determination (R²) | Betekenis & Voorbeelden (2024)

Vertaald op 5 juli 2022 door Veronique Scharwächter. Oorspronkelijk gepubliceerd door Shaun Turney

De determinatiecoëfficiënt (coefficient of determination) is een getal tussen de 0 en 1 dat de mate aanduidt waarin een statistisch model in staat is een bepaalde uitkomst te voorspellen.

Determinatiecoëfficiënt (R²)Interpretatie
0Het model voorspelt de uitkomst niet.
Tussen 0 en 1Het model voorspelt de uitkomst gedeeltelijk.
1Het model voorspelt de uitkomst volledig.

De determinatiecoëfficiënt wordt meestal aangeduid met R², wat wordt uitgesproken als “r-kwadraat”. Bij een enkelvoudige lineaire regressie wordt in plaats van R² vaak een kleine letter r gebruikt (r²).

Inhoudsopgave

  1. Wat is de determinatiecoëfficiënt?
  2. De determinatiecoëfficiënt berekenen
  3. Determinatiecoëfficiënt interpreteren
  4. Determinatiecoëfficiënt rapporteren
  5. Valkuil van de determinatiecoëfficiënt
  6. Oefenvragen over de coefficient of determination
  7. Veelgestelde vragen over de coefficient of determination

Wat is de determinatiecoëfficiënt?

De determinatiecoëfficiënt of coefficient of determination (R²) meet in hoeverre een statistisch model in staat is een bepaalde uitkomst te voorspellen. De uitkomst wordt gerepresenteerd door de afhankelijke variabele van het model.

De laagst mogelijke waarde van R² is 0 en de hoogst mogelijke waarde is 1. In het kort gezegd: hoe beter een model is in het maken van voorspellingen, hoe dichter de determinatiecoëfficiënt bij het getal 1 zal liggen.

R² is een maatstaf voor de aansluiting van het model bij de daadwerkelijke uitkomst (goodness of fit). Het is de proportie (het deel) van variantie in de afhankelijke variabele die wordt verklaard door het model.

Stel je voor dat je een enkelvoudige lineaire regressie uitvoert die de examencijfers van studenten voorspelt (de afhankelijke variabele) op basis van de tijd die ze studeren voor het examen (de onafhankelijke variabele).
  • Als de R² gelijk is aan 0, dan is het lineaire regressiemodel niet in staat om de examencijfers beter te voorspellen dan simpelweg te schatten dat iedereen een gemiddeld examencijfer heeft behaald.
  • Als de R² tussen de 0 en 1 ligt, kan het model de examencijfers gedeeltelijk voorspellen. De voorspellingen van het model zijn niet perfect, maar in ieder geval beter dan wanneer je enkel het gemiddelde examencijfer zou gebruiken.
  • Als de R² gelijk is aan 1, kun je het model gebruiken om de examencijfers van iedereen perfect te voorspellen.

Als je de data van je lineaire regressie in een grafiek zet, kun je hieruit meestal afleiden of de R² hoog of laag is. De onderstaande grafieken zijn gebaseerd op voorbeelddata:

  • De observaties worden weergegeven als stippen.
  • De voorspellingen van het model (de lijn van de beste pasvorm) worden getoond als een zwarte lijn.
  • De afstand tussen de daadwerkelijke observaties en hun voorspelde waarde (de residuen) worden weergegeven als paarse lijnen.

Je kunt in de eerste dataset zien dat R² hoog is, en dat de observaties dan dicht bij de voorspellingen van het model liggen. In andere woorden: de meeste stippen liggen dicht bij de zwarte lijn:

Coefficient of Determination (R²) | Betekenis & Voorbeelden (1)

De determinatiecoëfficiënt is altijd positief, zelfs als de correlatie negatief is.

Bij de tweede dataset kun je zien dat de R² laag is, en dat de observaties ver van de voorspellingen van het model verwijderd zijn. In andere woorden: de meeste stippen liggen ver van de zwarte lijn af:

Coefficient of Determination (R²) | Betekenis & Voorbeelden (2)

Ontvang feedback op taal, structuur, lay-out en bronvermelding

Professionele Scribbr-editors kijken je scriptie na op:

  • Academisch taalgebruik
  • Onduidelijke zinnen
  • Grammaticale fouten
  • Interpunctie
  • Verboden woorden

Bekijk het voorbeeld

Coefficient of Determination (R²) | Betekenis & Voorbeelden (3)

De determinatiecoëfficiënt berekenen

Je kunt kiezen tussen twee formules om de determinatiecoëfficiënt (R²) van een enkelvoudige lineaire regressie te berekenen.

  • De eerste formule is specifiek voor eenvoudige lineaire regressies
  • De tweede formule kan worden gebruikt om de R² van veel verschillende typen statistische modellen te berekenen.

Formule 1: De correlatiecoëfficiënt gebruiken

Coefficient of Determination (R²) | Betekenis & Voorbeelden (4)

Waarbij Coefficient of Determination (R²) | Betekenis & Voorbeelden (5) = de Pearson correlatiecoëfficiënt.

Je onderzoekt de relatie tussen de hartslag en leeftijd bij kinderen, en je ontdekt dat de twee variabelen een negatieve Pearson correlatie hebben:

Coefficient of Determination (R²) | Betekenis & Voorbeelden (6)

Deze waarde kan worden gebruikt om aan de hand van Formule 1 de determinatiecoëfficiënt (R²) te berekenen:

Coefficient of Determination (R²) | Betekenis & Voorbeelden (7)

Coefficient of Determination (R²) | Betekenis & Voorbeelden (8)

Coefficient of Determination (R²) | Betekenis & Voorbeelden (9)

Formule 2: De regressieresultaten gebruiken

Coefficient of Determination (R²) | Betekenis & Voorbeelden (10)

Waarbij:

  • RSS = som van de gekwadrateerde residuen (residual sum of squares)
  • TSS = totale kwadratensom (total sum of squares)
Als onderdeel van een enkelvoudige lineaire regressieanalyse waarin de examencijfers van studenten (afhankelijke variabele) worden voorspeld op basis van hun studietijd (onafhankelijke variabele), bereken je dat:

Coefficient of Determination (R²) | Betekenis & Voorbeelden (11)

Coefficient of Determination (R²) | Betekenis & Voorbeelden (12)

Deze waarden kunnen worden gebruikt om aan de hand van Formule 2 de determinatiecoëfficiënt (R²) te berekenen:

Coefficient of Determination (R²) | Betekenis & Voorbeelden (13)

Coefficient of Determination (R²) | Betekenis & Voorbeelden (14)

Coefficient of Determination (R²) | Betekenis & Voorbeelden (15)

Coefficient of Determination (R²) | Betekenis & Voorbeelden (16)

Determinatiecoëfficiënt interpreteren

Je kunt de determinatiecoëfficiënt (R²) interpreteren als de proportie van de variantie in de afhankelijke variabele die het statistisch model voorspelt.

Een andere manier om erover na te denken is dat de R² het deel van de variantie is dat de afhankelijke en onafhankelijke variabelen met elkaar delen.

Je kunt ook zeggen dat de R² de proportie van de variantie is die wordt “verklaard” of “verantwoord” door het statistisch model. Het deel dat overblijft (1 – R²) is dan de variantie die niet wordt verklaard door het model.

Als je wilt, kun je er ook voor kiezen om de R² te noteren als een percentage in plaats van een proportie. Dit doe je door de proportie te vermenigvuldigen met 100.

R² als effectgrootte

Als laatste zou je de R² ook kunnen interpreteren als een effectgrootte: dit is een maat voor de sterkte van de relatie tussen de afhankelijke en onafhankelijke variabelen. Psycholoog en statisticus Jacob Cohen (1988) heeft de volgende vuistregels opgesteld voor enkelvoudige lineaire regressies:

Minimale waarde van determinatiecoëfficiënt (R²)Interpretatie effectgrootte
.01Klein
.09Medium of middelgroot
.25Groot

Let op: de R² op zichzelf zegt niets over een oorzakelijk verband.

Een enkelvoudige lineaire regressie die de examencijfers van studenten (afhankelijke variabele) voorspelt aan de hand van de studietijd (onafhankelijke variabele) heeft een R² van .71. Deze R²-waarde vertelt ons dat:
  • 71% van de variantie in de examencijfers van de studenten kan worden voorspeld op basis van hun studietijd.
  • 29% van de variantie in de examencijfers van de studenten wordt niet verklaard door het model.
  • De tijd die de studenten studeren voor het examen heeft een groot effect op hun examencijfers.

Langer studeren kan mogelijk de oorzaak zijn van een verbetering in de cijfers van de studenten. Hoewel een causale relatie hier erg aannemelijk is, is de R² alleen niet in staat om ons te vertellen waarom er een relatie bestaat tussen de studietijd en de examencijfers van de studenten.

Studenten zouden studeren bijvoorbeeld ook minder frustrerend kunnen vinden als ze het lesmateriaal beter begrijpen, en daarom langer studeren.

Determinatiecoëfficiënt rapporteren

Als je besluit om de determinatiecoëfficiënt (R²) te gebruiken in je paper of scriptie, dien je deze te rapporteren in je onderzoeksresultaten. Je kunt de volgende regels gebruiken om statistieken te rapporteren in APA-stijl:

  • Gebruik “r²” voor statistische modellen met één onafhankelijke variabele (zoals enkelvoudige lineaire regressies). Gebruik “R²” voor statistische modellen met meerdere onafhankelijke variabelen.
  • Het is niet nodig om een referentie of formule toe te voegen, aangezien de determinatiecoëfficiënt een veelgebruikte statistiek is.
  • Cursiveer r² en R² wanneer je hun waarden rapporteert (maar cursiveer de 2 niet).
  • Voeg nooit een voorloopnul toe (een nul voor de decimale punt), want de determinatiecoëfficiënt kan niet groter zijn dan 1.
  • Achter de decimale punt dienen twee significante getallen te staan.
  • De determinatiecoëfficiënt wordt meestal gerapporteerd in combinatie met gerelateerde statistische resultaten, zoals de F-waarde, de vrijheidsgraden, en de p-waarde.
De examencijfers van studenten zijn voorspeld aan de hand van hun studietijd, r² = .71, F(1,32) = 7.33, p = .003

Hoeveel fouten bevat jouw scriptie?

De taalexperts van Scribbr verbeteren gemiddeld 150 fouten per 1000 woorden. Benieuwd wat er precies wordt verbeterd? Verschuif de cursor van links naar rechts!

Coefficient of Determination (R²) | Betekenis & Voorbeelden (17)Coefficient of Determination (R²) | Betekenis & Voorbeelden (18)

Scriptie nakijken op taal

Valkuil van de determinatiecoëfficiënt

Een belangrijke valkuil van de determinatiecoëfficiënt (R²) is dat een hoge of lage R² lijkt te bepalen of een model goed of slecht is. Dit is echter niet waar.

Als je in een lineaire regressieanalyse meer onafhankelijke variabelen toevoegt om de afhankelijke variabele te verklaren, zal de determinatiecoëfficiënt (R²) altijd toenemen, ook als de onafhankelijke variabelen helemaal geen verband houden met de afhankelijke variabele.

Dit komt doordat de determinatiecoëfficiënt het deel van de variantie in de afhankelijke variabele weergeeft dat wordt voorspeld door het model. Hoe meer onafhankelijke variabelen je toevoegt, hoe meer variantie er verklaard lijkt te worden.

Hierdoor kan de mate van verklaarbaarheid van het model overschat worden.

Daarom is de aangepaste determinatiecoëfficiënt (R2) ontwikkeld, die aantoont welk deel van de variantie in de afhankelijke variabele door alle onafhankelijke variabelen gezamenlijk wordt voorspeld door het model.

Oefenvragen over de coefficient of determination

Veelgestelde vragen over de coefficient of determination

Wat is de definitie van de determinatiecoëfficiënt (R²)?

De determinatiecoëfficiënt (R²) is een getal tussen de 0 en 1 dat de mate aanduidt waarin een statistisch model in staat is een bepaalde uitkomst te voorspellen. Je kunt de R² interpreteren als de proportie (het deel) van de variantie in de afhankelijke variabele die wordt voorspeld door het statistisch model.

Wat is de formule voor de determinatiecoëfficiënt?

Er zijn twee formules die je kan gebruiken om de determinatiecoëfficiënt (R²) van een enkelvoudige lineaire regressie te berekenen.

Formule 1: Coefficient of Determination (R²) | Betekenis & Voorbeelden (19)

Formule 2: Coefficient of Determination (R²) | Betekenis & Voorbeelden (20)

Hoe bereken ik de determinatiecoëfficiënt (R²) in softwareprogramma R?

Je kunt de samenvattingsfunctie() (ook wel summary () function) gebruiken om R² (coefficient of determination) van een lineair model weer te geven in R. Onderaan de output zie je “R-kwadraat” (“R-squared”) staan.

Hoe bereken ik de determinatiecoëfficiënt (R²) in Excel?

Je kunt de RSQ() functie gebruiken om R² (coefficient of determination) in Excel te berekenen. Als je afhankelijke variabele in kolom A staat, en je onafhankelijke variabele in kolom B, klik je op een willekeurige lege cel en typ je: “RSQ(A:A,B:B)”.

Wat is de coefficient of determination?

Decoefficient of determinationis de Engelse term voor de determinatiecoëfficiënt.

Dedeterminatiecoëfficiënt (R²) is een getal tussen de 0 en 1 dat de mate aanduidt waarin een statistisch model in staat is een bepaalde uitkomst te voorspellen.

Citeer dit Scribbr-artikel

Als je naar deze bron wilt verwijzen, kun je de bronvermelding kopiëren of op “Citeer dit Scribbr-artikel” klikken om de bronvermelding automatisch toe te voegen aan onze gratis Bronnengenerator.

Scharwächter, V. (2022, 05 juli). Coefficient of Determination (R²) | Betekenis & Voorbeelden. Scribbr. Geraadpleegd op 24 juni 2024, van https://www.scribbr.nl/statistiek/determinatiecoefficient/

Citeer dit artikel

Wat vind jij van dit artikel?

Je hebt al gestemd op dit artikel. Bedankt :-) Je stem is doorgevoerd :-) Bezig met het verwerken van je stem...

Coefficient of Determination (R²) | Betekenis & Voorbeelden (21)

Veronique Scharwächter

Veronique heeft twee bachelors: één in Taal- en Cultuurstudies en één in Philosophy, Politics and Economics. Daarnaast heeft zij een boek geschreven over hoe filosofie je kan helpen in je studentenleven. Ze hoopt haar brede, interdisciplinaire kennis in te kunnen zetten om zo veel mogelijk studenten te helpen met het schrijven van hun scriptie.

Coefficient of Determination (R²) | Betekenis & Voorbeelden (2024)

FAQs

What does the coefficient of determination or r2 tell us? ›

What is the coefficient of determination? The coefficient of determination (R²) measures how well a statistical model predicts an outcome. The outcome is represented by the model's dependent variable. The lowest possible value of R² is 0 and the highest possible value is 1.

What is the difference between r2 and correlation coefficient? ›

Whereas correlation explains the strength of the relationship between an independent and a dependent variable, R-squared explains the extent to which the variance of one variable explains the variance of the second variable.

What does the r2 value tell you? ›

An R-Squared value shows how well the model predicts the outcome of the dependent variable. R-Squared values range from 0 to 1. An R-Squared value of 0 means that the model explains or predicts 0% of the relationship between the dependent and independent variables.

What is the coefficient of determination r2 also equivalent to? ›

The coefficient of determination or R squared method is the proportion of the variance in the dependent variable that is predicted from the independent variable. It indicates the level of variation in the given data set. The coefficient of determination is the square of the correlation(r), thus it ranges from 0 to 1.

What do r2 and r2 tell us? ›

The R2 tells us the percentage of variance in the outcome that is explained by the predictor variables (i.e., the information we do know). A perfect R2 of 1.00 means that our predictor variables explain 100% of the variance in the outcome we are trying to predict.

What does an r2 value of 0.9 mean? ›

For example, a model with an R-squared value of 0.9 means that approximately 90% of the variance in the dependent variable is explained by the independent variables. This suggests a strong relationship between the variables and indicates that the model provides a good fit to the data.

What is R2 in statistics for dummies? ›

Definition. The coefficient of determination, or R2 , is a measure that provides information about the goodness of fit of a model. In the context of regression it is a statistical measure of how well the regression line approximates the actual data.

Do you want a high or low R2 value? ›

Higher R-squared values suggest a better fit, but it doesn't necessarily mean the model is a good predictor in an absolute sense.

What does a low R-squared but significant mean? ›

However, what if your model has independent variables that are statistically significant but a low R-squared value? This combination indicates that the independent variables are correlated with the dependent variable, but they do not explain much of the variability in the dependent variable.

How to interpret regression results? ›

Interpreting Linear Regression Coefficients

A positive coefficient indicates that as the value of the independent variable increases, the mean of the dependent variable also tends to increase. A negative coefficient suggests that as the independent variable increases, the dependent variable tends to decrease.

What if the coefficient of determination is a positive value? ›

This is because the positive coefficient of determination means that the relationship of the dependent variable y increases as the independent variable x increases. Therefore, the slope must be positive.

What is coefficient in simple words? ›

A coefficient is a number that is multiplied by a variable. That is, a number being multiplied by a variable, such as x, y, or z, is called a coefficient.

How do you interpret the coefficient estimates and the r2? ›

The most common interpretation of r-squared is how well the regression model explains observed data. For example, an r-squared of 60% reveals that 60% of the variability observed in the target variable is explained by the regression model.

What is r2 and its significance? ›

The coefficient of determination, or R2 , is a measure that provides information about the goodness of fit of a model. In the context of regression it is a statistical measure of how well the regression line approximates the actual data.

Is a higher R-squared better? ›

R-squared measures the goodness of fit of a regression model. Hence, a higher R-squared indicates the model is a good fit, while a lower R-squared indicates the model is not a good fit. Below are a few examples of R-squared and the model fit.

What does the coefficient of determination r2 tell us Chegg? ›

Question: The coefficient of determination (r2) tells you the proportion of total variation that is explained.

References

Top Articles
Latest Posts
Article information

Author: Mrs. Angelic Larkin

Last Updated:

Views: 5882

Rating: 4.7 / 5 (47 voted)

Reviews: 94% of readers found this page helpful

Author information

Name: Mrs. Angelic Larkin

Birthday: 1992-06-28

Address: Apt. 413 8275 Mueller Overpass, South Magnolia, IA 99527-6023

Phone: +6824704719725

Job: District Real-Estate Facilitator

Hobby: Letterboxing, Vacation, Poi, Homebrewing, Mountain biking, Slacklining, Cabaret

Introduction: My name is Mrs. Angelic Larkin, I am a cute, charming, funny, determined, inexpensive, joyous, cheerful person who loves writing and wants to share my knowledge and understanding with you.