Scatter plot

Een scatter plot is een verzameling punten uitgezet op een horizontale en verticale as.

Scatter plots zijn belangrijk in de statistiek omdat ze de mate van correlatie, indien aanwezig, tussen de waarden van waargenomen grootheden of verschijnselen (variabelen genoemd) kunnen laten zien. Als er geen correlatie bestaat tussen de variabelen, liggen de punten willekeurig verspreid op het coƶrdinatenvlak. Als er een grote correlatie bestaat, concentreren de punten zich in de buurt van een rechte lijn. Scatter plots zijn nuttige hulpmiddelen voor datavisualisatie om een trend te illustreren.

Naast de mate van correlatie toont een scatter plot ook de betekenis van de correlatie:

  • Als de verticale (of y-as) variabele toeneemt naarmate de horizontale (of x-as) variabele toeneemt, is de correlatie positief.
  • Als de y-asvariabele afneemt naarmate de x-asvariabele toeneemt of omgekeerd, is de correlatie negatief.
  • Als het onmogelijk is een van de bovenstaande criteria vast te stellen, dan is de correlatie nul.

De maximaal mogelijke positieve correlatie is +1 of +100%, als alle punten in een scatter plot precies langs een rechte lijn met een positieve helling liggen. De maximaal mogelijke negatieve correlatie is -1 of -100%, in welk geval alle punten precies langs een rechte lijn met een negatieve helling liggen.

Correlatie wordt vaak verward met oorzakelijk verband, hetzij per ongeluk (als gevolg van valse of onbewezen hypothesen) of opzettelijk (met de bedoeling te misleiden). In zuivere zin kan een scatter plot echter wel de aard en omvang van correlatie onthullen, maar zegt het niets over causatie.

Zie ook: grafentheorie, pictogram, staafdiagram, punt-tot-puntgrafiek, sparkline, tijdreeksgrafiek