Samenvattend: als de verdeling van gegevens naar links scheef is, is het gemiddelde kleiner dan de mediaan, wat vaak kleiner is dan de modus. Als de verdeling van gegevens naar rechts scheef is, is de modus vaak kleiner dan de mediaan, wat kleiner is dan het gemiddelde.
Waarom wordt de mediaan minder beïnvloed door scheve gegevens?
Waarom wordt de mediaan minder beïnvloed door scheve gegevens dan het gemiddelde? Echter, naarmate de gegevens scheef worden, verliest het gemiddelde zijn vermogen om de beste centrale locatie voor de gegevens te bieden, omdat de scheve gegevens het wegslepen van de typische waarde.
Waarom is de mediaan beter voor scheve gegevens?
Voor distributies die uitbijters hebben of scheef zijn, heeft de mediaan vaak de voorkeur maat van centrale tendens omdat de mediaan beter bestand is tegen uitschieters dan het gemiddelde… Merk op dat het gemiddelde in de richting van de scheefheid wordt getrokken (d.w.z. de richting van de staart).
Wanneer scheef naar rechts is het gemiddelde mediaan?
Voor een rechtsscheve verdeling is het gemiddelde doorgaans groter dan de mediaan Merk ook op dat de staart van de verdeling aan de rechterkant (positief) langer is dan aan de linkerkant. Uit het box-and-whiskerdiagram kunnen we ook zien dat de mediaan dichter bij het eerste kwartiel ligt dan bij het derde kwartiel.
Hoe beïnvloedt scheefheid gegevens?
Effecten van scheefheid
Als er te veel scheefheid in de gegevens zit, werken veel statistische modellen niet, maar waarom. Dus in scheve gegevens kan het staartgebied fungeren als een uitbijter voor het statistische model en we weten dat uitbijters de prestaties van het model nadelig beïnvloeden, met name op regressie gebaseerde modellen.