15
feb
2017
0
beste statistische programma's

Wat zijn de beste statistische programma’s? Mijn persoonlijke drie favorieten.

Beste lezers, voor jullie verder lezen over de beste statistische programma’s wil ik jullie eventjes waarschuwen: dit artikel zal waarschijnlijk niet iedereen aanspreken. Ik heb het geschreven voor mensen die weleens kwantitatieve data moeten analyseren, of voor mensen die gewoon graag af en toe hun innerlijke bolleboos van wat spelmateriaal voorzien. Ik zal het namelijk hebben over mijn favoriete statistische programma’s. Ben ik helemaal gek geworden en verander ik de naam van mijn blog nu in ‘Work with Standarddeviations’? Natuurlijk niet, al wil ik wel graag meedelen dat de domeinnaam nog vrij is voor de liefhebbers. Ik heb het eigenhandig gecheckt. Stuur me gerust een berichtje als je ambitie hebt om deze domeinnaam te kopen, dan word ik je eerste trouwe volger.

Voor de mensen die nu nog niet afgehaakt zijn: ik beschouw mezelf niet als een statistisch expert. Ik heb dezelfde houding tegenover statistiek als tegenover schoensmeer. Schoensmeer is voor mij een neutraal gebruiksvoorwerp, waarmee ik mijn geliefde schoenencollectie onderhoud. Ik ben geen schoensmeerfanaat, noch houd ik mijn handen ver weg van alles wat naar schoensmeer ruikt. Zo is het net met statistiek. Ik ga niet in mijn vakantiedagen voor de lol wat analyses doen, maar ik ben wel blij dat ik het tot mijn beschikking heb wanneer ik het nodig heb. Ik vind het namelijk wel heel leuk om wetenschappelijk onderzoek te doen, en dan is statistiek mijn onvermijdelijke bondgenoot. Net als schoensmeer gebruik ik het wanneer ik het nodig heb, en dat liefst zonder er een rommeltje van te maken.

We leven in een tijd waarin computerprogramma’s aan een ongelofelijke snelheid complexe berekeningen kunnen maken. Onze bloemkool hoeft dus niet meer al het zware rekenwerk te doen. Zo hebben we meer tijd over om na te denken over andere dingen of om een blogpost te schrijven over statistiek. Graag deel ik met jullie mijn drie favoriete statistische programma’s.

1. SPSS

Op nummer één staat SPSS, voluit Statistical Package for the Social Sciences. Zonder overdrijven, mijn werkdagen zouden er niet hetzelfde uitzien zonder SPSS. Het is mijn meest favoriete statistische programma, en als een analyse prima met SPSS kan gebeuren, dan is dit steevast mijn eerste keus. De dag dat ik SPSS niet meer kan gebruiken, wordt ongetwijfeld een zwarte dag in mijn onderzoekscarrière. In de opleiding psychologie werd dit programma het meest gebruikt, wat ervoor heeft gezorgd dat ik al slapend mijn analyses ermee zou kunnen uitvoeren. Oké, misschien is dit wel wat overdreven. Al heb ik wel al over SPSS gedroomd!

PRO

  • SPSS is erg gebruiksvriendelijk. Het heeft een logische opbouw, en als je de juiste stappen aanklikt, kan er niet veel mislopen.
  • De analyses hebben allerhande opties. Vinkjes zetten, en klaar is kees.
  • SPSS heeft een heel scala aan analysemogelijkheden. ANOVA, MANOVA, lineaire regressie, logistische regressie, (exploratieve) factoranalyse, clusteranalyse, betrouwbaarheidsanalyse,… Het is alsof je in het Kruidvat staat, en je al je favoriete snoepjes naar hartenlust in een puntzak mag scheppen.
  • Je kan zowel vragen om je data weer te geven, als een oplijsting vragen van je variabelen. Labels toekennen of het type variabele veranderen wordt zo kinderspel.
  • Via de ‘recall’ button, kan je makkelijk reeds uitgevoerde analyses terug oproepen. Dit werkt heel handig als je verschillende analyses door mekaar gebruikt, en je telkens wat variabelen moet veranderen. Zo moet je niet telkens alle stappen doorlopen. De ‘recall’ button ziet eruit als een schermpje met twee blauwe kolommen en een groen pijltje in de rechter onderhoek. Het staat ongeveer ter hoogte van ‘data’. Ik heb jaren met SPSS gewerkt zonder dit te weten, en sinds ik dit weet gebruik ik het voortdurend. Ik geef het jullie dus graag mee als tip.
  • Voor de SPSS-leken bestaat er een goede en grappige handleiding. Grappig? Jawel, SPSS kan ook staan voor Serieus Proesten en Schokkerig Schateren. Het heet ‘Discovering Statistics Using SPSS (and sex and drugs and rock ‘n’ roll)’ en is geschreven door Andy Field. Het beste nieuws? Het is hier online te vinden!

Contra

  • Je hebt er een licentie voor nodig, dus het is een betalend programma.
  • De meest gebruikte maat voor effectgrootte (Cohens’ D) wordt niet gerapporteerd. Je moet dit dus zelf eventjes uitrekenen, of bij opties ‘Estimates of effect size’ aanklikken en met de gerapporteerde ‘Partial Eta Squared’ werken.
  • Doordat je gemakkelijk opties kunt aanvinken, is de verleiding groot om voor de lol maar wat extra zaken te laten rapporteren. Maar kan je zo nog garanderen dat je weet waar je mee bezig bent, en je een goede reden hebt om deze zaken te achterhalen?
  • Niet àlle statistische analyses zijn vooralsnog in SPSS beschikbaar. Het is alsof je in het Kruidvat staat, en je denkt dat al je favoriete snoepjes aanwezig zijn, maar je dan ontdekt dat je allerfavoriete snoepje net uitverkocht is. Confirmatorische factoranalyse en IRT-analyses kan je bijvoorbeeld niet in SPSS doen.
  • Als je volstrekt onlogische variabelen invult (of naar de vakjes sleept), kan het programma vastlopen bij de analyses. Dit valt makkelijk op te lossen door… geen onlogische variabelen in te vullen. Of wat had je gedacht? Nadenken is ook hier de boodschap.

2. R

Als ik SPSS niet kan gebruiken is R vaak mijn redder in nood. De naam van dit programma verwijst naar de initialen van de ontwerpers Ross Ihaka en Robert Gentleman. Confirmatorische factoranalyse is hierin wel perfect mogelijk, en ook IRT-analyses zijn welkom bij R. Voor de geïnteresseerden: ik gebruik het ltm-pakket (Latent Trait Models) voor mijn IRT-analyses. Wanneer ik met R werk, doe ik dit steeds in RStudio. Ik vind dit zelf overzichtelijker dan de standaarduitvoering, omdat je zowel je data, je analyses in de console, als je geselecteerde pakketten/grafische output/… kan zien.

PRO

  • R is open source, dus volledig gratis. Je vindt het hier. Nu je toch bezig bent, kan je evengoed RStudio downloaden.
  • Ik ken persoonlijk geen analyses die je er niet mee kan uitvoeren
  • R wordt nog steeds verder ontwikkeld, dus als je suggesties zou hebben voor de makers, kan je dit steeds doorsturen
  • R heeft allerlei handige pakketjes, die je naar believen kan downloaden. Lavaan, lisrelToR, foreign (=handig als je data uit andere programma’s wilt uitlezen), psych… Je zou zonder probleem een blogpost kunnen schrijven over ‘Mijn favoriete R-pakketten’. Mochten hier gegadigden voor zijn, meld je gerust aan als gastblogger
  • R heeft een community, namelijk R-bloggers. Hierop vind je allerlei R-nieuws en tutorials. Heel veel mensen gebruiken R. Als je een probleem hebt, of een foutmelding krijgt, mag je er gif op innemen dat iemand anders dit ook al heeft meegemaakt. Het antwoord op je vraag is dus vast wel ergens te vinden, als je het probleem googelt.

Contra

  • Het programma is iets minder gebruiksvriendelijk. Als je pech hebt, ben je makkelijk een hele namiddag kwijt doordat je een stukje van je code verkeerd ingeeft.
  • Hoewel je in R ook een help-functie hebt, heeft me dit zelden echt geholpen. Meestal vraag ik me af hoe ik een analyse precies hoor te doen, en welke zaken ik waar in de code moet invullen. De symbooltjes die de help-functie geeft ter verduidelijking, helpen me meestal geen stap verder. Vaak is net mijn vraag wat die symbooltjes betekenen voor mijn data of analyses. Gelukkig geeft het internet betere aanwijzingen, en kan ik dan onrechtstreeks afleiden wat ik hoor in te vullen in de code.
  • Ik heb in het verleden al problemen gehad met het uploaden van mijn data. Waarschijnlijk deed ik iets verkeerd, maar het kan jou vast ook overkomen. Een beetje doorzettingsvermogen is dan cruciaal. Uiteindelijk geraakt het allemaal wel opgelost.
  • Als je een heel uitgebreide output hebt, bijvoorbeeld wanneer je de ‘ability’ van heel wat participanten wilt bereken bij IRT, past de output soms niet volledig in de console. Dan moet je even ‘sinken’ naar een temporary file, en het dan openen via kladblok. Vergeet nadien ook het ‘sinken’ niet te stoppen. Anders mag je tot het einde van je dagen je output uit het kladblok kopiëren. Grapje natuurlijk. Maar serieus, stop het sinken.

3. JMP

JMP, uitgesproken als ‘jump’ (of ‘jump for joy’ voor de fans) is net als SPSS een erg gebruiksvriendelijk programma. JMP werd initieel ontwikkeld door John Sall, en is een afkorting voor ‘John’s Macintosh Project’. Je kan er ongeveer dezelfde zaken mee doen als met SPSS, alleen zitten de functies hier wat beter verborgen. Ook met JMP heb ik al vele uren doorgebracht, en dit programma heeft sommige van mijn analyses echt naar een hoger niveau getild. De plaats in mijn top drie der statistische programma’s is dan ook meer dan verdiend.

Pro

  • Ik zei het al, het is erg gebruiksvriendelijk. Het werkt op een intuïtieve manier, en het wordt vanzelf duidelijk welke variabelen je waar naartoe moet slepen.
  • Het is super makkelijk om er mooie graphics mee te maken. Noem een type grafiek, en JMP heeft er vast de meest geavanceerde opties voor. Wil je een scatterplot maken van het aantal gelopen kilometers per maand in functie van het gemiddeld aantal gerookte sigaretten per dag? Met de handige ‘graph builder’ wordt dit een fluitje van een cent. En wil je de datapunten van mannen en vrouwen in een ander kleur weergeven? JMP staat tot uw dienst.
  • JMP werkt overzichtelijk doordat de output relatief ‘clean’ is. Als je extra’s wilt, kan je dit doen door in de rode pijl te klikken, en de gewenste opties te selecteren.
  • JMP is ideaal om multilevel analyses mee uit te voeren. Het werkt met ‘linear mixed models’, wat als grote voordeel heeft dat het niet alleen ‘complete cases’ nodig heeft. SPSS bijvoorbeeld werkt wel alleen met ‘complete cases’, en dat kan problematisch zijn als de uitval niet volledig random is. Ook gaan er zo incomplete data verloren, die wel nog bruikbare informatie hadden kunnen bieden.

Contra

  • Net als SPSS is dit betalend.
  • Output kopiëren is nogal omslachtig. Je moet eerst de ‘F10’-toets induwen, waarna je het menu te zien krijgt, en je via ‘Edit’ je output kan kopiëren.
  • Een kleuter kan ermee werken. Is dit dan een nadeel? Jazeker! Je kan als een bezetene variabelen verslepen, en je zal altijd wel een output krijgen, hoe betekenisloos ook. Als je niet weet waar je fout zit, en je gaat in het wilde weg wat dingen verslepen, zal dit zelden tot een juiste oplossing leiden. Het is dus belangrijk om goed te weten waar je mee bezig bent.
  • Doordat JMP een eenvoudig design heeft, ben je soms niet op de hoogte van het bestaan van nuttige opties. Waar je bij SPSS logischerwijs opties aanklikt bij ‘Options’ moet je bij JMP al weten dat je hiervoor in een rode pijl links van de titel moet klikken. Maar goed, eenmaal je dit weet vormt dit ook geen belemmering meer.

 

Wat zijn jouw favoriete statistische programma’s? Gebruik jij één van bovenstaande programma’s? Wat vind jij dan de grootste voordelen en nadelen? Laat het weten in een reactie!

beste statistische programma's

Bron afbeelding: https://pixabay.com/nl/users/Pexels-2286921/

Disclaimer: dit artikel is geen commerciële samenwerking met bovenstaande programma’s.

You may also like

Elke Struyf
Power Woman: Elke Struyf
Vooroordeel
Vooroordelen over doctoreren

2 Responses

  1. Tine

    Interessant lijstje met pRo’s en contRa’s! 🙂

    Zelf ben ik begonnen met SPSS, maar geleidelijk aan overgestapt naar R(Studio). Dat was inderdaad omdat de analysetechniek die ik toen nodig had niet beschikbaar was in SPSS. Ondertussen durf ik me een fReak noemen…

    Aanvankelijk eindigden mijn wedstrijden met R vaak in het voordeel van die laatste. (Een eindstand van dRie-nul was daarbij geen uitzondering.) Veel oefening, doorzettingsvermogen en uren FUN later… kan ik niet meer zondeR!

    Wat vind ik dan zo geweldig aan R? (En ik vul gewoon jouw lijstje met pro’s aan!)
    *Gratis is uiteraard fijn, maar ik apprecieer het open source karakter van R omwille van een andere reden. Het sluit mooi aan bij het recente streven naar een grotere openheid, transparantie en reproduceerbaarheid in wetenschappelijk onderzoek. Openheid is inheRent en er zijn bovendien R-packages, functies en tools die je hierbij als onderzoeker kunnen helpen (bv. checkpoint, set.seed(), RMarkdown).
    *Ik gebruik R-scripts om mijn eigen onderzoek zo transparant en reproduceerbaar mogelijk te maken. (Trouwens, ook in R moet je stijl hebben blijkbaar… http://jef.works/R-style-guide/ 🙂 )
    *R is altijd in beweging. Je blijft nieuwe en leuke packages en functies ontdekken! (Die beweging heeft ook wel z’n nadelen. Nieuwe versies van packages betekenen soms ook eRRors die je voorheen niet had.)
    *Bovendien kan je ook gewoon zelf functies schrijven! Ik heb mezelf een tijdje, bij wijze van oefening, verplicht de onnozelste dingen in functies uit te schrijven. Hoewel de door R gewonnen veldslagen daarbij niet op één hand te tellen zijn, merk ik heel wat functies later dat het me niet alleen geholpen heeft om systematischer en logischer na te denken. Ik vind het vooral keileuk en laat die functies-op-maat het werk doen bij mijn analyses!
    *Je kan echt geweldige grafieken maken met het ggplot2-package! 🙂

    PS(“oplossing voor jouw output-probleem”, package = “xlsx”)

    1. Haydée

      Dag Tine

      Als ik jouw antwoord lees, kan mijn voorkeur ook nog veRanderen in de toekomst. 😉
      Leuke tips trouwens, van die Style Guide en de packages! Die openheid is in mijn opinie ook een voordeel. Bedankt om dit aan te vullen aan mijn lijstje! In de toekomst zal het alleen nog belangrijker worden om alles goed gedocumenteerd uit te voeren denk ik.

      Groeten
      Haydée

Leave a Reply