Wat zijn de beste statistische programma’s? Mijn persoonlijke drie favorieten.

Beste lezers, voor jullie verder lezen over de beste statistische programma’s wil ik jullie eventjes waarschuwen: dit artikel zal waarschijnlijk niet iedereen aanspreken. Ik heb het geschreven voor mensen die weleens kwantitatieve data moeten analyseren, of voor mensen die gewoon graag af en toe hun innerlijke bolleboos van wat spelmateriaal voorzien. Ik zal het namelijk hebben over mijn favoriete statistische programma’s. Ben ik helemaal gek geworden en verander ik de naam van mijn blog nu in ‘Work with Standarddeviations’? Natuurlijk niet, al wil ik wel graag meedelen dat de domeinnaam nog vrij is voor de liefhebbers. Ik heb het eigenhandig gecheckt. Stuur me gerust een berichtje als je ambitie hebt om deze domeinnaam te kopen, dan word ik je eerste trouwe volger.

Voor de mensen die nu nog niet afgehaakt zijn: ik beschouw mezelf niet als een statistisch expert. Ik heb dezelfde houding tegenover statistiek als tegenover schoensmeer. Schoensmeer is voor mij een neutraal gebruiksvoorwerp, waarmee ik mijn geliefde schoenencollectie onderhoud. Ik ben geen schoensmeerfanaat, noch houd ik mijn handen ver weg van alles wat naar schoensmeer ruikt. Zo is het net met statistiek. Ik ga niet in mijn vakantiedagen voor de lol wat analyses doen, maar ik ben wel blij dat ik het tot mijn beschikking heb wanneer ik het nodig heb. Ik vind het namelijk wel heel leuk om wetenschappelijk onderzoek te doen, en dan is statistiek mijn onvermijdelijke bondgenoot. Net als schoensmeer gebruik ik het wanneer ik het nodig heb, en dat liefst zonder er een rommeltje van te maken.

Lees ook: 7 vooroordelen over doctoreren

Beste statistische programma’s

We leven in een tijd waarin computerprogramma’s aan een ongelofelijke snelheid complexe berekeningen kunnen maken. Onze bloemkool hoeft dus niet meer al het zware rekenwerk te doen. Zo hebben we meer tijd over om na te denken over andere dingen of om een blogpost te schrijven over statistiek. Graag deel ik met jullie mijn drie favoriete statistische programma’s.

1. SPSS

Op nummer één staat SPSS, voluit Statistical Package for the Social Sciences. Zonder overdrijven, mijn werkdagen zouden er niet hetzelfde uitzien zonder SPSS. Het is mijn meest favoriete statistische programma, en als een analyse prima met SPSS kan gebeuren, dan is dit steevast mijn eerste keus. De dag dat ik SPSS niet meer kan gebruiken, wordt ongetwijfeld een zwarte dag in mijn onderzoekscarrière. In de opleiding psychologie werd dit programma het meest gebruikt, wat ervoor heeft gezorgd dat ik al slapend mijn analyses ermee zou kunnen uitvoeren. Oké, misschien is dit wel wat overdreven. Al heb ik wel al over SPSS gedroomd!

PRO

SPSS is erg gebruiksvriendelijk. Het heeft een logische opbouw, en als je de juiste stappen aanklikt, kan er niet veel mislopen.
De analyses hebben allerhande opties. Vinkjes zetten, en klaar is kees.
SPSS heeft een heel scala aan analysemogelijkheden. ANOVA, MANOVA, lineaire regressie, logistische regressie, (exploratieve) factoranalyse, clusteranalyse, betrouwbaarheidsanalyse,… Het is alsof je in het Kruidvat staat, en je al je favoriete snoepjes naar hartenlust in een puntzak mag scheppen.
Je kan zowel vragen om je data weer te geven, als een oplijsting vragen van je variabelen. Labels toekennen of het type variabele veranderen wordt zo kinderspel.
Via de ‘recall’ button, kan je makkelijk reeds uitgevoerde analyses terug oproepen. Dit werkt heel handig als je verschillende analyses door mekaar gebruikt, en je telkens wat variabelen moet veranderen. Zo moet je niet telkens alle stappen doorlopen. De ‘recall’ button ziet eruit als een schermpje met twee blauwe kolommen en een groen pijltje in de rechter onderhoek. Het staat ongeveer ter hoogte van ‘data’. Ik heb jaren met SPSS gewerkt zonder dit te weten, en sinds ik dit weet gebruik ik het voortdurend. Ik geef het jullie dus graag mee als tip.
Voor de SPSS-leken bestaat er een goede en grappige handleiding. Grappig? Jawel, SPSS kan ook staan voor Serieus Proesten en Schokkerig Schateren. Het heet ‘Discovering Statistics Using SPSS (and sex and drugs and rock ‘n’ roll)’ en is geschreven door Andy Field. Het beste nieuws? Het is hier online te vinden!

Contra

Je hebt er een licentie voor nodig, dus het is een betalend programma.
De meest gebruikte maat voor effectgrootte (Cohens’ D) wordt niet gerapporteerd. Je moet dit dus zelf eventjes uitrekenen, of bij opties ‘Estimates of effect size’ aanklikken en met de gerapporteerde ‘Partial Eta Squared’ werken.
Doordat je gemakkelijk opties kunt aanvinken, is de verleiding groot om voor de lol maar wat extra zaken te laten rapporteren. Maar kan je zo nog garanderen dat je weet waar je mee bezig bent, en je een goede reden hebt om deze zaken te achterhalen?
Niet àlle statistische analyses zijn vooralsnog in SPSS beschikbaar. Het is alsof je in het Kruidvat staat, en je denkt dat al je favoriete snoepjes aanwezig zijn, maar je dan ontdekt dat je allerfavoriete snoepje net uitverkocht is. Confirmatorische factoranalyse en IRT-analyses kan je bijvoorbeeld niet in SPSS doen.
Als je volstrekt onlogische variabelen invult (of naar de vakjes sleept), kan het programma vastlopen bij de analyses. Dit valt makkelijk op te lossen door… geen onlogische variabelen in te vullen. Of wat had je gedacht? Nadenken is ook hier de boodschap.

2. R

Als ik SPSS niet kan gebruiken is R vaak mijn redder in nood. De naam van dit programma verwijst naar de initialen van de ontwerpers Ross Ihaka en Robert Gentleman. Confirmatorische factoranalyse is hierin wel perfect mogelijk, en ook IRT-analyses zijn welkom bij R. Voor de geïnteresseerden: ik gebruik het ltm-pakket (Latent Trait Models) voor mijn IRT-analyses. Wanneer ik met R werk, doe ik dit steeds in RStudio. Ik vind dit zelf overzichtelijker dan de standaarduitvoering, omdat je zowel je data, je analyses in de console, als je geselecteerde pakketten/grafische output/… kan zien.

PRO

R is open source, dus volledig gratis. Je vindt het hier. Nu je toch bezig bent, kan je evengoed RStudio downloaden.
Ik ken persoonlijk geen analyses die je er niet mee kan uitvoeren
R wordt nog steeds verder ontwikkeld, dus als je suggesties zou hebben voor de makers, kan je dit steeds doorsturen
R heeft allerlei handige pakketjes, die je naar believen kan downloaden. Lavaan, lisrelToR, foreign (=handig als je data uit andere programma’s wilt uitlezen), psych… Je zou zonder probleem een blogpost kunnen schrijven over ‘Mijn favoriete R-pakketten’. Mochten hier gegadigden voor zijn, meld je gerust aan als gastblogger
R heeft een community, namelijk R-bloggers. Hierop vind je allerlei R-nieuws en tutorials. Heel veel mensen gebruiken R. Als je een probleem hebt, of een foutmelding krijgt, mag je er gif op innemen dat iemand anders dit ook al heeft meegemaakt. Het antwoord op je vraag is dus vast wel ergens te vinden, als je het probleem googelt.

Contra

Het programma is iets minder gebruiksvriendelijk. Als je pech hebt, ben je makkelijk een hele namiddag kwijt doordat je een stukje van je code verkeerd ingeeft.
Hoewel je in R ook een help-functie hebt, heeft me dit zelden echt geholpen. Meestal vraag ik me af hoe ik een analyse precies hoor te doen, en welke zaken ik waar in de code moet invullen. De symbooltjes die de help-functie geeft ter verduidelijking, helpen me meestal geen stap verder. Vaak is net mijn vraag wat die symbooltjes betekenen voor mijn data of analyses. Gelukkig geeft het internet betere aanwijzingen, en kan ik dan onrechtstreeks afleiden wat ik hoor in te vullen in de code.
Ik heb in het verleden al problemen gehad met het uploaden van mijn data. Waarschijnlijk deed ik iets verkeerd, maar het kan jou vast ook overkomen. Een beetje doorzettingsvermogen is dan cruciaal. Uiteindelijk geraakt het allemaal wel opgelost.
Als je een heel uitgebreide output hebt, bijvoorbeeld wanneer je de ‘ability’ van heel wat participanten wilt bereken bij IRT, past de output soms niet volledig in de console. Dan moet je even ‘sinken’ naar een temporary file, en het dan openen via kladblok. Vergeet nadien ook het ‘sinken’ niet te stoppen. Anders mag je tot het einde van je dagen je output uit het kladblok kopiëren. Grapje natuurlijk. Maar serieus, stop het sinken.

3. JMP

JMP, uitgesproken als ‘jump’ (of ‘jump for joy’ voor de fans) is net als SPSS een erg gebruiksvriendelijk programma. JMP werd initieel ontwikkeld door John Sall, en is een afkorting voor ‘John’s Macintosh Project’. Je kan er ongeveer dezelfde zaken mee doen als met SPSS, alleen zitten de functies hier wat beter verborgen. Ook met JMP heb ik al vele uren doorgebracht, en dit programma heeft sommige van mijn analyses echt naar een hoger niveau getild. De plaats in mijn top drie der statistische programma’s is dan ook meer dan verdiend.

Pro

Ik zei het al, het is erg gebruiksvriendelijk. Het werkt op een intuïtieve manier, en het wordt vanzelf duidelijk welke variabelen je waar naartoe moet slepen.
Het is super makkelijk om er mooie graphics mee te maken. Noem een type grafiek, en JMP heeft er vast de meest geavanceerde opties voor. Wil je een scatterplot maken van het aantal gelopen kilometers per maand in functie van het gemiddeld aantal gerookte sigaretten per dag? Met de handige ‘graph builder’ wordt dit een fluitje van een cent. En wil je de datapunten van mannen en vrouwen in een ander kleur weergeven? JMP staat tot uw dienst.
JMP werkt overzichtelijk doordat de output relatief ‘clean’ is. Als je extra’s wilt, kan je dit doen door in de rode pijl te klikken, en de gewenste opties te selecteren.
JMP is ideaal om multilevel analyses mee uit te voeren. Het werkt met ‘linear mixed models’, wat als grote voordeel heeft dat het niet alleen ‘complete cases’ nodig heeft. SPSS bijvoorbeeld werkt wel alleen met ‘complete cases’, en dat kan problematisch zijn als de uitval niet volledig random is. Ook gaan er zo incomplete data verloren, die wel nog bruikbare informatie hadden kunnen bieden.

Contra

Net als SPSS is dit betalend.
Output kopiëren is nogal omslachtig. Je moet eerst de ‘F10’-toets induwen, waarna je het menu te zien krijgt, en je via ‘Edit’ je output kan kopiëren.
Een kleuter kan ermee werken. Is dit dan een nadeel? Jazeker! Je kan als een bezetene variabelen verslepen, en je zal altijd wel een output krijgen, hoe betekenisloos ook. Als je niet weet waar je fout zit, en je gaat in het wilde weg wat dingen verslepen, zal dit zelden tot een juiste oplossing leiden. Het is dus belangrijk om goed te weten waar je mee bezig bent.
Doordat JMP een eenvoudig design heeft, ben je soms niet op de hoogte van het bestaan van nuttige opties. Waar je bij SPSS logischerwijs opties aanklikt bij ‘Options’ moet je bij JMP al weten dat je hiervoor in een rode pijl links van de titel moet klikken. Maar goed, eenmaal je dit weet vormt dit ook geen belemmering meer.

Wat zijn jouw favoriete statistische programma’s? Gebruik jij één van bovenstaande programma’s? Wat vind jij dan de grootste voordelen en nadelen? Laat het weten in een reactie!

Bron afbeelding: Pixabay

Disclaimer: dit artikel is geen commerciële samenwerking met bovenstaande programma’s.

Homeyz: een helpende hand gezocht! - De app voor occasionele klushulp »

« Interesse hebben in het leven van een vrouw zonder kinderen: een moeilijke bevalling

Tags: AnalysesDoctorerenJMPRSPSSStatistiekStatistische programma's

Haydée:

Hoe machteloos zijn we tegenover een oorlog?
Dit is een carrièreblog met een feministische insteek. Dit is een blog om andere vrouwen…
Zal AI het werk van bloggers overnemen?
De ontwikkelen met betrekking tot artificiële intelligentie (AI) gaan razendsnel. Elke dag verschijnt er wel…
Een masterproef schrijven over een onderwerp dat je niet interesseert?
Laatst was ik op het forum van NaNoWriMo aan het lezen. NaNoWriMo is een afkorting…