Alles over Website testing in 2024
In deze gids legt Brandfirm je alles in begrijpelijke taal uit over website experimenten in 2024. Met deze website testing gids bij de hand lukt het jou ook.
Na het lezen van dit artikel weet jij
- welke typen website experimenten er zijn
- wanneer je welke type experiment gebruikt
- hoe je een juiste hypothese bepaalt
- hoe je de doorlooptijd van een experiment bepaalt
- welke tools je kunt gebruiken bij website testing
- hoe je de resultaten van een experiment analyseert
In dit artikel
In deze uitgebreide gids leer je alles over verschillende soorten website experimenten en hoe je deze op de juiste manier kunt uitvoeren en analyseren.
Als ondernemer weet je ongetwijfeld dat een goede website bijdraagt aan het succes van jouw bedrijf. Maar hoe zorg je ervoor dat jouw website de juiste boodschap overbrengt en de aandacht van je bezoekers en potentiële klanten vasthoudt?
Website testing maakt het mogelijk om deze vragen zo goed mogelijk voor jezelf te beantwoorden. Het stelt je in staat om de prestaties van je website te meten, te analyseren en te verbeteren. Je weet precies wat wel en niet werkt voor jouw bezoekers. Zo kun jij het maximale uit je online aanwezigheid halen.
In dit artikel gaan we er uitgebreid op in, zodat jij precies snapt hoe je begint met website testing.
1. Wat is website testing?
Website testing is een belangrijk onderdeel van het optimaliseren van je website. Het is een proces waarbij je verschillende methoden gebruikt om de prestaties van je website te meten en te verbeteren. Je gaat bepaalde hypotheses testen, zoals het vervangen van een afbeelding of het verplaatsen van een knop.
Na de test blijkt of deze aanpassing daadwerkelijk effect heeft gehad. Zo verbeter je bijvoorbeeld de gebruikerservaring, het conversiepercentage of de doorstroom naar een bepaalde pagina.
Om het succes van je website te meten, verzamel je onder andere gegevens over het gedrag van je bezoekers.
Denk hierbij aan:
het aantal bezoeken
de duur van het bezoek
de pagina's die zijn bezocht
de conversieratio
pagina’s die goed/slecht presteren
waar haken bezoekers af
mobiel vs. desktop
Door deze gegevens te analyseren, kun je zien waar verbetering nodig is en waar nog kansen liggen. Met die kennis kun je gaan nadenken over nieuwe ontwerpen, inhoud, indelingen, elementen en CTA's (call to actions).
Deze nieuwe elementen ga je vervolgens implementeren in een test, om te kijken of jouw bedachte aanpassing ook daadwerkelijk het effect heeft wat je verwacht.
Bij een positief effect implementeer je de wijziging. Daarna monitor je de data om te onderzoeken of de optimalisatie daadwerkelijk bijdraagt aan wat je wilt bereiken.
Vervolgens kun je deze elementen opnieuw blijven doortesten om zo het maximale resultaat te behalen. Zo blijf je je website en de gebruikerservaring continu verder optimaliseren.
Het is belangrijk om te blijven werken aan zowel het gebruiksgemak als de personalisatie, duidelijkheid van jouw boodschap, betrouwbaarheid, toegankelijkheid en andere aspecten van je website.
Wees je ervan bewust dat website testing een doorlopend proces is. Het internet en de eisen en verwachtingen van consumenten veranderen voortdurend. Daarom moet je je website blijven testen om in te spelen op deze veranderingen.
Elke website en de bijbehorende doelgroep is uniek. Informatie over het verbeteren van de gebruikerservaring van een website is dus nooit universeel.
Je moet dus echt zelf aan de slag met website testing om erachter te komen wat het beste werkt voor jouw doelgroep.
Door actief te experimenteren, verbeter jij je website continu. Daarnaast geeft het je inzicht in gedrag dat je kunt inzetten op je andere online marketing kanalen (ads, social, e-mailmarketing, etc.).
Op deze manier kun je altijd een optimale gebruikerservaring bieden en je conversieratio blijven verhogen.
Advies nodig over Website experimenten?
- Ontvang een gratis analyse met verbeterpunten voor je website strategie
- We besteden 4-6 uur aan de analyse
2. Welke verschillende typen website experimenten zijn er?
Er zijn verschillende soorten experimenten die kunnen worden uitgevoerd om de prestaties van je website te testen. Elk type is gericht op het testen van verschillende soorten hypotheses.
We hebben de meest gebruikte website experimenten voor je op een rijtje gezet. Laten we ze bespreken.
A/B testen
Wat is A/B testen?
A/B testen is een vorm van website testing waarbij twee varianten van een webpagina met elkaar worden vergeleken. Zo kun je bepalen welke variant het best presteert.
Bij een A/B test wordt het verkeer naar een pagina willekeurig 50/50 verdeeld over twee varianten: de A-variant en de B-variant. Het is in sommige gevallen ook nog wenselijk om een C variant toe te voegen. Dan krijg je een 33/33/33 verhouding.
Laten we voor het gemak wat dieper ingaan op een A/B test met twee varianten.
De A-variant is de oorspronkelijke versie van de pagina, ook wel de control variant. De B-variant heeft wijzigingen ondergaan ten opzichte van de A-variant. Deze wijzigingen kunnen variëren van kleine aanpassingen, zoals de kleur of locatie van een knop, tot grote veranderingen, zoals een volledig redesign van de pagina. Bedenk wel dat A/B testen het meest effectief zijn bij kleine veranderingen. Wanneer je één item aanpast, kan je met 100% zekerheid zeggen dat het verschil hierdoor komt. Bij meerdere aanpassingen weet je niet precies welk element de verandering in gedrag heeft getriggerd.
Bij een A/B test kun je spelen met verschillende persuasion elementen.
Door bijvoorbeeld bepaalde zinnen wat krachtiger te formuleren met een focus op social proof, autoriteit, schaarste of de kracht van nu, kun je testen of dit effect heeft op de gebruikers.
Door het vergelijken van de resultaten van beide varianten kun je bepalen welke variant het best presteert op bepaalde metrics, zoals conversies of click-through rates.
Het doen van een A/B test stelt je in staat de effectiviteit van verschillende varianten te testen. Op basis daarvan kun je met zekerheid een wijziging doorvoeren die een positief resultaat op je website prestaties heeft.
Wat zijn de voor- en nadelen van A/B testen?
Voordelen
A/B testing kan je helpen ontdekken welke variant van een pagina of element het beste presteert. Dit kan leiden tot verbeteringen in conversiepercentages, klikfrequenties, doorklikpercentages en andere belangrijke metrics.
A/B testing zorgt ervoor dat je efficient met development capaciteit omgaat.
A/B testing is relatief eenvoudig te implementeren en kan snel resultaten opleveren.
A/B testing geeft je inzicht in het gedrag van je doelgroep waardoor je deze beter begrijpt en op deze manier beter kan inspelen op trends, ontwikkelingen en deze inzichten kan inzetten op andere marketing kanalen.
Nadelen
A/B testing heeft baat bij veel websiteverkeer, je moet dus genoeg bezoekers naar je website trekken om te kunnen starten met testen.
A/B testing kan soms leiden tot vertekende resultaten als gevolg van verschillende factoren. Denk aan een te kleine steekproefgrootte, seizoensgebonden invloeden of het feit dat het testen alleen op bepaalde tijdstippen wordt uitgevoerd. Daarom is het belangrijk om A/B tests zorgvuldig te plannen en uit te voeren om ervoor te zorgen dat de resultaten betrouwbaar zijn.
Omleidingstest
Wat is een omleidingstest?
Een omleidingstest wordt ook wel redirect test of split URL test genoemd. Het is een vorm van website testing waarbij bezoekers worden omgeleid naar verschillende varianten van een website.
Dit gebeurt op basis van de URL parameters die vooraf zijn opgegeven. Er worden twee of meer varianten van een webpagina gemaakt en vervolgens worden de bezoekers willekeurig verdeeld over deze verschillende varianten via de URL.
Je kunt daardoor meerdere pagina's bouwen met verschillen in de tone of voice, opbouw of core message en checken welke pagina meer leads genereert.
Wat zijn de voor- en nadelen van een omleidingstest?
Voordelen
Omleidingstesten kunnen relatief eenvoudig en snel worden uitgevoerd, zonder dat er veel technische kennis vereist is. Door het omleiden van bezoekers via de URL, kunnen verschillende varianten van de website direct worden getest. Zo worden inzichten over welke variant het beste presteert snel verkregen.
Het stelt je snel in staat inzichten te verkrijgen over verschillende type landingspagina’s en de effecten op je gebruikers. Hierdoor kan je snel en gericht een keuze maken voor de best presterende landingspagina die je uiteindelijk live gaat zetten voor al je bezoekers.
Nadelen
Wanneer een bezoeker verschillende URL’s gebruikt om jouw website te bezoeken, kan deze mogelijk verschillende varianten van de website zien. Dit kan leiden tot verwarring of een inconsistentie in de gebruikerservaring.
Er kunnen mogelijk vertekende resultaten optreden, als gevolg van variabelen die niet kunnen worden gecontroleerd via de URL. Denk daarbij aan bijvoorbeeld browsercompatibiliteit of het apparaat waar de bezoeker op dat moment gebruik van maakt.
Multivariate test
Wat is een multivariate test?
Multivariate testing is een vorm van website testing waarbij meerdere elementen op een pagina tegelijkertijd worden getest. Zo kun je bepalen welke combinatie van elementen het beste presteert op basis van conversies of andere belangrijke metrics.
Bij multivariate testing wordt de pagina opgedeeld in verschillende secties. Elke sectie heeft verschillende varianten van elementen, zoals tekst, afbeeldingen en kleuren. Vervolgens worden alle mogelijke combinaties van deze secties getest om te bepalen welke het beste presteert.
Wat zijn de voor- en nadelen van een multivariate test?
Voordelen
Je kunt in één keer meerdere elementen op een pagina testen. Daardoor is er minder tijd nodig om verschillende testen uit te voeren. Dit kan de efficiëntie van het testproces verhogen en de tijd die nodig is om conclusies te trekken verkleinen.
Multivariate testing kan helpen om inzicht te krijgen in hoe verschillende elementen op een pagina elkaar beïnvloeden. Door te testen hoe verschillende combinaties van elementen op elkaar inwerken, kun je beter begrijpen welke elementen op een pagina het belangrijkst zijn voor de conversies.
Nadelen
Het heeft vaak meer verkeer nodig dan andere vormen van website testing, om betrouwbare resultaten te krijgen. Dit komt doordat er meer variabelen worden getest, wat resulteert in meer combinaties. Dit kan het testproces langduriger maken.
Multivariate testing is complexer dan andere vormen van website testing. Je dient namelijk rekening te houden met verschillende combinaties van elementen en variabelen.
Advies over jouw Website strategie?
- Een gratis analyse t.w.v. 4 tot 6 uur werk
- 87% van de bedrijven die we analyseren loopt omzet mis
3. Wanneer gebruik je welk experiment?
Om effectieve tests uit te voeren is het goed om te weten welke soort test de juiste keuze is voor jouw website en het uiteindelijke doel. Elk type experiment heeft zijn eigen specifieke toepassingen en kan worden gebruikt om verschillende vragen te beantwoorden. Maar wanneer gebruik je welk experiment?
A/B testen
Een A/B test is geschikt als je een specifieke hypothese wilt testen en de impact van één verandering wilt bepalen.
A/B testen zijn vooral geschikt voor kleine veranderingen die een grote impact kunnen hebben, zoals het veranderen van de kleur van een knop, de plaatsing van een afbeelding, het aanpassen van de belangrijkste USP’s of de core message van de pagina.
Omleidingstest
Een omleidingstest is geschikt als je grote veranderingen wilt testen, zoals een compleet redesign van je website of het testen van een nieuwe landingspagina. Bij dit type test stuur je een deel van je bezoekers naar de nieuwe pagina en een deel naar de oude pagina.
Een omleidingstest is ideaal als je grote veranderingen wilt testen die mogelijk grote impact hebben op je conversies.
Multivariate
Een multivariate test is geschikt als je meerdere elementen wilt testen, zoals de kleur van een knop, plus de plaatsing van een afbeelding. Hiermee test je alle mogelijke combinaties van de verschillende elementen.
Een multivariate test is vooral geschikt voor websites met veel bezoekers (zodat je sample size groot genoeg is), waarbij je meerdere elementen wilt testen om te bepalen welke combinatie het beste werkt. Je kunt een vereiste sample size berekenen met een handige calculator.
Welke experiment is geschikt voor jouw vraagstuk?
Het is belangrijk om te onthouden dat het kiezen van het juiste type experiment afhangt van je doelstellingen en de omvang van je website. A/B testen zijn het meest geschikt voor kleine veranderingen, terwijl omleidingstesten en multivariate testen geschikter zijn voor grotere aanpassingen. Kijk ook naar de impact die de veranderingen kunnen hebben op je conversies en welk type experiment het beste past bij de veranderingen die je wilt testen.
Dus, voordat je kunt bepalen welk type experiment het meest toepasbaar is, is het belangrijk om eerst een testplan op te zetten en je hypothese te formuleren.
Wat wil je precies testen en waarom? Wat zijn de verwachtingen?
4. Hoe zet je een testplan op?
De eerste stap is het opzetten van een testplan.
Een goede opzet van een testplan bevat de volgende elementen:
Data analyse
Doel hypothese
Test varianten
Metrics
Looptijd
Door middel van een data analyse breng je in kaart waar je kansen ziet voor groei. Dit wil je met een website experiment gaan verbeteren en valideren.
Daarna formuleer je een hypothese.
5. Hoe bepaal je een juiste hypothese?
Een hypothese is een veronderstelling of aanname die je wilt testen met behulp van website testing. Het formuleren van een goede hypothese is de eerste stap die je neemt in het proces van website testing. Deze hypothese helpt je om te bepalen wat je wilt testen en waarom. Het geeft richting aan het experiment.
Maar waar begin je?
1. Start met je doelstellingen
Het formuleren van een goede hypothese begint met het bepalen van je doelstellingen. Wat wil je bereiken met je website? Wil je meer conversies genereren, de gemiddelde tijd op je website verhogen of de bounce rate verlagen? Het bepalen van je doelstellingen helpt je om te bepalen welke aspecten van je website je wilt testen.
2. Analyseer je data
Voordat je een hypothese formuleert, is het belangrijk om te analyseren wat er al bekend is over je website. Dit kan onder andere door middel van Google Analytics 4 (GA4). Ook tools als Hotjar en Mouseflow kunnen input geven voor data en conclusies.
Kijk bijvoorbeeld naar de meest bezochte pagina's op je website, de pagina's waarop de meeste bezoekers afhaken, producten die veel worden toegevoegd in de winkelwagen maar uiteindelijk niet worden gekocht en het verschil tussen conversies via mobiel of desktop. Dit geeft je inzicht in waar je mogelijke verbeteringen kunt aanbrengen.
3. Stel je hypothese op
Op basis van je doelstellingen en de data-analyse kun je een hypothese formuleren. Om het voor jezelf wat makkelijker te maken, kun je een structuur aanhouden waarbij jouw hypothese altijd uit drie elementen bestaat:
de verandering die je wilt testen
de reden waarom je denkt dat deze verandering de verwachte uitkomst zal opleveren
de verwachte uitkomst
Bijvoorbeeld: "We veranderen de kleur van de CTA knop van rood naar groen, omdat groen een kleur is die geassocieerd wordt met positiviteit en actie. Daarom verwachten we een stijging van 10% in het aantal klikken."
4. Test je hypothese en evalueer de resultaten
Nu je een hypothese hebt geformuleerd, kun je een website experiment opzetten om te testen of je hypothese klopt. Zorg ervoor dat je het experiment goed opzet en de juiste metrics meet om de resultaten te kunnen analyseren.
5. Analyseer je experiment
Als het experiment is afgerond, is het belangrijk om de resultaten te evalueren. Was je hypothese juist of niet? Wat zijn de belangrijkste inzichten die je hebt opgedaan? Op basis van de resultaten kun je besluiten om de verandering door te voeren, of verder te testen met andere aanpassingen.
Om het experiment te kunnen analyseren, bekijk je de data van de control en de test variant(en) apart. Dit doe je door in Analytics een segment aan te maken voor zowel de control als de test variant(en). Doe dit over de periode waarin het experiment heeft gedraaid. Op deze manier wordt het verkeer dat niet heeft deelgenomen aan het experiment eruit gefilterd.
Vervolgens kijk je naar de specifieke metric die je hebt vastgesteld voor het experiment. Op basis van de segmenten check je wat de verschillen zijn tussen de control en de test variant(en). Met deze informatie kun je zien wat het effect is geweest van het experiment en of de hypothese juist was.
Ontvang gratis groeitips
- +5.000 ondernemers gingen je voor. Het is dan ook gratis.
6. Koppel je hypothese aan een psychologische tactiek of observatie
Een succesvolle website test is gebaseerd op een goede hypothese. Om deze hypothese nog verder te versterken, kun je het koppelen aan een psychologische tactiek of observatie.
We bespreken enkele psychologische tactieken en observaties die je kunt gebruiken om je hypothese te verbeteren:
Sociale bewijskracht
Sociale bewijskracht is een veelgebruikte psychologische tactiek in website optimalisatie. Het houdt in dat mensen geneigd zijn om het gedrag van anderen te volgen.
Als je bijvoorbeeld wilt testen of het toevoegen van klantrecensies de conversieratio verhoogt, dan kun je dit koppelen aan sociale bewijskracht. Een hypothese zou kunnen zijn: "Als we klantrecensies toevoegen aan onze landingspagina, verhogen we het vertrouwen, omdat bezoekers zien dat anderen tevreden zijn met ons product. Hierdoor zullen bezoekers sneller overgaan tot een aankoop".
Urgentie
Urgentie is een andere psychologische tactiek die je kunt gebruiken om je hypothese te versterken. Mensen zijn geneigd om sneller actie te ondernemen als ze het gevoel hebben dat er haast bij is.
Denk aan het toevoegen van een timer aan een salespagina. Een mogelijke hypothese: "Als we een timer toevoegen aan onze salespagina, dan zullen bezoekers bang zijn dat ze de actie missen als ze te lang wachten. Hierdoor zullen ze sneller overgaan tot een aankoop".
Verliesaversie
Mensen zijn van nature geneigd om verlies te vermijden. Een goed voorbeeld hiervan is een 'beperkte voorraad' tekst op een productpagina.
Hypothese: "Als we een 'beperkte voorraad' boodschap toevoegen aan onze productpagina, dan zullen bezoekers sneller overgaan tot een aankoop, omdat ze bang zijn dat ze het product anders mislopen".
Affectieve valentie
Affectieve valentie houdt in dat mensen geneigd zijn om te handelen op basis van emoties. Ons eerdere voorbeeld over het veranderen van de kleur van een CTA knop is hier een goed voorbeeld van.
Een ander voorbeeld van affectieve valentie is het gebruik van beelden op een website. Een hypothese zou kunnen zijn: "Als we specifieke afbeeldingen die een emotie opwekken toevoegen aan onze productpagina, zullen bezoekers meer betrokken raken bij het product. Ze gaan dan sneller over tot een aankoop." Of bijvoorbeeld het voorbeeld hierboven, waarbij de populariteit van het product wordt benadrukt.
Door je hypothese te koppelen aan een psychologische tactiek of observatie, maak je de test nog gerichter en kun je beter voorspellen wat het effect van de veranderingen zal zijn op het gedrag van je bezoekers.
7. Hoe bereken je de doorlooptijd van een experiment?
Het is goed om vooraf te bedenken hoe lang je de test laat lopen. Zo kun je ervoor zorgen dat je voldoende tijd hebt voor de uitvoering en om betrouwbare resultaten te verkrijgen.
Hieronder vind je een stappenplan om een goede doorlooptijd te berekenen:
Bepaal de gewenste betrouwbaarheid en statistische significantie. De betrouwbaarheid geeft aan hoe vaak de uitkomst van het experiment correct is en de statistische significantie geeft aan hoe groot het verschil tussen de varianten moet zijn voordat we het effect als significant beschouwen. Meestal wordt een betrouwbaarheid van 95% en een statistische significantie van 80% gekozen. Later in de gids gaan we hier wat dieper op in.
Bepaal de minimale detecteerbare effectgrootte. Dit is het kleinste effect dat je wilt kunnen detecteren. Hoe groter het effect, hoe sneller je het resultaat zult zien. Om de minimale detecteerbare effectgrootte te bepalen, kun je gebruikmaken van een tool zoals de Sample Size Calculator van Optimizely. Later in de gids gaan we nog wat dieper in op het gebruik van Optimizely.
Bereken het aantal dagen dat nodig is om het vereiste aantal deelnemers te krijgen. Hiervoor vergelijk je de benodigde steekproefgrootte met je dagelijkse verkeer, het huidige conversiepercentage, de groei die je wil behalen en het aantal varianten dat je wilt testen. Hoe meer varianten, hoe minder bezoekers of hoe lager het conversiepercentage, des te langer de test moet draaien. Hiervoor kun je een tool inzetten, zoals een A/B test duration calculator die wordt aangeboden door VWO, een tool waar we hieronder wat dieper op ingaan.
Nu je een doorlooptijd hebt berekend, kunnen we aan de slag gaan met de instellingen van het experiment.
8. Hoe stel je een experiment in? Welke tools gebruik je hiervoor?
Je kunt gebruikmaken van verschillende tools voor website testing. Hieronder delen we graag onze favorieten.
Google Optimize
Google Optimize is een gratis tool van Google. Je kunt hiermee A/B testen, multivariate testen en omleidingstesten uitvoeren. Zo kun je eenvoudig experimenteren met verschillende pagina elementen, zoals koppen, afbeeldingen en knoppen.
Met de komst van GA4 zal Google Optimize ophouden te bestaan. De verwachting is dat er een A/B testing tool in GA4 zal worden geïntegreerd, maar hier is nog niet veel over bekend.
VWO
VWO is een softwareplatform voor CRO en website testing.
Het biedt functies voor het maken en uitvoeren van A/B testen, multivariate testen en splittesten, evenals functies voor het bijhouden van doel- en evenementgegevens, segmentatie, rapportage en analyse.
Optimizely
Optimizely stelt je in staat om snel en eenvoudig A/B testen en multivariate testen uit te voeren.
Het is zeer flexibel op het gebied van van experimentontwerp en -uitvoering en het biedt een intuïtieve en gebruiksvriendelijke interface. Hierdoor is het makkelijker om experimenten op te zetten en te beheren zonder diepgaande kennis van codering of statistiek.
Optimizely biedt integraties met veel andere tools en platforms voor een naadloze workflow, waaronder GA4, Salesforce, Marketo, Slack en Amplitude.
Convert.com
Convert.com is een krachtige testingtool. Het biedt een breed scala aan mogelijkheden, zoals A/B testen, multivariate testen, split URL-testen en meer. Ook zien we geavanceerde targetingopties, rapportages en analysemogelijkheden, plus integraties met andere tools en platforms.
ABTasty
ABTasty is een CRO platform met uitgebreide mogelijkheden voor A/B testen, multivariate testen en personalisatie. Het biedt geavanceerde targeting, segmentatie, rapportage en analysemogelijkheden. Integraties met andere tools en platforms zijn mogelijk.
Kameleoon
Kameleoon is een conversie optimalisatieplatform dat A/B testen en multivariate testen mogelijk maakt. Het heeft een gebruiksvriendelijke interface en biedt geavanceerde mogelijkheden. Denk aan segmentatie, gedrags- en contextuele targeting, en integraties met andere tools en platforms.
Stappenplan om een experiment in te stellen
De opzet van een experiment ziet er op elk platform vrijwel hetzelfde uit. Hieronder volgt een kort stappenplan om je op weg te helpen bij het opzetten van een experiment in Google Optimize, VWO of Optimizely:
Maak een account aan bij Google Optimize, VWO of Optimizely en configureer het met behulp van de instructies op de website.
Creëer een nieuwe experimentpagina binnen jouw gekozen tool en selecteer het type experiment dat je wilt uitvoeren.
Geef je experiment een duidelijke naam en voeg een beschrijving toe ter herinnering voor jezelf.
Maak de verschillende varianten van de pagina's die je wilt testen. Dit kan worden gedaan met behulp van de editor of door HTML en CSS toe te voegen
Stel indien gewenst de doelgroep in voor het experiment door specifieke criteria te definiëren, zoals locatie, apparaattype of demografische gegevens.
Definieer de metrics waarop je het experiment wil afrekenen op succes zoals, klikfrequentie of conversieratio.
Het experiment is nu klaar om live gezet te worden en data te gaan verzamelen. Houd de voortgang van het experiment in de gaten en check of alles op de website goed blijft werken.
Zorg ervoor dat je de richtlijnen en best practices van de tool volgt om ervoor te zorgen dat je experiment correct wordt uitgevoerd en betrouwbare resultaten oplevert.
9. Hoe analyseer je een experiment?
Nadat een test doorlopen is, gaan we kijken naar de resultaten. Er zijn verschillende aspecten van de analyse die je moet begrijpen, om zo een goed inzicht te krijgen in de prestaties van het experiment.
Hoe weet je wanneer je testresultaat significant is?
Wanneer een experiment is uitgevoerd, ga je eerst kijken of de resultaten significant zijn. Of met andere woorden, dat de resultaten van de test niet op toeval berust zijn.
Om te bepalen of een resultaat significant is, moeten we kijken naar het niveau van betrouwbaarheid. Dit niveau wordt bepaald door het gekozen significantieniveau en het aantal bezoekers tijdens de looptijd van het experiment.
Het gekozen significantieniveau geeft aan hoe zeker we willen zijn dat het verschil tussen de testpagina's of -elementen niet het gevolg is van toeval. Het meest gebruikte significantieniveau is 0,05, wat betekent dat we 95% zeker willen zijn dat het verschil niet op toeval berust.
Het aantal bezoekers dat deelneemt aan het experiment heeft ook invloed op de significantie. Hoe groter het aantal bezoekers, hoe betrouwbaarder het resultaat. Bij een klein aantal bezoekers is het moeilijker om significante verschillen te vinden tussen de twee testomgevingen.
Kortom, een resultaat is significant als het verschil in metrics tussen de huidige situatie en de testpagina groter is dan wat we op basis van toeval kunnen verwachten. Klinkt dat nog een beetje lastig? Natuurlijk zijn er handige methoden om de significantie te helpen bepalen: p-value en Bayesian.
Wat is het verschil tussen p-value en Bayesian?
P-value en Bayesian zijn twee methoden die vaak worden gebruikt om de significantie van een resultaat te bepalen bij website testing. Hoewel beiden worden gebruikt om de betrouwbaarheid van de resultaten te beoordelen, zijn er enkele belangrijke verschillen tussen de twee.
P-value
P-value is de meest gebruikte methode om de significantie van website testen te bepalen. Het berekent de waarschijnlijkheid dat het waargenomen verschil tussen variant A en variant B het gevolg is van toeval. Als de p-waarde kleiner is dan het gekozen significantieniveau (meestal 0,05), dan wordt het resultaat als significant beschouwd.
De eerder besproken tools Google Optimize, VWO en Optimizely kunnen de p-waarde automatisch berekenen. Ze zijn speciaal ontworpen om de statistische significantie van de resultaten van website testing te bepalen en zijn in staat om de p-waarde snel en nauwkeurig te berekenen.
Bayesian
Bayesian daarentegen gebruikt een andere benadering om de significantie te bepalen. Het maakt gebruik van Bayesiaanse statistiek om te bepalen hoe zeker we zijn dat de testvariant B beter presteert dan de huidige variant A.
Er wordt gebruikgemaakt van huidige kennis om te voorspellen hoe waarschijnlijk het is dat de varianten van elkaar verschillen. Die huidige kennis kan voortkomen uit soortgelijke situaties, eerdere experimenten, gegevens van vergelijkbare bedrijven of de persoonlijke ervaring van de tester. Vervolgens wordt de data uit de test gebruikt om deze kennis te herzien. Dit past zich aan naarmate er meer gegevens beschikbaar komen.
Vaak moet je business beslissingen maken, in plaats van het onderzoeken van wetenschappelijke hypotheses. Het kiezen voor de kans dat een variant beter presteert dan de andere, op basis van de huidige kennis die we hebben, is daarin doorslaggevend. Daarom wordt in de praktijk vaak voor Bayesian gekozen.
Bayesian statistiek gebruikt wiskundige regels om waarschijnlijkheden te berekenen en beslissingen te nemen. Op basis van zowel bestaande kennis als nieuwe gegevens.
Het begint met een initiële schatting van de kans dat een gebeurtenis waar is (prior probability). Nieuwe gegevens die voortkomen uit een experiment worden gebruikt om deze schatting bij te werken (posterior probability).
Hoe werkt Bayesian?
Wat Bayesian anders maakt dan andere methoden, is dat het ook subjectieve kennis kan meenemen in de analyse. Bij A/B testen kan het worden gebruikt om te bepalen welke versie beter presteert. In tegenstelling tot p-value, geeft Bayesian een waarschijnlijkheidsverdeling die aangeeft hoe waarschijnlijk het is dat één versie beter is dan de andere. Dit maakt beslissingen op basis van de waarschijnlijkheid van de uitkomst mogelijk. Ook biedt ook de mogelijkheid om de test tussentijds te stoppen als er al overtuigend bewijs is dat één versie beter presteert, wat tijd en middelen kan besparen.
Een voorbeeld van het gebruik van Bayesian statistieken in een A/B-test is bijvoorbeeld om te bepalen welke kleur van een CTA knop het beste werkt. Stel dat je huidige kennis zegt dat een groene knop beter presteert dan een rode knop. Vervolgens voer je een A/B-test uit met een groene en rode knop. De groene knop levert 100 klikken op. De rode knop 75.
Door de Bayesiaanse statistiek toe te passen met deze nieuwe gegevens en je voorgaande kennis, kun je berekenen welke kleur knop waarschijnlijk het beste presteert. Als uit de test blijkt dat bijvoorbeeld 70% op de groene knop heeft geklikt en 30% op de rode knop, dan kun je concluderen dat de groene knop waarschijnlijk beter presteert dan de rode knop.
Bayesian houdt dus rekening met zowel de huidige kennis of statistieken, als met de resultaten van het experiment om de kans op het waarheidsgetrouwe effect van het experiment te berekenen. Ook deze methode kun je makkelijk laten berekenen in Google Optimize, VWO en Optimizely.
Zodra je weet wat de significantie is, heb je een beter inzicht over de power van de test.
Hoe bereken je de power van een experiment?
Statistische power is de kans dat je een effect kan detecteren, wanneer het effect er is. Dus een power van 80% betekent dat van de 100 tests waarbij variaties verschillend zijn, 20 tests foutief zullen concluderen dat variaties hetzelfde zijn en dat er geen effect is.
Dat klinkt lastiger dan het daadwerkelijk is. Laten we het uitleggen in de vorm van een eenvoudige analogie.
Stel je voor dat je een schat gaat zoeken in een groot veld. Je hebt een metaaldetector om je te helpen bij je zoektocht. De power van je metaaldetector is vergelijkbaar met de statistische power van een experiment.
Als je metaaldetector een hoge power heeft, betekent dit dat de kans groot is dat je de schat vindt als deze in het veld verborgen is.
Heeft hij een lage power, dan betekent dit dat je een grotere kans hebt om de schat te missen. Zelfs als deze wél in het veld verborgen is.
Bij experimenten is het belangrijk om een voldoende hoge power te hebben, omdat een lage power kan leiden tot het missen van aanwezige effecten. Oftewel het maken van foutieve conclusies dat er geen effect is, terwijl het effect eigenlijk wél aanwezig is.
Om de power van een experiment te berekenen, moet je van tevoren een aantal parameters vaststellen, waaronder:
Het significantieniveau: dit is de kans dat je een vals positief resultaat krijgt. Gebruik hiervoor p-value of Bayesian. Bij p-value wordt het meestal ingesteld op 0.05. Bij Bayesian 95, 90 of 80%.
De gewilde effectgrootte: dit is de minimale verandering in conversiepercentage die je wilt detecteren. Het wordt meestal uitgedrukt als een percentageverandering.
De power: dit is de kans dat je een effect detecteert als het er ook daadwerkelijk is. Het wordt meestal ingesteld op 80%.
Om de power te berekenen, moet je ook rekening houden met andere factoren. Denk aan de variantie van de data en het aantal varianten in de test. Het is belangrijk om een voldoende grote steekproef grootte te kiezen om de power te maximaliseren en nauwkeurige conclusies te kunnen trekken over de resultaten van het experiment.
Door de power van een experiment te berekenen voordat je begint met de test, kun je ervoor zorgen dat je voldoende data verzamelt om betrouwbare resultaten te krijgen en het risico op het maken van fouten te minimaliseren.
Klinkt het lastig? Geen zorgen! De power van het experiment kan worden berekend met behulp van een power calculator, die beschikbaar is voor alle website testing tools die we hebben besproken: Google Optimize, VWO en Optimizely. Tevens heb je met deze tools meer kans op betrouwbare resultaten.
Wanneer is een experiment resultaat betrouwbaar?
Een resultaat dat voortkomt uit website testing is pas betrouwbaar wanneer het significant is. Tevens moet het experiment goed zijn opgezet en uitgevoerd. Let daarbij op de volgende punten:
Steekproefgrootte: Er moeten genoeg bezoekers hebben deelgenomen aan het experiment. Bijvoorbeeld: de data die voortkomt uit het gedrag van 1000 bezoekers is betrouwbaarder dan die van maar 20 bezoekers.
Representativiteit: De steekproef moet representatief zijn voor de doelgroep waarop het experiment is gericht. Bijvoorbeeld: als je een aanpassing test om nieuwe klanten uit te dagen hun eerste bestelling te plaatsen, dan mag de steekproef niet bestaan uit vaste klanten.
Controle: Zorg dat je controle hebt over de impact van eventuele andere factoren. Je wilt uiteraard zo min mogelijk variabelen die de test kunnen beïnvloeden. Bijvoorbeeld: wanneer je een test doet met verschillende kleuren van een knop, zorg dan dat de knop in alle varianten op dezelfde locatie staat, met dezelfde grootte en font. Zo minimaliseer je andere factoren die de testresultaten kunnen beïnvloeden.
Meetinstrumenten: De gebruikte meetinstrumenten dienen betrouwbaar te zijn. Maak daarom gebruik van Google Optimize, VWO of Optimizely. Dan weet je zeker dat er goed wordt gemeten!
Verder is het goed om te beseffen dat het resultaat van website testing slechts een momentopname is. Het kan afhankelijk zijn van verschillende factoren, zoals de tijd van het jaar, de marktontwikkelingen en het gedrag van de doelgroep. Blijf daarom altijd actief testen om te zorgen voor continue verbetering en betrouwbare resultaten op de lange termijn.
Wanneer je betrouwbare resultaten hebt verzameld, kunnen we verder gaan kijken naar de vervolgstappen. Implementeer je de testvariant, of toch niet?
Wanneer kies je ervoor door te gaan met de test variant?
Het besluit om door te gaan met de testvariant, hangt af van verschillende factoren.
Betrouwbaarheid van de resultaten: De resultaten moeten betrouwbaar zijn en er moet voldoende data zijn verzameld om een conclusie te kunnen trekken. Zorg ervoor dat de steekproef relevant en groot genoeg is en dat de resultaten statistisch significant zijn.
Impact van de resultaten: De resultaten moeten een significante impact hebben op de conversie (of een ander doel). Als de resultaten een kleine impact hebben, kan het de moeite niet waard zijn om door te gaan met de testvariant.
Tijd en middelen: Wat zijn de kosten, tijd en middelen die nodig zijn om de testvariant de implementeren? Staat dit in balans met de impact van de resultaten?
Over het algemeen besluit je pas om door te gaan met de testvariant als de resultaten betrouwbaar, relevant, impactvol en haalbaar zijn. Het is belangrijk om een weloverwogen beslissing te nemen op basis van de beschikbare gegevens en de doelstellingen van het experiment.
Hoe bereken je de groei in conversie?
Om de groei in conversie te berekenen, moet je eerst het conversiepercentage van de geteste varianten berekenen. Het conversiepercentage is het percentage bezoekers dat de gewenste actie heeft voltooid. Denk bijvoorbeeld aan het doen van een aankoop of het invullen van een formulier.
Bijvoorbeeld, stel dat je een A/B test hebt uitgevoerd en de originele variant A had 1000 bezoekers met 50 conversies. Testvariant B had met hetzelfde aantal bezoekers 80 conversies. Het conversiepercentage voor variant A is dan 5% (50/1000) en voor variant B is het 8% (80/1000).
Om de groei in conversie te berekenen, neem je het verschil tussen het conversiepercentage van de geteste varianten. Dit deel je vervolgens door het conversiepercentage van de originele variant A. Als laatste vermenigvuldig je het altijd met 100. In ons voorbeeld ziet dat er zo uit:
((8% - 5%) / 5%) x 100 = 60%
De groei in conversie is dan dus 60%. Dit betekent dat de testvariant (variant B) een conversiegroei van 60% heeft behaald ten opzichte van de huidige variant (variant A).
De eerder genoemde tools (Google Optimize, VWO of Optimizely) kunnen dit voor je berekenen. Ze kunnen bijvoorbeeld het aantal conversies en bezoekers van de oorspronkelijke pagina vergelijken met die van de testvariant en de verbetering in procenten of absolute aantallen weergeven.
10. Hoe waarborg je je testresultaten?
Een tool die je kan helpen bij het waarborgen van de betrouwbaarheid van je testresultaten is Airtable.
Airtable
Dit is een krachtige tool voor het beheren van website testen en het verzamelen van gegevens. Met Airtable kun je experimenten gemakkelijk organiseren en plannen. Zo heb je altijd een goed overzicht van alle lopende en geplande tests.
Je kunt de resultaten van de testen per klant bijhouden en eenvoudig analyseren welke testen significant waren en welke niet. Ook kun je in één oogopslag zien op welke pagina's er getest is en op basis van welke psychologische tactieken er getest is.
Je kunt met meerdere mensen tegelijkertijd in dezelfde database werken. Dit is erg handig als je bijvoorbeeld een team hebt dat zich bezighoudt met website testing. Je structureert en organiseert alle gegevens op een flexibele manier. Tevens kun je alle data, resultaten en lopende tests op verschillende manieren weergeven en filteren. Dit zorgt ervoor dat je snel inzicht kunt krijgen in de resultaten van de tests en dat je makkelijk conclusies kunt trekken.
Extra handig: Airtable kan worden gebruikt in combinatie met Google Optimize, VWO of Optimizely. Het is mogelijk om de resultaten handmatig te importeren of automatisch te koppelen door gebruik te maken van integraties en API's. Dit bespaart tijd en vermindert de kans op fouten bij het handmatig invoeren van de gegevens.
Als je gebruikmaakt van Google Optimize, kun je gebruikmaken van de Airtable integratie in het Google Optimize Dashboard. Hierdoor kun je automatisch resultaten en gegevens van je testen importeren in Airtable. Op deze manier kun je de resultaten van je testen eenvoudig organiseren en analyseren.
Voor VWO kun je gebruikmaken van hun API om automatisch de resultaten van je testen in Airtable te importeren. Het is mogelijk om de testresultaten per variatie in Airtable op te slaan en de gegevens te filteren op basis van verschillende parameters.
Optimizely heeft ook een Airtable integratie die het mogelijk maakt om automatisch resultaten en gegevens van je testen in Airtable te importeren. Hierdoor kun je eenvoudig de verschillende testversies documenteren en analyseren.
11. Conclusie: website testing in 2024
Het is duidelijk dat website testing tegenwoordig een zeer grote impact heeft voor ondernemers die online zaken doen. Het geeft inzicht in het effect van de wijzigingen die je maakt op jouw website. Succes berust niet meer op aannames of een onderbuik gevoel.
De uitkomsten van jouw website testen zijn gebaseerd op de data van jouw eigen doelgroep. Je leert dus niet alleen je doelgroep beter kennen, maar je komt er ook achter wat wel en niet voor ze werkt. Met deze data kan je beter en sneller aanpassingen doorvoeren die daadwerkelijk een effect opleveren. Je hebt veel meer controle!
We zien voortdurend nieuwe technologieën, tools en trends opduiken. Het is dan ook heel goed dat jij op de hoogte blijft van de nieuwste ontwikkelingen op het gebied van website testing. We raden je aan om jouw website testing strategie voortdurend te evalueren en bij te werken.
Je weet nu wat de kracht en relevantie van website testing is. En welke tools en strategieën jij hiervoor kunt gebruiken. Je kunt zelf aan de slag gaan met het verbeteren van jouw website testprogramma!
Laat je ons weten hoe het gaat?
Advies over website testing?
- Een gratis analyse t.w.v. 4 tot 6 uur werk
- Heldere website strategie op maat
- 87% van de bedrijven die we analyseren loopt omzet mis