Analyse van domeinnaamverlengingen binnen verschillende ccTLD's

Inzichten uit 40 miljoen domeinnamen onder 10 ccTLD's onthullen patronen achter domeinnaamverlengingen

Iemand die data op een laptop analyseert.

De oorspronkelijke blogpost is Engelstalig. Dit is de Nederlandse vertaling ervan.

De afgelopen jaren hebben veel CENTR-leden gedragsveranderingen waargenomen rondom de verlenging van domeinnamen. In 2023-2024 zagen veel leden dat het aandeel van verlengde domeinnamen afnam. Zelfs een kleine daling van de verlengingspercentages kan al een behoorlijke financiële impact hebben, omdat een aanzienlijk deel van de inkomsten van registry's doorgaans afkomstig is uit verlengingen en niet uit nieuwe registraties. Bovendien faciliteren stabiele en voorspelbare verlengingspercentages een nauwkeurigere financiële planning.

Inzicht in het gedrag rondom de verlenging van domeinnamen is dan ook van cruciaal belang. Een zorgvuldige analyse helpt ccTLD-registry's te bepalen of neerwaartse trends waarschijnlijk zullen aanhouden of dat ze maar tijdelijke veranderingen in het gedrag van domeinnaamhouders reflecteren.

CENTR heeft eerder al onderzocht welke invloed de leeftijd van een domeinnaam en de inhoud van de bijbehorende website hebben op de verlengingspercentages bij verschillende ccTLD's. Dit artikel bouwt daarop voort door de analyse uit te breiden naar een bredere reeks mogelijke graadmeters voor verlenging, die door meerdere ccTLD's aan de hand van gestandaardiseerde data en methoden zijn onderzocht.

Renewal Indicators Taskforce

Vertegenwoordigers van 10 ccTLD-registry's (.at, .be, .de, .ie, .it, .nl, .no, .nu, .nz en .uk) hebben de CENTR Renewal Indicators Taskforce opgericht om hun expertise te bundelen en te onderzoeken welke factoren van invloed zijn op de waarschijnlijkheid dat een domeinnaam wordt verlengd.

Het onderzoek van de taskforce richt zich in het bijzonder op 3 kernvragen:

  • Welke factoren laten bij alle registry's een consistente correlatie met verlengingen zien?

  • Welke factoren zijn voor sommige registry's uiterst relevant, maar voor andere niet?

  • Kunnen factoren die door een bepaalde registry zijn geïdentificeerd, door andere worden gevalideerd?

De antwoorden op deze vragen helpen deelnemende ccTLD's om interessante trends in hun eigen datasets te identificeren door deze te vergelijken met die van andere deelnemers. Daarnaast bieden ze een solide uitgangspunt voor andere TLD's die hun eigen methoden voor het voorspellen van verlengingen willen ontwikkelen.

Factoren en methodologie

De meeste deelnemende registry's hebben al enige ervaring met verlengingen analyseren. Op basis van hun gezamenlijke kennis identificeerden de taskforceleden 14 factoren waarvan de verwachting is dat ze verband houden met verlengingsgedrag. Deze factoren hebben betrekking op registratiegegevens, DNS-querydata en inhoudskenmerken van websites. Niet alle registry's leverden gegevens voor alle factoren, omdat in sommige gevallen extra infrastructuur nodig is, zoals een webcrawler. Een volledige lijst van de onderzochte factoren is te vinden in tabel 1.

Om de vergelijkbaarheid te waarborgen, ontwikkelde de taskforce gemeenschappelijk analysecode en een uniforme aanpak om de effecten van de verschillende factoren te meten. We kwantificeren deze effecten door te kijken naar cohorten. Zo is er bijvoorbeeld een cohort met alle domeinnamen met een MX-record, een cohort met alle domeinnamen die 7-10 jaar oud zijn, enzovoort.

De cohorteffecten worden vervolgens gemeten aan de hand van risicoverschillen: het verschil tussen het verlengingspercentage van een cohort en het algemene verlengingspercentage van de registry. Als het algemene verlengingspercentage van een registry 70% is en domeinnamen die minder dan een jaar geleden zijn geregistreerd een verlengingspercentage van 60% hebben, bedraagt het risicoverschil voor dat cohort –10 procentpunt. In de rest van het artikel gebruiken we de term verlengingsverschillen als een meer intuïtieve benaming voor deze risicoverschillen.

Naam

Omschrijving

Registratieleeftijd

De tijd die is verstreken sinds de registratie van de domeinnaam.

Leeftijd van houdercontact

De tijd die is verstreken sinds de aanmaak van het contact of de handle van de domeinnaamhouder.

Webgebruik

De laatst waargenomen manier waarop de domeinnaam op het web is gebruikt volgens niveau 2 van de CENTR Low Content Taxonomy.

Crawlstatus

Het resultaat van de meest recente poging om de hoofdpagina van de domeinnaam op te halen.

Houderregio

De geografische regio waarin het adres van de domeinnaamhouder zich bevindt. Dit zijn UN M49-regio's, zoals Noord-Afrika of West-Europa.

Houder in TLD-regio

Een indicator die aangeeft of het adres van de domeinnaamhouder zich in dezelfde regio bevindt als de locatie van de registry.

Domein heeft MX-record

Of er een MX-record aan de domeinnaam is gekoppeld.

Type houder

Categorie van de domeinnaamhouder (persoon, organisatie, overig of onbekend).

Bedrijfsmodel van registrar

Categorie van de huidige registrar zoals gedefinieerd door de Registry Registrar Data Group van CENTR.

DNS-magnitude

De dagelijkse DNS-magnitude voor de domeinnaam, een door NIC.AT ontwikkelde meetwaarde die hier wordt uitgelegd, zoals gemeten via ENTRADA van SIDN.

Portfoliogrootte van houder

Het aantal domeinnamen dat eigendom is van de domeinnaamhouder.

Registratie is verhuisd

Of de domeinnaamregistratie in de afgelopen 12 maanden is verhuisd naar een andere registrar.

Domeinnaam bevat getal

Of de domeinnaam een getal bevat dat is uitgedrukt in cijfers (98, 2025, ...)

Dropcatch-registratie

Of de domeinnaam binnen 24 uur na vrijgave opnieuw is geregistreerd.

Tabel 1: Overzicht van onderzochte factoren. Alle factoren worden een maand voor de vervaldatum van de domeinnaam geëvalueerd.

Dataoverzicht

Deze methodologie werd door 10 ccTLD-registry's toegepast op datasets bestaande uit domeinnaamregistraties die in 2024 moesten worden verlengd. Elke dataset bevat 1 regel per registratie, met daarin een indicator voor het verlengingsresultaat en de waarden van de geselecteerde factoren, gemeten 1 maand voor de verlengingsdatum van de domeinnaam. Om de privacy van de domeinnaamhouders te waarborgen, berekende elk ccTLD zelf de geaggregeerde statistieken voor de eigen dataset en werden alleen de resultaten met de rest van de taskforce gedeeld.

In totaal beslaat de analyse 40 miljoen domeinnamen uit 10 ccTLD's. In de volgende secties geven we eerst een overzicht van de factoren die binnen de registry's de sterkste samenhang met verlengingen laten zien. Daarna lichten we een aantal bevindingen nader toe, met speciale aandacht voor de overeenkomsten en verschillen tussen registry's.

Belangrijkste factoren

Eerst brengen we in kaart hoe belangrijk factoren in het algemeen zijn. Daarna onderzoeken we hoe specifieke cohorten (zoals leeftijdsgroepen) de verlengingspercentages beïnvloeden.

Om te kwantificeren hoe belangrijk een factor voor een registry is, berekenen we de standaarddeviatie van de verlengingsverschillen over alle cohorten. Hoe groter de spreiding in verlengingspercentages tussen cohorten, hoe belangrijker de factor. Om te voorkomen dat kleine cohorten de rangorde van factoren onevenredig beïnvloeden, wegen we de standaarddeviatie naar cohortgrootte. Grotere cohorten krijgen daardoor proportioneel meer invloed. Dit is noodzakelijk omdat cohorten lang niet allemaal even groot zijn. Zo hebben de meeste registry's bijvoorbeeld veel meer registraties van lokale houders dan van houders ver weg.

Vervolgens rangschikken we de factoren op basis van hun belangrijkheidsscores, zodat we de registry's met elkaar kunnen vergelijken. Figuur 1 laat deze rangschikking zien. De rijen stellen factoren voor, terwijl elke kolom de positie van die factor voor een specifieke ccTLD-registry toont. Factoren die bij de meeste registry's steevast hoog scoren, staan bovenaan de grafiek. Factoren die over het algemeen minder belangrijk zijn of alleen bij bepaalde registry's een hoge score hebben, staan lager. Sommige cellen zijn leeg, wat betekent dat de betreffende registry geen data voor die factor heeft geleverd.

Ranking of indicators by weighted retention rate spread
https://images.ctfassets.net/yj8364fopk6s/62pn08JYvS0a3tniEsRv7b/b261220b33edd04f619c713e6769d9a3/ranking-of-indicators-by-weighted-retention-rate-spread.svg

Figuur 1. Factoren gerangschikt naar hun effect op het verlengingspercentage. Factoren die bij de registry's steevast hoog scoren, staan bovenaan; factoren die lager scoren of alleen hoog scoren bij bepaalde registry's staan onderaan.

We gaan nu dieper in op een aantal interessante bevindingen die uit deze rangschikking naar voren komen.

Nieuwe registraties verlengen minder vaak

Een bevinding die meteen opvalt, is dat bij alle registry's de leeftijd van de registratie steevast een belangrijke rol speelt: deze factor scoort hoog bij elke registry in de analyse.

Figuur 2 laat zien dat de jongste registraties – domeinnamen die minder dan een jaar geleden zijn geregistreerd – steevast lagere verlengingspercentages hebben dan oudere registraties (met uitzondering van .no). Over alle registry's bezien heeft dit cohort een gemiddeld risicoverschil van –22 procentpunt, wat aangeeft dat domeinnamen in hun eerste jaar aanzienlijk minder vaak worden verlengd dan wat het gemiddelde is voor een registry. Bij oudere registraties is het tegenovergestelde patroon zichtbaar: vooral domeinnamen die al meer dan 10 jaar geregistreerd zijn, worden juist vaker verlengd en vertonen positieve risicoverschillen.

Er zijn echter opvallende verschillen tussen de registry's. Bij .no worden registraties in hun eerste jaar vaker dan gemiddeld verlengd, met een positief verlengingsverschil van +9 procentpunt. Daarentegen laat .nl een veel sterker negatief effect zien: domeinnamen in hun eerste jaar worden 44 procentpunt minder vaak verlengd dan het gemiddelde van de registry. Dit lijkt samen te hangen met de strategie van enkele grotere .nl-registrars, die klanten aantrekken met kortingen in het eerste jaar, gevolgd door aanzienlijk hogere prijzen in de daaropvolgende jaren. Het resultaat is dat .nl veel nieuwe registraties ziet, maar ook veel opzeggingen aan het einde van het eerste jaar.

(Klik op de afbeeldingen om deze te vergroten.)

Risk differences for cohorts within the registration‑age factor
https://images.ctfassets.net/yj8364fopk6s/3jA2lgOClfd2jNLaLKY1KH/add58afc9147994d0f3efcca32637da4/indicator-f_registration_age_00_binned.clear.svg

Figuur 2: Risicoverschillen voor cohorten binnen de factor registratieleeftijd. Elke subgrafiek toont de resultaten voor een specifiek leeftijdscohort. De balken geven aan met hoeveel procentpunt een cohort het gemiddelde verlengingspercentage van de registry verhoogt of verlaagt. Anders dan bij figuur 1 zijn deze risicoverschillen niet gewogen naar de grootte van het cohort.

De op één na belangrijkste graadmeter uit figuur 1 is de tijd die is verstreken sinds de aanmaak van het houdercontact, wat vaak nauw verband houdt met de registratieleeftijd. Deze graadmeter heeft een sterke correlatie met verlenging en staat bij 7 van de 8 registry's die data konden leveren in de top 5. Helaas is deze factor voor sommige registry's minder betrouwbaar (bijvoorbeeld .at en .nl), omdat bepaalde registrars voor elke domeinnaam of zelfs bij kleine wijzigingen in de contactgegevens een nieuw contact aanmaken, ook al blijft de onderliggende houder waarschijnlijk hetzelfde.

Lokale registraties verlengen vaker

We zien ook dat bij de meeste ccTLD-registry's de geografische regio van de houder een belangrijke rol speelt bij het verlengingsgedrag. De regio van de houder staat bij 5 van de 8 registry's die deze factor analyseerden in de top 5, terwijl de graadmeter of de houder zich in de TLD-regio bevindt bij 4 van de 7 registry's in de top 5 staat.

Figuur 3 laat de risicoverschillen zien tussen houders binnen en buiten de geografische regio van de ccTLD. Gemiddeld worden domeinnamen die door houders buiten de TLD-regio zijn geregistreerd ongeveer 10 procentpunt minder vaak verlengd dan het gemiddelde van de registry. De onderliggende hypothese is dat de ccTLD-registry's voornamelijk lokaal gericht zijn en registraties van buiten de kernregio daardoor minder snel worden verlengd. Voor de meeste TLD's in deze analyse wordt deze verwachting bevestigd door de data.

Risk differences for registrants in and outside the ccTLD region
https://images.ctfassets.net/yj8364fopk6s/2XHDvODOMApemjBPlZzyD3/92fdec7735d8167f7b6db07befdd096c/indicator-f_rant_in_tld_region.clear.svg

Figuur 3. Risicoverschillen voor houders binnen en buiten de ccTLD-regio.

Het effect is vooral duidelijk bij .at en .nl, waar registraties van buiten de regio de grootste negatieve risicoverschillen laten zien (respectievelijk -27 en -24 procentpunt). Dit wijst erop dat deze ccTLD's mogelijk vooral lokaal gericht zijn. Figuur 4 toont een verdere uitsplitsing naar houderregio en laat zien dat registraties uit Azië in zowel .at als .nl duidelijk lagere verlengingspercentages hebben.

Een interessante uitzondering is .ie. Bij deze registry laten registraties van buiten de TLD-regio juist hogere verlengingspercentages zien, met een positief risicoverschil van ongeveer +8 procentpunt. Een mogelijke verklaring ligt in het restrictieve registratiebeleid van .ie: alleen houders die een connectie hebben met Ierland mogen een .ie-domein registreren. Mogelijk zijn houders van buiten de regio die aan dit criterium voldoen daardoor vaak extra gemotiveerd om hun domeinen te behouden, wat leidt tot hogere verlengingspercentages.

Risk differences for different registrant regions
https://images.ctfassets.net/yj8364fopk6s/5jsH4f3bPbWsUiHVdxmaAB/f0c346501012ba9514c79cc4d1684ed2/indicator-f_rant_region_00.clear.svg

Figuur 4. Risicoverschillen voor verschillende houderregio's.

Domeinnaamverhuizing is een wisselende graadmeter voor verlenging

Een domeinnaam verhuizen van de ene naar de andere registrar is voor een houder een tamelijk ingewikkeld proces. Het doorlopen van dit proces zou een aanwijzing kunnen zijn dat de houder belang hecht aan de domeinnaam en deze in de toekomst wil behouden. Met de verzamelde data kunnen we deze veronderstelling nu toetsen bij de deelnemende ccTLD's. Het resultaat is te zien in figuur 5.

Risk differences for domain names that have been transferred and those that have not
https://images.ctfassets.net/yj8364fopk6s/3UWXosywRQpgtcvppTGuqh/20b14af9ec9ca4565ca9aec5de3d0521/indicator-f_registration_transferred_00.clear.svg

We zien een wisselend effect. Hoewel een verhuizing in ongeveer twee derde van de deelnemende TLD's inderdaad gepaard gaat met een (soms sterke) toename van de kans op verlenging, is het effect in de overige TLD's juist tegenovergesteld. De reden voor dit verschil in gedrag is op dit moment onbekend. Het correleren van registrybeleid en andere ccTLD-specifieke factoren verband houden met de hier getoonde resultaten biedt echter een goed startpunt voor verder onderzoek en daarmee voor meer inzicht in de domeinnaammarkt.

Conclusies

De CENTR Renewal Indicators Taskforce heeft het voor deelnemende registry's mogelijk gemaakt hun praktijkervaring met de analyse van verlengingsgedrag uit te wisselen en samen tot datagedreven inzichten te komen. Zo hebben we vastgesteld dat de leeftijd van een domeinnaam steevast de belangrijkste graadmeter is voor domeinnaamverlenging en dat voor de meeste (maar niet alle!) registry's geldt dat houders met een lokaal adres eerder geneigd zijn hun domeinnaam te behouden. Daarentegen valt het te bezien in hoeverre je de verhuisgeschiedenis van een domeinnaam kunt gebruiken om te voorspellen of die domeinnaam wordt verlengd. Hoe zwaar die factor weegt, verschilt namelijk sterk per registry.

Door deze en vele andere inzichten mee te nemen naar onze eigen ccTLD's, kunnen we de kwaliteit van onze verlengingsprognoses verbeteren en mogelijk nieuwe strategieën ontwikkelen om in de toekomst hogere verlengingspercentages te realiseren.

Met het oog op de toekomst zien we dat de Taskforce – in slechts enkele maanden tijd – een robuust kader heeft ontwikkeld voor de toepassing van een gezamenlijke data-analyse waarbij elke registry de volledige controle behoudt over de gegevens van zijn eigen ccTLD. Met die basis op orde is het veel eenvoudiger geworden om te experimenteren met nieuwe benaderingen voor verlengingsmodellen (en andere analytische onderwerpen). We zijn dan ook enthousiast over de mogelijkheden voor nadere samenwerking in de toekomst.

Heb je ideeën, feedback of zie je een mogelijkheid om samen te werken? Laat het ons weten via thymen.wabeke@sidn.nl, clemens.moritz@nic.at of scastro@weare.ie.