Een zeilboot voor Sytze
De blogpost van Pieter Stroop van 6 oktober 'Schrijf toch eens een Bourgondische brief aan een Brabander' verdient geen reactie, maar een vervolgpost. Naamgeografisch onderzoek is namelijk een belangrijke informatiebron voor tal van (marketing)disciplines.
An Marijnissen van de KU in Leuven bracht in de jaren negentig al de achternamen in België in kaart, vorig jaar berichtte de Volkskrant over de betekenisvolle samenhang tussen de voornamen die ouders aan hun kinderen geven en de leefstijl van die ouders en nu komt Pieter met een verhaal, waar ze bij het Meertensintituut beslist van zullen smullen...
Dan zal ik ook maar een duit in het zakje doen.
De onderzoekers Emma van Nifterick, Doreen Gerritzen en Gerrit Bloothooft ontdekten, na analyse van de gegevens van de Sociale Verzekeringsbank (de instelling die in Nederland de kinderbijslag uitbetaalt), dat binnen een gezin vaak specifieke voornaamcombinaties voorkomen. Ouders laten zich dus bij het bedenken van de voornaam van hun aanstaande baby niet alleen leiden door motieven als vernoeming (familieleden of idolen), leuke klank, alliteratie met de achternaam of originaliteit.
Ook de naam van de broer(s) en/of zuster(s) speelt dikwijls een belangrijke rol. Zo heet de zus van Merel vaak Sophie en de broer van Fatima heet Mustafa.
De onderzoekers verdeelden op deze manier de voornamen in Nederland in acht verschillende groepen in. Wegener DM koppelde vervolgens persoonsgegevens (sportbeoefening, autobezit, vakantiebesteding, enzovoort) aan deze voornaamgroepen en constateerde dat bij elke naamgroep een onderscheidende leefstijl blijkt te horen. Volgens Wegener DM kunnen bedrijven hun voordeel doen met dit gegeven.
De grote vraag hierbij is natuurlijk: Hoe moeilijk en hoe nuttig is voornaamsegmentatie nu eigenlijk precies?
Ambiguïteit van voornamen
Voornamen hebben een hoge mate van ambiguïteit met andere relatiegegevens. Zeker wanneer deze namen zijn opgeslagen in grote databestanden, is het moeilijk om de eenduidigheid ervan vast te stellen. Wanneer ik de kennistabellen van Human Inference er eens bij pak, dan vallen de volgende zaken op:
Er zijn bijna 9.000 voornamen die ook als achternaam voorkomen. In de meeste gevallen zal de absolute frequentie van de bewuste achternaam laag zijn. Dit is echter niet altijd het geval en het zal daarom tot onduidelijkheden leiden bij het vastleggen van de naam in een database of bij het representeren van de naam in correspondentie. Enkele voorbeelden:
Alfred Erna <--> Erna Alfred
Max Euwe <--> Euwe Max
Nelleke Otto <--> Otto Nelleke
Meindert Michel <--> Michel Meindert
Er bestaat eveneens ambiguïteit tussen voornamen en geografische aanduidingen.
Hoewel we bij de volgende reeks voorbeelden geneigd zijn om te denken aan plaatsen of landen, gaat het eveneens om voornamen:
Holland, Oene, Egmond, Uden, France, Weert, Mook, Deventer
Verder zijn er in de kennistabellen van Human Inference ook bedrijfsnamen vastgelegd, die als voornaam voorkomen. Wat te denken van:
Bruna, Mercedes, Esso, Stork, Renault, Lloyd, Jeep, Hero
Alleen gedegen contextanalyse met behulp van kenniscorpora biedt uitkomst bij de bepaling van de juiste betekenis van dergelijke woorden. Correcte identificatie is dus de eerste voorwaarde voor het gebruik van voornamen – op welke manier dan ook.
Tweelingen
Wanneer we in staat zijn om voornamen correct te identificeren, kunnen we met deze gegevens aan de slag. Wat zijn gerichte marketingacties en hoe kiezen we het meest geschikte mediakanaal voor communicatie met de klant op basis van voornaamsegmentatie?
De voorkeur van ouders voor ‘gelijksoortige’Â voornamen voor hun kinderen blijkt misschien nog wel het beste uit de verzameling tweelingnamen op de bijzonder informatieve website voornamelijk.nl. Onderstaande voorbeelden illustreren de onderzoeksresultaten:
dochter - dochter
Famke en Nienke
Floortje en Roosje
Kimberly en Romy
Charlotte en Godelieve
Amber en Ashley
zoon - zoon
Bas en Thijs
Alexander en Olivier
Damian en Dylan
Samir en Yassine
Owen en Quinten
dochter - zoon
Lotte en Marijn
Brittney en Mitchell
Hidde en Tessel
Soraya en Zico
Esmée en Mathijs
Het moge duidelijk zijn dat de overeenkomsten in deze voornaamparen een indeling in naamgroepen (zoals in het onderzoek beschreven) inderdaad rechtvaardigt. Wellicht is het zo, dat ouders bij de naamgeving van tweelingen nog meer waarde hechten aan de congruentie tussen de namen, maar dat kan ook worden gezien als een bevestiging van het geconstateerde fenomeen.
Maar hoe betrouwbaar is deze onderverdeling in relatie tot consumentengedrag? Luisteren de ouders van Brittney en Mitchell inderdaad liever naar het levenslied dan de ouders van Charlotte en Godelieve? Is het werkelijk zo dat de vader van Bas en Tijs eerder in een Saab of Volvo zal rijden dan de moeder van Kimberley en Kevin?
Combinatie van gegevens
Demografische statistieken, geodata en consumenteninformatie worden sinds jaar en dag gebruikt voor gerichte marketingacties. Wanneer de samenhang tussen leefstijl en naamgeving voor de kinderen gecombineerd wordt met deze gegevens, is het – althans volgens Janny Hoekstra, hoogleraar direct marketing aan de Rijksuniversiteit Groningen – mogelijk om de responskans op de marketinginspanning (bijvoorbeeld een reclamefolder of een catalogus) te vergroten.
Dat is mooi, maar dan moet de betreffende marketeer wel rekening houden met het feit dat deze koppeling een aantal belangrijke aandachtspunten kent. Naast het eerder genoemde identificatieaspect, moet er natuurlijk ook worden stilgestaan bij a-typische combinaties van hoogfrequente voornamen: Hoe delen we gezinnen in met voornaamcombinaties zoals Frouke en Wesley? Daarnaast kennen voornamen ook een 'historisch' perspectief: Waar Kevin een aantal jaren geleden eerder een voornaam voor kinderen van ouders met een sterke voorkeur voor de Angelsaksische en Ierse cultuur was, wordt deze naam tegenwoordig vaak gesignaleerd in de lagere sociale klassen. Ook de regionale verschillen in voornaamgeving moeten in overweging worden genomen.
Tot slot
Het onderzoek naar voornaamgeving en het koppelen van de resultaten van dit onderzoek aan consumenteninformatie is - net als de blog van Pieter over familienaamspreiding in Nederland - een mooi staaltje moderne naamkunde. Enig kritisch bewustzijn is echter wel op zijn plaats.
Binnen Human Inference krijgen we regelmatig aanvragen om familienamen op grond van vormkenmerken in te delen naar het land van herkomst. We kijken bij dit soort aanvragen altijd extra nauwkeurig naar de achterliggende redenen voor een dergelijke segmentatie. Het is immers bijzonder onwenselijk wanneer deze gegevens op een 'verkeerde' manier worden gebruikt. Ze moeten, zogezegd, op de juiste waarde worden geschat. Er is in deze een zekere analogie met de indeling van voornamen in naamgroepen. Goed onderzoek verdient dan ook een goed vervolg.

Prachtie bijdrage, Holger. Voorzichtig zijn blijft de boodschap. Toch zijn er wel wat marketing-toepassingen te verzinnnen. Bij duidelijk herkenbare Turkse voor- of achternamen kun je marketing toepassingen voorstellen die Bellen met Turkije reclameren. Of een verspreidingsgebied met een hogere concentratie Antilliaanse namen. Om Fernandes af te zetten. Marketing is vaak kansverdichting, en dat kan hier heel goed mee.
Nu we het toch over namen hebben: het is trouwens Ann Marynissen, en ze werkt nu aan de universiteit van Keulen. Haar inteactieve, realtime website voor het in kaart brengen van achternamen in Belgie staat op www.familienamen.be