Beide...
Een stapje abstracter: ik werk op dit moment in het zorg-informatie-domein en wij gebruiken zorg-data om de kwaliteit van zorg te verbeteren. Een van de grootste uitdagingen is om die data klaar te maken voor onderzoek. De problemen die wij tegen komen:
1) het format waarin de data staat kan anders zijn bij verschillende bronnen (e.g. de ene doet word documentjes, de ander excel lijsten).
2) Dan zit er soms verschil in de terminologie die tussen verschillende bronnen gebruikt wordt. Bijvoorbeeld, de ene noemt het een fractuur, de ander een botbreuk.
2b) wanneer het over vrije tekst gaat, dan krijg je ook nog eens te maken met allerlei nuances van geschreven tekst voor de kiezen. (e.g. negaties, referenties tussen termen, koppelwoorden zoals "welke", etc)
3) En dan kan er nog een verschil zijn in betekenis/abstractie. De ene noteert "kanker", de ander heeft het over een "plaveiselcarcinoom", waarbij de term "kanker" de abstractere term is.
Wanneer ik naar jouw platform kijk, en dan met name de vrije teksten die bedrijven in kunnen vullen, doet zich hier hetzelfde voor:
Ieder bedrijf is een aparte bron van data.
1) Elk gebruiken ze een eigen schrijfstijl en formatjes
2) Elk hebben ze misschien net een wat ander jargon
3) Elk gebruiken een ander abstractieniveau
1 en 2 maken de zoekbaarheid van de data moeilijker. Dus kandidaat moet door meer vacatures heen browsen...
3 beïnvloedt de nauwkeurigheid van de match. Bijvoorbeeld, kandidaat zoekt een team van 4+ developers met een dedicated scrum master (specifiek). Bedrijf beschrijft: "je komt in ons software development team terecht" (generiek)
De andere kant op: Bedrijf wil CosmosDB ervaring (specifiek), kandidaat heeft wel vaker gewerkt met NoSQL databases (generiek).
Dan is er nog de casus waarin het bedrijf de nuance niet kwijt kan: Bedrijf wil iemand die een Dockerfile wel kan lezen, maar vult in "Docker ervaring". Kandidaat interpreteert dat als diepgaande Docker ervaring en haakt af.
Ook nog: bedrijf plaatst een vacature voor een medior (specifiek), maar bedenkt zich niet dat wanneer de unicorn-senior interesse heeft dat ze die ook wel willen aannemen voor wat meer salaris.
Is er hier een oplossing voor? Ja, maar die is niet bepaald dummy-proof: ontologieën. Je kunt het sollicitatie-domein en technisch domein modelleren in een ontologie, en de gebruikers (zowel vanuit het bedrijf als de kandidaat) hun data vast laten leggen middels een ontologie.
Maar dit is niet triviaal of intuïtief. Ik hoor al 10+ jaren dat we medische data gecodificeerd/gestructureerd op gaan slaan, maar vooralsnog is er nog genoeg weerstand/obstakels om te overwinnen op usability-vlak.
Op jouw platform zijn veel van de datapunten al gestructureerd (e.g. salaris ranges, lijsten van technologieën), maar het is nog niet goed genoeg om een match te doen op basis van alleen maar de data van bedrijf en kandidaat. Je hebt nog steeds dat gesprek nodig met de persoon die ECHT weet wat er nodig is (dus niet HR

)
Tot zoverre het data-perspectief
Daarbij zit je ook met het probleem dat er in zowel een vacature als een cv een perceptie neergezet wordt. Dus je kunt je ook afvragen wat de betrouwbaarheid van de data is.
Je impliciete vraag is "hoe kan ik mijn platform verbeteren". De betere match maken vanuit data-perspectief is lastig en mogelijk onwerkbaar. Dat probleem probeert men al heeeeeel lang op te lossen in het medisch domein. Misschien dat LLM's/AI soelaas gaat bieden.
Dan blijft (voornamelijk) over om drempels te verlagen en features toegankelijker te maken, en ik denk dat je op dat vlak al heel veel hebt.