Person-data er en af de mest komplekse datatyper at håndtere i moderne informationssystemer. Hvordan sikrer man, at "Henrik Hansen" i én database er den samme som "H. Hansen" i en anden? Svaret ligger i vidensgrafer og entity resolution.
Vidensgrafer og person-entiteter
En vidensgraf (knowledge graph) repræsenterer information som et netværk af noder (entiteter) og kanter (relationer). Person-entiteter er fundamentale noder i disse grafer:
# RDF Triple eksempel
<https://example.org/person/123> rdf:type schema:Person .
<https://example.org/person/123> schema:name "Henrik Hansen" .
<https://example.org/person/123> owl:sameAs <http://www.wikidata.org/entity/Q12345> .
<https://example.org/person/123> schema:worksFor <https://example.org/org/456> .
Nøglekoncepter i person-datamodellering
Unique Identifiers
For at disambiguere personer bruges persistente identifikatorer:
- Wikidata QID - Q-numre fra Wikidata (f.eks. Q76 for Barack Obama)
- ORCID - For forskere og akademikere
- ISNI - International Standard Name Identifier
- VIAF - Virtual International Authority File
Entity Resolution
Entity resolution er processen med at identificere, hvornår to dataposter refererer til samme virkelige person:
// Entity Resolution Pipeline
1. Blocking → Gruppér kandidater baseret på navn-lighed
2. Comparison → Sammenlign attributter (fødselsdato, profession)
3. Classification → Bestem om det er samme person (ML model)
4. Clustering → Gruppér alle poster der matcher
Schema.org Person ontologi
Schema.org definerer en standardiseret ontologi for person-data:
| Property | Type | Beskrivelse |
|---|---|---|
| name | Text | Fulde navn |
| identifier | PropertyValue | Unikke ID'er |
| sameAs | URL | Links til samme entitet |
| knows | Person | Relationer til andre personer |
| memberOf | Organization | Organisationstilknytning |
Linked Data principper
For at person-data kan integreres på tværs af systemer, bør man følge Linked Data principper:
- Brug URI'er som navne for ting
- Brug HTTP URI'er så folk kan slå dem op
- Returner nyttig information via RDF
- Inkluder links til andre URI'er
Profilindeks.dk - Struktureret person-data
At etablere sig som en veldefineret entitet i vidensgrafer kræver tilstedeværelse i de rigtige datakilder. Profilindeks.dk tilbyder:
- Verificerede person-profiler med komplet struktureret data
- Integration med internationale autoritetsdatabaser
- sameAs-relationer til vidensgrafer
- Schema.org compliant JSON-LD output
Besøg profilindeks.dk for at etablere din person-entitet i det globale data-økosystem.
Data Quality og Person Master Data
For organisationer der arbejder med person-data er det afgørende at have en "golden record" - én autoritativ kilde til person-information. Profilplatforme som Profilindeks kan fungere som en ekstern validering af person-entiteter.