Datastrukturer

Person Data i Vidensgrafer: Linked Data og Entity Resolution

Af Admin
Knowledge GraphsLinked DataEntity ResolutionRDFOntologierWikidata

Person-data er en af de mest komplekse datatyper at håndtere i moderne informationssystemer. Hvordan sikrer man, at "Henrik Hansen" i én database er den samme som "H. Hansen" i en anden? Svaret ligger i vidensgrafer og entity resolution.

Vidensgrafer og person-entiteter

En vidensgraf (knowledge graph) repræsenterer information som et netværk af noder (entiteter) og kanter (relationer). Person-entiteter er fundamentale noder i disse grafer:

# RDF Triple eksempel
<https://example.org/person/123> rdf:type schema:Person .
<https://example.org/person/123> schema:name "Henrik Hansen" .
<https://example.org/person/123> owl:sameAs <http://www.wikidata.org/entity/Q12345> .
<https://example.org/person/123> schema:worksFor <https://example.org/org/456> .

Nøglekoncepter i person-datamodellering

Unique Identifiers

For at disambiguere personer bruges persistente identifikatorer:

  • Wikidata QID - Q-numre fra Wikidata (f.eks. Q76 for Barack Obama)
  • ORCID - For forskere og akademikere
  • ISNI - International Standard Name Identifier
  • VIAF - Virtual International Authority File

Entity Resolution

Entity resolution er processen med at identificere, hvornår to dataposter refererer til samme virkelige person:

// Entity Resolution Pipeline
1. Blocking     → Gruppér kandidater baseret på navn-lighed
2. Comparison   → Sammenlign attributter (fødselsdato, profession)
3. Classification → Bestem om det er samme person (ML model)
4. Clustering   → Gruppér alle poster der matcher

Schema.org Person ontologi

Schema.org definerer en standardiseret ontologi for person-data:

PropertyTypeBeskrivelse
nameTextFulde navn
identifierPropertyValueUnikke ID'er
sameAsURLLinks til samme entitet
knowsPersonRelationer til andre personer
memberOfOrganizationOrganisationstilknytning

Linked Data principper

For at person-data kan integreres på tværs af systemer, bør man følge Linked Data principper:

  1. Brug URI'er som navne for ting
  2. Brug HTTP URI'er så folk kan slå dem op
  3. Returner nyttig information via RDF
  4. Inkluder links til andre URI'er

Profilindeks.dk - Struktureret person-data

At etablere sig som en veldefineret entitet i vidensgrafer kræver tilstedeværelse i de rigtige datakilder. Profilindeks.dk tilbyder:

  • Verificerede person-profiler med komplet struktureret data
  • Integration med internationale autoritetsdatabaser
  • sameAs-relationer til vidensgrafer
  • Schema.org compliant JSON-LD output

Besøg profilindeks.dk for at etablere din person-entitet i det globale data-økosystem.

Data Quality og Person Master Data

For organisationer der arbejder med person-data er det afgørende at have en "golden record" - én autoritativ kilde til person-information. Profilplatforme som Profilindeks kan fungere som en ekstern validering af person-entiteter.