Correlatie opnieuw bekeken

14 februari 2020 door Fouke Boss

Correlatie, het bij elkaar passen van informatie uit bronnen bij de personen in je onderzoek, is waarschijnlijk dat ene concept dat Centurial anders maakt dan alle andere genealogiepakketten. In deze blog bekijken we dit concept opnieuw, en introduceren we het Correlatiepaneel.

Wat is correlatie ook weer?

Als genealogen verkrijgen wij onze informatie uit bronnen. Wanneer we een bron vinden, passen we de informatie in die bron bij de personen in onze database, en dan nemen we de claims uit die bron over naar de bijbehorende persoon. Dit proces van het bij elkaar passen van informatie in een bron bij de bestaande personen in een database wordt correlatie genoemd.

Dit proces is onafhankelijk van de software die we gebruiken om ons onderzoek in vast te leggen, correlatie is dus zeker niet uniek voor Centurial. Wat wel uniek is, is dat in Centurial deze stap zo expliciet wordt gemaakt. In de meeste software pakketten is het zo dat je, wanneer je een bron vindt, je de informatie gelijk matcht met de personen in je onderzoek en dan de beweringen overneemt. In Centurial is dit stappenplan herschikt, waarbij de focus initieël op de bron ligt:

  1. Je vindt een bron.
  2. Je neemt de informatie en beweringen van die bron over in Centurial.
  3. Pas dan correleer je de informatie aan de bestaande personen in je onderzoeksproject.

Op deze manier ben je initieël veel meer gefocust op de informatie en de beweringen in de bron, onbevooroordeeld door de conclusies die je eerder al hebt getrokken in je onderzoeksproject. Een voorbeeld uit mijn eigen onderzoek is de achternaam van mijn overgrootvader: Quaedackers. Wanneer ik een bron vind die aangeeft dat een meneer Quadackers aangifte heeft gedaan van de geboorte van een dochter, en ik direct herken dat dit mijn overgrootvader moet zijn (correlatie), zou ik kunnen missen dat zijn achternaam net anders gespeld is in deze nieuwe bron. Als ik echter eerst alle informatie uit de bron overneem, en pas dan probeer deze te correleren aan mijn bestaande onderzoek, dan zal ik (en ook Centurial) dit verschil in spelling direct opmerken.

Correlatie is wat informatie tot bewijs maakt

In een eerder blog, Op bewijs gebaseerde genealogie - Wat is bewijs?, hebben we beargumenteerd dat informatie in een bron pas bewijs wordt, wanneer we vaststellen dat de informatie daadwerkelijk betrekking heeft op ons onderzoek. Wanneer een bron een meneer Quadackers noemt, is dat nog geen bewijs. Pas als we (op basis van de voorhanden zijnde informatie) vaststellen dat de informatie betrekking moet hebben op de meneer Quaedackers uit ons onderzoek, pas dan wordt deze informatie bewijs voor het feit dat zijn naam op meerdere manieren werd gespeld.

Bron 1
Quaedackers
Bron 2
Quadackers
Conclusie Quaedackers
Quadackers

Dit werkt ook omgekeerd. Stel dat we, nadat we aanvullende bronnen hebben gevonden, tot de conclusie komen dat meneer Quadackers een heel ander persoon moet zijn dan meneer Quaedackers. Dan is de informatie over meneer Quadackers niet langer bewijs voor meneer Quaedackers, maar wordt het bewijs voor een nieuwe persoon in ons onderzoek.

Bron 1
Quaedackers
Bron 2
Quadackers
Conclusie Quaedackers Quadackers

Correlatie is niet heel anders dan samenvoegen

De meeste genealogiepakketten bieden de gebruiker de mogelijkheid een GEDCOM bestand te importeren en samen te voegen in een bestaand onderzoeksproject. Dit is meestal een wat spannend proces, aangezien deze pakketten vaak niet de mogelijkheid bieden de samenvoeging ongedaan te maken. Wanneer de GEDCOM eenmaal is samengevoegd met het onderzoeksproject, is er geen eenvoudige weg terug.

Zo bekeken zou je kunnen zeggen dat in Centurial iedere bron wordt samengevoegd met het bestaande onderzoeksproject. Gelukkig is het ontkoppelen in Centurial eenvoudig, en dat maakt het proces een heel stuk minder enerverend.

Automatische correlatie

Zou Centurial het correlatieproces geheel aan de gebruiker overlaten, dan zou correlatie een eentonige opgave worden. Daarom is Centurial uitgerust met een automatisch correlatie-algoritme. Dit algoritme probeert de informatie in een nieuwe bron te passen op het bestaande bewijs in het onderzoeksproject.

Nadat je alle informatie uit de bron hebt overgenomen in Centurial, start je het automatische correlatie-algoritme met een klik op de knop Automatische correlatie:

Het algoritme legt de verschillen tussen een mens en een computer mooi bloot. Zo zal een mens de overeenkomst tussen Quaedackers en Quadackers eenvoudig zien, terwijl een computer een redelijk complex algoritme nodig heeft voor dezelfde conclusie. Aan de andere kant kan een computer op een veel objectievere manier rekening houden met veel meer informatie, en zo verschillen detecteren die een mens nooit had gezien, of juist relaties ontdekken waarvan je je nooit had gerealiseerd dat ze er waren.

Controle van de resultaten van het automatische correlatie-algoritme

Hoewel het automatische correlatie-algoritme steeds verder wordt verbeterd en verfijnd, is het zeker niet onfeilbaar. Zo nu en dan suggereert het een correlatie die je zelf nooit zo zou hebben gemaakt. Soms is de informatie uit de verschillende bronnen simpelweg te verschillend om door het algoritme te worden gekoppeld, of weegt het algoritme de overeenkomsten en verschillen op een onverwachte manier.

In Centurial heeft de gebruiker altijd het laatste woord over correlaties, het automatische correlatie-algoritme is niets meer dan een hulpmiddel dat je in de meeste gevallen een hoop tijd bespaard. Maar het is dus aan te raden om altijd de resultaten van het algoritme te controleren.

Het nieuwe Correlatiepaneel

Centurial v1.14 introduceert het nieuwe Correlatiepaneel. Dit paneel vereenvoudigt de controle van de resultaten van het automatische correlatie-algoritme. Nadat de automatische correlatie is afgerond, wordt het nieuwe paneel rechts naast het Netwerkdiagram getoond.

Het paneel toont bovenin de bronvermelding (1) van de bron die zojuist gecorreleerd is. Daaronder worden de personen (2, 3) getoond waaraan de informatie in de bron werd gecorreleerd. De persoon die centraal in het Netwerkdiagram staat, wordt met een groene achtergrond gemarkeerd (3). Om een andere persoon in de lijst centraal te plaatsen, gebruik je de knop (4).

Voor iedere persoon toont het paneel vervolgens regels voor iedere bron die informatie bevat over deze persoon. Iedere regel staat voor de informatie uit een enkele bron. De informatie die uit de huidige bron (1) komt, wordt benadrukt weergegeven. Iedere regel toont de naam, het geslacht (gerepresenteerd door de kleur van de rechthoek), de geboorte- en overlijdensdatum en de partner zoals beweerd in die bron. Door de muisaanwijzer over de datums te plaatsen, wordt in een tooltip de bronvermelding van de betreffende bron getoond. Een klik op de regel met de rechtermuistoets opent het snelmenu, met daarin de optie 'Bekijk informatie'; deze opent de bijbehorende Bronweergave.

Je kunt het Correlatiepaneel op ieder moment sluiten met behulp van knop (6). Maar als je de resultaten van het automatische correlatie-algoritme wilt controleren, gebruik dan knop (7). Deze knop is alleen zichtbaar voor de persoon die centraal in het Netwerkdiagram staat. Gebruik het Netwerkdiagram om te bepalen of je tevreden bent met de correlatie. Indien je tevreden bent, klik dan knop (7). Centurial verwijdert dan de gecontroleerde persoon van de lijst, en plaats de volgende persoon in de lijst centraal in het Netwerkdiagram. Op deze manier kun je eenvoudig de personen één voor één afvinken. Wanneer je de laatste persoon afvinkt, wordt het paneel gesloten:

Merk op dat het afvinken van de correlaties niets wijzigt aan de correlatie zelf. Aangezien correlatie eenvoudig kunnen worden opgeheven, voegt het automatische correlatie-algoritme de informatie van de verschillende bronnen meteen samen. De onderzoeker hoeft niet per se iedere correlatie goed te keuren, het controleren van de correlaties via het Correlatiepaneel is optioneel.

Handmatig een correlatie verbeteren

Wanneer je vindt dat de informatie niet aan de juiste persoon is gecorreleerd, kun je te allen tijde de correlatie handmatig verbeteren. Dit doe je door de muisaanwijzer op de informatieregel te plaatsen die je wilt corrigeren. Door op de linker muistoets te drukken en deze ingedrukt te houden, kun je de onjuist gecorreleerde informatierechthoek vrij over het scherm bewegen. Plaats de rechthoek op de persoon waarvan jij denkt dat het de juiste is door de muistoets los te laten terwijl de muisaanwijzer op die juiste persoon staat. Je kunt ook een volledig nieuwe persoon aanmaken door de informatierechthoek in de lege ruimte tussen de personen los te laten. Gebruik de Escape toets op je toetsenbord om een handmatige correlatie af te breken.

Na de handmatige correlatie zal Centurial het Netwerkdiagram en de betreffende conclusies bijwerken om zo de nieuwe ontstane situatie weer te geven.

Achteraf correlaties analyseren

Het nieuwe Correlatiepaneel vervangt de oude Correlatiedialoog, waarmee de onderzoeker op ieder moment tijdens het onderzoek de correlatie van een of meerdere personen kon analyseren, zelfs lang nadat een bron is gecorreleerd. Het nieuwe Correlatiepaneel ondersteunt dit scenario nog steeds en heeft enkele aanvullende eigenschappen om de bruikbaarheid verder te vergroten.

Er zijn meerdere manieren om te starten met de analyse van de correlatie van een enkele of meerdere personen. In de Persoonslijst, het Netwerkdigram en in de Persoonsweergave vind je de Bekijk correlatie menu optie. Ieder van deze opties opent het Correlatiepaneel, deze keer zonder dat de broninformatie bovenin het paneel wordt weergegeven.

Nieuw in v1.14 is de mogelijkheid om personen toe te voegen aan een reeds geopend Correlatiepaneel. Kies Bekijk correlatie vanuit de Persoonslijst of het Netwerkdigram, en de betreffende persoon of personen zullen worden toegevoegd aan het geopende Correlatiepaneel.

Gebruik de knop om personen van het Correlatiepaneel te verwijderen. Om alle personen van het paneel te verwijderen kun je simpelweg het gehele paneel sluiten via de sluitknop (6) in de rechterbovenhoek.

Handmatige correlaties werken uiteraard hetzelfde in dit scenario. Merk ook op hoe je eenvoudig door de lijst in het Correlatiepaneel kunt scrollen terwijl je informatie versleept, namelijk door de muisaanwijzer boven- of onderaan de lijst van het Correlatiepaneel te plaatsen terwijl je een informatierechthoek versleept.

Samenvatting

Correlatie is een belangrijk onderdeel van genealogie, en Centurial biedt vele manieren om de onderzoeker hierbij te helpen, zowel tijdens de initiële correlatie als bij latere verbeteringen en analyses.