onsdag 21. desember 2022

Autolenking av Raumabasen - del 2

Etter å ha oppretta bustader i basen slik forklart i dette innlegget, er tida etter kvart inne til å sette i gang med sjølve lenkinga (altså søke fram personhendingar i databasen og lenke dei saman til ein person slik det er forklart her).

Prosessen vi kallar autolenking tek utgangspunkt i dei svært sterke søkefunksjonane i BSS. Autolenkinga er eigentleg ei oppskrift (maskinell simulering) av arbeidet med å søke fram hendingar som gjeld ein og same person eller eit par, og kople saman desse til «ferdige» personar (lenking) med kjente namn, fødsels/dødsdato, forhold til andre personar (barn, familie), opphav (foreldre), bustader osv.

Det er – som tidlegare nemnt fleire gonger – mest rekningssvarande å ta utgangspunkt i to personar som er relaterte til kvarande (vanlegvis gifte). Da vil variablane to for- og etter-/farsnamn kombinerte med kvarandre utgjere eit nokså lite utval, i alle fall viss dei to ikkje er Ole Olsson og Kari Olsdotter (sjølv da er det neppe snakk om mange slike kombinasjonar, når vi veit om lag når dei levde). Ein vil som oftast – om ikkje anna så frå ei folketeljing – altså kjenne namna og ca alder på dei to hovudpersonane.

Som elles er det mange måtar å arbeide mot ein BSS-database på, men for desse 'automatiske' prosessane er det altså ein stor fordel å ta utgangspunkt i to personar som har ein relasjon seg i mellom (altså par). Autolenkinga omfattar så at paret blir kopla til aktuelle bustader nemnt i kjeldene, først og fremst folketeljingane, men det blir også oppretta andre bustader basert på namnebruk i kyrkjebøkene og andre kjelder.

Prosessen må følgjast opp av ein manuell kontrollrunde på kvar person, der vi sjekkar namn, datoar, familie, bustader osv., gjer kontrollsøk, legg til hendingar som autolenkinga ikkje godtok, eventuelt fjernar hendingar som feilaktig vart lagt til, rette opp bustader, redigere tidsperiode o.a.

BSS har alltid hatt ein funksjon for å tildele oppretta personar ein status, gjerne NY ved første manuelle lenking. Så kan brukaren lage seg eit system for å tildele status på personar, t.d. SJEKK, UTVANDRA osv. Fordelen med funksjonen er at brukaren kan søkje fram personar på status og rette opp, supplere, lage analysar osv. seinare i prosessen.

Etter den automatiske behandlinga blir kvar person tildelt ein status i personvinduet i BSS: AUTOLENKA.


Når så kontrollrunden er gjennomført, kan brukaren endre status til t.d. LENKA, SJEKK e.l. (i historiefeltet kjem det nokre gonger ein slik advarsel som her, til hjelp for brukaren).

Vi har nå testa med utgangpunkt i ektepar i folketeljingane frå 1920 og 1910 for Kors sokn i Rauma, og går vidare med dei neste teljingane. Alle personane (nokre hundre) er altså førebels automatisk lenka med tillegg av ei kontrollrutine, og vi har eit førebels manuelt tidsbruk per lenka person.

Merk at BSS fangar opp hendingar frå andre kjelder i databasen enn folketeljingane, for dei personane som blir lenka automatisk slik. Det er sjølvsagt i denne perioden hendingar frå kyrkjebøkene. Seinare blir nok særleg dødsbuskifta lagt til.

Døme: Anne Eiriksd. født 1853, d. 1935, gift 1881 med Mathias Monge:


Her har vi altså fanga opp dei sentrale hendingane i livet til Anne, frå dåpen i 1853, i folketeljingane 1865 og 1875, giftarmålet i 1881, hendingane som markerer ungane i 1882, 1884, 1887, 1890, 1894 og 1898 (dåp og konfirmasjon). folketeljingane 1891, 1900, 1910 og 1920 og gravlegginga i 1935. Alle desse er innafor dei kjeldene vi har i databasen. 1935 er siste året vi har gravlagde i Kors frå, så lista hennar er komplett. Mannen, Mathias, levde nokre år lenger, og må ev. fangast opp ved delprosjektet med familieskjema som er under arbeid. Den informasjonen må leggast til manuelt.

Når dei nominative teljingane bakover til 1865 er autolenka slik, må vi vurdere resultatet og korleis vi skal gå vidare bakover i tid. Fordelen med dei nyare nominative teljingane er at ein finn att same personar i fleire av teljingane, noko som gir sikrare grunnlag for autolenking. Mellom 1865 og 1801 er tidsspranget såpass langt at det neppe er mange personar vi finn i begge teljingane, så da må vi prøve andre metodar. Det gjeld sjølvsagt òg når vi kjem ned på 1700-talet.

torsdag 8. desember 2022

Om automatisk lenking av Raumabasen - del 1

Dataprogrammet Busetnadssoge (BSS) har ei tid hatt ein innebygd funksjon for å lenke personhendingar automatisk. Det høyrest ut som ein draum, og det er det nok til ein viss grad óg. Men BSS har frå det ble lansert i 2004 hatt sterke søkefunksjonar, og det er desse som er organiserte i repeterande søk etter personhendingar for å sette saman personar slik det er gjort greie for i dette innlegget (23. oktober), med framhald i dette (24. oktober).

Autolenk-funksjonen

har altså vore ein del av BSS ei tid, og vi har prøvd han ut i litt større omfang på ein liknande database med kjelder frå Lesja. Som vi ser i innlegget frå 3 oktober, var det i Raumabasen 46.168 hendingar og 162.626 hendingsobjekt. I den Lesjabasen vi testa er det 60.185 hendingar og 235.808 hendingsobjekt (inkluderer Dovre), men funksjonen går greitt, så vi trur ikkje Raumabasen er for stor for å køyre automatisk lenking.

For å kunne starte opp med autolenking må databasen ha oppretta bustader. Det kan sjølvsagt gjerast på mange måtar, men for å autolenke Raumabasen har vi i alle fall gjort det ved å generere matrikkel-/namnegardar ut frå matrikkelen 1886. Da tar vi òg med oss både gardsnumra som vi kjenner frå nyare tid, og dei løpenumra eigedomane hadde i den forrige matrikkelen, frå 1838. Løpenumra står i den fjerde kolonnen i 1886-matrikkelen, etter dei nye gards- og bruksnumra.

Da får vi desse gardskapitla for Hen:


Vi får desse for Grytten hovudsokn:


Og desse for Kors sokn;


I det vidare arbeidet skal så automatlenka personar plasserast på desse bustadene, som sjølv må bearbediast fortløpande. Det kjem vi tilbake til.


Utfordring til slektsgranskarar: Anders Olss. f. ca. 1780

Som det går fram denne bloggforklaringa , får alle som blir lenka ein status (lenka, innflytt, neste m.fl.) undervegs i denne fasen. I blog...