Steen Thomsen's forside  >  Artikel-oversigt  >  Store databaser - her og 'hinsidan'
Post: steen.thomsen snabel-a mail.danbbs.dk

Trykt i Slægt og Data 1996.2.

Steen Thomsen:

Store databaser - her og 'hinsidan'.


Vi opbygger store og tværgående databaser med person- og slægtsoplysninger, og når vi går sammen, kan de blive rigtig store.
 

1. Store slægtsdatabaser herhjemme.

Her er lidt overblik over de større databaser jeg kender her i landet:

På Solrød Lokalarkiv har Kirsten Larsen og John Møller indsamlet beboere i Solrød kommune (og omegn), og de havde 26.000 personer i marts 94 (se Slægt og Data 94-1).

Georg Agerby startede med alle færinger før 1900, og samler nu danskere ind fra bøger, IGI-kort mm. og kobler personer sammen, som går igen i flere kilder. Han nærmer sig de 500.000! Både danske, færinger, svenskere, islændere, tyskere og gammel adel og kongefamilie. Desværre gemmer han ingen kildehenvisninger.

Lars Kr Lundin laver under betegnelsen GEDCOMP en fælles database. Det hele sker automatisk: send en GEDCOM-fil til hans e-post adresse, og modtag en liste over andre indsendere med de samme personer. Hans sammenligning tager højde for stavevarianter af navnene, upræcise datoer mm. Pr feb 98 har han ½ million personer. GEDCOMP-databasen
 

2. Om sammenkobling.

Når man modtager persondatabaser (GEDCOM-filer) fra andre forskere, eller man indtaster fra flere stamtavler, vil man nu og da møde en person der går igen i flere baser/kilder. Det er spændende at finde dem og lægge de to forekomster af personen sammen (dvs koble databaserne/stamtavlerne sammen), men det er et stort arbejde, og ikke ganske enkelt. Jeg kan i hvert fald få øje på flere problemer:
 

2.1 Find gengangere.

Når en ny fil/stamtavle kommer ind ad døren, skal man finde ud af, om nogle af personerne er gengangere, dvs allerede findes i databasen. Det er bestemt ikke nemt at afgøre, for Hans Schütt i Rinkenæs (ca 1750 - 1790 -) kan godt være den samme som Hans Schütt i Rinkenæs (ca 1750 - 1780 -), og umiddelbart vil man mene at navnet er så sjældent, at det må være den samme mand. Men de kan altså også være jævnaldrende fætre der er opkaldt efter samme farfar - jeg havde faktisk 3 af slagsen, som jeg måtte skille ad med møje og besvær. På samme vis har jeg 2 jævnaldrende skippere Johan Jørgen Thrane i København. Dertil kommer problemet med stavevarianterne, hvad med Hans Schytte, Hans Skytte og Hans Schiøtz?
 

2.2 Sammenlægning.

Når så et genganger-par er fundet (med rimelig sikkerhed), skal de vel slås sammen til 1 individ, som er koblet til begge familier. Afhængigt af, hvor meget biografi der er, kræver det en del tastearbejde. Programmet Cumberland Family Tree har en funktion, der kan lave noget af arbejdet automatisk, og det svenske program DISGEN har gode manuelle funktioner hvor man peger på de to man vil koble. Her kan man se hvad man laver.  

Når to individer skal lægges sammen, skal der nok opstå et problem med modstridende oplysninger, og så skal man vel have fat i begge indsendere (eller kilder) for at løse det. Både den forsker der lige har indsendt en fil, og ham/hende der engang indsendte den anden udgave af gengangeren. Det kræver at man har mærket hvert eneste individ med 'afsender' (DISGEN i Mac-versionen kan tilføje 'afsender'-reference under GEDCOM-importen). Og tilsvarende må man checke de kilder, som man tidligere har indtastet stamtavler fra.
 

2.3 Mange gengangere.

Hvis man engang fik en GEDCOM-fil fra Per, og nu får en fra Poul, OG Per og Poul engang udvekslede oplysninger, så får man gengangere i massevis. Måske i hundredevis, og de er i mellemtiden blevet ajourført lidt forskelligt af Per og Poul. Eller endnu værre: Poul sender en ny fil med alle dem han sendte for 3 år siden, plus de 1000 nye han siden da har hægtet på hist og pist. 

Så lugter det af arbejde gør det! Og der bliver mere og mere af den slags, jo mere vi sender GEDCOM-filer til hinanden - og det gør vi jo.
 

2.4 Fejlretning og ajourføring.

Der er også et problem med at rette fejl og ajourføre de lagrede oplysninger. Hverken Per eller Poul ligger vel brak, bare fordi de har sendt en fil ud af huset. Vi finder stadig nye oplysninger om vores registrerede personer, og føjer stadig nye slægtninge til. Og ingen er fuldkommen, så ind imellem finder vi også et par fjel vi tidligere lavede, og retter dem. Hvordan sender man det til en fælles database? Og husker men at få det gjort?

 

3. Folketællinger og Kirkebøger.

Indtastning af alle landets folketællinger og kirkebøger er et gigantisk projekt, som vi må være mange om, hvis vi skal blive færdige før de kan scannes ind med tydning af håndskrift, tolkning af datoer (Dom IV p Trin) og alting.

Her har KOKI gjort et stort og fortjenstfuldt arbejde med at definere et fælles format, og Dansk Data Arkiv med at holde rede på hvem der har indtastet hvad, samt stille data til rådighed på nettet og ekspedere kopier, i hvert fald af filer der overholder det fælles format. Så vidt jeg ved, er filer udenfor standarden ikke i DDAs fokus, og ikke med på deres CD eller i søgemaskinen.
 

4. Kirkebogsregistre.

 Sådan som begrebet 'kilder' er defineret af KOKI, omfatter det også de navneregistre til kirkebøgerne som slægtsforskere gennem mange år har udarbejdet. Både de gamle håndskrevne som kun medtager 'personer af genealogisk interesse' og de yngre komplette hånd- eller maskinskrevne.

 Her i Københavnstrup har vi Lengnick's og Olsen's KB-registre, men for resten af Sjælland og omegn er det yderst sparsomt hvad der er lavet. I Nørrejylland er det vist også ret begrænset hvad der findes, men det er anderledes i Sønderjylland og på Fyn, dér er der registre til langt de fleste sogne.

Oversigt over kirkebøger etc der er indtastet i tekstbehandlingsprogram, maskinskrevet, lavet register til osv er nylig udgivet af SSF.

Nu har vi kirkebøgerne på mikrokort til at købe hjem. Det er jo herligt, men uanset om man sidder hjemme eller på arkivet, så er det Ebberød Bank at lede side op og side ned, hvis der allerede er lavet et register. Og registrene kommer ikke med på mikrokortene. Her må arkivarerne have sovet i timen, siden det ikke kom med i kopi-bevillingen, og vores mange forenings-bestyrelser ligeså.

Det sidste nye (apr 98) er at registrene bliver fotokoipieret, så de er på alle arkiverne. Det hjælper jo svært på situationen, men øger nok trængslen på læsesalene, og den hjemmearbejdende er stadig dårligt stillet.
 

5. DIS i Sverige.

Vores storesøster-forening DIS-Sverige samler en database DISBYT over personer efter en udbygget TinyTafel-model, og kører en sammenligning af dem. En TinyTafel er en fil som slægtsprogrammet (også BK) kan trække ud over alle dine personer. Den rummer bare ikke personerne, men kun slægtsnavne, samt første og sidste årstal for personer med dette navn. Så alle dine Hansen'er resulterer i 1 linie i denne fil, som derfor bliver en ret lille tabel - deraf navnet. Det er en gammel opfindelse, fra dengang disketteplads var et sparsomt gode.

Svenskerne har nu udvidet begrebet, så alle personer bliver opregnet, med de årstal og steder man har på dem, og med både for- og efternavne. Så deres tabeller er ikke helt så 'Tiny'.

Sammenligningen (på Newspeak kaldet TinyTafel match) sker fonetisk, for at fange stavevarianter af samme navn. Her anvendes den amerikanske Soundex-kode, som omsætter Stuart og Stewart til samme kodeværdi. Den egner sig desværre ikke særligt godt til nordiske forhold, og kan for eksempel ikke få Christensen og Kristensen til at mødes.

DIS-Sveriges DISBYT-base er gammel og stor.
 

6. Kalmar i Sverige.

Jeg fik kontakt til PLF (Person- og Lokalhistoriskt Forskarcentrum) i Oskarshamn på den svenske østkyst. De har slået et stort brød op: Kirkebøgerne for alle sogne i Kalmars Län (ca 250, incl nogle udenfor lenet) er under indtastning. De sigter på at registrere både dåb, vielse og begravelse, foruden ind- og ud-flytning samt 'husförhörslängder', dvs årlige sognemandtal.

Og man må sige at de har gjort noget ved sagen: De har fast lokale, og her har et par arbejdsløse været i 'jobtræning' gennem de sidste år, så der var 2,3 millioner poster i databasen i foråret 96! Skriver: to millioner og tre hundrede tusind, og der er blevet flere siden. Basen er tilgængelig på Oskarshamns Bibliotek, og ydermere tager de imod skriftlige forespørgsler - det kan man da kalde service. Adressen er
          PLF,
          Box 23,
          S - 572 21 Oskarshamn.
Formelt er det gratis, men vedlægger du en hund som bidrag til arbejdet, bliver den taget vel imod.
 

7. Og hvad mere?

Databaser er så meget. Poul Steen har udgivet første bind af det store sammenflettede navneregister til alle 117 årgange af Personalhistorisk Tidsskrift. Det er et uvurderligt værktøj, ligesom det titel- emne- og efternavnsregister, han udgav for et par år siden

Og glæde sig kan man også over Arne Julins arbejde med registeret til FT 1801 i København og de skjulte personer i Richters dødsfald.

Der kan laves mange flere store og tværgående databaser til stor glæde for alle slægtsforskere. Hvem laver for eksempel en slægtsdatabase over alle adelsslægterne i Danmarks Adels Aarbog? Den kunne da være herlig at trække på.

Joh, selvom man skulle have fået fod på alle sine aner (så langt det nu går), så er der såmænd nok at gå igang med.
 

Steen Thomsen


Indlagt på WWW: Sep 1999.

Steen Thomsen's forside  >  Artikel-oversigt  >  Store databaser - her og 'hinsidan'  >  Top
Post: steen.thomsen snabel-a mail.danbbs.dk