Om läget av i AI släktforkningen

Efter årsmötet 2026 berättade Ulf Berggren om läget med Ai (Artificiell Intelligens) är inom släktforskningsområdet.

Ulf var här för några år sedan och berättade då om Riksarkivets satsning på att ta fram verktyg för att tolka äldre handskrivna texter.

Nu några år senare så fick vi en sammanställning över hur långt man har kommit med AI inom slätforskningen. 

Ett AI-programmen måste träna på att tolka handskrivna texter. För det används en teknik som kallas Deep learning.

AI “tränas” genom att matas med stora mängder data där det rätta svaret (t.ex. vilket tecken, vilket ord, sammanhang mm) är känt. Under träningen justeras AI tolkningen för att minimera skillnaden mellan tolkningen och det rätta svaret. Det gör att AI blir bättre ju mer text den tränar på. I dagsläget har AI modellerna tränat på några miljoner sidor löpande text. Se exempel nedan. Observera att tolkning sker av det som står i dokumenten. Ingen översättning eller tolkning till ”modernt” språk görs.

Tabellstrukturer har AI ännu svårt för. Tex bouppteckningar mm. Att försöka göra en tolkning av en hel sida i kyrkbok som har kolumnindelning blir också svårt.

Felprocenten är numera mindre än 5% och förväntas kunna minskas ytterligare med tiden. Att komma till 100% är väldigt svårt.

Man skall vara medveten om att ibland kan AI ”hallucinera” och komma med konstiga tolkningsförslag. Man skall alltid göra en rimlighetskontroll mot källan. Den rekommendationen gäller för alla avskrifter/tolkningar av uppgifter inom släktforskningen oavsett vem som står för tolkningen även utanför AI-tolkning.

Riksarkivet m. fl. Jobbar för att AI tolka så mycket de kan, men för att komma vidare med upplärningen av AI programmen beror mycket på hur stora resurser som ställ till arkivens förfogande. Det finns en viss volontär verksamhet men för att få riktig fart på det hela behövs nog att mer resurser tilldelas till de offentliga arkiven.

Arkiv digital har inför ett menyval ”Maskinell texttolkning”. Arkiv Digitals tjänst bygger på Riksarkivets öppna AI-modeller ”HTRflow” och ”Swedish Lion Libre” som gör det möjligt att tolka stora mängder historiskt material med hög precision.

Arkiv Digitals maskinella texttolkning kan göras på data från Domsagor, Hovrätter, Häradsrätter, Högsta Domstolen, Kämnärsrätter, Landskanslier och Rådhusrätter. Det är ca 9 700 volymer med mer än 5,9 miljoner bilder. Som kan användas med texttolkningsverktyget

Stockholms stadsarkiv har tolkat ca 50000 handskrifter från 1700-talet. En grupp frivilliga så kallade medborgarforskare hjälper Stadsarkivet att renskriva och korrekturläsa de tolkade texterna som därefter publiceras.

Observera att tolkningen sker tecken för tecken. Ingen “översättning” till modernare språkbruk eller stavningskontroll motsv. sker. Står det fel i texten så finns felet kvar i resultatet av tolkningen.

Exempel en text på Riksarkivet från 1670. Texten är från komissionen i Bohus län ang Trolldomsväsendet

Tolkning:

Exhib: 5. Octobr. A:o 1670. Anno 1669 dhen 27 Augusti höltz Extraordin: tingh i gården Hållin: medh Almogen af Stangenäs hwadh: t Under sitiendhe Hwedi¬ Nyddh från Stengeäß och Botnäß, som in protocollo finnes: 

Då Wälteß för Rätten Elin Andersdotter Ifära i Storman Elin Andhers¬ Hustru, anklagades för Troldom, och berettades af Befal:ne dotter för S: A: Gabriel Pederßon A. hon derföre icke allenest war truldomb. kommen uthi oppenbart rychte, uthan och serdeles be¬ skylter och tillagde af Pedher Hindriksson i Lyseszl; det hafua bewyst på honom, Huilket medh befal:en flere folk, Lyse lykst hördt hadhe: Pedher Hendri Kßon framkom gaf tilkenna, af han inno 1663 beskagh och arresteradhe een Facht för öfuer i Stazengh Elinß Mandh, ett wton han medh Fächtenswaret uthanöckes efter Kalk at sigh ey an¬ gifuet wedh Tuhlammaren: Någre tidh dhe efter reste, han till Stazengh, då war öfwer icke hemman uthan Elin hans hustru, han frågade Elin om det Skrin Ifua hadhe medh sigh heem på Fechten, bedh Elin läsnhet up, hwil¬ ket omsidhro skedde, och sadhe då Elin, då skall wäl få Skam derföre, När han Kom et litet Stöcke frå gården, kom een Windkula, och kastadhe honom medh hustru öfuer ända, afsidas i een bäck: doch skedde honom ingen skadhe: Ordhan

Om man är intresserad av att veta mer om AI och dess roll i släktforskningen finns nedan några länkar mm till information och möjlighet att testa.

HTRflow Riksarkivet 15 bilder/dag

Transkribus 50 bilder / månad

https://www.transkribus.org

https://huggingface.co/spaces/Riksarkivet/htr_demo.

https://sok.riksarkivet.se/nad