Scandia introducerar: Automatiserad texttolkning och bearbetning med stora språkmodeller. Källor från Nya Sverige

Gerard Farrell

doi:10.47868/scandia.v92i1.29340

Författare

Gerard Farrell

DOI:

https://doi.org/10.47868/scandia.v92i1.29340

Nyckelord:

Handskriven, handskriven textigenkänning, Språkmodell, kolonialism, Nya Sverige, Imperium, ChatGPT

Abstract

Denna artikel beskriver en pilotstudie där handlingar från Riksarkivet rörande kolonin Nya Sverige (1638–1655) transkriberades, översattes och sammanfattades med hjälp av handskriftsigenkänning (HTR) via Transkribus och den stora språkmodellen (LLM) ChatGPT. Projektet genomfördes inom ramen för ”Empire”, ett forskningsprojekt vid Trinity College Dublin som undersöker Irlands roll i uppbyggnaden av det engelska imperiet under 1600- och 1700-talen. Syftet var att testa hur effektivt dessa verktyg kunde användas för att bearbeta detta omfattande material (över 130 foliosidor) med dokument på svenska, tyska, nederländska och latin. Artikeln förklarar valet av HTR-modeller, särskilt hur en kombination av Transkribus och transformer-baserade modeller såsom ”Text Titan I” och ”Swedish Lion I” användes för att optimera hastigheten och uppnå en acceptabel noggrannhet. En viktig aspekt var att utvärdera LLM:s förmåga att sammanfatta och översätta fragmentariska och delvis oläsliga texter, samt att väga noggrannhet mot effektivitet. Artikeln presenterar också ett exempel från en rättegång 1643 mellan guvernör Johan Printz och den engelske köpmannen George Lamberton, vilket visar metodens potential för tolkning av komplexa källor. Slutligen diskuterar författaren teknikens framtida potential och möjliga vägar för vidare utveckling, och betonar att även om tekniken kräver mänsklig övervakning är den ett kraftfullt arbetsbesparande verktyg som kan förändra hur historiskt material görs tillgängligt och analyseras.

Översatt från engelska med hjälp av DeepL Translate.

Scandia introducerar: Automatiserad texttolkning och bearbetning med stora språkmodeller. Källor från Nya Sverige

Författare

DOI:

Nyckelord:

Abstract

Downloads

Publicerad

Nummer

Sektion

Licens

Språk

Scandia Blogg

Socialhjälpstaten

Allmänningen – en central periferi genom historien

Sexualpolitikens folkliga dimension