Scandia introducerar: Automatiserad texttolkning och bearbetning med stora språkmodeller. Källor från Nya Sverige
DOI:
https://doi.org/10.47868/scandia.v92i1.29340Nyckelord:
Handskriven, handskriven textigenkänning, Språkmodell, kolonialism, Nya Sverige, Imperium, ChatGPTAbstract
Denna artikel beskriver en pilotstudie där handlingar från Riksarkivet rörande kolonin Nya Sverige (1638–1655) transkriberades, översattes och sammanfattades med hjälp av handskriftsigenkänning (HTR) via Transkribus och den stora språkmodellen (LLM) ChatGPT. Projektet genomfördes inom ramen för ”Empire”, ett forskningsprojekt vid Trinity College Dublin som undersöker Irlands roll i uppbyggnaden av det engelska imperiet under 1600- och 1700-talen. Syftet var att testa hur effektivt dessa verktyg kunde användas för att bearbeta detta omfattande material (över 130 foliosidor) med dokument på svenska, tyska, nederländska och latin. Artikeln förklarar valet av HTR-modeller, särskilt hur en kombination av Transkribus och transformer-baserade modeller såsom ”Text Titan I” och ”Swedish Lion I” användes för att optimera hastigheten och uppnå en acceptabel noggrannhet. En viktig aspekt var att utvärdera LLM:s förmåga att sammanfatta och översätta fragmentariska och delvis oläsliga texter, samt att väga noggrannhet mot effektivitet. Artikeln presenterar också ett exempel från en rättegång 1643 mellan guvernör Johan Printz och den engelske köpmannen George Lamberton, vilket visar metodens potential för tolkning av komplexa källor. Slutligen diskuterar författaren teknikens framtida potential och möjliga vägar för vidare utveckling, och betonar att även om tekniken kräver mänsklig övervakning är den ett kraftfullt arbetsbesparande verktyg som kan förändra hur historiskt material görs tillgängligt och analyseras.
Översatt från engelska med hjälp av DeepL Translate.
Downloads
Publicerad
Nummer
Sektion
Licens

Detta verk är licensierat under en Creative Commons Erkännande-IckeKommersiell 4.0 Internationell-licens.