Nu kan du snart göra sökningar i sammanlagt 36 olika bibelöversättningar på en och samma gång. Fredagen 28 maj offentliggörs en digital textsamling där bland annat forskare från Göteborgs universitet har samlat och digitaliserat bibeltexter från 1300-talet till idag. Samlingen är unik i sitt slag och kan användas för att göra automatiserade jämförelser mellan olika tidsepoker och språk.
– Idén att koppla ihop bibeltexter är inte ny – det har gjorts tidigare – men de flesta samlingar är inte offentligt tillgängliga. Vi hoppas på att det arbeta vi lagt på upphovsrättsfrågor ska göra att fler kan använda den här resursen, säger Evie Coussé som leder arbetet.
Bibeltext bra för att studera språkförändringar över tid
Bibeltexterna har samlats in inom ramen för forskningsprojektet Uppkomsten av komplexa verbkonstruktioner i germanska språk och täcker sammanlagt fyra olika språk: engelska, nederländska, svenska och tyska. Gerlof Bouma på Språkbanken Text vid Göteborgs universitet har varit med och byggt den digitala textsamlingen.
– Om man letar efter ett och samma textmaterial som har översatts i olika språk och som ska sträcka sig långt tillbaka i tiden så finns det egentligen bara en texttyp som är lämplig och det är bibelöversättningar. Vi har valt att bygga en samling där vi börjar så långt bak som praktiskt möjligt, alltså 1300-talet, säger Gerlof.
Gerlof har bearbetat materialet för att det ska få ett enhetligt sökbart format och sedan länkat ihop biblarna på versnivå – något som gör samlingen till en så kallad parallellkorpus. På det sättet kan man exempelvis söka i en engelsk bibel från 1300-talet och samtidigt se alla övriga korresponderade verser i senare versioner eller på ett annat språk.
Precis som vi själva så älskar folk att nörda ner sig i ett par sidor av äldre tyska eller nederländska och samtidigt få bidra till forskningen
Medborgarforskning har bidragit till korpusen
Många biblar fanns redan i digitaliserad form men de kom ofta i helt olika format – dessa behövde alltså konverteras till ett enhetligt sökbart format. Andra biblar behövde digitaliseras från grunden. Ett nederländskt nätverk av volontärer som digitaliserar äldre texter har hjälpt till.
– Volontärerna har utifrån inskannat material transkriberat texter – det är en typ av medborgarforskning. Precis som vi själva så älskar folk att nörda ner sig i ett par sidor av äldre tyska eller nederländska och samtidigt få bidra till forskningen, skrattar Gerlof.
Arbetet medvolontärerna började för mer än tio år sedan. Nicoline van der Sijs, som är en av projektmedarbetarna, ville digitalisera Statenvertaling, en ikonisk nederländsk bibelöversättning från 1600-talet. Hon gick ut i nederländsk media och bad om hjälp och fick massiv respons. Sedan dess har de digitaliserat den ena bibeln efter den andra.
– Ja, Nicoline hade tillgång till en stor samlingvolontärer som vi har jobbat med. Det var ett tjugotal personer inblandade i textarbetet, säger Evie.
En korpus med många användningsområden
Det främsta syftet med att digitalisera och sammanställa det historiska materialet har varit att studera hur hjälpverb i germanska språk har utvecklat sig över tid och hur de börjar kombineras allteftersom. Det finns däremot många fler användningsområden än så.
– Man skulle kunna studera språkliga förändringar inom ett språk eller språklig variation mellan olika språk. Man skulle till exempel kunna göra jämförelser mellan Vasabibeln och andra stora bibelöversättningar från reformationen, så som engelska King James bibel eller nederländska Statenvertaling, säger Evie och fortsätter:
– Sedan är korpusen absolut intressant för alla som intresserar sig för bibeltext som bärare av språk, av tankar eller som religiös text.
Offentliggörs med webinar
Korpusen EDGeS Diachronic Bible Corpus offentliggörs under ett webinar fredagen den 28 maj. Under releasen kommer man berätta mer om hur man kommit fram till att just den här typen av textsamling är extra användbar.
– Vi kommer att berätta hur vi byggt den, vad man kan göra med den och hur man hittar den. Sedan har vi bjudit in forskare som kommer att prata om hur de har använt korpusen, säger Gerlof som avslöjar att det redan har gjorts några preliminära sökningar.
Korpusen kommer att finnas tillgänglig genom sökverktyget OPUS som är särskilt anpassat för att göra sökningar i parallella textsamlingar.
Text: Sven Lindström
FAKTA
Parallellkorpusen EDGeS Diachronic Bible Corpus har tagits fram inom ramen för projektet Uppkomsten av komplexa verbkonstruktioner i germanska språk. Bakom projektet och arbetet med korpusen står:
Evie Coussé, forskare på institutionen för språk och litteraturer vid Göteborgs universitet
Gerlof Bouma, forskare på Språkbanken Text, institutionen för svenska språket vid Göteborgs universitet.
Nicoline van der Sijs, professor på Centre for Language Studies vid Radbound university, Nederländerna.