Nytt KB-labb för datadriven forskning

Kungliga biblioteket.Kungliga biblioteket drar igång ett nytt datalabb för datadriven forskning i humaniora och samhällsvetenskap. Här kan forskarna skanna ett stort antal källor.

20 februari 2019 av Stina Loman
Foto: Getty.

I vår startar ett nytt projekt på Kungliga biblioteket som ska göra det möjligt för forskare att göra storskaliga dataanalyser. Datalabbet riktar sig till forskare inom humaniora och samhällsvetenskap. I stället för att de själva ska söka igenom databaser gör nu algoritmer jobbet, något som går fort och antalet källor blir mycket större än tidigare.

– Som forskare kunde du tidigare ha 50-100 källor till en artikel. Med datadriven forskning kan du använda en miljon källor, säger Pelle Snickars.

Han är professor i medie- och kommunikationsvetenskap vid Umeå universitet och har skrivit en förstudie åt KB där han undersökt förutsättningar för en ny labbverksamhet. Här pekar Pelle Snickars ut flera fördelar med den datadrivna forskningen, bland annat att forskningsresultaten blir mer kvantifierade.

Börjar som ett tvåårigt projekt

KB-labb för datadriven forskning i humaniora och samhällsvetenskap startar under våren 2019. Successivt byggs en miljö där forskare får tillgång till kurerade dataset med ursprung i KB:s digitaliserade samlingar. Fler databaser ska tillkomma, bland annat ett digitalt arkiv med alla svenska romaner från åren 1945–1989.

I datadriven forskning söker algoritmer igenom stora sammanlänkade datamänger i så kallade dataset. Det gör att forskare kan använda mycket fler källor i sin forskning.

KB-labb ska till en början drivas som ett tvåårigt projekt.

– Forskaren kan tydligare visa hur den kommit fram till sitt resultat. Det kan annars vara svårt att motbevisa resultat inom humanistisk och samhällsvetenskaplig forskning eftersom resultaten kan vara väldigt subjektiva.

Algoritmerna i programmen skannar igenom textmassor och kan hitta exempelvis namn och orter men även tematiska strukturer och mönster som är omöjliga att se för en människa.

Det här gör att forskarna kan ställa en helt ny typ av frågor. I ett forskningsprojekt som Pelle Snickars ska dra i gång kommer han bland annat att granska Statens offentliga utredningar under perioden 1945–1989. Här kan han ställa frågor som ”vilken röst har staten talat med när det gäller filmpolitik, infrastruktur och organisering av vården under perioden?”

Pelle Snickars påpekar att datadriven forskning inte ersätter den traditionella humanistiska forskningen.

–Algoritmerna kan inte tala om hur poeten Tomas Tranströmer använde metaforer i sina texter, säger han.

Den nya verksamheten riktar sig till forskare och till en början kan dataanalyserna bara göras på plats, berättar Miriam Nauri, avdelningschef på Kungliga biblioteket.

– Vi jobbar för att så småningom möjliggöra fjärraccess från de forskande institutionerna. Det kräver dock att de upphovsrättsliga frågorna blir lösta, något vi tittar på nu, säger hon.

Flera andra nationalbibliotek i Europa har redan datalabb av den här typen. Att KB drar i gång nu beror på att det finns en politisk vilja att främja datadriven forskning. I regeringens forskningsproposition från 2016 nämndes bland annat detta.

– Som ett resultat av propositionen gjorde Vetenskapsrådet en stor utlysning kring digitalisering och tillgängliggörandet av kulturarvet. Cirka hälften av de projekt som fick bidrag utgår från KB:s samlingar. Det visar att det finns ett stort intresse i forskarsamhället för de datamängder vi kan erbjuda, säger Miriam Nauri.

Läs mer: 

22 000 svenska romaner digitaliseras