söndag 29 april 2018

Ett annat sätt att kommunicera forskning?

I slutet av mina doktorandstudier, när jag skulla börja skriva min avhandling, berättade en av mina handledare en anekdot om en doktorand som lade in ett par rutor ur en Kalle Anka-tidning som en figur i andra halvan av sin avhandling. Inte för att den på nåt sätt hade med ämnet att göra, utan för att han var helt säker på att inte ens opponenten (som ändå ska göra en ordentlig granskning) skulle läsa så långt. Om nån upptäckte tilltaget eller inte ingick inte i anekdoten, men den ger ändå en utmärkt illustration av attityden kring akademiska texter inom naturvetenskap. I ditt forskarliv förväntas du producera en inte oansenlig mängd text enligt en bestämd mall, men räkna inte med att någon kommer att läsa mer än sammanfattningen, bildtexterna och möjligen resultat- och metoddelarna. Resten är endast en formsak.

Samtidigt som en stor del av innehållet i akademiska texter alltså egentligen är rätt onödigt är det mycket som inte finns med, eller åtminstone inte kommer till sin rätt. På grund av begränsat utrymme och den tryckta textens (eller den e-publicerade pdf-filens) statiska natur blir figurer och tabeller mindre och otydligare än de kunde ha varit. När du analyserat din data och plottat en figur med t.ex. Matplotlib kan du zooma i den och ta reda på exakta värden i viktiga punkter. Är det en figur som gör sig bättre i 3D kan du oftast rotera den. I den publicerade texten är figuren platt och låst i det perspektiv som artikelförfattaren bestämt.

En kommunikationsform som skulle kunna lösa det sistnämnda problemet och som ofta framställs som ett alternativ till vanliga vetenskapliga artiklar är så kallade "notebooks", dokument där förklarande text och matematiska formler varvas med programkod. Har man tillgång till samma mjukvara som den som skrev dokumentet kan man köra kodstyckena interaktivt, zooma som man vill i figurerna och dubbelkolla analyserna. Formatet har sitt ursprung hos Wolfram Mathematica men har spritt sig till open source-världen i form av Jupyter notebooks. I den senaste artikeln jag läst där notebooks beskrivs som framtiden för vetenskapliga publikationer framhålls hur detta skulle kunna motverka problemet med icke reproducerbara resultat genom att göra de bakomliggande analyserna lättare att granska.

Jag har arbetat i Jupyter notebooks på senare tid som en del i en online-kurs i maskininlärning, och jag kan absolut se poängen med formatet. Det underlättar när man behöver kombinera exempel i text med exempel i kod, så om inte annat är det ett utmärkt undervisningsverktyg. Å andra sidan gör kombinationen med vanlig text och figurer att det inte är rätt format för den mest komplicerade eller omfattande koden, som fortfarande får ligga i egna moduler eller klasser (ja, jag kör Python) utanför själva notebook-dokumentet. Det gör att det inte nödvändigtvis blir transparent och lätt att följa bara för att det är en notebook.

Kanske kan notebooks bidra till att akademiska texter innehåller mindre av det som ingen läser, och mer relevant information. Men antagligen kommer någon att försöka smyga in seriestrippar i dem i alla fall.