Publicering i XML-format

Jag var på ett arbetsmöte i Göttingen för att lära mig använda en uppsättning verktyg för XML-publicering som redan används av en del universitetsförlag. Verktygslådan kallas Métopes och utvecklas av den franska organisationen Numédif.

Single Source Publishing är en produktionsmodell för publicering som innebär att man har ett enda dokument (en XML-fil) som källa för alla de former (t.ex. PDF, HTML, EPUB, InDesign, andra XML-standarder) innehållet ska presenteras i. Man kan säga att modellen utgår från källdatan istället för presentationsformen. Den bygger på att man strukturerar sin källdata (författarens text) bra.

En fördel med detta är att man inte är beroende av utvecklingen av presentationsverktyg. Om t.ex. EPUB-formatet inte längre är aktuellt har man fortfarande kvar en verktygsoberoende källfil som kan användas för att presentera texten i ett nytt format.

En annan fördel är att man kan effektivisera produktionsflödet genom att automatisera omvandlingen från XML till de olika formaten. Genom att skapa bra mallar behöver man inte redigera varje text i varje format. Utseendet definieras en enda gång i samband med att mallen för t.ex. en pdf-fil skapas.

När man sitter med sin Word-fil som en författare skickat in är det däremot inte så självklart hur den ska förvandlas till en XML-fil. Men även detta kan delvis automatiseras. Men (ännu) inte helt. Produktionsmodellen innebär att man flyttar arbetsinsatser från redigeringen av presentationsformaten till produktionen av XML-filen.

För att XML-filen ska bli användbar måste nämligen författarens text taggas noggrant. Varje del av texten, som t.ex. stycken och rubriker, måste ha ett korrekt och fördefinierat styckeformat. Dessa stycke- och teckenformat måste följa den mall som Numédif har tagit fram i samarbete med förlagsredaktörer. Mallen täcker de flesta behov som kan uppstå vad gäller en vetenskaplig text, så som användande av bilder, tabeller, matematiska formler, angivande av lärosätestillhörighet, finansiärer, ämnesord etc. Taggningen av dokumentet underlättas såklart om författaren jobbat i en välgjord Word-mall som begränsar vilka text- och styckeformat som finns tillgängliga.

När Word-filen är vältaggad kan den läsas av programvaran som spottar ur sig en XML-fil, och sen är det bara att köra.

Arbetsmötet inleddes av de två utvecklarna som varnade oss för att vi nu skulle ha två heldagars snabb genomgång av ett tekniskt system på engelska talad av två fransoser. Och så blev det också – tappade man koncentrationen en minut fick man fråga sin bordsgranne för att hinna ikapp. Det var intensivt men också mycket roligt och spännande att lära sig jobba på ett sätt som jag tror verkligen skulle höja kvaliteten på publiceringen vid Malmö universitet. Till och med endast det första steget i modellen — att producera en XML-fil — skulle vara ett bra steg att ta. Att publicera vetenskapligt material i XML-format ökar tillgängligheten och användbarheten och blir allt oftare ett krav från t.ex. finansiärer (se t.ex. krav på publicering i XML-format i Plan S).

Några inledande konkreta steg för biblioteket skulle kunna vara att dels kontakta de tidskriftsredaktioner som i dag använder vår OJS-installation och fråga om de är intresserade av att publicera i XML-format och dels undersöka möjligheten att tagga våra avhandlingar, vilket borde vara ganska lätt eftersom de är skrivna i en word-mall.

/Jacob Andersson

 

Kommentera

E-postadressen publiceras inte. Obligatoriska fält är märkta *