Det finns ett helt gäng script som används i olika steg av processen för att skapa eller underhålla Projekt Runebergs utgåvor.
Script att köra manuellt
bin/bygg_kapitel.pl
Används för att slå ihop ett antal OCR-filer till en html-fil. För att det
ska göras krävs att varje OCR-fil har korrekturlästs minst en gång.
$ bygg_kapitel.pl [--dikt] <utgåva> <kapitelnamn>
<utgåva> är utgåvans namn (dvs namnet på katalogen som filerna för utgåvan ligger i).
<kapitelnamn> är namnet på kapitelfilen man vill ska skapas, dvs det som står i
första kolumnen i Articles.lst. Innan man kör bygg_kapitel.pl ska man lägga till det
namnet manuellt. Scriptet använder sedan den raden i Articles.lst för att ta reda på
vilka OCR-filer som ska ingå i kapitlet. När filerna slagits samman sätter scriptet
RCS-taggen "html" på alla filer den slagit ihop så att bin/uppdaterat.pl kan användas
för att kolla om någon gör korrekturläsningar efter sammanslagningen.
Om man anger flaggan --dikt så kommer alla radbrytningar i OCR-filen att bevaras genom
att ett <br> stoppas in först på varje rad.
bin/bygg_verk.pl
Används för att skapa alla kataloger som behövs för ett nytt verk, och i möjligaste
mån även skapa de filer som ska ligga i dem (eller i alla fall påminna om vad som
behöver göras).
$ bygg_verk.pl <utgåva> [<författarkod>]
Det går även bra att köra scriptet på en redan skapad utgåva. I så fall kommer det
att titta igenom filerna som finns och se om det är någonting som saknas eller är
fel.
bin/bygg_index.pl <utgåva>
Används för att skapa rader till Articles.lst utifrån <chapter>-taggar instoppade i
OCR-filerna.
bin/klart.pl
Talar om (för faksimilutgåvor) om det finns kapitel där varje sida är korrekturläst
minst en gång. Man kan antingen köra det för en enstaka utgåva genom att ange namnet
på en utgåva som parameter, eller så anger man inget och får statusen för alla utgåvor.
Man kan även ange diverse flaggor till klart.pl:
--korrat ger en lista på alla kapitel som är klara att slås ihop. Om man anger
namnet på en utgåva som parameter antas --korrat.
--rapport ger en lista på korrekturläsningsstatusen för alla utgåvor. Om man även
anger --html får man rapporten i html-format.
--mednf anger att även Nordisk Familjebok ska gås igenom. Ibland vill man köra
utan den flaggan (när man testar, till exempel), vilket går mycket fortare.
--status ger en lista på alla kapitel för alla utgåvor, och sedan för varje kapitel
en lista på alla OCR-filer som ingår i det kapitlet. Varje OCR-fil är färgkodad för
att visa dess korrekturläsningsstatus, så att man lätt ska kunna se var det gör störst
nytta att korrekturläsa.
--helt anger att endast sidor som markerats som "whole page OK" minst en gång ska
betraktas som klara.
bin/uppdaterat.pl
Talar om (för faksimilutgåvor) om det finns sidfiler (från OCR) som någon
korrekturläst efter att de slogs ihop till en html-fil. Om det gör det behöver
man manuellt ta reda på skillnaden mellan den RCS-version som användes för att
bygga html-filen (taggad med rcs-taggen "html") och den senaste revisionen. Om man
anger en utgåvas namn som parameter kontrolleras den utgåvan, annars kontrolleras alla
utgåvor.
Ett cronjobb kör uppdaterat.pl en gång i veckan och rapporterar eventuella ändringar till
redaktionsmötet i LysKOM.
Det går också att köra uppdaterat.pl med flaggan --update. Då behöver man ange två
parametrar; utgåva och sida. Diffen mellan den version av sidan som användes för att
bygga kapitlet och den senaste versionen kommer att visas och rcs-taggen "html" kommer
att flyttas till den senaste versionen. Man måste sedan manuellt införa diffen i det
ihopslagna kapitlet.
bin/runeberglib.pl
Funktioner för att hantera *.lst-filer och RCS-filer. Används av klart.pl, uppdaterat.pl
och bygg_kapitel.pl.
bin/word9html2html.pl
Konverterar html-filer sparade av Word 9 (och möjligen andra versioner) till mer
läsbar html. Bra att ha när folk skickar korrekturläsningar sparade som html i Word.
Script som körs automatiskt
texter/TOPLEVEL/proof.pike
scriptet för webbgränssnittet för korrekturläsning.
bin/wwwinst.lpc
scriptet som körs av gmake (dock inte för authors), och som skapar
html-filerna. Detta behöver skrivas om i Perl.
Se även Olika filer för en utgåva.
Åter till Arbetsgång för redaktionen.