Saker att göra för Projekt Runebergs redaktion.
Bidragsansökningar, konferenser, stoppdatum
- 2 april 2005, H. C. Andersens 200:e födelsedag, se [H. C. Andersen 2005 i Odense], [Odense kommun] och jubileum
- 1 maj 2005, stoppdatum för posters och demos till ECDL 2005
- 1 juni 2005, stoppdatum för [ansökningar till II-stiftelsens Internetfond]
- 13 juni 2005, Magnus von Wrights 200:e födelsedag
- juni 2005, [Dreamhack], Jönköping
- 14-18 augusti 2005, [IFLA 2005 i Oslo]
- 18-23 september 2005, [ECDL 2005] i Wien, Österrike
- 22-23 september 2005, hundraårsminnet av förhandlingarna i Karlstad inför unionsupplösningen, se [Karlstadskommuns firande], Jubileum och [Prosjekt 1905]
- 9-13 oktober 2005, hundraårsminnet av unionsupplösningens godtagande i Stortinget och Riksdagen, se Jubileum
- november 2005, [Dreamhack], Jönköping
- 3 dec 2005, Georg Nordensvans 150:e födelsedag
Nyutveckling:
- Lägg till inloggning för användare. En inloggad användare kan:
- Uppdatera sin epostadress.
- Korrekturläsa som vanligt.
- Bli uppgraderad till "extern redaktionsmedlem" av någon i redaktionen.
- "Externa redaktionsmedlemmar" kan:
- Via webben markera kapitel i Articles.lst och slå ihop dem till HTML-filer (när alla OCR-sidor som ingår i det kapitlet är korrekturlästa).
- Slutkorrekturläsa hela kapitel. Detta innebär att:
- Texten ska vara korrekt
- Styckeindelningen ska stämma
- Fetstil och kursiveringar ska finnas med
- Bilder ska vara inlagda
- ...
- Flera personer ska kunna markera samma kapitel som klart för extra kvalitetssäkring.
- Det ska vara möjligt att markera till exempel att texten är korrekt med uppmärkning, men att bilder inte är inlagda.
- Se till att man kan se från ett verks indexsida vad statusen på dess korrekturläsning är.
- Automatisk koppling mellan Articles.lst i Nordisk Familjebok och authors (för att kunna länka artiklar, utan att behöva länka om när artiklarna är korrekturlästa).
- Möjlighet att ladda upp scannade faksimilbilder.
- Möjlighet att bygga och korrigera Pages.lst via webben.
- Information saknas i t.lst om hur man bygger om den.
- På Sherman går man till /lysator/runeberg/texter/metadata och kör "make". Då byggs t.lst från Metadata i nya verk och från authors/a.lst. Denna t.lst används när man kör "make" i de olika verken.
- Sedan kan man behöva unison-synca över texter/metadata till fatabur och köra "perl update_db.pl" där också. Den "databas" som uppdateras då är den som används när man tittar på PDF-bilder.
- Och så är det bra att köra /home/runeberg/bin/search*.pl på fatabur också. Den databas som uppdateras då är den som används av search.pl.
Informationshantering:
- Sammanställ informationen om vilka förlagor som använts för inscanning (om det är känt) och samla det på en sida (samt stoppa in det automatiskt på lämplig plats på alla indexsidor.
- Gör något kreativt med verk som har hårdkodad korrekturläsningsstatus.
- Kolla i webbträdet om det finns filer som bara finns där (gamla arkiverade framsidor, exempelvis). Se i så fall till att en masterkopia av dem arkiveras även bland källkoden.
- Gå igenom alla verk och städa bort Metadata1. Den kan innehålla information som saknas i Metadata, och i så fall ska den informationen flyttas över till Metadata.
- Lägg till komponenterna "Allmänt" och "Hjälpscript" i Bugzilla.
- Gå igenom och komplettera tema-sektionen.
- http://runeberg.org/authors/montghug.html död 1872, enl. SBH - för in mer info.
- http://runeberg.org/authors/krondhan.html bör inte innehålla några understrykningar som inte är länkar.
Verkshantering:
- Publicera utgåvan "enhvar" i början av 2005.
- Fixa uppmärkning av sättningsfel.
- Gör något vettigt med noterna i gmlante (09.html). http://runeberg.org/gmlante/09.html
- Gå igenom hela erofring och kolla att alla bilder är inlagda.
- Fixa bilden på /jordinre/0093.html och bedöm om 0107.html behöver fixas.
- Kolla vad som hände med alla de verk som var bortkommenterade i den gamla t.lst. Antagligen ligger de ute på webben nu.
- Fixa indexsidor som behöver snyggas till
- kram har ingen index-sida (eller indexsida med RXML-taggar)
- nordflor dito
- fritiofs nästan dito -- sidan klipps halvvägs
- bsjoberg innehåller gammal copyrightinformation (bör innehålla info liknande syntaxup)
- Fixa bilden på hvar8dag/3/12/0008.html + 0009.html i något vettigare format
- Fixa in bilden från runeberg/6/0044.html i freja.html istället för den tråkigare texten
- Se till så att alla kapitel i fribyt har samma huvud
- http://www.lysator.liu.se/runeberg/authors/lagerlof.html har en massa brutna länkar
Saker att fixa i hjälpscripten:
- klart.pl:
- Summeringen längst ner på korr.html stämmer inte med delsummorna i tabellerna.
- klart.pl bör kontrollera att det verkligen finns .txt-filer att korrekturläsa innan den tycker att folk skall göra det. Kanske någon ocr-text-saknas-på-dessa-sidor-funktion?
- Dela upp korr.html så att verk som har kapitel som kan slås ihop hamnar i en egen tabell för att underlätta för redaktionen.
- Rensa upp i koden så att den går att läsa igen. Mycket av koden bör antagligen förpassas till runeberglib.pl.
- korr.html bör även lista information om de verk vi har som inte har faksimilbilder. Dels så att de blir mer synliga, dels så att det blir lättare att få en överblick över hur många de är så att man kan försöka bli av med dem genom att ersätta dem med faksimilverk istället. För dessa verk är det dock svårare att lista ut vilken statusen egentligen är på något vettigt sätt.
- Kolla varför bemadikt (+ evenutella andra verk) saknas i listningen.
- mkfrontpage:
- Se till att TOPLEVEL/mkfrontpage klagar om den inte hittar "---" i någon fil. Det är inte troligt att en fil skulle innehålla bara metadata, vilket den tror nu.
- proof.pike (som borde bli proof.pl):
- Se till att korrekturläsningsscriptet upptäcker om någon annan har sparat samma version av en sida redan.
- Notera det händer att man trycker tillbaka för att editera en sparad text, detta brukar skript som verionshanterar reagera fel på.
- bygg_kapitel.pl:
- bygg_kapitel.pl rapportarar "För många träffar i Articles.lst" om den inte fick några träffar alls.
- Just nu konverteras <footnote> till HTML redan i ihopslagningsfasen. Det vore bättre om det inte skedde förrän när sidan byggs för installation.
- Kolla så att bygg_kapitel.pl byter fnuttar åt rätt håll när den skapar html. Det skall vara ' ASCII 39 (0x27) som är rätt.
- bygg_index.pl:
- bygg_index.pl bör, åtminstone om man ger någon extra flagga, kolla igenom alla sidor i verket istället för bara de som är " ..."-märkta och rapportera om något inte stämmer. Detta löser exempelvis problemet med att en påbörjad <chapter> för första kapitlet och en avslutande </chapter> för sista kapitlet annars rapporteras som ett komplett kapitel och senare tillkommna taggar mellan dem upptäcks inte.
- uppdaterat.pl:
- Om en OCR-fil är uppdelad på mer än ett kapitel så rapporteras bara den första av uppdaterat.pl --update som den man ska titta i.
- uppdaterat.pl --update borde på slutet rapportera nästa fil i verket där en uppdatering gjorts, så att man lätt kan fortsätta sitt arbete, utan att behöva växla till en extern lista. Är verket klart kanske den till och med skall drista sig till att meddela detta, samt i vilket verk man kan fortsätta jobba.
- rudolf.pl:
- Fixa så att inte varje matchfunktion behöver göra anrop till KOM-servern för att gräva fram kommentarerna till ett spam.
- Flytta virusdefinitionerna ($w32_<virus>_{subject|body|attachment}) till respektive funktioner.
- Flytta ut virusdefinitionerna till en separat fil (igen, men gör rätt den här gången).
OCR-kön
- Side 286-287 i tiphyche/1872/ mangler.
Scanningkön
Vi har en del som ligger på kö för att scannas.
Se även önskelistan.
Åter till Arbetsgång för redaktionen.