- Project Runeberg -  About Project Runeberg /
Korrekturläsning av elektroniska faksimilutgåvor

Table of Contents / Innehåll | << Previous | Next >>
  Project Runeberg | Like | Catalog | Recent Changes | Donate | Comments? |   

Korrekturläsning
av
elektroniska faksimilutgåvor

This text is also available in English.

Här beskrivs hur du kan hjälpa Projekt Runeberg med korrekturläsning av intressanta texter, för att förhöja deras användbarhet. Först en bakgrund.

Bakgrund

Projekt Runeberg publicerar nordisk litteratur på Internet sedan 1992. Det enklaste men också det jobbigaste sättet att lägga ut en bok på nätet är att skriva in texten på tangentbord. I stället kan man använda en scanner tillsammans med ett program för teckentolkning, så kallad OCR (optical character recognition). I båda fallet får man en textfil, som man sparar i HTML-format för att det ska bli en websida av den. När sidan visas för läsaren har bokens vackra typografi försvunnit. En annan nackdel är att man saknar garantier mot skrivfel. Det hjälper inte att man är aldrig så noga när man skriver in texten. För att veta om texten är rätt avskriven, måste man gå till biblioteket och titta i den riktiga boken.

Under hösten 1998 började Projekt Runeberg arbeta med elektroniska faksimilutgåvor. Det betyder man sparar en bild av den inscannade boksidan. På det sättet återges bokens typografi exakt och dessutom försvinner risken för fel.

Visst kan fel uppstå även vid inläsning av bilden. Det kan bero på dåligt tryck, fläckar i papperet eller "fluglortar". Men det är ytterst osannolikt att sådana fel skulle leda till att en bokstav skulle förvandlas till en annan, att två bokstäver skulle byta plats, eller att en hel rad i texten skulle utelämnas. Det är sådana fel man vill skydda sig emot. Och faksimiltekniken är det bästa skyddet.

Samtidigt innebär faksimiltekniken också nackdelar: Bilden tar längre tid att ladda ner över modem. Det går inte att klippa-och-klistra text mellan bilden och ett ordbehandlingsprogram. Det går inte att söka efter ord eller fraser i bilderna. Och blinda eller synskadade kan inte läsa bilden i blindskrift. Det beror på att bilden, ur datorns synvinkel, består av en massa svarta och vita bildpunkter och inte av enskilda bokstäver och ord.

För att få fram bokstäverna och orden ur bilden, används ett OCR-program. Dessa är väldigt bra på sitt arbete, men ändå blir det ett och annat fel kvar, siffran 1 kan förväxlas med bokstaven l och bokstäverna e och c förväxlas ibland. Dessutom är programmen sällan bra på att känna igen rubriker, kursiveringar och styckebrytningar. Resultatet från OCR-programmet brukar vi kalla för råtext, eftersom den inte är speciellt användbar utan bearbetning, ungefär som råolja.

När Projekt Runeberg producerar en elektronisk faksimilutgåva, läggs varje boksida upp som en websida. Överst kommer sidhuvudet med logotypen och bokens titel. Sedan följer den inscannade bilden av boksidan. Därunder läggs råtexten, och sist en sidfot.

För vanliga textutgåvor, görs i stället en websida för varje kapitel i boken. Kapitel kan vara olika stora. Romaner har kapitel som omfattar flera tiotal boksidor. Diktsamlingar har dikter som ryms på en eller två boksidor. Uppslagsverk har kanske flera artiklar på varje sida.

Gör så här

För att skapa och korrekturläsa en textutgåva utifrån en faksimilutgåva, gör man så här:

  1. Vi producerar ett "kapitel" i taget, se ovan.
  2. Ta reda på hur mycket text som hör till ett kapitel. Det är så många sidor som anges på en rad av innehållsförteckningen (Table of Contents). Klicka på boktiteln i sidhuvudet för att komma till innehållsförteckningen.
  3. Besök de boksidor som ingår i kapitlet, en i taget.
  4. Markera och kopiera råtexten från boksidan. Rulla websidan neråt, så finns råtexten nedanför faksimilbilden.
  5. Klistra in råtexten i en ordbehandlare eller texteditor.
  6. När råtexten är inklistrad, börjar korrekturläsningen:
  7. Kontrollera att texten stämmer mot faksimilbilderna. Var extra noga med alla siffror, till exempel årtal.
  8. Kontrollera att alla rubriker, kursiveringar och styckebrytningar stämmer.
  9. Spara texten på fil i HTML-format. De flesta ordbehandlare har denna möjlighet. Filnamnet ska sluta på .HTM eller .HTML
  10. Skriv ett brev till runeberg@lysator.liu.se och skicka med den sparade filen som en bilaga. Glöm inte att berätta vilken bok och vilket kapitel det rör sig om.

Sedan är det bara att vänta på besked från Projekt Runebergs redaktörer att texten blivit mottagen.

Om du undrar över något, är det bara att skriva ett brev. Redaktörerna har som målsättning att svara personligt på varje brev. Du kan skriva på svenska, danska, norska eller engelska.


Project Runeberg, Thu Dec 20 03:34:57 2012 (aronsson) (diff) (history) (download) << Previous Next >>
http://runeberg.org/admin/fakskorr.html

Valid HTML 4.0! All our files are DRM-free