- Project Runeberg -  Changes made to admin/fakskorr <<
  Project Runeberg | Catalog | RSS | Forum | Recent Changes | Comments? |   

Return to Recent Changes
Changes made to admin/fakskorr - (history)
VersionSize (words) Common Deleted Inserted Changed
1.0 0 words
1.1 742 0 = 0%  742 = 100% 0 = 0%

<h1>Korrekturläsning
<br>av
<br>elektroniska faksimilutgåvor</h1>

<p><i>This text is also available <a href="faxproof.html" >in
English</a></i>.

<p>Här beskrivs hur du kan hjälpa Projekt Runeberg med
korrekturläsning av intressanta texter, för att förhöja deras
användbarhet. Först en bakgrund.

<h2>Bakgrund</h2>

<p>Projekt Runeberg publicerar nordisk litteratur på Internet sedan
1992. Det enklaste men också det jobbigaste sättet att lägga ut en
bok på nätet är att skriva in texten på tangentbord. I stället kan
man använda en scanner tillsammans med ett program för teckentolkning,
så kallad OCR (optical character recognition). I båda fallet får man
en textfil, som man sparar i HTML-format för att det ska bli en
websida av den. När sidan visas för läsaren har bokens vackra
typografi försvunnit. En annan nackdel är att man saknar garantier
mot skrivfel. Det hjälper inte att man är aldrig så noga när man
skriver in texten. För att veta om texten är rätt avskriven, måste
man gå till biblioteket och titta i den riktiga boken.

<p>Under hösten 1998 började Projekt Runeberg arbeta med
<b>elektroniska faksimilutgåvor</b>. Det betyder man sparar en bild
av den inscannade boksidan. På det sättet återges bokens typografi
exakt och dessutom försvinner risken för fel.

<p>Visst kan fel uppstå även vid inläsning av bilden. Det kan bero på
dåligt tryck, fläckar i papperet eller "fluglortar". Men det är
ytterst osannolikt att sådana fel skulle leda till att en bokstav
skulle förvandlas till en annan, att två bokstäver skulle byta plats,
eller att en hel rad i texten skulle utelämnas. Det är sådana fel man
vill skydda sig emot. Och faksimiltekniken är det bästa skyddet.

<p>Samtidigt innebär faksimiltekniken också nackdelar: Bilden tar
längre tid att ladda ner över modem. Det går inte att
klippa-och-klistra text mellan bilden och ett ordbehandlingsprogram.
Det går inte att söka efter ord eller fraser i bilderna. Och blinda
eller synskadade kan inte läsa bilden i blindskrift. Det beror på att
bilden, ur datorns synvinkel, består av en massa svarta och vita
bildpunkter och inte av enskilda bokstäver och ord.

<p>För att få fram bokstäverna och orden ur bilden, används ett
OCR-program. Dessa är väldigt bra på sitt arbete, men ändå blir det
ett och annat fel kvar, siffran 1 kan förväxlas med bokstaven l och
bokstäverna e och c förväxlas ibland. Dessutom är programmen sällan
bra på att känna igen rubriker, kursiveringar och styckebrytningar.
Resultatet från OCR-programmet brukar vi kalla för råtext, eftersom
den inte är speciellt användbar utan bearbetning, ungefär som råolja.

<p>När Projekt Runeberg producerar en elektronisk faksimilutgåva,
läggs varje boksida upp som en websida. Överst kommer sidhuvudet med
logotypen och bokens titel. Sedan följer den inscannade bilden av
boksidan. Därunder läggs råtexten, och sist en sidfot.

<p>För vanliga textutgåvor, görs i stället en websida för varje
kapitel i boken. Kapitel kan vara olika stora. Romaner har kapitel
som omfattar flera tiotal boksidor. Diktsamlingar har dikter som ryms
på en eller två boksidor. Uppslagsverk har kanske flera artiklar på
varje sida.

<h2>Gör så här</h2>

<p>För att skapa och korrekturläsa en textutgåva utifrån en
faksimilutgåva, gör man så här:

<ol>

<li>Vi producerar ett "kapitel" i taget, se ovan.

<li>Ta reda på hur mycket text som hör till ett kapitel. Det är så
många sidor som anges på en rad av innehållsförteckningen (Table of
Contents). Klicka på boktiteln i sidhuvudet för att komma till
innehållsförteckningen.

<li>Besök de boksidor som ingår i kapitlet, en i taget.

<li>Markera och kopiera råtexten från boksidan. Rulla websidan neråt,
så finns råtexten nedanför faksimilbilden.

<li>Klistra in råtexten i en ordbehandlare eller texteditor.

<li>När råtexten är inklistrad, börjar korrekturläsningen:

<li>Kontrollera att texten stämmer mot faksimilbilderna. Var extra
noga med alla siffror, till exempel årtal.

<li>Kontrollera att alla rubriker, kursiveringar och styckebrytningar
stämmer.

<li>Spara texten på fil i HTML-format. De flesta ordbehandlare har
denna möjlighet. Filnamnet ska sluta på .HTM eller .HTML

<li>Skriv ett brev till <a href="mailto:runeberg@lysator.liu.se"
>runeberg@lysator.liu.se</a> och skicka med den sparade filen som en
bilaga. Glöm inte att berätta vilken bok och vilket kapitel det rör
sig om.

</ol>

<p>Sedan är det bara att vänta på besked från Projekt Runebergs
redaktörer att texten blivit mottagen.

<p>Om du undrar över något, är det bara att skriva ett brev.
Redaktörerna har som målsättning att svara personligt på varje brev.
Du kan skriva på svenska, danska, norska eller engelska.


Project Runeberg, Thu Jun 20 00:03:38 2013
http://runeberg.org/rc.pl

Valid HTML 4.0!