Det var den kortfattede version. Undtagelser og forklaringer til disse regler ses i det følgende.
Dette er en wiki-side. Du kan redigere den hvis du vil. Længst nede til venstre findes linket "Redigera den här sidan".
Korrekturlæsning er en vigtig del af Projekt Runebergs virksomhed, og her der brug for mange frivillige medarbejdere. Fra foråret 2003 sker den direkte fra webbrowseren. Dette bygger på, at både det scannede faksimile-billede (se scanning) og den maskinelt tolkede OCR-tekst findes tilgængelige, som det er tilfældet i Projekt Runebergs digitale faksimileudgaver. For vore ældre tekstudgaver som mangler faksimile-billeder, skal man stadig bruge e-post (runeberg@lysator.liu.se) til at påpege fejl og mangler.
Korrekturlæsning via webbrowseren er altså en relativt ny del af Projekt Runeberg, og et stadie i udvikling. Derfor hilser vi idéer og forslag til forbedringer. Nogle andre projekter som også benytter korrekturlæsning via webbrowseren, og som man kan hente flere idéer fra, er
På hver side i Projekt Runeberg som indeholder både et faksimilibillede og den maskintolkede OCR-tekst findes også linket "Korrekturläs sidan nu!". Ved at klikke på det, får du en ny side som også viser faksimile-billedet og teksten, men her kan du rulle dem uafhængigt af hinanden for at se den samme del af teksten i den begge to samtidigt (de fleste skærme er for små til at vise begge helt på en gang). Her er der også mulighed for at rette teksten. Når du har rettet de fejl, du har fundet, så klik bare på "Save"-knappen. Den næste som kigger på denne side kommer til at se din rettede tekst, ikke den oprindelige version. Hvis du læser hele siden igennem og retter alle de fejl du finder, vil det være godt hvis du også sætter et mærke i vinduet "Hela sidan är OK nu" som findes længst nede.
Når alle sider i et kapitel er blevet korrekturlæst, kan en redaktør i Projekt Runeberg lægge siderne sammen til en HTML-side.
Hvordan læser man korrektur
Som frivillig medarbejder har vi gjort det let for dig at hjælpe Projekt Runeberg med at læse korrektur på maskintolket tekst fra faksimile-billeder. Følg bare de her enkle trin. Formålet med korrekturlæsningen er at forbedre muligheden for at søge i teksten samt at gøre det lettere at bruge den til andre formål, ikke at give et nøjagtigt billede af den trykte teksts typografi.
Hvis den trykte tekst har en stavefejl eller giver fakta som er fejlagtige, så lad det stå. Lad gammmeldags stavemåde (gj, kj, aa) stå som den er. Her forsøger vi at gengive gamle bøger, ikke at skrive nye, opdaterede tekster. Hvis et navn staves på en anden måde i en tekst (Kjøbenhavn) end det er sædvanligt i dag (København), så ret det ikke. Finder du åbenlyse sættefejl (Københvan) er det tilladt at rette det, men skriv i det tilfælde en kommentar om hvad du har rettet i feltet "Comment".
Fjern hoved- og fod-tekster. Har alle sider for eksempel forfatterens navn, kapitlets titel eller lignende øverst eller nederst, så fjern det. Fjern også sidetal og arknummer, når det forekommer.
Afsnitsinddeling
Lad en linie stå tom mellem hver afsnit i teksten. Hvis første linie i hvert afsnit er indrykket, så fjern denne indrykning og erstat den med en tom linie.
Hvis værket indeholder illustrationer med billedtekster, så flyt billedteksten til mellemrummet mellem to afsnit. Det spiller ingen større rolle om billedteksten flyttes fremad eller bagud. Fremad føles mest naturligt, men hvis afsnittet ikke slutter på samme side, går det fint at lægge billedteksten før det afsnit den hører til i stedet for. Hvis siden ikke indeholder nogen afsnitsdeling, så læg billedteksten sidst på siden (efter en tom linie). (Hvordan billedtekster håndteres bliver antageligt ændret, når der udarbejdes mere detaljerede instruktioner om billeder.)
I almindelig løbende tekst er det ikke nødvendigt, at den korrekturlæste tekst har linieskift på samme sted som den trykte. Når det gælder poesi er det derimod naturligvis vigtigt at linieskiftene kommer på rette sted, og det er ikke altid at OCR-programmet klarer det. Den som læser den første korrektur på et digt kan komme til at ændre en hel del linieskift.
I digte sker det undertiden at visse linier har indrykning. Markér dette ved at indsætte <tab>.
En første digtlinie
En første digtlinie
En indrykket linie <tab>En indrykket linie
Mere yndig poesi Mere yndig poesi
Når en linie i et digt har været for lang, så det sidste stykke er trykt med stor indrykning skal <tab> ikke indsættes. I de tilfælde skal hele linien i stedet skrives på en linie, eftersom en linie på en computerskærm normalt er meget længere end en linie i en digtsamling.
Pausemarkeringer
Mellem hvert afsnit skal der være en tom linie. Undertiden sker det at en bog indeholder længere mellemrum mellem afsnittene en del steder med en eller anden form for markering:
*
eller
* *
*
eller
--------
Når du støder på noget i den retning, så fjern det og erstat det med en tom linie som blot indeholder * først på linien (og lad en linie stå tom før og efter linien med *).
Sammenskriv liniedelte ord
Hvis et ord er delt, så træk det sammen.
Därför har Stock-
Därför har Stockholm
holm S:t Erik som S:t Erik som
Dette gælder også ord som tilfældigvis bliver delt over to sider. Det nemmeste er at fjerne første del af ordet på den ene side og klistre denne del ind på næste side. Pas bare på, at du ikke glemmer at sætte noget ind igen!
Hvis værket indeholder udtaleanvisninger i form af apostroffer inde i ordene, så fjern dem.
Ta'rtu
Tartu
Hvis værket indeholder spatieret tekst, skal den også sammenskrives.
s p a t i e r e t
spatieret
Se mere nedenfor om forskellige skriftsnit.
Forskellige skriftsnit
Når der står "kursiv" skal det erstattes med <i>kursiv</i>.
Når der står "fed skal det erstattes med <b>fed</b>.
Når der står "s p a t i e r e t" skal det erstattes med <sp>spatieret</sp>.
I selve værket viser vi ikke spatieret tekst (dvs. "s p a t i e r e t t e k s t") som spatieret tekst eftersom det er besværligt at læse, men som kursiv tekst. Spatieret tekst anvendtes tidligere som erstatning for kursivering, eftersom det med blytyper er lettere at bruge uden at man behøver at have adgang til et helt ekstra sæt typer. Når du støder på spatieret tekst bør den dog markeres som spatieret, ikke som kursiv, selv om den i sidste ende bliver vist som kursiv.
Ganske ofte støder man på navne som er spatierede. Pas på at markere så tilpas meget som spatieret, at det ser fornuftigt ud også som kursiv:
P. A. S p a r r e
<sp>P. A. Sparre</sp>
Når skilletegn forekommer i direkte forbindelse med spatieret tekst spiller det ikke nogen større rolle, om de kommer med i spatieringsmarkeringen eller ej, så gør det som bliver nemmest. Men husk dog på at den spatierede tekst bliver kursiv ved visning, så også "!" eller "?" i direkte tilslutning bør markeres som spatieret.
s p æ r!
<sp>spær!</sp>
e n, t o og t r e
<sp>en, to</sp> og <sp>tre</sp>
Streger og andre specialtegn
Når er bindestreg i et ord skal det skrives med et minustegn. Når teksten bruger anførselstegn (fx. til replikker eller for at markere udeladte ord) skrives det med to minustegn. Brug ikke de lange tankestreger som fx. findes i en del fonte til Windows. De tegn som bruges, skal findes i tegnsættet ISO-8859-1. Denne standard indeholder ikke alle de tegn man kunne ønske, og så er man nødt til at bruge følgende erstatninger:
Ligatur (sammenskrevet) oeskriv oe (to bogstaver, ikke ligatur) Dagger / crux / kors ved dødsår
skriv d. (forkortelse for død) Kvadrat, i ældre forkortelser
skriv "kvadrat", "qwadrat" eller lignende med bogstaver Pundtegn, Skålpund
skriv "pund" eller "skålpund" med bogstaver Runer, græsk, hebræisk, kyrillisk tekst
her er der ingen gode løsninger, lad teksten stå uændret. Skriv også en kommentar i Comment-feltet, når siden gemmes. Fonetisk skrift, udtaleangivelser
her er der ingen gode løsninger, lad teksten stå uændret. Diverse fritstående accenttegn, apostrof
brug ASCII-tegnet ' (kode 39 decimalt)
Bemærk, at Microsoft Windows afviger fra ("udvider") tegnsæt ISO-8859-1. Det er muligt at indsætte en del at disse tegn ved at holde Alt nede og angive et tal mellem 127 og 159. Disse tegn må ikke bruges i Projekt Runeberg, for de fungerer ikke ens i alle Windows-tegnsæt og slet ikke under andre operativsystemer. Vi holder os til standarden, så det fungerer for alle.
Fodnoter
Når en tekst indeholder fodnoter med en eller anden form for markering inde i teksten og siden selve fodnotens tekst i bunden af siden skal den flyttes.
skal ændres til
Bemærk, at markeringen ("1" eller "*" eller andet) af fodnoten skal fjernes.
Indeksering af kapitler
Visse at vore værker angives som "ofullständigt indexerade". Det betyder, at ingen har indtastet hvilke sider der hører til hvilket kapitel, og derfor kan vi ikke præsentere nogen ordentlig indholdsfortegnelse. I stedet vises hele eller dele af indholdsfortegnelsen kun som "Sidor ..." og så en lang række med sidetal. Indekseringen kan du også hjælpe til med, samtidigt med at du læser korrektur.
Antag, at teksten ser sådan ud:
For at indeksere dette skal man tilføje lidt:
Begyndelsesmarkeringen <chapter name="..."> skal stå lige akkurat før kapiteloverskriften (eller første linie i teksten i teksten, hvis der ikke er kapiteloverskrifter). Hvis der er en kapiteloverskrift bliver den altså fordoblet. Slutmarkeringen </chapter> skal stå på første linie efter den sidste tekst i kapitlet. Forsøg ikke at sætte en <chapter>-tag ind i en anden for at markere underkapitler, for det kommer ikke til at fungere. Den tekst som angives som beskrivelse i name, må ikke indeholde nogen afmærkning (fed, kursiv osv.).
Denne metode kan anvendes på alle værker undtagen Nordisk Familjebok och Salmonsens konversationsleksikon. Hvis du vil hjælpe til med indekseringen af disse, læs i stedet Indexering av uggleupplagan respektive Salmonsens konversationsleksikon.
Bemærk, at der ikke er nogen grund til at indsætte <chapter>-tags, hvis værket allerede er indekseret.
Matematik og den slags
Hvis værket indeholder talangivelser i brøkform, så skriv dem med almindelige tal. Der findes rigtig nok specialtegn for ½ og nogle andre brøker, men at bruge dem gør det sværere at søg i teksten, og desuden bliver det inkonsekvent eftersom der ikke findes specialtegn for alle mulige brøker.
1½
1 1/2
Når angives enheder i kvadratmeter, kan man skrive sådan:
17 m²
17 m<sup>2</sup>
Brug <sub>sænket</sub> på samme måde.
Billeder
Der er i øjeblikket ikke nogen faste retningslinier for hvordan man skal markere billeder. De er under udvikling og vil blive præsenteret her fremover. Skriv helst en kommentar i “Comment”-feltet, hvis siden indeholder et billede indtil videre (for værker som er relativt sparsomt illustrerede; hvis værket har billeder på hver anden side eller lignende, er det meningsløst at påpege det).
Jeg plejer at indsætte <img> hvor der skal være et billede. Godt eller dårligt?
Andet
Græske bogstaver og fonetisk skrift kan nemmest transskriberes til det svensk/norsk/danske alfabet. Til nøjagtig gengivelse af den trykte tekst findes faksimile-billedet der jo stadig. Skriv en kommentar i "Comment"-feltet.
Se også: