- Fråga: Vad är det här?
- Svar: Det är en korrstapel
En korrstapel är ett stapeldiagram som visar hur långt korrekturläsningen och indexeringen av en bok har kommit. Korrstaplar visas när man korrekturläser och även i anslutning till bokens innehållsförteckning. Den här sidan beskriver hur färgerna i stapeln ska tolkas. Korrstaplar infördes i april 2004.
Det är fortfarande lite osäkert exakt hur korrstaplarna ska se ut och var på webbplatsen de bäst bör placeras.
Varje volym (band) av ett verk visas som en stapel som växer med en bildpunkt (pixel) åt höger för varje sida i bandet. Varje stapel består av tre rader:
- Första raden ("linjalen") anger bara antalet sidor. Varje horisontellt färgstreck motsvarar tio sidor. Kom ihåg att sidnumreringen kan skilja sig från ordningsföljden. Om bildskärmen är 1024 punkter bred och boken har färre än 1000 sidor, så ska hela stapeln få plats utan att scrolla i sidled.
- Rött markerar första tiotalet i varje hundratal (1-10, 101-110, o.s.v.)
- Vitt markerar udda tiotal (11-20, 31-40, o.s.v.)
- Svart markerar övriga jämna tiotal (21-30, 41-50, o.s.v.)
- Andra raden anger graden av korrekturläsning.
- Vitt markerar sidor som saknar OCR-text och därför inte kan korrekturläsas
- Rött markerar OCR-text som aldrig har redigerats
- Ljusgrönt markerar sidor som redigerats men ännu inte är fullständigt korrekturlästa.
- Mörkgrönt markerar sidor som är fullständigt korrekturlästa.
- Tredje raden anger graden av indexering
- Vitt markerar sidor som inte är indexerade
- Ljusblått markerar sidor som är indexerade, men inte omvandlade till HTML
- Mörkblått markerar sidor som är konverterade till HTML (en HTML-sida per kapitel, efter fullständig korrekturläsning)
Frågor och svar
- Varför är det tunna vita streck i vissa böcker? Svar: Det är blanka sidor, t.ex. baksidan på planscher. Projekt Runeberg har som princip att scanna alla sidor, även de blanka, och fram till 2003 raderades de tomma OCR-filerna från dessa sidorna. Alltså finns det ingen text att korrekturläsa.
- Varför är det breda vita fält i vissa böcker? Svar: Fram till 2002 hade Projekt Runebergs redaktion som vana att radera OCR-filerna när de var helt korrekturlästa och överförda till HTML-form. Dessa korrekturlästa OCR-texter finns alltså inte kvar, och kan inte korrekturläsas längre. Från 2003 är principen i stället att låta alla OCR-filer, både tomma och HTML-konverterade, vara kvar. På det viset kan man fortsätta att använda korr-funktionen för att rätta fel i sidorna hur länge som helst.
- Så Projekt Runebergs redovisade antal sidor är ett uppblåst och överdrivet mått? Svar: Ja, precis som alltid är fallet när en bok anges ha ett visst antal sidor, så kan några av dessa vara blanka.
Exempel
En helt färdig bok ([Arbetets herravälde]):