Det finns en OCR-kö på Saker att göra sidan. Redaktionen har dessutom en automatisk rapport, vilken rapporterar vilka verk som saknar en automatisk OCR-tolkning (se http://runeberg.org/korr.html).
Jag har en gammal lagbok från 1875 skriven med den gamla snirkliga textfonten (svårläst i början, men efter ett tag så går det bättre). Finns det nåt sätt att automatiskt "översätta" den till ren text, eller är det ett rent manuellt arbete? Lagboken är rätt intressant, den säger en del om livet på den tiden, t.ex. när man läser Legostadgan. //Tåggas
"Den gamla snirkliga textfonten" kallas fraktur. Det är latin och betyder benbrott, vilket rätt så bra beskriver utseendet. Det går att träna OCR-program, t.ex. ABBYY Finereader version 6 och 7, till att läsa fraktur, men det är inte trivialt. ABBYY Har du släppt ett OCR-program för frakturstil, ABBYY FineReader XIX for Fraktur. Läs mer om det på http://www.frakturschrift.de
Framtida versioner (t.ex. Finereader 8 eller 9) kommer eventuellt att ha inbyggt stöd för fraktur, och då kommer saken i en helt annan dager. Projekt Runebergs erfarenheter av fraktur-tolkning är hittills rätt så begränsade, t.ex. http://runeberg.org/ankjaer/ --Lars Aronsson
Universitetet i Yale har en bra tabell Fraktur
vanlig text.
http://www.library.yale.edu/cataloging/music/fraktur.htm