- Project Runeberg -  Svenskt biografiskt handlexikon /
Preface to the Electronic Edition

(1906) Author: Herman Hofberg, Frithiof Heurlin, Viktor Millqvist, Olof Rubenson - Tema: Reference, Biography and Genealogy
Table of Contents / Innehåll | << Previous | Next >>
  Project Runeberg | Like | Catalog | Recent Changes | Donate | Comments? |   

Preface to the Electronic Edition

by Lars Aronsson, February 1997--September 1998 (Ett svenskt förord följer nedan)

The electronic edition is yet incomplete, and inline images have not been included in the individual biographies.

Work on this electronic edition began in January 1997. The text of letter A was completed in March 1997. One year later, only half of the text of letter B had been completed.

Svenskt biografiskt handlexikon (SBH), 2nd edition, 1906, contains detailed descriptions of the then renowned Swedish men and women from the reformation (16th century) until the then-present times. In retrospect, the most useful descriptions for all normal purposes are those of people who died before 1906, as they document complete lives.

The 2nd edition of SBH has four creators. The first is Herman Hofberg (1823--1883), who created the 1st edition alone in 1873--1876. Of the remaining three, who edited the 2nd edition, the last one died in 1916. As more than 70 years have passed since then, the 2nd edition of SBH is now in the Public Domain. Project Runeberg has received valuable help from the Royal Library in Stockholm in this research. The distribution of the work among the three editors is documented in the Swedish preface ("Förord") of 1906.

Two copies of the same edition have been used, and their text found to be identical, although the covers differ. The edition contains two volumes, both in 8:o. The first volume (A--K) contains a title leaf (pages i, ii), a non-paginated leaf with the preface, 39 full parts of 8 leaves each, and one final part of 4 leaves (the last leaf is blank). The second volume (L--Ö with supplement) contains a title leaf, a blank leaf, one part of 4 leaves, 51 full parts of 8 leaves each, and one final part of 4 leaves (the last page is blank). Each part of 4 or 8 leaves has a date printed on it, and the entire sequence of dates is the same in the two copies that have been studied. Most of the text from the titel page is shown above.

One of the copies was cut apart and fed to an Automatic Document Feeding (ADF) scanner, one part (4 or 8 leaves) at a time. The text was captured by Optical Character Recognition (OCR) software, and the output "raw" text was edited and corrected manually.

Scan images were produced in a separate run. The same pages were fed through the ADF, now 50 leaves at a time. Two formats were tried on the first 200 pages. First (starting March 1998), the pages were scanned in 8 bit (256 levels) grayscale, 200 dpi (dots per inch), and saved in JPEG format. Later (September 1998), the pages were scanned in bitonal, 600 dpi, and saved in TIFF format with fax group 4 compression. Either way, the resulting image files are rather large (310 kilobytes per page on average). The TIFF files are considered more useful, because most OCR software will accept TIFF input but not JPEG, and the high scan resolution actually wins over the print raster resolution, so the small portrait pictures can be either be used in the originally printed bitonal raster or downsampled into a grayscale image that is equivalent to the JPEG alternative.

Scan images are stored in this TIFF format internally, but are downsampled to 150 dpi grayscale (16 levels) images for display. The portrait pictures show an interference pattern due to this sampling process, which is unfortunate, but original data is not destroyed, and better grayscale images can be produced later by a higher quality resampling procedure.

This is not the first scan image edition that Project Runeberg produces, but the first where scan images are published in a parallel structure with a normal text edition. The text pages and the scan images make up two separate linear structures of HTML files, which can be read sequentially by using the >> and << arrows at the top and bottom of each page. There are also links from each text page to all related scan image pages, and back. Producing this rather advanced link structure is currently the most important part of the effort.

Most of the biographies have a portrait picture of the person described. All printed pictures are 20 x 23 mm and rendered in black and white. Only a few of these images have yet been included in the electronic edition. Where included, the images were scanned at 150 dpi, 16 level greyscale, which will render them twice bigger (40 x 46 mm) on most screens than they appear in print. Experiments showed that higher scan resolution and more grey levels did not visibly improve the quality of the digital images. The image format is GIF, and the image size averages 8 kbyte.

The text is printed in two columns. For each person, the entry starts with her name in boldface. The entry is split into paragraphs, separated by an m-dash, but the line of text is not broken. Entries vary in length from a few lines to a few pages. The portraits are placed to the left in the text column. Entries appear in alphabetic order by surname, then by genealogic or chronologic order. Persons of the same surname are numbered.

In the electronic edition, each person's description is put in an HTML file (page) of its own, and the filename used for each person is the same as is used in Project Runeberg's database of Nordic Authors. (From each Nordic Author page, a link is automatically added to the corresponding page here. This way, Nordic Authors is enhanced while SBH at the same time is kept in an electronic edition of its own.) The genealogic overviews that are given for some families have filenames that start with digit zero (0), and have no counterpart among the Nordic Authors. Information from the supplement has been appended to the end of each author's or family's file under a "[supplement]" heading.

The order between the entries is kept in the electronic edition. References to the "previous" person etc. have been made with hyperlinks. The entry name is put in an H1 (header) tag, normally rendered in large a font. Paragraphs within the entry are separated by the P tag, normally rendered as a blank line. Portraits are put in paragraphs of their own. The italics, boldface and olde spelling of the copy have been kept. Line breaks (and thus line counts) are not kept, and words split by linebreaks in the printed copy have been joined in the electronic edition.

Spelling errors and oddities in language should be kept in the electronic edition. When found in the printed copy, they should be documented, not corrected. The RCS revision history of the electronic edition is available for text critical research upon request.

Proofreading Update

Starting in 2002, a self-service web form for proofreading has been introduced. Submitting proofread pages and articles by e-mail is still possible. In both cases, moving the proofread OCR text from the facsimile pages to individual HTML pages for each article requires manual editing by Project Runeberg's editors in Linköping. This activity has been going slowly over the last few years. Proofread pages 201-260 of volume I were submitted by an ambitious volunteer in August 2002.
There are a total of 4159 articles
Proofread articles Not yet
proofread
articles
(percentage)
Date longer than 2000 chars.
(percentage)
500 - 2000 chars.
(percentage)
shorter than 500 chars.
(percentage)
Sept 8, 2002 186 (4.4%) 446 (10.7%) 79 (1.9%) 3447 (82.9%)
Sept 9, 2002 217 (5.2%) 480 (11.5%) 78 (1.9%) 3383 (81.4%)
Sept 10, 2002 228 (5.5%) 500 (12.0%) 78 (1.9%) 3353 (80.6%)


Förord till den elektroniska utgåvan

av Lars Aronsson i januari 1997

Svenskt biografiskt handlexikon (SBH), vars andra upplaga 1906 här presenteras, innehåller utförliga beskrivningar av den tidens kända svenskar, både levande och redan döda. När nu SBH publiceras elektroniskt, är givetvis alla beskrivna personer döda sedan länge. För vanligt bruk, är beskrivningarna av de redan före 1906 avlidna personerna de mest värdefulla, eftersom de sammanfattar ett helt liv.

Det är mycket användbart att ha tillgång till dessa personbeskrivningar på nätet, inte minst i samband med Projekt Runeberg, men det är inte med självklar rätt vi kan publicera verket. Första steget är en upphovsrättslig undersökning. Först när samtliga medverkande författare och redaktörer varit döda i 70 år, är verket fritt för spridning.

Johan Herman Hofberg är utgivare av verkets första utgåva (1873-1876). Han dog den 28 april 1883, långt innan andra utgåvan publicerades. Detta är dokumenterat i SBH. Enligt andra upplagan (ugglan) av Nordisk familjebok, är Hugo Viktor Millqvist född den 19 augusti 1864 och dog den 18 november 1916. Han redigerade verkets andra utgåva, tillsammans med två andra personer, om vars namn uppgifter har varit svårare att hitta. För detta har Projekt Runebergs redaktion vänt sig till Kungliga Bibliotekets referenssektion, där bibliotekarie Jan Ottoson varit oss behjälplig. Sålunda visar det sig att Frithiof Heurlin föddes 1836 och dog 1916, samt att Olof Rubenson föddes 1869 och dog 1909. Därmed är samtliga fyra namngivna medverkande döda sedan 1916, vilket är 80 år sedan, och verket tillhör därför sedan tio år det kulturella allmängodset.

Den valda förlagan på papper består av två band om 630 (A-K) respektive 815 sidor (L-Ö samt supplement), tryckta i två spalter. Artiklarna varierar i längd från några rader till mer än en hel sida. Det mesta av titelbladets text anges ovan, båda banden trycktes 1906 på Alb. Bonniers boktryckeri i Stockholm. I första bandet finns ett förord undertecknat av de tre redaktörerna i november 1906.

En recension av verket finns i Personhistorisk tidskrift, årgång 1904, sidan 145 f..

För den elektroniska utgåvan har valts att presentera varje person på en egen HTML-sida, och att namnge dessa HTML-sidor på samma sätt som i Projekt Runebergs eget register Nordic Authors. På detta sätt underlättas en sammanlänkning av de båda registren, utan att de för den delen blandas samman.

Artiklarna presenteras i samma ordningsföljd här i den elektroniska utgåvan som i pappersförlagan, vilken först är alfabetisk på efternamn och därefter kronologisk och/eller genealogisk. Namnet Bellman är ett tydligt exempel på detta.

Som med alla Projekt Runebergs prosautgåvor, har förlagans typografi och radbrytning till största delen offrats för läsarens bekvämlighets skull; det vore oförnuftigt att binda läsaren vid papperets begränsningar när vi publicerar elektroniskt. Avstavade ord i förlagan har skrivits samman i den elektroniska utgåvan. Artiklarna i SBH är indelade i stycken som avskiljs av ett tankstreck, men inte av radbrytning. I den elektroniska utgåvan har dessa stycken brutits som vanligt vid HTML-text, varvid tankstrecket har bortfallit.

Stafningen är densamma här som i förlagan. Det har varit vår avsikt att bevara de stavfel som finns i förlagan, och inte tillföra några nya. Eftersom det är mänskligt att fela, hoppas vi att läsarna ska göra oss uppmärksamma på våra eventuella misstag. För den som textkritiskt vill granska vår utgåva, ställer vi gärna den elektroniska utgåvans RCS-historik till förfogande på förfrågan.

Med de metoder för textfångst som Projekt Runeberg länge tillämpat, har det här inte varit fråga om att digitalisera hela verket i ett svep. Hela verket är heller inte intressant för oss, som valt att lägga ner oavlönat arbete på det: Det är huvudsakligen artiklar om kända svenska författare som lagts in. Dessa läggs in en i taget, efterhand som behov uppstår och lusten faller på.

För en mer detaljerad beskrivning av vissa tekniska detaljer, hänvisas till det engelska förordet ovan.


Project Runeberg, Fri Dec 17 05:29:44 2004 (runeberg) (diff) (history) (download) << Previous Next >>
http://runeberg.org/sbh/0about.html

Valid HTML 4.0! All our files are DRM-free