Project Runeberg's front page section for June 2012:
Two and a half years ago, in October and November 2009, we started an experiment in copyright law by digitizing some works in the Who's Who genre. These are periodically published directories of contemporary people, full of biographic details about their birth, education and career.
By scanning volumes that were less than 70 years old, we wanted to test the hypothesis that such works are not covered by literary copyright, but only by the lesser "catalog protection" established in the copyright laws of the Scandinavian countries in the 1960s. Catalog protection, according to Danish copyright law section § 71, Norwegian copyright law 1961-05-12 nr 02 section § 43, and Swedish copyright law 1960:729 section § 49, is granted for a period of 15 years after the first publication of a "catalog, a table, a database or similar".
It's not clear exactly what kinds of works are covered by the full literary copyright for the author's lifetime + 70 years. We think that this covers traditional encyclopedias and biographic dictionaries such as Dansk biografisk Lexikon and Svenskt biografiskt handlexikon, which contain written stories with complete sentences. But a Who's Who contains only chronological lists of abbreviations, based on information submitted by the described individuals themselves.
In the 30 months that have passed since we started to digitize such works, not a single complaint or take-down notice has been received. While this is not a final answer, we take this opportunity to celebrate that our hypothesis has prevailed for two and a half years. As more time goes by and more works are being digitized, our interpretation manifests itself as the way it was always done.
Här är några utvalda korn, som långsamt har malts på den kvarn som drivs av svenska statliga skattepengar.
Om något av nedanstående gör dig glad eller frustrerad, skriv ett brev till den ansvariga ministern. För Kungliga biblioteket är det utbildningsminister Jan Björklund, för Riksarkivet och Riksantikvarieämbetet kulturminister Lena Adelsohn Liljeroth, för SCB finansminister Anders Borg, för digitala agendan IT-minister Anna Karin Hatt, för Kulturarvslyftet arbetsmarknadsminister Hillevi Engström. Du kan också donera pengar till Projekt Runeberg, som inte får del av de statliga pengarna.
1. Gamla ord får ny betydelse (nyspråk, käre Orwell) när IT-minister Anna Karin Hatt ska genomföra sin digitala agenda för Sverige och den 7 juni 2012 tillsatte en digitaliseringskommission, ledd av professor Jan "Gulan" Gulliksen. Ordet digitalisering används här för det, som tidigare kallades datorisering; införandet av datorer i olika delar av den offentliga förvaltningen. Det verkar inte ha något att göra med digitalisering i den gamla betydelsen omvandling från analogt till digitalt format, till exempel scanning av böcker.
2. Kulturarvslyftet lanserades i september 2011 som en arbetsmarknadsåtgärd, värd 800 miljoner kronor, för att få arbetslösa akademiker i arbete med inventering, vård och digitalisering av kulturarvet. Det låter ju mycket lovvärt, om man nu får värde för pengarna. Det hela samordnas av Riksantikvarieämbetet. Men den 29 maj 2012 meddelade Göteborgs-Posten att denna miljardsatsning gav bara 1 jobb hittills i Göteborgsregionen och 25 i hela landet, mot planerade 4400.
3. Riksarkivet tillkännagav 29 mars 2012 att Svenskt biografiskt lexikon (SBL) nu finns gratis på webben. Äntligen! Detta unika personhistoriska uppslagsverk påbörjades inom Bonnierkoncernen 1917, men blev aldrig lönsamt. Utgivningen övertogs 1962 av staten och ingår sedan 2009 i Riksarkivet. 2004 kom en CDROM-utgåva som nu har varit slutsåld i flera år. Slutet gott, allting gott? Nja... inte riktigt. Utgivningen har fortfarande bara kommit från Abelin (1917) till Ström (band 33, 2011) och ännu återstår minst fem band. Den aktuella webbversionen består enbart av text, inga faksimilbilder, och texten innehåller OCR-fel. Här är halva jobbet ogjort. Bakläxa! Någon öppen licens enligt Creative Commons anges inte heller.
4. Riksarkivets stora SVAR-databas är fortfarande inte öppet tillgänglig, utan kostar 995 kr/år i abonnemangsavgift. Hur många år ska vi behöva vänta på frisläppandet? Detta är betalt med skattemedel, så släpp det fritt. Nu, omedelbart!
5. Riksarkivet driver sedan september 2011 Digisam, ett sekretariat för samordning av digitalisering (i ordets äldre betydelse) av kulturarvet vid 24 svenska statliga minnesinstitutioner, däribland Kungliga biblioteket, Nationalmuseum, Nordiska museet, Riksantikvarieämbetet, Riksarkivet, Svenska filminstitutet och Tekniska museet.
6. Riksarkivet samarbetar med Kungliga biblioteket om att digitalisera dagstidningar inom det EU-finansierade projektet Digidaily. Mycket lovvärt! KB har 122 miljoner tidningssidor på sina hyllor och hittills har 1,6 miljoner sidor blivit digitaliserade. Men - håll i er nu - projektet omfattar inte tillgängliggörandet på nätet. Man scannar och lagrar, men visar ingenting! Hur tänkte man när man gjorde upp den planen? Borde den ansvarige ministern avgå? Eller är det helt okej?
7. Kungliga biblioteket har köpt en bokscanningsrobot som själv bläddrar sidor för 850.000 kronor. Hur många böcker har den scannat hittills? Det sägs att den arbetar på Statens offentliga utredningar, från startåret 1922 till och med 1988, vilket skulle vara ett utmärkt material eftersom det redan från början är fritt från upphovsrätt. Men när kommer de att bli läsbara på nätet? Den 20 april 2012 skriver Christian Zeising att man hunnit fram till 1950-talet och att de ska nätpubliceras "inom de närmaste veckorna". Två månader senare har inget mer hänt.
Uppdatering: Den 7 september 2012 tillkännagav Kungliga biblioteket att 930 SOU (av totalt 5600) nu är tillgängliga. Se vår indexsida för mer information.
8. Statistiska centralbyrån (SCB) har digitaliserat bokserien Bidrag till Sveriges officiella statistik (BiSOS) från 1800-talet och annan historisk statistik, totalt 4400 volymer om 650.000 sidor (ungefär jämnstort med Projekt Runeberg). Liksom aktuell statistik ligger allt öppet och lätt tillgängligt på webben. Härifrån kanske staten borde rekrytera nästa riksarkivarie? Ett reportage finns i Biblioteksbladet, nr 3-2012, sidan 17 (PDF).
During May 2012, Project Runeberg's collections continued to grow fast, both by scanning and by importing scanned works from external sources. It seems that a total of 39,138 scanned pages were added. While this is just a bit more than half of what we did in April, it's almost as much as we did in the first three months of this year and more than we did in all of 2006 or 2010.
Some authors whose works were added are John Bunyan, Frederik Dreier, Erik Jakob Ekman, Albert Engström, Carl Grimberg, Joseph Guinchard, Mauritz Hallberg, Johan Ludvig Heiberg, Bror Emil Hildebrand. Victor E. Lennstrand, Carl Gustaf af Leopold, Jack London, and Christian Winther. There might be others as well, and there are some works without a named author.
But which were the texts that we added? And what other progress did we make during the month? Previously, we provided a list as part of this monthly update. But the list was compiled semi-manually in an improvised fashion. We need a better system for this and thought volunteers like you may help out. Already, our catalog can be sorted by the date each work was added, to get a list of recently published titles, but this is only half the truth. The catalog only lists the top level titles, such as the title of a journal or encyclopedia. But it doesn't indicate which volumes of that title are available or when the parts were added. For example, the catalog won't tell you that during May 2012 we added years 1894-1897 to the already existing 1898-1940 of the journal Pedagogisk tidskrift.
What would it take to make a better catalog, that immediately could provide the complete and up-to-date information of what we have? Ultimately, it needs to list not only titles and volumes, but also the contents of volumes. For a journal, it's the individual articles that are interesting. Could we present this as an API for developers, or as open bibliographic data for download? In what format and by what parameters?
As more people are helping out with scanning books, we also need more volunteers to run OCR. You are welcome to run any OCR software you prefer. If you ask for our recommendation, we'll say Finereader Professional, which unfortunately only runs under Microsoft Windows. If you have a good computer that runs Windows and some time to devote, we'll guide you through the process. Send us an e-mail.
The vast majority of our titles are in Swedish or Danish.
Literature in Norwegian and Finnish is still an uncharted territory
(not to mention Icelandic or Sami). Which titles would be most useful
to bring online? Please give us a hint. Perhaps you can even help us
to scan them?