Blog archiwistów i bibliotekarzy Instytutu Piłsudskiego

Blog archiwistów i bibliotekarzy Instytutu Piłsudskiego

hathitrust-28010 czerwca 2014 r. Sąd Apelacyjny Drugiego Okręgu (południowy Nowy Jork) wydał wyrok, przychylając się do argumentów HathiTrust i odrzucając apel kilku organizacji autorskich, w tym m.in. amerykańskego Authors Guild i szwedzkiego Sveriges Författarförbund. W podsumowaniu wyroku czytamy:

“...utrzymujemy, że doktryna “dozwolonego użytku” pozwala pozwanym na stworzenie bazy danych umożliwiającej przeszukiwanie pełnotekstowe dzieł objętych prawami autorskimi i na dostarczenie tych dzieł w formatach dostępnych dla osób niepełnosprawnych.”

Dlaczego ten wyrok ma duże znaczenie dla archiwów i bibliotek? W prawodawstwie USA, w odróżnieniu np. od polskiego, doktryna “dozwolonego użytku” jest zdefiniowana w prawie autorskim w postaci dość ogólnych reguł. Powoduje to, że konkretne przypadki są decydowane przez sądy, ale także pozwala na uwzględnienie nowych rozwiązań technicznych.

W 2004 kilka uniwersytetów w USA zgodziło się, aby Google zeskanowało ich kolekcje książek. W 2008 trzynaście uniwersytetów ufundowało organizację o nazwie HathiTrust w celu zarządzania powstającą w ten sposób wspólną biblioteką cyfrową. Obecnie HathiTrust ma 80 członków instytucjonalnych i ponad 10 milionów zdigitalizowanych dzieł, opublikowanych poprzez wieki, w wielu językach i obejmujących wszystkie wyobrażalne tematy. HathiTrust, wraz Internet Archive, Project Gutenberg i innymi projektami digitalizacji jest organizacją partnerską dającą szeroki dostęp do dóbr kultury człowieka.

Wyrok Sądu apelacyjnego jednoznacznie odrzuca teorię, według której digitalizacja książek w celu stworzenia bazy danych jest naruszeniem praw autorskich, przynajmniej w USA. Jakkolwiek droga apelacji nie została jeszcze wyczerpana, wyrok ten ma bardzo duże znaczenie dla wszystkich, którzy digitalizują zbiory kultury. Jest przed nami jeszcze daleka droga do rozsądnego ulepszenia praw autorskich - patrz np. blog o tygodniu praw autorskich, ale ten wyrok jest krzepiącym precedensem.

Czytaj więcej

Marek Zieliński, 15 czerwca 2014

Może Cię też zainteresować

Rola wikipedii w cztereach typach bibliotekPanel "Wikipedia’s Role in Four Different Types of Librarianship". Wikiconference USA 2014. Photo Piotr Puchalski

Wikiconference USA 2014 was held from Friday, May 30 to Sunday, June 1 2014 at New York Law School in Manhattan. The conference brought together U.S.-based Wikipedians who discussed current hot topics related to the Free Encyclopedia and its sister organizations in the Wikimedia Foundation. In addition to technical issues, training and a day dedicated to an “Unconference,” many sessions were devoted to topics of close interest to the GLAM institutions and educational organizations, such as the use of Wikipedia in academic courses, copyright, Wikiprojects and other forms of partnership with Wikipedia. Below are some reflections from parallel sessions that we participated in.

The first day of the conference resulted in many ideas for the development of the GLAM project of the Piłsudski Institute. During the session in which four different institutions presented their way of using Wikipedia, Natalie Milbrodt from the Queens Library shared her innovative idea of the " Edit-a-thon.” The “Edit-a-thon” is a gathering of people interested in a particular field, during which, on the basis of documents that a given institution has in possession, they write articles to Wikipedia, first having learned the basics of Wikipedia editing.

linked-data280A fragment of a Linked Data Graph from LinkedData.org

Linked Data is a relatively new phenomenon in the World Wide Web, providing access to structured data. What is structured data? World Wide Web is now a universal vehicle for human-readable information - all websites, articles, apps give us information that we can read and interpret, for example an answer to the question “when is the next bus coming to this bus stop?” Such information is not easy for a computer to read - it does not know what “this stop” means, whether you are waiting a specific line or any bus, etc. Computers require information with a structure, which for example can take form of label:value pairs (“bus stop number:4398, bus line:Q11, distance from the stop:2.5 miles, etc.).

Information is commonly stored in databases, which have evolved to be very efficient in data storage and retrieval, but terrible in information sharing. Each database has lots of columns, each named differently and only the local computer system knows how to retrieve the data. This is where the new concept, Linked Data, comes to the rescue. Linked Data is an system  that makes computers understand each other by labeling databases with metadata. Its metadata scheme, RDF (resource description framework), requires that data comes not in provincial tables, but in universally readable RDF sentences, consisting of subject, predicate and object. Instead of invented column names we use standard names arranged in ontologies, and instead of a textual description of the  subject of the RDF sentence we use its identifier, URI (Universal Resource Identifier). Thus, instead of the trivial for the human reader information about the title of this blog (after all we can read it above, right?) we get a structured sentence or “triple” in RDF lingo, [http://www.pilsudski.org/en/news/blog/832 - dc:title - “Linked Data part 2: Where Is the Data?”]. The first part is the URI or unique “address” of this article, the second means “title” in a specific metadata standard (Dublin Core), and the third part is the actual title.

wschod-ziemi-280Wschód ziemi. W dolnej części odzyskane zdjęcie wysokiej jakości.

NASA opublikowało niedawno nowo odzyskane zdjęcia z sond księżycowych, wysyłanych  w latach 1966-67 w ramach programu "Lunar Orbiter". Różnica jakości pomiędzy starymi, opublikowanymi zdjęciami i nowym materiałem jest uderzająca. Historia uratowania materiału i odtworzenia wysokiej jakości obrazów jest pouczająca, a zaczyna się od roku 1986, kiedy to archiwistka Jet Propulsion Laboratory (JPL) Nancy Evans zdecydowała, że nie może, w dobrej wierze, zwyczajnie wyrzucić starego materiału.

Sondy wyposażone były kamery wysokiej jakości, z podwójnymi obiektywami, i wykonywały duże ilości zdjęć na taśmie 70 mm. Taśmy były potem wywoływane na pokładzie sondy, zdjęcia były skanowane i wysyłane na ziemię. Modulowany sygnał z sondy, był zapisywany na taśmę magnetyczną, wraz z komentarzami operatorów. Następnie cała sonda (z oryginałami zdjęć) była bezceremonialnie rozbijana o powierzchnię księżyca. Taśmy magnetyczne były wykorzystane do wydrukowania dużych obrazów na papierze (wynajmowano stare kościoły aby rozwiesić ogromne arkusze), które używano do zidentyfikowania potencjalnych miejsc lądowania na księżycu. Następnie taśmy były załadowane do pudeł i zapomniane.

W 2005 dwaj entuzjaści z NASA, Keith Cowing i Dennis Wingo rozpoczęli prace nad odtworzeniem taśm, które w międzyczasie zmieniały kilkakrotnie miejsce przechowywania. Napęd taśm, bardzo rzadko spotykany Ampex FR-90, został zlokalizowany w szopie Nancy Evans, i grupa rozpoczęła pracę nad odzyskaniem obrazów. Wymagało to odbudowania napędu, odtworzenia nieistniejących już części i elektroniki, konwersji zmodulowanego sygnału na zapis cyfrowy, a następnie cierpliwego poskładania fragmentów zdjęć w jedno. Po odzyskaniu pierwszego zdjęcia ("Wschód ziemi", patrz wyżej), zespól, pracujący do tej pory ochotniczo, uzyskał finansowanie z NASA na kontynuowanie projektu. Od 2007 udało się odzyskać ok. 2000 zdjęć księżyca, ze zdumiewającymi szczegółami.

Why bother scanning and digitizing documents and books? What is the justification of such enormous effort to convert the cultural legacy of humans to digital form? I often hear such questions - from historians who prefer the “smell and touch” of the original documents or archivists who claim that microfilms are good enough. Is digital technology just a the fashion that will soon pass, or does it have a deeper significance?

If you think that there is something powerful in the digital, read on. We will explore why digital is important - for archives, libraries, museums (GLAM) and all the producers and consumers of cultural goods. In the next three sections we will discuss the three reasons for switching (or, perhaps, returning) to digital information processing: Preservation, Discoverability, Access and review the oldest discrete information systems known to us. 

Preservation

Digital is only one of many implementations of discrete information storage and processing. Most of the signals that reach our senses, be it a rainbow, a symphony or the smell of a rose, can be considered analog. Analog means that the signal can take any value, for example a tone in music or a color in visible spectrum. The range of possibilities is typically limited only by capabilities of our senses - we cannot see the infrared, nor hear the ultrasound. Once the signal enters our eye (or a digital camera), it does not retain the continuity of the original signal. In the eye retina the sensors - rods and cones - act on the ‘all or nothing’ principle, in the camera the pixel sensors decompose the light into a small number of levels.  In the discrete system only a limited, countable number of states is allowed, with nothing in between. All modern digital computers use the basic information unit of a binary bit, which can only have two states (commonly called 0 and 1). The mathematical theory of information, first proposed by Claude Shannon, also uses the binary bit with two possible states, implying that information is in its nature discrete. In computers, single bits are typically strung together: a group of 8 bits in sequence is called byte. In order to keep the generality of the discussion, we will call the smallest unit a character, and a string of characters a word. The digital computers thus operate with 2-state character and 8 character word.

GLAM_logo_transparent

GLAM is an acronym that stands for: Galleries, Libraries, Archives and Museums. The designation applies to institutions that have something in common - they are repositories of human cultural heritage.

Although there are institutions that bring together museums, archives, libraries, etc., providing them with financial or logistical support -- such as the Institute of Museum and Library Services (ILMS) in Washington, DC, Museums, Libraries and Archives Council in the UK and the Norwegian Archive, Library and Museum Authority -- these institutions do not claim to belong to GLAM nor do they use this acronym.

What, therefore, is GLAM? It is the idea that the institutions whose mission it is to collect cultural treasures will benefit from making these resources widely available. The idea of GLAM can be best illustrated by two initiatives, OpenGLAM and GLAM-Wiki.

copyright-square-1Recently (13-18) the Electronic Frontier Foundation  (EFF) organized the Copyright Week to remind us what can we do to keep and exercise our rights under the law, and how to work on improving it. For each of the (daily) topics, the participating institutions contributed articles, blogs and other material. It is a fascinating lecture, well worth reading. Below is a short review illustrated with excerpts from selected texts.

Transparency

After the public outcry over ACTA and SOPA, the US Congress tries again to keep the new proposed law secret. This time it is the TPP, which, if enacted, could bury the new copyright provisions in secret treaty negotiations. As before, the legislators fear public scrutiny, while consulting with the industry.

“The leaked ‘Intellectual Property’ chapter of the Trans-Pacific Partnership agreement confirmed our worst fears: Big Content companies are pushing extreme copyright provisions in a secret trade deal that would put restrictive controls on the Internet. While Hollywood has had easy access to view and comment on draft texts—so it can get the provisions it wants—our own lawmakers have been mostly left out”. - EFF

PARTNERZY
mkidn
bn
senat
ndap
msz
dn
psfcu
nyc