linked-data280Fragment diagramu Linked Data z portalu LinkedData.org

Linked Data jest stosunkowo nowym zjawiskiem w sieci WWW, ideą dostępu do danych strukturalnych. Co to są dane strukturalne? WWW jest uniwersalnym nośnikiem informacji czytelnej dla człowieka - wszystkie strony internetowe, artykuły, aplikacje dają nam informacje, które możemy odczytać i zinterpretować, na przykład pytanie: "kiedy przyjedzie następny tramwaj?” i odpowiedź; “za 10 minut". Takie pytanie i odpowiedź nie są jednak łatwe do odczytania przez komputery, które potrzebują informacji w ścisłej strukturze: (“Numer przystanku: 4398, linia tramwajowa: 11, odległość od przystanku: 0.8 km, itp.)

Informacja jest zwykle zapisana w bazach danych, które po wielu latach udoskonalania są bardzo wydajne w przechowywaniu i wyszukiwaniu danych, ale fatalne w wymianie informacji. Każda baza danych zawiera wiele kolumn, nazywanych raczej dowolnie i tylko lokalny system komputerowy umie z niej wyciągnąć dane. Nowy koncept, Linked Data, przybywa tutaj z pomocą. Schemat metadanych Linked Data, o nazwie  RDF (Resource Description Framework, struktura opisu zasobów), wymaga, aby dane nie były prezentowane w trudnych do odcyfrowania tabelach, ale w prostych zdaniach, składający się z podmiotu, orzeczenia i dopełnienia. Zamiast wymyślonych nazw kolumn używamy nazw standardowych, a zamiast nazwy podmiotu używamy jego identyfikator URI (Universal Resource Identifier, uniwersalny identyfikator zasobu). Przykładowo, trywialna dla człowieka informacja o tytule tego blogu (przecież możemy przeczytać go powyżej, prawda?) zamienia się w zdanie albo “trójkę” w slangu RDF [1) www.pilsudski.org/portal/pl/nowosci/blog/484, 2)  dc:title, 3) "Linked Data cz. 2: gdzie są dane?"]. Pierwsza część to adres URI jednoznacznie wskazujący na ten artykuł, druga to "tytuł” w konkretnym standardzie metadanych (Dublin Core), a trzecia część to tekst tytułu.

Więcej o szczegółach Linked Data i RDF znajdziecie w pierwszym artykule z tej serii,: "Wstęp do Linked Data", i nie będę ich tu powtarzać. W tym blogu chciałbym skupić się na konkretnych źródłach danych dostępnych obecnie na stronach WWW, nad tym jak je znaleźć i co one zawierają. W procesie digitalizacji archiwów często poszukujemy odnośnika do nazw, miejsc, organizacji lub zdarzeń, który byłby stabilny i dostępny. Jeśli pojawia się nazwisko, np. Karol Anders, czy możemy znaleźć źródło, które będzie jednoznacznie wskazywać na rekord tej osoby? Z oczywistych powodów będziemy omawiać tylko te źródła danych, które są publicznie dostępne. Link, który opublikujemy na stronie internetowej, otwartej dla każdego czytelnika, nie może prowadzić do zasobu, który nie jest dostępny dla tego czytelnika. Będziemy analizować nie wszystkie Linked Data, a otwarte Linked Open Data. Ilustracja powyżej pokazuje mały fragment ogromnej sieci Linked Open Data, poniżej kilka wybranych  źródeł z wyszczególnieniem tych użytecznych dla archiwisty i bibliotekarza.

W bieżącym roku Instytut  Józefa Piłsudskiego w Ameryce przyznał nagrody w pięciu dziedzinach wybitnym osobom w uznaniu ich osiągnięć:

jan czekajewskiJózef Pilsudski Achievement and Leadership Award

– Jan Czekajewski

Jan Czekajewski jest  uczonym i specjalistą w dziedzinie  badawczego sprzętu medycznego i właścicielem firmy “Columbus Instruments” eksportującej około siedemdziesiąt różnych przyrządów naukowych do ponad pięćdziesięciu krajów świata. Jan Czekajewski działa w ośrodkach polonijnych: jest członkiem Polonia Technica i PIASA. Prowadzi  działalność publicystyczną w obronie dobrego imienia Polski i Polaków.

krzysztof szwagrzykWacław Jędrzejewicz History Medal

– Krzysztof Szwagrzyk

Doc. dr hab. Krzysztof Szwagrzyk, historyk,  naczelnik Biura Edukacji Publicznej IPN we Wrocławiu, jest badaczem komunistycznych struktur aparatu represji w Polsce i podziemia niepodległościowego w latach 1945 – 1956. Jest szefem grupy naukowej poszukującej na Łączce na cmentarzu powązkowskim szczątków ofiar reżimu komunistycznego.

tadeusz puaskiJoseph Conrad-Korzeniowski Literature Medal

– Tadeusz Płużański

Tadeusz Płużański jest autorem książki „Bestie: Mordercy Polaków” zawierającej zapis reporterskiego śledztwa dotyczącego funkcjonariuszy stalinowskich wydających sądowe wyroki po wojnie. Publikuje w szeregu czasopismach. Jest szefem działu opinie w „Super Expresie”.

 

 

tadeusz-massalski

Marie Skłodowska – Curie Science Medal 

- Tadeusz Massalski

Profesor Tadeusz Massalski jest wybitnym naukowcem w dziedzinie fizyki metali, profesorem emerytowanym w Carnegie Mellon University. Otrzymał tytuł doctor honoris causa  Politechnki Warszawskiej w 1973 r. i Politechniki w Turynie w 2011 r.

 

janusz skowronIgnacy Paderewski Art and Music Medal

– Janusz Skowron

Janusz Skowron jest artystą uprawiający malarstwo, rysunek i grafikę. Brał udział w ponad 100 wystawach w USA, krajach Europy i Azji. Mieszka w Nowym Jorku. Jest członkiem szeregu organizacji związanych ze sztuką. Organizuje programy dla starszych Polaków mieszkających w Nowym Jorku.

Gratulujemy !

Józef Piłsudski - ze zbiorów InstytutuNagrodą “Marshal Józef Piłsudski Leadership and Achievement Award” został wyróżniony Bogdan Chmielewski, dyrektor wykonawczy Polsko-Słowiańskiej Federalnej Unii Kredytowej. Przyznając tę nagrodę  Instytut Józefa Piłsudskiego w Ameryce docenia osiągnięcia Bogdana Chmielewskiego w dziedzinie polskiej bankowości w Stanach Zjednoczonych oraz w pomocy dla instytucji polonijnych.

 

 

Wacław Jędrzejewicz History Medal - projekt Jerzy KardasińskiNagrodę "Wacław Jędrzejewicz History Medal” Instytut przyznał profesorowi Wojciechowi Roszkowskiemu, historykowi i ekonomiście za wkład w badania historii Polski XX wieku oraz edukację historyczną polskiego młodego pokolenia.

 

 

Ignacy Paderewski Arts and Music Medal - projekt Kazimierz KardasińskiNagrodę “Ignacy Paderewski Arts and Music Medal” otrzymuje  Alina Czerniakowska, reżyser filmowy i dziennikarka telewizyjna za osiągnięcia w tworzeniu filmów dokumentujących reżim komunistyczny w PRL, biografie wybitnych polityków i patriotów polskich oraz ważne wydarzenia historyczne.

Uroczyste wręczenie nagród Instytutu Piłsudskiego odbędzie się  podczas dorocznej Gali Nagród Instytutu w dniu 30 października.

wschod-ziemi-280Wschód ziemi. W dolnej części odzyskane zdjęcie wysokiej jakości.

NASA opublikowało niedawno nowo odzyskane zdjęcia z sond księżycowych, wysyłanych  w latach 1966-67 w ramach programu "Lunar Orbiter". Różnica jakości pomiędzy starymi, opublikowanymi zdjęciami i nowym materiałem jest uderzająca. Historia uratowania materiału i odtworzenia wysokiej jakości obrazów jest pouczająca, a zaczyna się od roku 1986, kiedy to archiwistka Jet Propulsion Laboratory (JPL) Nancy Evans zdecydowała, że nie może, w dobrej wierze, zwyczajnie wyrzucić starego materiału.

Sondy wyposażone były kamery wysokiej jakości, z podwójnymi obiektywami, i wykonywały duże ilości zdjęć na taśmie 70 mm. Taśmy były potem wywoływane na pokładzie sondy, zdjęcia były skanowane i wysyłane na ziemię. Modulowany sygnał z sondy, był zapisywany na taśmę magnetyczną, wraz z komentarzami operatorów. Następnie cała sonda (z oryginałami zdjęć) była bezceremonialnie rozbijana o powierzchnię księżyca. Taśmy magnetyczne były wykorzystane do wydrukowania dużych obrazów na papierze (wynajmowano stare kościoły aby rozwiesić ogromne arkusze), które używano do zidentyfikowania potencjalnych miejsc lądowania na księżycu. Następnie taśmy były załadowane do pudeł i zapomniane.

W 2005 dwaj entuzjaści z NASA, Keith Cowing i Dennis Wingo rozpoczęli prace nad odtworzeniem taśm, które w międzyczasie zmieniały kilkakrotnie miejsce przechowywania. Napęd taśm, bardzo rzadko spotykany Ampex FR-90, został zlokalizowany w szopie Nancy Evans, i grupa rozpoczęła pracę nad odzyskaniem obrazów. Wymagało to odbudowania napędu, odtworzenia nieistniejących już części i elektroniki, konwersji zmodulowanego sygnału na zapis cyfrowy, a następnie cierpliwego poskładania fragmentów zdjęć w jedno. Po odzyskaniu pierwszego zdjęcia ("Wschód ziemi", patrz wyżej), zespól, pracujący do tej pory ochotniczo, uzyskał finansowanie z NASA na kontynuowanie projektu. Od 2007 udało się odzyskać ok. 2000 zdjęć księżyca, ze zdumiewającymi szczegółami.

Epos o GilgameszuFragment  tabliczki Eposu o Gilgameszu z opisem potopu; zbiory British Museum via Wikimedia Commons

Dlaczego ważne są technologie cyfrowe, skanowanie i digitalizacja dokumentów i książek i innych obiektów? Jakie jest uzasadnienie ogromnego wysiłku przekształcania spuścizny kulturowej w postać cyfrową? Często słyszę takie pytania - od historyków, którzy preferują zapach i dotyk oryginalnych dokumentów lub archiwistów, którzy twierdzą, że mikrofilmy są wystarczająco dobre. Czy cyfryzacja to tylko moda, która wkrótce przejdzie, czy też ma to głębsze uzasadnienie?

“Cyfrowe” jest ważne - dla archiwów, bibliotek, muzeów (GLAM) oraz dla wszystkich producentów i konsumentów dóbr kultury. Omówimy tu trzy powody przechodzenia do cyfrowego przetwarzania informacji: Zabezpieczanie, Znajdywalność (discoverablity) i Dostęp.

Zabezpieczanie

Układ cyfrowy jest tylko jedną z wielu implementacji dyskretnych systemów przechowywania i obróbki informacji. Większość sygnałów, które docierają do naszych zmysłów, np. widok tęczy, symfonia lub zapach róży, można uznać za analogowe. Sygnał analogowy może przyjąć dowolną wartość, na przykład dźwięku lub koloru. Zakres jest zazwyczaj ograniczony jedynie możliwościami naszych zmysłów - nie widzimy podczerwieni, ani słyszymy ultradźwięków itp. Ale sygnał optyczny, po tym jak wpadnie do naszego oka lub kamery cyfrowej, nie jest dalej przetwarzany jako sygnał ciągły. Czujniki światła w siatkówce (czopki i pręciki) działają na zasadzie “wszystko albo nic”, podobnie dzieje się w kamerze gdzie każdy element czujnika rozkłada światło na ograniczoną liczbę poziomów.  Sygnał zostaje zmieniony w informację - wkraczamy tu w sferę dyskretności. W układzie dyskretnym tylko ograniczona, przeliczalna liczba stanów jest dozwolona, nie ma nic pomiędzy. W nowoczesnych komputerach cyfrowych podstawową jednostką informacyjną jest bit, który może posiąść tylko dwa stany (zwyczajowo zwane 0 i 1). Matematyczna teoria informacji, po raz pierwszy zaproponowana przez Claude E. Shannona, również używa jako jednostki binarnego bitu, z implikacją, że informacja w naturze swojej jest dyskretna. W komputerach, pojedyncze bity są zazwyczaj ułożone w grupy: 8 bitów w określonej kolejności nazywa się bajtem. W celu utrzymania ogólnego charakteru dyskusji, najmniejsza jednostkę systemu dyskretnego będziemy dalej nazywać znakiem, a ciąg znaków słowem.

W dalszym ciągu przyjrzymy się kilku systemom dyskretnym i na ich przykładzie tym ich cechom, które są są ważne w zabezpieczeniu i zachowaniu zasobów:  bezstratnemu kopiowaniu, czytelności maszynowej i korekcji błędów.

PARTNERZY
mkidn
bn
senat
ndap
msz
dn
psfcu
nyc