Blog archiwistów i bibliotekarzy Instytutu Piłsudskiego

Blog archiwistów i bibliotekarzy Instytutu Piłsudskiego

Czym jest a czym nie jest MoReq2010

moreq2010MoReq2010 jest najnowszym europejskim standardem opisującym wymagania systemu zarządzania aktami (RM = record management).

Dlaczego powinniśmy się w ogole interesować RM? Zarządzanie aktami dotyczy przede wszystkim instytucji czy firm które takie akta wytwarzają. Pozornie dobry system szafek na dokumenty, segregatorów, ksiąg korespondencji przychodzącej i wychodzącej powinien być całkowicie wystarczający. Stare biurokracje o tradycji sięgającej Bizancjum (a do takich należy w dużym stopniu Polska) posiadają takie zwyczaje w nadmiarze. Ale system o tak starej tradycji jest trudny do zmodyfikowania, a czas dokumentów elektronicznych, łatwości kopiowania informacji, rozproszenia geograficznego firm itp. tworzy wyzwania którym trudno jest już dziś sprostać. Archiwa, jak każe tradycja, wcześniej lub później dostaną  takie kolekcje dokumentów generowanych masowo wewnątrz ministerstw, ambasad, firm i instytucji użyteczności publicznej, i powinny być żywotnie zainteresowane, w jakim stanie i w jakiej formie te dokumenty będą przekazane.

Zarządzanie dokumentami (RM) zajmuje się konceptualnie prostymi problemami. Dla ułatwienia można sobie wyobrazić zapis narady prezydenckiej w Białym Domu albo zapis wizyty i badania u lekarza. Dokument trzeba przechować i opublikować, aby był dostępny dla jego użytkowników. Trzeba go zaklasyfikować do właściwej kategorii (szuflady, teczki, przegródki). Trzeba określić, kto w ogóle może go czytać, a kto (i kiedy) może go zmodyfikować. Czy można robić kopie, a jeśli tak, to gdzie będą przechowywane. Trzeba zapisać historię tego dokumentu. Trzeba określić, jaki jest jego czas życia, i jaki będzie jego los po tego czasu upłynięciu: dokument może być np. usunięty, poszatkowany albo przekazany archiwum.

Część 2

Wszystkie nowoczesne standardy zapisu informacji używają jednego języka zapisu, XML. Jest to język uniwersalny, prosty i łatwy do opanowania, a jednoczesnie ma ogromną moc ekspresji. Adres Instytutu możemy w XML zapisac płasko:

<adres>180 Second Avenue, New York, NY</adres>

albo hierarchicznie:

<galaktyka nazwa="Droga Mleczna">
   <gwiazda nazwa="Sol">
     <planeta nazwa="Mars"/>
     <planeta nazwa="Ziemia">
       <kontynent nazwa="Ameryka Północna">
         <panstwo nazwa="USA">
           <stan nazwa="Nowy Jork"> [...] itp.
           </stan>
         </panstwo>
       </kontynent>
     </planeta>
   </gwiazda>
</galaktyka>


EAD jest standardem (wyrażanym w XML) opracowanym dla archiwów i jest bardzo typowym przykładem opisu hierarchicznego. Jest odbiciem typowej organizacji archiwum, gdzie kolekcja (zespół archiwalny, fonds) może byc podzielona na pod-zespoły (subfonds), te z kolei na serie, podserie, grupy, podgrupy itp. Często organizacja taka nie jest sprawą wyboru, gdy na przykłład oryginalny twórca danej kolekcji tak ją właśnie uporządkował. Zasada szacunku dla oryginalnego twórcy kolekcji (respect de fonds) wymaga pozostawienia w miarę możności oryginalnej organizacji.

Instytut Piłsudskiego od kilku lat współpracuje z wielu lat z Metropolitan Library Council (METRO, www.metro.org), organizacją skupiającą 250 bibliotek zatrudniających 8000 tysięcy bibliotekarzy i archiwistów w Nowym Jorku i okolicy. Celem działania METRO jest szeroko rozumiana pomoc w dziedzinie wsparcia technologicznego, szkolenia kadr, pozyskiwania grantów oraz stworzenie możliwości wzajemnego poznania się i współdziałania społeczności skupiającej specjalistów z zakresu informacji naukowej.

METRO jest organizacją sponsorowaną przez stan Nowy Jork, każdego roku w swych przestronnych pomieszczeniach organizuje ponad 70 różnego rodzaju szkoleń z zakresu digitalizacji, opracowania zbiorów i najnowszych trendów w dziedzinie informacji naukowej.

Pracownicy i wolontariusze Instytutu wielokrotnie uczestniczyli w szkoleniach, nawiązali kontakty z pracownikami innych a działających podobnie instytucji. Szczególnie twórcze było spotkanie, które odbyło się 3 kwietnia 2012 pt. Basic introduction to Encoded Archival Description EAD, które znacznie ułatwiło zrozumienie tego ważnego dla archiwistów standardu. Jesienią 2012 planujemy udział w kolejnych zajęciach dotyczących ważnego programu z grupy Open Source - Archivist’s Toolkit, który od niedawna stosujemy w opracowaniu zbiorów archiwalnych.

Wsparcie jakim służy METRO jest bardzo ważne dla działalności Instytutu, daje możliwość śledzenia postępu technologicznego, edukacji oraz poprzez działanie w dużej grupie możliwość realnego wpływu na ważne dla społeczności biblioteczno-archiwalnej rozporządzenia i uchwały stanowe.

Iwona Korga, 7 sierpnia 2012

Może Cię też zainteresować:

Część 1

Przy planowaniu procedur i etapów pracy projektu digitalizacji zasobów archiwalnych Instytutu zastanawialiśmy się nad tym, jakiego standardu użyć przy opisie digitalizowanych dokumentów. Po wykonaniu skanu czyli zapisu obrazu dokumentu, niezbędnym jest jego opisanie tak, aby możliwe było znalezienie interesującej czytelnika informacji. Idealnie byłoby dokonać transkrypcji całości materiału, ale przy dużej ilości ręcznie pisanych dokumentów były to tylko marzenia. Proces  znajdywania i organizowania informacji o tekście, zdjęciu itp. czyli tak zwanych metadanych (danych o danych) oraz zapisywania ich w odpowiedniej bazie danych jest najważniejszyma (i najbardziej czasochłonnym) etapem digitalzacji.

Jest wiele schematów i standardów zapisu i transportu metadanych, więcej niż można łatwo ogarnąć ciekawie brzmiących skrótów: DC, EAD, MARC, MODS, TEI, AACR2, CCO, CDWA, DACS, FOAF, ISAD(G), METS, OAI-PMH, OAIS, OWL, POWDER, PREMIS, RDA, RDF, SWORD itp. Nawet ograniczając się do standartów opisu metadanych zawartości dokumentów, mieliśmy do wyboru DC, EAD, MARC i TEI. Przy testach pojawił się problem hierarchizacji informacji, który w zasadzie ciągle jest z nami, mimo prób jego oswojenia.

Otwarty niedawno Europejski Portal Archiwów, Archives Portal Europe (APE), zrzesza 63 archiwów z 15 krajów europejskich. Archiwa wnoszą swój wkład w postaci elektronicznie zakodowanych pomocy archiwalnych. Zaletą systemu jest wspólna wyszukiwarka, która pozwala na przeszukiwanie pomocy w całym zespolonym zasobie. Przydatna jest też przeglądarka po jednostkach archiwalnych, pozwalająca na oglądanie sąsiednich zapisów tego samego poziomu, oraz przesuwanie się z poziomu na poziom.

Intrygujące jest użycie standardu EAD do zapisu informacji. EAD, w połączeniu z ISAD(G)  jest bardzo elastycznym systemem kodowania informacji archiwalnych, ale na skutek tej elastyczności występuje nadmierna różnorodność w schemacie zapisu. Prawie każdą informację można zapisać na kilka sposobów, co w kapitalny sposób utrudnia interoperatywność. APE opracował usztywnioną wersję EAD oraz przygotował zestaw narzędzi do konwersji różnych ‘smaków’ EAD w jednolity system, który może byc użyty do wyświetlania informacji i do jej łączenia. Takie narzędzie i standard może się stać podstawą interoperacyjnej wersji EAD.

Głębokość zasięgu APE kończy się na opisie zasobów, który jest tak wyczerpujący jakim go stworzyły archiwa, ale nie daje dostępu do dokumentów. Następnym etapem pracy badacza jest wizyta w odnalezionym archiwum lub podróż po róznych archiwach  i studiowanie oryginałow lub mikrofilmów.  Polska jest reprezentowana w APE przez 10 archiwów, które umieściły tam część swoich katalogów.

Marek Zieliński, 30 czerwca 2012

Może Cię też zainteresować

Crowdsourcing z użyciem Google Docs

slaska-mala-260Fragment mapy z okresu Powstań śląskich z archiwów Instutytu Józefa Piłsudskiego, zespół 8 jedn. 164.

Przy pracy nad kolekcją  “Powstania Śląskie” w archiwum Instytutu pojawił się dylemat. Archiwa są już zmikrofilmowane a mikrofilmy zeskanowane, ale z ponad 800 jednostek (teczek) udostępnione zostało tylko 50. Wynika to z braku metadanych, szczególnie danych o powstańcach, którzy walczyli w trzech Powstaniach Śląskich w latach 1919-1921. Brak finansowania powodował odsuwanie dokończenia projektu, gdyż nie umieliśmy wykorzystać pomocy wolontariuszy pracujących w domu. Co prawda istniały podobne projekty crowdsourcing, ale były one oparte na specjalnie napisanym oprogramowaniu i sporym finansowaniu projektu.

Wpadliśmy wtedy na pomysł, aby użyć gotowego, publicznie dostępnego systemu. Google Docs (teraz Google Drive) wydawał się być użyteczny dla tego projektu. Wymagało to dopasowania naszych wymagań do możliwości systemu, i narażało nas na wpadkę jeśliby Google w sposób istotny zmienił format dokumentów (co już się raz zdarzyło). Ale postanowiliśmy zaryzykować.

Crowdsourcing jest relatywnie nowym pomysłem, polegającym na powierzeniu jakiegoś zadania, tradycyjnie wykonywanego przez pracowników organizacji, grupie osób czy społeczności (crowd = tłum) poza tą organizacją. Różnica w stosunku do techniki outsourcing polega na tym, że zadanie powierzone jest nieznanej grupie jako publiczny apel, a nie jakiemuś konkretnemu ciału. Crowdsourcing, dzięki technologii Web. 2.0, uważany jest za narzędzie z dużymi perspektywami tak w przypadku komercyjnych organizacji jak i non-profit, jakimi są biblioteki i archiwa. Najbardziej znanym przykładem wykorzystania techniki crowdsourcing jest Wikipedia, czyli cyfrowa, powszechnie dostępna encyklopedia, tworzona przez internetowych wolontariuszy. Projekt ten w bardzo krótkim czasie i przy minimalnym koszcie doprowadził do powstania blisko 4 milionów artykułów w przypadku anlogjęzycznej wersji!

Biblioteki i archiwa wydają się być naturalnie predysponowane do wykorzystania metody crowdsourcing. Ograniczone i często skromne budżety, jak i niewielka ilość pracowników często stają na przeszkodzie w wykonaniu projektów, zwłaszcza tych związanych z digitalizacją. Z drugiej strony biblioteki i archiwa cieszą się dużym zaufaniem i poparciem publiki, które to może zaowocować zaangażowaniem i silną motywacją wolontariuszy. Jak sugeruje Ross Holley w swoim artykule “Crowdsourcing: How and Why Should Libraries Do it?”, satysfakcja z wykonywania pracy, która przynosi dobro dla ogółu jest ważnym motorem sukcesu organizacji kulturalnych podejmujących ideę crowdsourcing.

PARTNERZY
mkidn
bn
senat
ndap
msz
dn
psfcu
nyc