Blog archiwistów i bibliotekarzy Instytutu Piłsudskiego

Blog archiwistów i bibliotekarzy Instytutu Piłsudskiego

Czyli migracja z MAK do Koha

W sierpniu ubiegłego roku została podpisana umowa o współpracy Instytutu Józefa Piłsudskiego i Instytutu Naukowego w Nowym Jorku. Jej pierwszym owocem jest wspólny katalog zasobów bibliotecznych obu instytucji, który został uruchomiony w listopadzie 2012. W październiku ubiegłego roku podobna umowa została podpisana z Polską Fundacją Kulturalną w Clark, NJ, której biblioteka wkrótce rozpocznie dodawanie swojej kolekcji do naszego katalogu.  Wspólny katalog ma na celu ułatwić badaczom dostęp do zbiorów naszych instytucji tworząc jedno, docelowe narzędzie do przeszukiwania. Wspólny katalog powinien także usprawnić i przyśpieszyć sam proces katalogowania zasobów dzięki “współkatalogowaniu”, co jest szczególnie ważne w związku ze skromnymi środkami jakie nasze instytucje mogą przeznaczyć na ten cel. O ile nasze kolekcje nie są identyczne to jednak posiadają sporo duplikatów. Łatwo sobie wyobrazić sytuację, gdzie opisy bibliograficzne stworzone przez katalogujących jednej instytucji, będą mogły być wykorzystane przez drugą, oszczędzając w ten sposób czas i wysiłek.

Tutaj chciałbym przedstawić techniczną stronę łączenia bazy zbiorów biblioteki Instytutu Józefa Piłsudskiego i Instytutu Naukowego. 

More Product Less Process

On czasu opublikowania przez Marka A. Greene and Dennisa Meissnera w 2005 wpływowego artykułu More Product, Less Process: Revamping Traditional Archival Processing[1], proponowane w tej pracy rozwiązania zdobywają sobie coraz większe powodzenie wśród archiwistów. Jest to zdumiewające o tyle, że archiwa, instytucje o długiej tradycji, powołują się w pracy raczej na tę tradycje niż na nowinki. Wydaje się jednak, że autorzy tej metodyki, zwanej już popularnie jako MPLP, trafili w dziesiątkę i spowodowali poważne przemyślenia procedur w wielu instytucjach.

Praca ta, dotycząca organizowania i opisywania archiwów, wychodzi z zauważenia zjawiska tworzenia się w archiwach rosnących zaległości w opracowywaniu nabytków. Zaczynając od wyczerpującego przeglądu literatury, autorzy wysłali (i opracowali) ankiety do dużej liczby archiwów (państwowych i prywatnych), do archiwistów, a także dokonali analizy projektów fundowanych przez Narodową Komisję Rekordów i Publikacji Historycznych w USA. Hipoteza roboczą, która została potwierdzona w trakcie badań, było stwierdzenie, że “stosowana powszechnie metodyka obróbki archiwów trwoni cenne środki, ponieważ archiwiści tracą zbyt wiele czasu na zadania które nie muszą być wykonane, albo nie muszą być wykonane w tym momencie”. Autorzy twierdzą, że przez uproszczenie procedur i odłożenie części prac na później, można w znaczący sposób przyspieszyć udostępnienie zasobów badaczom.

Katalogowanie i opisywanie zasobów archiwalnych, prowadzone tradycyjnie w księgach lub na kartach katalogowych, od dekady lub dwóch wchodzi w czas komputerów i internetu. Aby robić to właściwie, potrzebne są zasady pracy i odpowiedni program komputerowy do tych zasad się stosujący. Zasady są szczegółowo opisane w międzynarodowym standardzie ISAD(G) i jego narodowych wersjach (np. kanadyjskie RAD czy amerykańskie DACS). Formatem zapisu i transportu danych archiwalnych jest powszechnie już stosowany EAD.

Aby móc katalogować, potrzebny jest jeszcze dobry program komputerowy. Opiszemy tu rozwiązania Open Source, preferowane zarówno ze względu na cenę jak i na to, że zwykle posiadają one bardzo dużą bazę użytkowników i programistów, stale ulepszających produkt. Programy Otwartego Oprogramowania napisane specjalnie dla potrzeb archiwistów to Archivists’ Toolkit, ArchivesSpace i ICA-AtoM. Przy opisie zwrócimy uwagę na funkcjonalność, łatwość instalacji i obsługi, oraz możliwości importu i eksportu danych w EAD i w innych standardowych formatach.

W ostatnich dniach października odbyły się w Warszawie dwie konferencje naukowe: “Dokumenty Polskiego Państwa Podziemnego 1939-1945” oraz “Polonica bliżej kraju”. Konferencje nakładały się częściowo w czasie, pierwsza w środę i czwartek 24 i 25 października, druga też w czwartek, co spowodowało, że uczestnicy musieli się szybko przemieszczać z jednego do drugiego miejsca (z budynku PASTy na Zielnej 29 do “Przystanku Historia” na Marszałkowskiej 21). Jakkolwiek aspekt zawartości był w obu konferencjach różny (Państwo Podziemne z jednej strony a dziedzictwo audiowizualne z drugiej), przewodni temat był ten sam - rozproszenie zasobów archiwalnych i sposoby do nich dotarcia.

Obie konferencje były bardzo ciekawe i obie pokazywały zaskakujące aspekty rozproszonych archiwów. Prof. Władysław Stępniak mówił o podstawach prawnych “restytucji i przejmowania” archiwów. Takie okreslenia jak restytucja, rewindykacja, przejmowanie sugeruje jakąś przynależność archiwów. Określenie tego, do kogo one należą napotyka jednak na spore trudności. Zasada proveniencji czy pertynencji terytorialnej oznacza, że archiwa powinny pozostać tam, gdzie zostały stworzone. Nawet, jeśli nastapiło przesunięcie granic. Wszystko byłoby proste, gdyby nie dochodziła zasada przynaleznościo zespołowej, która wymaga poszanowania całości i układu zespołu czy kolekcji już stworzonej. Dochodzi do tego zasada pertynencji funkcjonalnej, i nowo wypracowywana zasada wspólnego dziedzictwa archiwalnego. Łatwo sobie wyobrazić, jak skomplikowane są te tematy, zastanawiając się do kogo należeć powinny dziś archiwa powstałe na Kresach Wschodnich oraz na ziemiach Zachodnich i Północnych Polski.

111Papież Honoriusz III deklaruje trywialność skargi Templariuszy na Krzyżaków, dotyczący noszenia przez Krzyżaków podobnych białych płaszczy.

Materiały archiwalne są rozproszone po całym świecie. Mamy szczęście, jeśli zostały zgromadzone w archwach, wtedy badacz ma do zwiedzania tylko kilka miejsc na świecie. Na konferencji Dokumenty Polskiego Państwa Podziemnego (Warszawa 24-25 października 2012) usłyszymy o dokumentach dotyczących tego dość wąskiego zakresu czasowego, które znajdują się z Londynie, Nowym Jorku, Stamford, w Niemczech, Ameryce Łacińskiej, Warszawie, Radomiu, Rzeszowie itp. Wiele cennych dokumentów które nie trafiły do archiwów  jest dużo bardziej rozproszonych.

Dlatego tez nieslychanie cenne są inicjatywy wirtualnego scalania archiwów. Pisałem już o podobnej inicjatywie, tu chciałbym zwrócić uwagę na Monasterium, wirtualne archiwum dokumentów z okresu średniowiecza, Monasterium posiada w tej chwili ponad 250 tysięcy dokumentów (materiałow żródłowych) z 100 archiwów europejskich. Dokumenty dostępne sa w oryginale (jako skany wysokiej rozdzielczości), sa zindeksowane i opisane. Wiele z nich jest również dostępne w postaci tekstu, a więc można nie tylko podziwiać oryginał, ale równiez pracować nad jego zawartością.

Aby dobrze opisać i dokonać transkrypcji średniowiecznych tekstów, autorzy Monasterium stworzyli nowy język (standard) opisu, zwany CEI - Charters Encoding Initiative. Jest on oparty o i rozszerza standard TEI (Text Encoding Initiative) i jest przykładem bardzo pozytywnego trendu rozbudowywania istniejących standardów zamiast tworzenia nowych. W ten sposób TEI zawierac będzie w sobie CEI jako szczególny przypadek.

Polecamy zajrzenie do Monasterium. Autorzy zapraszają także do współpracy.

Marek Zieliński, 18 października 2012

Może Cię też zainteresować:

Jednym z najważniejszych zadań systemu zarządzania aktami (RM) jest dokumentowanie działalności instytucji czy organizacji, tworzenie zapisanej i niezmienialnej pamięci jej działalności i historii, zapisywanie dowodów które mogą być użyte (np. przez historyka lub sąd) z pewnością, że nie zostały one zmienione czy zafałszowane. W tym aspekcie MoReq2012 jest istotny również dla archiwów, których funkcja pokrywa się w dużym stopniu z tymi zadaniami.

Moduły MoReq2010

MoReq2010  - wymagania sytemu zarządzania aktami -  jest podzielone na moduły, które opisują różne działy albo funkcje oprogramowania. Moduły to jednocześnie serwisy, części oprogramowania które te funkcje spełniają. Niektóre rodzaje serwisów są  już w powszechnym użyciu w prawie każdym systemie wielo-użytkownikowym, niektóre są specyficzne dla MoReq.

Moduły obsługujące użytkowników to Grupy Użytkowników i modelowy Moduł Ról. Zadaniem modułu użytkowników jest zarządzanie użytkownikami i ich grupami, podobnie do istniejących użytkowników w systemach komputerowych, ale z konkretnymi ograniczeniami (np. nie wolno ponownie używać identyfikatorów itp.). Moduł ról opisuje role jakie moga przyjmować użytkownicy, i możliwości dostępu do przypisane tym rolom. Jan Kowalski może więc na przykład należeć do grupy Działu Handlowego, i posiadać rolę Administratora z prawami dodawania nowych użytkowników, ale tylko w tym dziale.

Moduły dotyczące dokumentów to serwis Klasyfikacji i serwis Rekordów. Nowością MoReq2010 jest stosowanie podwójnej, przenikającej się hierarchii klas (kategorii) i agregacji (teczek). Obie są hierarchiczne, i obie mają możliwość dziedziczenia. Każdy dokument musi należeć do jednej i tylko jednej klasy, i jednej i tylko jednej agregacji, ale duplikaty dokumentów mogą się znajdować w różnych agregacjach, i należeć do różnych klas. Klasy mają określać kontekst biznesowy, a agregacje dziedziczenie metadanych, praw dostępu a także klas. Jeśli to brzmi skomplikowanie to prawdopodobnie jest, ale daje bardzo wiele możliwości dopasowywania systemu do struktury organizacji.

W dniach 26-28 września 2012 odbyła się w Vancouver konferencja UNESCO “The Memory of the World in the Digital age: Digitization and Preservation”. Wielka konferencja z delegatami z całego świata była częscią obchodów 20-lecia programu UNESCO “Pamięć Świata”. Poprzednia konferencja tego programu odbyła sie w maju 2011 w Warszawie (patrz ciekawy blog na temat tej konferencji).

Temat konferencji - Pamięć Świata w Wieku Cyfrowym - odzwierciedla coraz bardziej rosnące zrozumienie faktu, że na skutek zmian w funkcjonowanu cywilizacji spowodowanych przez komputeryzacje i Internet, rola archiwów i bibliotek zmienia się nieodwracalnie. Model, który działał od czasu Biblioteki Alleksandryjskiej do zaledwie 20 lat temu, ulega gwałtownycm zmianom; konferencja próbuje poszerzyć dyskusję nad tymi zmianiami. Jednym mówców na sesji plenarchej był legendarny Vint Cerf, jeden z ojców Internetu.

Przy szesciu równoległych sesjach w każdym segmencie nawet będąc na konferencji trudno by było opanowac cały materiał (razem odbyły się  4 sesje plenarne, 34 sesje wykładowe i 11 warsztatów i pokazów, nie wspominając o wydarzeniach przed- i pokonferencyjnych). Zakres tematyki może zilustrowac kilka wybranych tematów sesji wykładowych:

  • Misja CODATA: Zachowanie informacji naukowej dla przyszłości
  • Strategie budowania repozytoriów cyfrowych
  • Własność intelektualna a ochrona tradycyjnej wiedzy
  • Metadane i formaty dla digitalizacji i cyfrowego zachowania
  • Digitalizacja w małej i dużej skali: wspólny model konceptualny
  • Zachowanie tradycji i sztuki scenicznej w postaci cyfrowej

Organizatorzy konferencji obiecują, że nagrania referatów pojawią się wkrótce na stronie konferencji. Jeśli takie nagrania się pojawią, postaram się poinformować czytelników

Marek Zieliński, 1 października 2012

Może Cię też zainteresować:

{plusone}

PARTNERZY
mkidn
bn
senat
ndap
msz
dn
psfcu
nyc