Od kilku lat Instytut Piłsudskiego w Ameryce prowadzi ważny projekt digitalizacji zasobów archiwalnych. W naszym posiadaniu jest ponad 1.5 miliona stron unikalnych dokumentów dotyczących najnowszej historii Polski od 1863 roku do chwili obecnej. Są to teksty rozkazów, tajne dokumenty wojskowe, korespondencja, listy i wspomnienia, zdjęcia i wiele innych materiałow dokumentujących historię Polski i Polaków na świecie. Zbiory te są przez nas systematycznie skanowane i opisywane, a następnie udostępniane na naszej stronie internetowej Archiwów online. Pozwala to uchronić je przed zniszczeniem (papier, jak wiadomo, ma określony czas życia) i przed zapomnieniem. Proces ten jest pracochłonny, wymaga sprzętu i umiejętności.

Od kilku lat, instytucje rządowe w Polsce dofinasowywały ten ważny dla zachowania dziedzictwa narodowego program. W tym roku pomoc ta niespodziewanie się urwała.

Nasza sytuacja stała się krytyczna. Nie chcielibyśmy przerywać pracy, z której wyników już w tej chwili korzysta 20 tysięcy badaczy historii rocznie. Nie chcielibysmy przerywać działań, które zabezpieczają przed rozpadem niepowtarzalną dokumentację historyczną. Dlatego też zwracamy się o pomoc finansową do Państwa: użytkowników strony Online, czytelników naszych biuletynów e-mailowych, przyjaciół i sympatyków, członków Instytutu. Apelujemy do wszystkich, którzy doceniają ważność ocalenia, zabezpieczenia i udostępniania cennych zasobów archiwalnych, które są w posiadaniu Instytutu.

Każda kwota w tym trudnym dla nas okresie jest ważna. Wpłaty można dokonać online na naszej stronie, używając karty kredytowej albo przelewu bankowego w Polsce. Przyjmujemy też czeki wysłane na adres Instytutu, 180 Second Avenue, New York, NY 10003, wystawione na Pilsudski Institute. 

Z góry bardzo serdecznie dziękujemy!

{plusone}

Na gorące dni lżejszy temat. Chociaż może niekoniecznie lżejszy, a na pewno gorący. W ostatnim okresie dostawałem całą serię emaili od znajomych, wszystkich z kontami w yahoo. Emaile wygladały dość podobnie - “hej, zobacz co ciekawego znalazłem” i link do strony internetowej. Jeśli tekst jest po angielsku, a Twój korespondent używa polskiego, łatwo jest od razu być podejrzliwym, ale nie zawsze tak jest. Link prowadzić może do strony, która zainfekuje Twój komputer, może nawet próbowac ukraść hasła, które używasz. To zjawisko ma juz swoja nazwę (Spear Phishing - łowienie z ostrym narzędziem?).

Mam też znajomych którzy popadają w drugie ekstremum i unikają jakiejkolwiek obecności w sieci - nie zapisują sie do społeczności, nie odpowiadają na emaile (albo nawet nie używają komputera, co jest już ekstremizmem konserwatywności). Ludzie Ci wylewają dziecko z kąpielą, gdyż obecność w sieci ma swoje autentyczne zalety, co jest widoczne szczególne mocno wtedy kiedy jak my jesteśmy daleko od bliskich sobie ludzi (lub na odwrót, to bliscy czy rodzina wyjechali daleko).

Zdarza mi się też od czasu do czasu zajmować się czyimś komputerem lub laptopem całkowicie opanowanym przez wirusy. Zwykle wygląda to tak, że komputer chodzi bardzo wolno, a jakakolwiek próba połaczenia ze stroną internetową powoduje przekierowanie na inną stronę (prawdopodobnie jeszcze bardziej zawirusioną). W takim przypadku najlepszym rozwiązaniem jest skopiowanie cennych materiałów (a następnie przepuszczenie plików przez dobry program antywirusowy) i kompletne sformatowanie twardego dysku.

Zdarza się też dość często, że poczta jest odrzucona przez serwer odbiorcy (ze słabą wymówką). Ten problem jest o tyle skomplikowany, że widzi go tylko nadawca (odbiorca zwykle odpowiada “przecież do mnie poczta zawsze dochodzi”...) a naprawić go może tylko odbiorca. 

Jak z tym wszystkim sobie poradzić? Nie ma w tym żadnej wielkiej magii, wystarczy zdrowy rozsądek. Poniżej kilka uwag z własnego doświadczenia:

david David by Michelangelo; dithered by User:Gerbrant using own software (cropped from Image:Dithering algorithms.png) [Public domain], via Wikimedia Commons

Niezbyt dawno, w czasie rozmowy z archiwistą z Londynu, mieliśmy okazje sprzeczać się na temat dpi plików cyfrowych. Wydawało mi się wtedy, że to zwykłe nieporozumienie, aż do chwili, kiedy inny archiwista z dużej instytucji w Polsce zaczął przekonywać mnie, że filmy 35 mm (negatywy) skanuje się z rozdzielczością 600 dpi. Ponieważ dałoby to skan podobny do rastrowych zdjęć w starych gazetach (używano tam procesu zwanego dithering) - patrz obraz po prawej,  byłem nieco zaskoczony. Dało to impuls do napisania tego blogu o dość powszechnej, jak widać,  mitologii dpi.  O skanie tego negatywu będzie nieco dalej, na początek wstęp o rozdzielczości.

Rozdzielczość

Rozdzielczość optyczna jest pojęciem o ustalonej reputacji pochodzącym z optyki, i w ogólności definiuje, dla danego systemu optycznego, jak daleko muszą być odległe od siebie dwa obiekty (np. dwie równoległe linie), aby dało się je odróżnić - jeśli są za blisko, zmyją się w jeden.  Rozdzielczość obiektywów zależy od jakości soczewek i od średnicy soczewki, rozdzielczość błony filmowej od wielkości ziarna itp. Rozdzielczość optyczną wyraża się często w liniach na centymetr. Przy digitalizacji rozdzielczość optyczna jest podstawym parametrem, gdyż określa, jak drobne szczegóły oryginału będą wiernie oddane w zapisie cyfrowym.

Rozpowszechnienie technik cyfrowych wprowadziło inną miarę, nazywaną też rozdzielczością, a określającą liczbę pikseli na które podzielony jest oryginalny obraz, w stosunku do jego fizycznego wymiaru, w czasie konwersji na plik cyfrowy. Dla odróżnienia od rozdzielczości optycznej nazywamy tę miarę Rozdzielczością pikselową (RP), i wyrażamy ją zwyczajowo w pikselach na cal, w skrócie DPI (litera D pochodzi od kropki, ‘dot’). Jeśli więc skanujemy obraz który ma szerokość 2 cali, i dzielimy ten wymiar na 600 elementów, zapisując jasność (kolor) w każdym, to otrzymujemy skan z RP = 300 dpi. Możemy zrobić tak samo w drugim wymiarze (wysokości) i jeśli użyjemy tej samej gęstości, co jest powszechne, to wysokość 3 cali podzielimy na 900 elementów, a piksele będą kwadratowe.

Jak się ma RP do rozdzielczości (optycznej) zależy wyłącznie od wielkości szczegółów na oryginale, które chcemy zachować. Dla ilustracji weźmy arkusz gazety, z notatką napisaną nonparelem. Font ten o wielkości 6 p. ma ok 2 mm  (0.08 cala) wysokości. Ile pikseli potrzeba aby móc ten tekst odczytać? Z ilustracji poniżej widać, że przy 20 pikselach daje się już literę z pewnym wysiłkiem odcyfrować, ale 50 pikseli pokaże ją lepiej. Daje to 250 dpi (= 20 / 0.08) minimum, 625 dpi (= 50 / 0.08) optymalnie.Resolution_illustration530

Ilustracja rozdzielczości (z Wikipedii).

RP jest prostym stosunkiem liczby pikseli N w jednym wymiarze do długości oryginału L. Długość wyrażamy tradycyjnie w calach, choć można łatwo przeliczyć na centymetry.

RP = N / L

Z powyższego wynika również wprost, że w odłączeniu od oryginału, plik cyfrowy obrazu nie posiada RP. Jest to szczególnie jasno widoczne dla zdjęć cyfrowych. Zdjęcie odzwierciedla świat trójwymiarowy na dwuwymiarowym czujniku optycznym, i choć znamy liczbę pikseli (reklamowaną w aparatach jako megapiksele), to nie istnieje szerokość czy wysokość oryginalnego obrazu, gdyż brak tego obrazu. Podobnie jest z każdym innym obrazem cyfrowym - RP odnosi się wyłącznie do procesu konwersji, jeśli skanowaliśmy płaski obiekt, nie do końcowego, przetworzonego obrazu.

Rastrowa grafika cyfrowa (np. zdjęcie w pliku tiff, jpg czy png), charakteryzuje się tylko wymiarami podanymi w pikselach. Plik może mieć 100 x 100 pikseli (kwadratowy) albo 3000 x 2000 pikseli (w proporcji 3:2). Rozmiar na dysku jest proporcjonalny do iloczynu tych dwóch wymiarów jeśli nie uległ kompresji (kompresja może zmniejszyć rozmiar wielokrotnie). Rozdzielczość obrazu albo optyczna zależy tylko od tego, jak drobne szczegóły są w tym obrazie zawarte, albo ile pikseli jest użyte dla zobrazowania najmniejszego szczegółu. Nieostre zdjęcie o wymiarze 3000 pikseli może mieć mniejszą rozdzielczość niż identyczne ale ostre zdjęcie o wymiarze 1000 pikseli.

Jakby w zaprzeczeniu stwierdzenia, że plik cyfrowy nie ma dpi, programy do obróbki obrazów rastrowych, takie jak photoshop, i zapisy w danych plików graficznych (np. EXIF) używają RP do charakteryzacji pliku. Dlaczego tak jest, dowiemy się w drugiej części, o magii 72.

Magia 72

W dobie druku na papierze istniała potrzeba ustalenia standardowych rozmiarów czcionek tak, aby drukarz mógł wybrać z kaszty zecerskiej odpowiedni rozmiar. W roku 1737 Perre Simon Fournier wprowadził standard, oparty na stopie francuskiej, wkrótce (w 1775) zamieniony przez François-Ambroise Didota na stopę paryską. System Pica, używany w USA oparty jest na stopie typograficznej (różnej od stopy anglosaskiej), gdzie jedna pica to 1/72 stopy (a w nowszym systemie Postscript 1 punkt to 1/72 cala). Pierwsze monitory komputerowe miały rozdzielczość 72 kropek na cal (dpi). Pozwalało to na wyświetlenie czcionek o wielkości 10 punktów lub większych, choć nawet przy 10 p. rozdzielczość, szczególnie małych liter, była słaba.

Manipulacja definicjami pochodzi już z tego okresu. Aby poprawić czytelność liter, Microsoft założył, ze rozdzielczość ekranu jest 96 dpi (bez zmiany rzeczywistej rozdzielczości ekranów) co pozwoliło na zwiększenie rozmiaru czcionek o ⅓. Od tej pory te same ekrany używane w PC były traktowane jako ekrany 96 dpi, a w Apple jako ekrany 72 dpi.

Ten trend naginania definicji pozostał do dziś w określaniu RP w plikach cyfrowych. Zdjęcie, które robię kamerą (Canon) o wielkości sensora 10 megapikseli ma wymiary 3888 na 2592 pikseli i zajmuje 28.8 MB pamięci a na dysku, a po kompresji ok 3.8 MB. Ale w danych EXIF zapisanych przez kamerę, jest również RP. Jaka ona jest? Można się już domyśleć, że jest to zupełnie fikcyjna wartość RP = 72 dpi. Po prostu wszystkie kamery propagują tę fikcję ustalając ten parametr na tradycyjnej magicznej wartości 72. Z równania RP = N / L można oczywiście obliczyć wymiar, i dla dłuższego boku tego obrazu otrzymujemy 1372 mm (o 15% większy od papieru format A0). Ponieważ równanie ma 3 zmienne, więc każde dwie wystarczą, aby obliczyć trzecią. np. N i L, albo RP i N, albo RP i L.

Jaki jest powód propagowania tej fikcji? Nie jest to jasne, ale podejrzewam, że przyzwyczajenia wymierają bardzo powoli, i tak, jak w Polsce używamy systemu Didota z 1775 opartego o stopę paryską, tak ludziom pracującym w grafice trudno się rozstać z mitem dpi.

Jaka jest więc odpowiedź na zagadkę z początku artykułu? Koledzy z dużej Instytucji w Polsce skanują używając fikcyjnej RP w wielkości 600 dpi, ustawiając jednocześnie “docelowy” fikcyjny rozmiar na 150 mm. Program posłusznie i po cichu przelicza, używając rozmiaru klatki negatywu (35 mm), że rozdzielczość powinna być 150/35 = 4.3 raza większa, i skanuje z RP = 2571 dpi. Ponieważ jest to rozdzielczość w granicach możliwości skanera, więc skaner nie musi robić interpolacji, i wynik jest bliski pożądanemu. Przypomina to trochę pytanie, z jaką szybkością jadę samochodem z Łodzi do Warszawy. Mój samochód jedzie z szybkością 5 milimetrów na godzinę i dojeżdża do Warszawy w 3 godziny. Jest to oczywiście możliwe, jeśli fikcyjna prędkość 5 mm/godz jest obliczana używając odległości z mapy Polski w skali 1 do miliona.

Skala ekranu

Być może RP ma jakiś sens przy określaniu, jak są one pokazywane na ekranie - w końcu ekran ma swoje fizyczne wymiary?  Ekrany produkowane dziś maja jednak różne wielkości i różną rozdzielczość. Szerokie ekrany komputerowe maja RP w granicach 95 - 110 dpi. Mniejsze ekrany tabletów - 220 do 260 dpi, nowe telefony komórkowe ponad 300 dpi. Rozdzielczość jest zwykle dopasowana do typowej odległości, z której się ogląda obraz. Co więcej, wszystkie obrazy są teraz skalowane przez oprogramowane tak, aby zmieściły się w jakimś prostokącie używanym do ich wyświetlania. Co więcej, po obróceniu obrazu o 90 stopni, zmienia się jego skala a więc ‘pozorne dpi’. Tak więc nawet i w tym przypadku powinniśmy się pożegnać z mitem dpi.

Podsumowanie

Obrazy w postaci cyfrowej należy charakteryzować wymiarem w pikselach (zwykle używa się dłyższego z dwóch wymiarów, albo wymiaru w poziomie). Typowe wymiary to 320 pikseli (nadaje sie do emailu), 640, 800 (rozmiary dawnych monitorów), 1200, 1600 itp. pikseli. Oryginalne zdjęcia robione aparatem cyfrowym mają 4000 pikseli lub więcej.

  • Rozdzielczość to możliwość rozróżnienia szczegółów w obrazie na który patrzymy. Rozdzielczość optyczna może być wyrażona w liczbie linii na centymetr.
  • Przy wykonywaniu skanu (lub fotografii cyfrowej) płaskiego obiektu, używamy parametru który określa, na ile pikseli podzieliliśmy dana długość (osobno w dwóch wymiarach). Parametr ten nazywa się rozdzielczością w pikselach (RP) i wyrażany jest w pikselach na cal, w skrócie dpi.
  • Formuła która określa RP to RP = N / L, gdzie N to liczba pikseli obrazu cyfrowego a L to wymiar oryginalnego obiektu.
  • Plik cyfrowy charakteryzuje się (m.in) wymiarami w pikselach w dwóch wymiarach, ale nie posiada RP ani L.
  • Opierając się na rozmiarze w pikselach N, można plikowi przypisać dowolną kombinację rozdzielczości pikselowej RP i wymiaru L, takich, że N = RP * L. Te pary N i L mogą być wybrane w sposób arbitralny.
  • Obrazy są zawsze skalowane na ekranie (komputera, tableta, telefonu itp.).
  • Przy używaniu oprogramowania graficznego należy zwracać szczególną uwagę na parametry RP, L i N, gdyż zmiana jednego z nich może prowadzić do niespodziewanych wyników, w zależności o tego, który z pozostałych program traktuje jako stałą.

Czytaj więcej

Marek Zieliński, 15 czerwca 2013

Może Cię też zainteresować:

{plusone}

5 czerwca 2013 r. na Zamku Królewskim w Warszawie i w siedzibie Stowarzyszenia Wspólnota Polska odbyły się uroczyste obchody 70 rocznicy powstania Instytutu Józefa Piłsudskiego w Ameryce. Gali patronował Minister Kultury i Dziedzictwa Narodowego Bogdan Zdrojewski. Piękna Wielka Sala Asamblowa mieszcząca około 350 osób była wypełniona po brzegi. Wśród zaproszonych gości byli przedstawiciele Rządu RP, instytucji rządowych, społecznych, twórczych i naukowych. Obecni byli przedstawiciele Instytutu Piłsudskiego w Londynie i Warszawie oraz wielu instytucji w Polsce, z którymi Instytut współpracuje. W uroczystości jubileuszowej uczestniczyło wielu przyjaciół i sympatyków Instytutu. Mistrzem ceremonii był Jan Kasprzyk, prezes Związku Piłsudczyków  oraz Komendant Marszu Szlakiem I Kompanii Kadrowej.

Instytut Pilsudskiego w Ameryce był licznie reprezentowany przez prezesa dr Magdę Kapuścińską, wiceprezesa dr Marka Zielińskiego, dyrektor wykonawczą dr Iwonę Korga, asystenta prezesa Jolantę Szczepkowską oraz członków Rady Dyrektorów dr Ewę Jędruch,  Piotra Kumelowskiego, Krzysztofa Langowskiego i Andrzeja Pelca. Była też obecna Danuta Cisek, były długoletni członek Rady i wiceprezes Instytutu.

Prezes Magda Kapuścińska powitała wszystkich zebranych. Potem zabrali głos goście honorowi: marszałek Senatu RP Bogdan Borusewicz, Dyrektor Generalny Ministerstwa Kultury i Dziedzictwa Narodowego Jacek Olbrycht, prezes Stowarzyszenia “Wspólnota Polska” Longin Komołowski oraz posłanka na Sejm RP Joanna Fabisiak. (Patrz fotoreportarz z obchodów).

Podczas uroczystości odbyło się wręczenie nagród Instytutu za wybitne osiągnięcia w dziedzinach: historii, literatury, nauki i sztuki. W tym roku medale otrzymali:

  • prof. Andrzej Chojnowski - Wacław Jędrzejewicz History Medal za badania nad najnowszą historią Polski,
  • prof. Mieczysław Mąkosza - Marie Skłodowska-Curie Science Medal za dokonania w dziedzinie chemii organicznej,
  • Zbigniew Gluza- Joseph Conrad Literature Medal za stworzenie i redakcję pisma historycznego KARTA,
  • Anna Seniuk - Ignacy Paderewski Arts and Music Medal za wieloletnią pracę aktorską i reżyserską.

Przedstawiciele Instytutu mieli także zaszczyt wręczyć medale Merentibus, przyznawane za szczególne zasługi położone dla rozwoju i działalności Instytutu Józefa Piłsudskiego w Ameryce, następującym osobom i instytucjom:

  • Jackowi Milerowi, dyrektorowi Departamentu Dziedzictwa Kulturowego Ministerstwa Kultury i Dziedzictwa Narodowego jako podziękowanie za szczególne wsparcie merytoryczne, przyjaźń i życzliwość,
  • Naczelnej Dyrekcji Archiwów Państwowych na ręce profesora Władysława Stępniaka,
  • Bibliotece Narodowej na ręce wicedyrektor Ewy Potrzebnickiej,
  • Instytutowi Pamięci Narodowej na ręce prezesa dr Łukasza Kamińskiego.

Wszyscy laureaci w pięknych słowach dziękowali za wyróżnienia. Szczególnie zachwyciła Anna Seniuk recytacją tekstu Zbigniewa Herberta.

Po wręczeniu nagród pokazano film o Instytucie, specjalnie przygotowany na jubileusz, którego twórcą jest znany reżyser mieszkający w Nowym Jorku, Tomasz Magierski.

Galę uświetnił recital młodego wybitnego pianisty Tomasza Rittera, sponsorowany przez Międzynarodową Fundację Muzyczną im. A. Rubinsteina.

Po południu, w siedzibie Stowarzyszenia "Wspólnota Polska", odbył się elegancki i smaczny poczęstunek przygotowany przez Hotel Zamek Pułtusk współpracujący z Domem Poloniii w Pułstusku oraz wygłoszone zostały wykłady

  • Wacław Jędrzejewicz (1893-1993). Historyk epoki Józefa Piłsudskiego - prof. dr hab. Rafał Stobiecki, Uniwersytet Łódzki
  • 70 lat Instytutu Piłsudskiego w Ameryce - dr Iwona Drąg - Korga, dyrektor wykonawczy IJP.

Na zakończenie goście oglądali pięknie opracowaną wystawę prezentowaną przed Domem Polonii, która powstała dzięki pomocy Stowarzyszenia "Wspólnota Polska".

Instytut Józefa Piłsudskiego w Ameryce dziękuje wszystkim tym, którzy przyczynili się do zorganizowania jubileuszu: Ministerstwu Spraw Zagranicznych za dofinansowanie, Stowarzyszeniu "Wspólnota Polska" za życzliwą  pomoc przy organizacji uroczystości, wydrukowanie materiałów, podanie pysznego posiłku i za przygotowanie wystawy. Dziękujemy prof. Andrzejowi Rottermundowi za udostępnienie pięknej sali Wielkiej Asamblowej, co przyczyniło się do tego, że obchody 70-lecia istnienia Instytutu Piłsudskiego w Ameryce w tak pięknej oprawie były wyjątkowe. Dziękujemy wszystkim wolontariuszom związanym z Instytutem i mieszkającym w Polsce, którzy licznie przybyli do Zamku i pomagali w szeregu ważnych czynnościach związanych z jubileuszem. Jesteśmy wdzięczni  wszystkim gościom, naszym przyjaciołom, sympatykom i znajomym za uczczenie uroczystości swoją obecnością.

{plusone}

Zegar katedry Satiago de Compostela

Zegar w katerdrze Santiago de Compostela. By Luis Miguel Bugallo Sánchez (Lmbuga Commons) [CC-BY-SA-2.5-es], via Wikimedia Commons

Nic tak dobrze nie ilustruje trudności, jakie napotyka tłumaczenie języka ludzkiego na język komputerowy, jak zapis jednostek czasu. Kalendarz którym się posługujemy pochodzi z roku 46 BC (wprowadzony przez Juliusza Cezara) z późniejszymi poprawkami z roku z 1582 (papieża Grzegorza VIII). Jest to najpopularniejszy, ale nie jedyny kalendarz, są inne w szerokim zastosowaniu jak Hijri, Hindu, kalendarz chiński czy hebrajski. W kalendarzu gregoriańskim podajemy dzień, miesiąc i rok, i wydaje nam się, że komputery powinny te ‘proste dane’ zawsze zrozumieć. Niestety, prostota ta jest bardzo pozorna.

Pierwszym problemem jest zapis daty. Po polsku zapisujemy 2 VI 1945 albo 11 września 1950 albo 3.4.23. Po angielsku zapisujemy 3/4/23 co może znaczyć 3 kwietnia 1923 roku albo 4 marca 2023 roku, zależnie od kraju i domyślnego wieku. Do niedawna komputer nie umiał zrobić nawet tak prostej konwersji, dziś próbuje odgadnąć język, którym się posługujemy, i czasem udaje się zgadnąć (a czasem nie) właściwą datę z zapisu.

Drugim problemem jest zapis czasu. W USA doba jest podzielona na godziny ‘ranne’ oznaczane AM i ‘popołudniowe’ - PM. Ale nikt nie chce się umawiać w poniedziałek o 12 AM ani we wtorek o 12 PM, gdyż te zapisy nie są jednoznaczne[1]. Zegar 24 godzinny usuwa przynajmniej tę niejednoznaczność (godzina 24:00 w poniedziałek  i 0:00 we wtorek to ten sam moment w czasie, ale należący do innego dnia).

Kolejny problem to zapis z okresloną dokładnością. Ktokolwiek pracował z arkuszem rozliczeniowym, nawet tym najnowszym, wie, że można zapisać dzień (bez określenia czasu) albo czas co do minuty. Możemy więc zapisać wydarzenie które ma miejsce danego dnia, albo w danej minucie, ale nie można zapisać roku (bez określenia miesiąca), roku i miesiąca (bez określenia tygodnia), roku, miesiąca i tygodnia (bez określenia dnia), ani też tylko godziny, godziny i minuty, itp. (inaczej niż przez opisanie tego słownie, co całkowicie zbija z tropu komputer).... i tak dalej.

PARTNERZY
mkidn
bn
senat
ndap
msz
dn
psfcu
nyc