Aleksander Radwański
Format MARC pochodzi z epoki komputerów mainframe i zapisu sekwencyjnego, ale przyjęty w nim sposób etykietowania sprawdza się do dziś. Architektura informacji to z kolei dziedzina kojarzona najczęściej z technologiami sieciowymi. MARC jest wciąż najlepszym formatem dla danych bibliograficznych i symbol współczesnej inżynierii informacyjnej – Google – indeksuje i wykorzystuje ogromne zasoby zapisane w tym formacie. Zastosowanie formatu MARC w katalogach bibliotecznych jest oczywiste, ale praktyczne wykorzystanie jego właściwości w dużej mierze zależy od jakości danych. Firma MOL, konsolidując katalogi biblioteczne, praktycznie zmierzyła się z problemami deduplikacji i ujednolicania danych bibliograficznych. W zakończonym już wdrożeniu w Książnicy Podlaskiej dokonano połączenia 39 baz bibliograficznych, tworzonych lokalnie. MOL opracował skuteczną metodę identyfikacji i deduplikacji opisów w oparciu o format MARC. W trwającym obecnie projekcie konsolidacji katalogów bibliotek publicznych Łodzi skala jest dwukrotnie większa. Dochodzi również dodatkowy aspekt – zastępowanie danych bibliograficznych niskiej jakości, opisami pobranymi z Biblioteki Narodowej. Prezentacja omawia doświadczenia firmy MOL i wnioski z nich płynące w kontekście stosowania formatu MARC.