MARC format in information architecture – MOL’s experience in integration of libraries’ metadata

.

Aleksander Radwański

MOL

The MARC format comes from the age of mainframe computers and sequential processing, but its labeling system works well up today. Information architecture is the knowledge branch often associated with Internet technologies. MARC is still the best format for bibliographic data and the symbol of modern information engineering – Google – indexes and process huge data resources saved in this format. Using the MARC format in library catalogs is obvious, but its effectiveness in real-life strongly depends from data quality. MOL, consolidating library catalogs, practically faced the problems of deduplication and unification of bibliographic data. In the just completed implementation, in Książnica Podlaska, 39 bibliographic databases created locally were joined. MOL has developed an effective method of identifying and deduplicating bibliographic descriptions based on the MARC format. In the ongoing project, consolidation of the public libraries catalogs in Łódź, the scale is twice big. There is also an additional aspect – substitution of low-quality bibliographic data by descriptions copied from the National Library. The presentation discusses experiences of MOL and conclusions from them in the MARC format context.

Format MARC pochodzi z epoki komputerów mainframe i zapisu sekwencyjnego, ale przyjęty w nim sposób etykietowania sprawdza się do dziś. Architektura informacji to z kolei dziedzina kojarzona najczęściej z technologiami sieciowymi. MARC jest wciąż najlepszym formatem dla danych bibliograficznych i symbol współczesnej inżynierii informacyjnej – Google – indeksuje i wykorzystuje ogromne zasoby zapisane w tym formacie. Zastosowanie formatu MARC w katalogach bibliotecznych jest oczywiste, ale praktyczne wykorzystanie jego właściwości w dużej mierze zależy od jakości danych. Firma MOL, konsolidując katalogi biblioteczne, praktycznie zmierzyła się z problemami deduplikacji i ujednolicania danych bibliograficznych. W zakończonym już wdrożeniu w Książnicy Podlaskiej dokonano połączenia 39 baz bibliograficznych, tworzonych lokalnie. MOL opracował skuteczną metodę identyfikacji i deduplikacji opisów w oparciu o format MARC. W trwającym obecnie projekcie konsolidacji katalogów bibliotek publicznych Łodzi skala jest dwukrotnie większa. Dochodzi również dodatkowy aspekt – zastępowanie danych bibliograficznych niskiej jakości, opisami pobranymi z Biblioteki Narodowej. Prezentacja omawia doświadczenia firmy MOL i wnioski z nich płynące w kontekście stosowania formatu MARC.

MARC, library catalogs, consolidation, deduplication, data quality MARC, katalogi biblioteczne, konsolidacja, deduplikacja, jakość danych

Scroll to Top
Skip to content