Users’ requirements formulated in reference to quality and functionality of digital documents are constantly growing. Whereas in the first, pioneering projects of digital collections it was sufficient to have access to digital image of pages of a given document, at present creators of digital documents are expected to fit them with advanced tools of edition and text analysis, as well as ensuring their searchability. A chance to meet those requirements is, on the one hand, scanning documents with the use of optical character recognition and, on the other hand, subjecting the digital texts to the process of transcription using special programming tools. The article presents the possibilities of selected solutions in this area, pointing to possible areas of their use, and outlines the potential advantages and disadvantages of their functionality.
Wymagania użytkowników formułowane w odniesieniu do jakości i funkcjonalności dokumentów cyfrowych stale rosną. O ile w pierwszych, pionierskich projektach kolekcji cyfrowych wystarczał dostęp do cyfrowego obrazu stron danego dokumentu, to obecnie od twórców dokumentów elektronicznych oczekuje się wyposażania ich w zaawansowane możliwości edycji i analizy tekstu oraz zapewniania ich przeszukiwalności. Szansą na spełnienie tych wymagań jest z jednej strony skanowanie obiektów z techniką optycznego rozpoznawania pisma, z drugiej – poddawanie dygitalizatów procesowi transkrypcji za pomocą specjalnych narzędzi programistycznych. Artykuł prezentuje możliwości wybranych rozwiązań w tym zakresie, wskazuje możliwe obszary ich zastosowań oraz nakreśla potencjalne zalety i wady w ich funkcjonalności.