Cel/Teza: Niniejszy artykuł prezentuje wyniki badań nad oceną jakości metadanych w polskich bibliotekach cyfrowych oraz możliwości wykorzystania tych danych do masowego przetwarzania zawartości cyfrowych repozytoriów oraz wyodrębnienia współczesnych prac naukowych. Koncepcja/Metody badań: Badania zostały przeprowadzone hybrydowo – poprzez automatyczną analizę metodami inżynierii lingwistycznej oraz analizę ekspercką. Wyniki i wnioski: W wyniku przeprowadzonych badań zidentyfikowano szereg nieścisłości i nieprawidłowości występujących w metadanych dla dokumentów w polskich bibliotekach cyfrowych. Wskazano również propozycje poprawy tego stanu.
Zastosowanie praktyczne: Wnioski płynące z badań mogą przyczynić się do znaczącej poprawy jakości metadanych i umożliwienia wykorzystania metadanych jako wartościowego materiału badawczego. Oryginalność/Wartość poznawcza: Według najlepszej wiedzy autorów badania tego typu, zarówno w zakresie tematyki jaki i skali, nie były dotychczas prowadzone w Polsce.
Purpose/Thesis: The authors discussed the research on the quality of metadata in Polish digital libraries and the evaluation of the possibility to use metadata in automatic processing of digital repositories to detect current scientific documents. Approach/Methods: The research was conducted in a hybrid way: automatic NLP analysis and expert analysis. Results and conclusions: The result of the research in question is the identification of the set of failures and misstatements in the metadata of digital objects available in Polish digital libraries. Practical implications: The improvements to the current metadata state were proposed. The results and conclusions of this research may contribute to the improvement of the quality of metadata and open the possibility of using metadata as valuable research data. Originality/Value: To the authors’ best knowledge, there is not any similar research in Poland as for the scope and scale.