NFJP: Narodowy fotokorpus języka polskiego (2014–2020)

Forma dostępu: online, https://nfjp.pl

Wymogi techniczne: pełny dostęp bez konieczności założenia konta i logowania się.

Zawartość: baza zawiera, po pierwsze, udokumentowane w postaci fotocytatów słownictwo polskie, ekscerpowane z tekstów źródłowych, w tym także w dużej mierze prasowych, z lat 1901–2000, składające się na 250 tys. haseł słownikowych¹. Zgodnie z przyjętymi kryteriam do zbioru tego winien był trafić każdy leksem nieodnotowany w pierwszym XX-wiecznym słowniku ortograficznym autorstwa Władysława Kokowskiego (1903) (Wawrzyńczyk, Wierzchoń, Borchmann 2021: 10). Po drugie, projekt, kierowany do roku 2021 przez Jana Wawrzyńczyka, ma charakter rozwojowy i obejmuje także inne okresy .W bazie uwzględnia się również takie odrębne segmenty konstrukcji fotokorpusu, jak lata: 1773–1800, 1801–1900 i 2001–2100. Główni inicjatorzy i twórcy NFJP podają jednak, że „w odpowiednich miejscach strony internetowej udostępniamy z tych lat jedynie nieliczne, przypadkowe fotocytaty; poważna rozbudowa tych segmentów to sprawa kilku najbliższych lat" (Wawrzyńczyk, Wierzchoń, Borchmann 2021: 12). 

Na dany artykuł hasłowy składa się zawsze wraz z danymi bibliograficznymi poświadczenie fotocytatowe (zwykle zdaniowe, czasem wielozdaniowe) danej jednostki leksykalnej, będące, co wyjaśnia Wawrzyńczyk, udokumentowanym ekscerptem „w postaci fotodokumentacyjnej, tzn. w takiej, w jakiej ukazał się on w druku nim wszedł w nasze e-posiadanie" (zob. opis projektu na stronie głównej: https://nfjp.pl/). Taki sposób podawania informacji o użyciu leksemu gwarantuje, zdaniem autorów NFJP, „absolutną zgodność wyimka z jego źródłem drukowanym (ewentualnie, zupełnie wyjątkowo – rękopiśmiennym) (Wawrzyńczyk, Wierzchoń, Borchmann 2021: 9). W strukturze hasła zamieszczone są ponadto takie elementy opisu leksykograficznego, jak: etykieta gramatyczna poświadczenia (np. informacja o części mowy, liczbie), informacje dodatkowe w postaci wykresu dotyczące diachronicznej częstości użycia słowa (wystąpień na milion wyrazów), lokalizacja ekscerptu na stronie oraz alfabetyczna lista (w układzie a fronte i a tergo) wyrazów sąsiadujących z interesującym nas leksemem w spisie haseł. Co ciekawe, na liście tej znajdują się również leksemy opatrzone symbolem „K", świadczącym o tym, iż jest to jednostka nieodnotowana w NFJP, gdyż obecna w słowniku Kokowskiego (1903). 

Możliwości i ograniczenia korzystania z zasobów: możliwość zaawansowanego wyszukiwania danych. W pierwszej kolejności możemy przeszukiwać bazę za pomocą alfabetycznej listy haseł (zob. https://nfjp.pl/index/). Po przejściu do indeksu na stronie wyświetlają się odrębne zbiory jednostek, pogrupowane według rozpoczynającej je danej litery. Dla każdego zbioru podana jest konkretna liczba wszystkich haseł na określoną literę oraz wizualna informacja diachroniczna na temat częstości użycia wybranych do oglądu wyników. 

W dalszej kolejności możemy wyszukiwać jednostki leksykalne z poziomu okienka dialogowego znajdującego w prawym górnym rogu strony. System nie rozpoznaje form fleksyjnych wyrazów, lecz wyszukuje hasła tylko według ciągu znaków, jaki zawiera dana jednostka. Jeśli więc wpiszemy słowo propaganda, wyniki będą następujące: brak hasła propaganda w NFJP, ale obecne hasła takie jak: antypropaganda, hurrapropaganda, kontrpropaganda itp. Jeśli zaś wpiszemy ciąg liter propago, system pokaże nam fotocytaty dla jednostek typu: niepropagowanie, propagowanie, rozpropagowanie, rozpropagować itp.

¹ NFJP powstał jako projekt finansowany w latach 2014 –2020 ze środków Ministerstwa Nauki i Szkolnictwa Wyższego w ramach Narodowego Programu Rozwoju Humanistyki.

secretcats.pl - tworzenie stron internetowych