NKJP: Narodowy Korpus Języka Polskiego
(2008–2012)

Forma dostępu: online, http://www.nkjp.pl/

Wymogi techniczne: pełny dostęp bez konieczności założenia konta i logowania się.

Forma wydania elektronicznego: teksty wtórnie lub powtórnie¹ wydane elektronicznie.

Zawartość: korpusy językowe, w tym także NKJP, należą do zasobów cyfrowych bardzo obszernych i dysponujących najbardziej zaawansowanymi możliwościami i narzędziami wyszukiwania danych. NKJP w wersji zrównoważonej² obejmuje 300 mln segmentów, a w wersji pełnej – 1,8 mld segmentów. Teksty zawarte w NKJP (a ściśle mówiąc, w korpusie zrównoważonym) są datowane od 1945 r., choć od tej reguły trafiają się pewne wyjątki w wypadku tekstów literackich, dla których data została przesunięta na początek XX w. (aby móc ująć ważne dla współczesnej kultury polskiej, a wydane po 1936 r. dzieła m.in. Reymonta, Żeromskiego czy Dołęgi-Mostowicza). NKJP jest korpusem znakowanym morfoskładniowo, sensami słów, składniowo, a także dokonano w nim anotacji jednostek nazewniczych (zob. Przepiórkowski i in. (red.) 2012: 49–193).

Możliwości i ograniczenia korzystania z zasobów: możliwość bardzo zaawansowanego przeszukiwania bazy za pomocą wyszukiwarek omówionych poniżej.

¹ Przypomnijmy, że zgodnie z przyjętą klasyfikacją zasobów cyfrowych korpusy należą do tej grupy, w której znajdują się zarówno zasoby wtórnie elektroniczne – powstałe w wyniku digitalizacji właściwej, jak i zasoby powtórnie elektroniczne, a więc „urodzone jako cyfrowe", już na etapie tworzenia wprowadzone do pamięci komputera, i powtórnie poddane obróbce cyfrowej w celu ich ponownej edycji elektronicznej.

² Zrównoważenie w korpusie to dbanie o to, aby w jego budowie żaden z elementów nie dominował nad innym (zob. Przepiórkowski i in. (red.) 2012: 25–36). 

secretcats.pl - tworzenie stron internetowych