Forma dostępu: online, https://sjp.pwn.pl/korpus
Wymogi techniczne: pełny dostęp bez konieczności założenia konta i logowania się.
Zawartość: korpus w wersji zrównoważonej zawiera 70 mln słów, a w wersji pełnej liczy 100 mln słów. Obejmuje on teksty datowane od 1920 do 2005 r. KJP PWN był pierwszym internetowym korpusem polszczyzny. Inicjatorką jego powstania była Maria Krajewska, a redaktorem przez wiele lat był Marek Łaziński.
Jak podaje się na stronie KJP PWN, cechą odróżniającą ten zbiór od innych jest to, że uwzględnia on dość dużo tekstów literackich: „Postanowiliśmy bowiem uwzględnić szczególnie żywą w Polsce tradycję autorytetu kulturalnego jako kryterium poprawności językowej" (zob. zakładka „O korpusie" w menu po lewej stronie). W wyniku znakowania plików tekstowych korpusu wzbogacono opis o dane dotyczące struktury tekstu, oznaczenie nietypowych lub błędnych wyrazów i konstrukcji, a także o informacje charakteryzujące autorów i uczestników rozmowy. Na stronie udostępnia się także opis struktury korpusu oraz podaje instrukcję, jak z niego korzystać.
Możliwości i ograniczenia korzystania z zasobów: możliwość zaawansowanego przeszukiwania bazy. Oprogramowanie umożliwia przeszukiwanie bazy z poziomu okienka dialogowego za pomocą: (1) zapytania o wszystkie formy fleksyjne danego leksemu (wystarczy wpisać jakiś wyraz bez żadnej specjalnej składni zapytań), (2) zapytania o dowolny zestaw liter po wpisanym danym ciągu, np. matk*, (3) zapytania o ciąg znaków zakończony dowolną, ale tylko jedną literą, np. matk?, (4) zapytania o konkretną formę lub wyrażenia czy frazę, np. „matką" bądź „biały kruk". Szczegóły dotyczące możliwości korzystania z KJP PWN są dostępne w zakładce „Jak szukać".
© Copyright by Patrycja Pałka; © Copyright by Agata Kwaśnicka-Janowicz; © Copyright by Towarzystwo Miłośników Języka Polskiego