Forma dostępu: online,
https://szukajwslownikach.uw.edu.pl/IMPACT_GT_1/
https://szukajwslownikach.uw.edu.pl/IMPACT_GT_2/
Wymogi techniczne: pełny dostęp bez konieczności założenia konta i logowania się.
Zawartość: jak podano na stronie, korpus w wersji pierwszej jednowymiarowej cechuje się tym, że „słowa podzielone przy przenoszeniu do nowego wiersza zostały automatycznie odtworzone". Zawiera on ok. 1,5 mln segmentów. Z kolei w korpusie w wersji drugiej dwuwymiarowej „zachowane są podziały słów przy przenoszeniu do nowego wiersza" i ujęto w nim ok. 1,6 mln segmentów. Obie wersje wykorzystują zasoby udostępnione przez Zespół Bibliotek Cyfrowych Poznańskiego Centrum Superkomputerowo-Sieciowego w postaci zbioru pełnotekstowych wersji cyfrowych wybranych dokumentów historycznych z czterech bibliotek cyfrowych w Polsce (zob. lista tekstów na stronie korpusu). Dane przygotowano w ramach projektu IMPACT jako teksty wzorcowe do oceny i trenowania programów w celu optycznego rozpoznawania znaków (OCR) (zob. Bień 2012).
Możliwości i ograniczenia korzystania z zasobów: możliwość zaawansowanego przeszukiwania bazy. Po wpisaniu ciągu znaków w okienko dialogowe pojawia się lista konkordancji. Kliknięcie w aktywny numer konkordancji otwiera wersję tekstową z poszerzonym kontekstem poszukiwanego wyrazu lub ciągu znaków. Kliknięcie w aktywny link zawierający poszukiwany ciąg znaków odsyła do skanu słownika. Przeszukiwanie zawartości korpusu z poziomu okienka dialogowego może odbywać się przy użyciu określonej składni zapytań. Składnia zapytań w wyszukiwarce korpusów DjVu jest zbliżona do tej z NKJP, chociaż są pewne ograniczenia:
wyszukiwanie jest możliwe jak w NKJP, ale tylko za pomocą zapytań o segmenty (zob. http://nkjp.pl/poliqarp/help/plse3.html#x4-60003.1, np. domk.* – wyszukanie dowolnej liczby znaków po wpisanym ciągu liter lub domk*. – wyszukanie tylko jednego znaku po wpisanym ciągu liter),
możliwe jest wyszukiwanie tylko konkretnych form fleksyjnych wyrazów (np. bić, biję, ale nie [base=bić] i połączeń wyrazowych (np. []^dom lub mieszkać w^[]).
© Copyright by Patrycja Pałka; © Copyright by Agata Kwaśnicka-Janowicz; © Copyright by Towarzystwo Miłośników Języka Polskiego