KT XVI–XVIII: Korpus tekstów XVI–XVIII w. Korpus GT projektu IMPACT (wersja 1-w.), 1570–1756 Korpus GT projektu IMPACT (wersja 2-w.), 1570–1756

Forma dostępu: online, 

https://szukajwslownikach.uw.edu.pl/IMPACT_GT_1/

https://szukajwslownikach.uw.edu.pl/IMPACT_GT_2/

Wymogi techniczne: pełny dostęp bez konieczności założenia konta i logowania się.

Zawartość: jak podano na stronie, korpus w wersji pierwszej jednowymiarowej cechuje się tym, że „słowa podzielone przy przenoszeniu do nowego wiersza zostały automatycznie odtworzone". Zawiera on ok. 1,5 mln segmentów. Z kolei w korpusie w wersji drugiej dwuwymiarowej „zachowane są podziały słów przy przenoszeniu do nowego wiersza" i ujęto w nim ok. 1,6 mln segmentów. Obie wersje wykorzystują zasoby udostępnione przez Zespół Bibliotek Cyfrowych Poznańskiego Centrum Superkomputerowo-Sieciowego w postaci zbioru pełnotekstowych wersji cyfrowych wybranych dokumentów historycznych z czterech bibliotek cyfrowych w Polsce (zob. lista tekstów na stronie korpusu). Dane przygotowano w ramach projektu IMPACT jako teksty wzorcowe do oceny i trenowania programów w celu optycznego rozpoznawania znaków (OCR) (zob. Bień 2012). 

Możliwości i ograniczenia korzystania z zasobów: możliwość zaawansowanego przeszukiwania bazy. Po wpisaniu ciągu znaków w okienko dialogowe pojawia się lista konkordancji. Kliknięcie w aktywny numer konkordancji otwiera wersję tekstową z poszerzonym kontekstem poszukiwanego wyrazu lub ciągu znaków. Kliknięcie w aktywny link zawierający poszukiwany ciąg znaków odsyła do skanu słownika. Przeszukiwanie zawartości korpusu z poziomu okienka dialogowego może odbywać się przy użyciu określonej składni zapytań. Składnia zapytań w wyszukiwarce korpusów DjVu jest zbliżona do tej z NKJP, chociaż są pewne ograniczenia: 

  • wyszukiwanie jest możliwe jak w NKJP, ale tylko za pomocą zapytań o segmenty (zob. http://nkjp.pl/poliqarp/help/plse3.html#x4-60003.1, np. domk.* – wyszukanie dowolnej liczby znaków po wpisanym ciągu liter lub domk*. – wyszukanie tylko jednego znaku po wpisanym ciągu liter),

  • możliwe jest wyszukiwanie tylko konkretnych form fleksyjnych wyrazów (np. bić, biję, ale nie [base=bić] i połączeń wyrazowych (np. []^dom lub mieszkać w^[]).

secretcats.pl - tworzenie stron internetowych