Korba: Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do roku 1772) (2013–2018, 2019-2023)

Forma dostępu: online, https://korba.edu.pl/query_corpus/

Wymogi techniczne: pełny dostęp bez konieczności założenia konta i logowania się.

Zawartość: korpus tekstów polskich z XVII i XVIII w. powstawał w latach 2013-2018 (Projekt KORBA1) oraz realizowany jest nadal w latach 2019-2023 (Projekt KORBA2) w IJP PAN oraz IPI PAN. Kierownikiem projektu jest Włodzimierz Gruszczyński. Korpus liczy prawie 13,5 miliona segmentów, łącznie wielkość korpusu planowana jest na 25 milionów segmentów. Zgromadzone w nim teksty prezentowane są w formie transkrypcji i transliteracji. Bogate metadane, znakowanie strukturalne i językowe oraz anotacja morfosyntaktyczna i lematyzacja dają możliwość zadawania różnorakich zapytań, filtrowania wyników oraz ich lokalizacji w źródle z dokładnością do numeru strony.

Możliwości i ograniczenia korzystania z zasobów: Zasób można przeszukiwać w całości lub w układzie chronologicznym (barok, oświecenie) za pomocą wyszukiwarki MTAS wykorzystującej język zapytań CQL. Pozwala to na wyszukiwanie pojedynczych segmentów lub ich sekwencji, których postać i wzajemne relacje można szczegółowo określić, używając przypisanych każdemu segmentowi atrybutów (por. wyszukiwarka Poliqarp w NKJP). Szczegółowy opis możliwości wyszukiwarki i języka zapytań MTAS znajduje się w zakładce Instrukcja, pkt 5. Język zapytań: https://korba.edu.pl/manual.

Zasób można również przeszukiwać, korzystając z konstruktora zapytań, ograniczającego wyszukiwanie np. do określonej części mowy, liczby, stopnia, aspektu itp.

Wyniki wyszukiwania dostępne są zarówno w formie transliteracji, jak i transkrypcji. Dzięki zastosowaniu zestawu metadanych możliwe jest również wyszukiwanie segmentów w dowolnie ograniczonych podkorpusach (ograniczenie np. do autora, tytułu, miejsca, regionu, gatunku tekstu, drukarni itp.). Wyniki wyszukiwania zwracają listę konkordancji danej formy. Kliknięcie w poszukiwaną formę, dzięki anotacji morfosyntaktycznej, odsłania jej opis gramatyczny oraz zestaw metadanych. Poniżej w widoku odsłania się szerszy cytat z użyciem formy, który można kopiować wraz z pełnym opisem meta. Widok odsyła również do artykułu hasłowego formy podstawowej w Elektronicznym słowniku języka polskiego XVII i XVIII wieku.

secretcats.pl - tworzenie stron internetowych