Walenty: Słownik walencyjny predykatów polskich (2021)

(2021¹)

Forma dostępu: online, http://walenty.ipipan.waw.pl/

Wymogi techniczne: pełny dostęp bez konieczności założenia konta i logowania się.

Rodzaj wydania elektronicznego: prymarne wydanie elektroniczne.

Zawartość: słownik walencyjny o postaci bazy danych zwany Walenty (zob. http://zil.ipipan.waw.pl/Walenty), powstaje w Instytucie Podstaw Informatyki PAN, w ramach działań polskiego konsorcjum naukowego CLARIN-PL, będącego częścią Europejskiej Infrastruktury Badawczej CLARIN (Common Language Resources and Technology Infrastructure). Walenty podaje, po pierwsze, powierzchniowoskładniowe informacje walencyjne głównie dla jednostek czasownikowych, ale także rzeczowników, przymiotników i przysłówków (w ramach schematów składniowych uwzględnia się też opis konstrukcji frazeologicznych²). Obecnie słownik zawiera łącznie ok. 18,6 tys. haseł (w tym nieco ponad 13 tys. to hasła czasownikowe; szczegółowe dane zob. http://walenty.ipipan.waw.pl/slowniki/). 

Po drugie, poza danymi morfoskładniowymi w słowniku prezentowane są także informacje semantyczne oraz frekwencyjne (dane na temat częstości występowania danego leksemu w NKJP są po prawej stronie u góry). Co ważne, przedstawione w Walentym schematy składniowe i ramy semantyczne ilustruje się autentycznymi cytatami ekscerpowanymi głównie z Narodowego Korpusu Języka Polskiego (zob. Przepiórkowski i in. (red.) 2012). 

Trzeba także odnotować, że opracowany dla słownika nowy formalizm zapisu schematów walencyjnych z jednej strony może utrudniać odbiór niespecjaliście, zwykłemu użytkownikowi polszczyzny, ale z drugiej jego zadaniem jest umożliwienie wykorzystania słownika przez programy, zwane parserami, które służą do automatycznej analizy składniowej języka. W bazie danych Walenty nie zamieszcza się typowej dla tradycyjnych opracowań leksykograficznych części wstępnej, nie odnajdziemy więc tu takich materiałów, jak instrukcja obsługi, zasady opracowania czy opis stosowanych oznaczeń i symboli. Takie informacje w sposób ogólny są przekazane w witrynie http://zil.ipipan.waw.pl/Walenty, szczegółowe zaś ich ujęcie odnajdziemy w monografiach dotyczących dwóch warstw słownika – semantycznej (zob. Hajnicz i in. 2021) i składniowej (zob. Hajnicz 2022) oraz w poszczególnych w artykułach, m.in.: Przepiórkowski i in. 2014b (do pobrania jako plik PDF z powyżej podanej strony), Hajnicz i in. 2015 (do pobrania jako plik PDF ze strony http://zil.ipipan.waw.pl/ElzbietaHajnicz), Przepiórkowski i in. 2017b, Hajnicz, Bartosiak 2018.

Na artykuł hasłowy składają się zatem następujące elementy: (1) schemat (schematy) składniowy³, (2) semantyka – opis ról semantycznych i preferencji selekcyjnych w obrębie określonej ramy interpretacyjnej (zob. omówienie wstępnej koncepcji – Andrzejczuk i in. 2014, Hajnicz i in. 2016; omówienie szczegółowych zasad opisu semantycznego, w tym podstaw teoretycznych – Hajnicz i in 2021: 30–50, 292–294, 313–315), (3) przykłady użyć powiązane z danym schematem. Należy zaznaczyć, że w przyjętym opisie nie rozróżnia się sensów słów, to znaczy w poszczególnych hasłach nie odnajdziemy podziału na odrębne znaczenia danego leksemu, którym będą przypisane określone schematy walencyjne wraz z wykazem ról realizowanych przez poszczególne elementy ramy. Warto jednak zwrócić także uwagę, że dużą zaletą słownika (z punktu widzenia jego użytkownika) jest graficzna prezentacja danych, która porządkuje treści i ułatwia ich zrozumienie. Po przejściu bowiem do zakładki „Semantyka" po lewej stronie widoczne są ramy „reprezentujące poszczególne znaczenia predykatu, po prawej – schematy stanowiace ich realizację składniową […]. Kliknięcie na wybraną ramę powoduje, że role semantyczne przypisane poszczególnym argumentom podświetlają się na przypisane im kolory […]. Na takie same kolory podświetlają się pozycje i typy fraz stanowiące składniowe realizacje tych argumentów semantycznych" (Hajnicz i in. 2021: 292). 

Możliwości i ograniczenia korzystania z zasobów: możliwość bardzo zaawansowanego przeszukiwania bazy. Oprogramowanie umożliwia przeszukiwanie słownika według listy haseł (indeksu a fronte) oraz wyszukiwanie interesujących nas artykułów hasłowych z poziomu okienka dialogowego (nad listą haseł) po wpisaniu całego wyrazu (odpowiadającego formie hasłowej) bądź jego początkowych liter (ale nie dowolnej formy fleksyjnej). W Walentym dostępna jest także rozbudowana funkcja filtrowania haseł (według części mowy, frazeologii, statusu hasła), schematów (m.in. według typu schematu, zwrotności, negatywności, aspektu, typu frazy i ram – według ról semantycznych i preferencji selekcyjnych). Aby móc skorzystać z filtrowania, należy kliknąć w lewym górnym rogu w ikonkę z niewielkim obrazkiem przypominającym lejek, znajdującą się nad listą haseł, tuż obok okienka dialogowego.

Inne wersje elektroniczne online: możliwość pobrania wersji tekstowej słownika (oraz wersji w formatach PDF i TEI (po przejściu na stronie startowej po kliknięciu do zakładki „Pobierz słownik")).

¹ Rok określony na podstawie podanej na stronie słownika daty ostatniej aktualizacji danych dotyczących liczby haseł o statusie wyższym niż „gotowe" (zob. http://walenty.ipipan.waw.pl/slowniki/).

² Szerzej o koncepcji reprezentacji informacji frazeologicznych zob. Przepiórkowski i in. 2014a, 2017a, zob. też teksty do pobrania na stronie http://zil.ipipan.waw.pl/Walenty.

³ Jak podają autorzy opracowania na temat słownika Walenty, „na poziomie składniowym hasło dzieli się na podhasła (chociaż większość haseł składa się z pojedynczego podhasła). Nagłówkiem podhasła jest lemat podhasła (się inherentne w wypadku czasowników jest częścią lematu podhasła), po którym w nawiasach następują trzy oddzielone przecinkami informacje, określające zanegowanie, predykatywność i aspekt hasła. […] Każde podhasło składa się listy schematów składniowych reprezentujących wszystkie konstrukcje składniowe charakterystyczne dla danego predykatu. Każdy schemat prezentowany jest w postaci tabeli, której kolumny (pomijając pierwszą mająca pomocniczy, informacyjny charakter) reprezentują poszczególne pozycje składniowe reprezentujące wymagane podrzędniki predykatu" (Hajnicz i in. 2021: 290).

secretcats.pl - tworzenie stron internetowych