Wstęp

Niniejsza publikacja ma charakter przewodnika informującego o zasobach cyfrowych przydatnych w pracy zwłaszcza badaczom polszczyzny dawnej i współczesnej. Opisujemy w niej stan językowych zasobów elektronicznych na dzień 13 września 2023 r., od tego czasu mogły więc zajść pewne zmiany i niektóre informacje dotyczące prezentowanych zasobów (np. ich zawartości, możliwości przeszukiwania czy technicznych sposobów udostępnienia) mogą już niestety być nieaktualne. W związku z korzystaniem przez użytkowników z różnych systemów operacyjnych i przeglądarek oraz szybko zmieniającym się wyglądem witryn internetowych zdecydowałyśmy się nie zamieszczać zdjęć poszczególnych stron, by nie wprowadzać czytelników w błąd.

Zwracamy także uwagę na to, aby w celu uniknięcia problemów związanych z otwarciem podanych w publikacji stron internetowych czy plików korzystać z właściwych programów (zob. linki do instalacji zalecanych programów w rozdziale 2).

Ze względu na liczbę, różnorodność i stały przyrost dostępnych cyfrowo zasobów wydanie niniejszego opracowania również w formie elektronicznej umożliwi w przyszłości aktualizowanie jego zawartości¹. Wybór prezentowanych materiałów uwzględnia perspektywę badacza polonisty, zwłaszcza lingwisty, dlatego nie przedstawiłyśmy szerzej materiałów literackich, dostępnych na przykład na stronach Wirtualnej Biblioteki Literatury Polskiej (https://literat.ug.edu.pl/), Wolnych Lektur (www.wolnelektury.pl) czy projektu Gutenberg (https://www.gutenberg.org/). Nie uwzględniłyśmy także żadnych amatorskich opracowań leksykograficznych, portali prowadzonych przez nieprofesjonalistów (osoby niepowiązane z jednostkami naukowymi, niezajmujące się zawodowo językoznawstwem, leksykografią, korpusologią czy szerzej – humanistyką cyfrową) ani amatorskich kompendiów udostępniających zbiory cyfrowe lub podających linki do nich.

Praca jest przeznaczona dla studentów kierunków humanistycznych, magistrantów, doktorantów, pracowników naukowych, a także miłośników języka polskiego, którzy od podstaw poznają zasoby elektroniczne oraz sposoby i możliwości ich eksploatowania.

czytaj dalej

W związku z przyjęciem perspektywy funkcjonalnej i popularno-naukowej w opracowaniu – poza wyjaśnieniem podstawowych i najistotniejszych zagadnień teoretycznych oraz terminów – skupiamy się na rozbudowanej części referencyjnej, w której znajdują się opisy licznych zasobów cyfrowych dostępnych głównie w wersji online. Materiały wydane offline są opisywane wybiórczo i nie zawsze w sposób pełny (nie wszystkie elementy przyjętego schematu opisu mogą być uwzględnione) z powodu trudności z dotarciem do nich lub z ich otwarciem przy użyciu nowszego oprogramowania.

 

I tak w rozdziale 1 objaśniamy najważniejsze pojęcia i terminy (takie jak digitalizacja, komputeryzacja, słownik elektroniczny, korpus językowy, znakowanie) oraz przedstawiamy autorską funkcjonalną klasyfikację zasobów cyfrowych wraz z omówieniem innych, obecnych w literaturze przedmiotu podziałów materiałów dostępnych elektronicznie. W rozdziale 2 wyjaśniamy pokrótce wymagania techniczne (dotyczące zwłaszcza określonych przeglądarek, programów i wtyczek), które muszą być spełnione, by móc korzystać z zasobów cyfrowych dostępnych online.

 

Na część referencyjną składają się: omówienie najważniejszych ogólnych portali i projektów cyfrowych (część I) oraz opis poszczególnych zasobów cyfrowych (część II). W części I omawiamy w sposób skrótowy takie platformy i projekty cyfrowe, jak: FBC, CBN Polona, RCIN, CLARIN-PL, CLIP IPI PAN, PBC, Książki Google, w ramach których prezentuje się i udostępnia różne rodzaje elektronicznych zasobów i narzędzi. Opisujemy także zasady działania wybranych portali, ich zawartość pod kątem jej użyteczności w pracy językoznawcy oraz problemy techniczne dotyczące wymaganych programów i ustawień komputerowych. W części II opracowania zajmujemy się szczegółową charakterystyką zasobów elektronicznych ujętych w pięciu głównych rozdziałach: 6. Najdawniejsze zabytki języka polskiego, 7. Słowniki, 8. Kartoteki, 9. Korpusy języka polskiego, 10. Kompendia i bazy elektroniczne. Część ta jest uzupełniona o alfabetyczny indeks omówionych pozycji.

 

Materiały (głównie prace historycznojęzykowe oraz słowniki współczesnego języka polskiego) są prezentowane w porządku chronologicznym – od tekstów najstarszych do najnowszych. W wypadku prac wtórnie wydanych elektronicznie liczy się data wydania ich wersji pierwotnej, rękopiśmiennej lub drukowanej, w wypadku zaś powtórnie wydanych prac elektronicznych – data publikacji ich najstarszej wersji cyfrowej. Dla materiałów prymarnie elektronicznych przyjmujemy podaną na stronie internetowej lub w literaturze przedmiotu datę edycji (opracowania) bądź datę dostępu.

 

Zgodnie z przyjętym kryterium chronologicznym także w opisie wychodzimy od zasobów rejestrujących najdawniejszą polszczyznę, przechodząc następnie do zasobów rejestrujących polszczyznę najnowszą. Jeśli jednak z jakichś względów kryterium to nie może być zastosowane, układ materiałów jest następujący: (1) od tekstów z kanonu do tekstów spoza niego albo (2) od prac (zasobów) obejmujących ogół jakichś danych językowych do prac (zasobów) specjalistycznych, np. biorących pod uwagę tylko dany rodzaj tekstów, albo (3) od prac (zasobów) stricte naukowych do prac (zasobów) popularnonaukowych.

 

Każdy z prezentowanych językowych zasobów elektronicznych (w ramach podanych wyżej pięciu głównych rozdziałów) jest opisywany według tego samego schematu, obejmującego następujące elementy:

 

1. Nazwa zasobów (skrócony opis bibliograficzny).

2. Forma dostępu:

a) online – adres strony (wersja jedyna lub najnowsza bądź najbardziej zaawansowana pod względem możliwości wyszukiwania danych),

b) offline – nośnik zapisu.

3. Wymogi techniczne (tylko dla zasobów online):

a) dostęp płatny czy bezpłatny,

b) konieczność założenia konta i logowania się czy korzystanie bez konta i logowania,

c) wymagane programy, adres strony do pobrania danego programu czy też bez szczególnych wymagań dotyczących programów,

d) zauważone problemy techniczne (np. rodzaj przeglądarki, wersja wpisu do wyszukiwarki).

4. Rodzaj wydania elektronicznego:

a) prymarne (zasoby cyfrowe, które od początku miały postać elektroniczną),

b) wtórne (zasoby wtórnie przekształcone do postaci cyfrowej, a prymarnie na przykład rękopiśmienne lub drukowane),

c) powtórne (zasoby prymarnie elektroniczne i powtórnie poddane obróbce cyfrowej w celu ich ponownej edycji).

5. Zawartość – krótka charakterystyka merytoryczna, opis treści i zakresu materiałowego zasobów, ogólne omówienie makro- i mikrostruktury słowników, ale tylko dla tych zasobów, które są prymarnie elektroniczne (nie mają wcześniejszych wersji drukowanych) bądź wtórnie elektroniczne i prezentowane w zmienionej oprawie graficznej oraz z nowymi możliwościami przeszukiwania tekstu, ograniczonymi tylko zastosowanym oprogramowaniem.

6. Techniczne możliwości korzystania z zasobów i ich ograniczenia (wraz z objaśnieniem składni zapytań w poszczególnych korpusach języka polskiego) w zależności od typu opisywanej pozycji (szczegółowy opis możliwości korzystania z zasobów, w tym wyszukiwania danych, znajduje się w rozdziale 2):

a) brak możliwości wyszukiwania danych i brak możliwości kopiowania tekstu,

b) ograniczone możliwości korzystania z zasobów, w tym wyszukiwania danych,

c) zaawansowane możliwości korzystania z zasobów, w tym wyszukiwania danych,

d) bardzo zaawansowane możliwości korzystania z zasobów, w tym wyszukiwania danych.

7. Dodatkowe możliwości oprogramowania (np. hiperłącza, pliki audio, pliki wideo, wersje na telefon komórkowy czy tablet, wersje w postaci aplikacji).

8. Inne wydania (w zależności od typu publikacji):

a) inne wydania elektroniczne w wersji online,

b) inne wydania elektroniczne w wersji offline,

c) wydanie drukowane (wydanie pierwsze lub wydania z jakichś względów najważniejsze).

 

W tym punkcie w strukturze opisu zasobów podajemy także informację na temat publikacji wykorzystanych w jakimś stopniu (np. w zakresie ich zawartości materiałowej) przy określonej edycji cyfrowej danego dzieła. Jeśli nie jesteśmy w stanie precyzyjnie ustalić stopnia podobieństwa i zależności pewnych zasobów, stosujemy sformułowanie „publikacja powiązana", wskazując tylko, że takie zasoby istnieją.

¹ Na temat zbiorczego omówienia zasobów cyfrowych zob. m.in. Korczakowska 2001, Żmigrodzki 2005a, 2008, Bień 2006, 2010, Andrzejczuk 2010, Andrzejczuk, Czupryniak 2009, Saloni, Gruszczyński 2013, Hebal-Jezierska (red.) 2014, Werla, Maryl (oprac.) 2014, Nowak 2015, Kwaśnicka-Janowicz, Pałka 2015, 2021 Derwojedowa 2017, Pastuch, Duda, Lisczyk i in. 2018, Duda, Liszczyk 2018, Gruszczyński 2020, Wierzchoń, Nowak 2020, a także strony internetowe: Słowniki dawne i współczesne: http://www.leksykografia.uw.edu.pl/ oraz Language tools and resources for Polish (IPI PAN): http://clip.ipipan.waw.pl/LRT.

secretcats.pl - tworzenie stron internetowych