Korpusy tekstowe

Prowadzący: dr hab. Marek Łaziński, prof. UW
Liczebność grup: 24
I cykl, 11.03.2016 12:00-13:30

Słowa klucze – Słowa dnia to projekt monitorowania częstości słów w mediach prowadzony przez Instytut Języka Polskiego UW.

II cykl, 18.03.2016 12:00-13:30

Korpus polsko-rosyjski oraz polsko-niemiecki – to projekty UW służące dydaktyce oraz analizie języków obcych.

III cykl, 15.04.2016 12:00-13:30

Korpus języka młodzieży – to baza naturalnych wypowiedzi oraz tekstów pisanych młodzieży wielkości 350 tys. słów, powstały w projekcie Laboratorium Języka Młodzieży.

Program ramowy:

Słowa klucze – Słowa dnia to projekt monitorowania częstości słów w mediach prowadzony przez Instytut Języka Polskiego UW. Frekwencja słów wskazuje słowa i tematy, które w danym dniu lub dłuższym okresie ogniskują uwagę mediów i społeczeństwa. Aby wybór był wiarygodny statystycznie, trzeba wykorzystywać mechanizmy korpusowe oraz dysponować dużym porównawczym zrównoważonym korpusem prasy. Spośród słów dnia wybierane jest słowo miesiąca i komentowane pod względem filologiczno-socjologicznym. Najdłuższy okres, dla którego wybieramy słowo charakterystyczne to rok. Na słowo roku głosują internauci oraz kapituła ekspertów (profesorów językoznawstwa z różnych uniwersytetów). Słowo roku 2015 to uchodźca, 2014 – kilometrówka, 2013 – gender. (slowanaczasie.uw.edu.pl, slowadnia.clarin-pl.eu)

Korpus polsko-rosyjski oraz polsko-niemiecki – to projekty UW służące dydaktyce oraz analizie języków obcych. Korpus polsko-rosyjski liczy około 30 mln słów. Program wyszukujący wybiera zdania zawierające wyszukiwane słowa lub połączenia (z zastosowaniem wyrażeń regularnych: zastępników, alternatywy i przeczenia) w języku źródłowym i pokazuje odpowiednie zdania w przekładzie. Program wyszukuje także dowolne wartości kategorii gramatycznych, wykorzystując tagowanie Narodowego Korpusu Języka Polskiego i Narodowego Korpusu Języka Rosyjskiego. Analogicznie zbudowany jest korpus polsko-niemiecki, powstający na Uniwersytecie Gutenberga w Moguncji przy współpracy UW (pol-ros.polon.uw.edu.pl; parasolcorpus.org/KrakowMW).

Korpus języka młodzieży – to baza naturalnych wypowiedzi oraz tekstów pisanych młodzieży wielkości 350 tys. słów, powstały w projekcie Laboratorium Języka Młodzieży w ramach programu MNiSW Ścieżki Kopernika 2013-2014. Oprócz korpusu w projekcie stworzono sieciowy słownik slangu, dostosowano wyszukiwarkę Narodowego Korpusu Języka Polskiego do pracy w szkole i opracowano scenariusze elekcji opartych na korpusie (kjm.polon.uw.edu.pl).

O prowadzącym:

dr hab. Marek Łaziński, prof. UW (Zakład Gramatyki, Semantyki i Pragmatyki Współczesnego Języka Polskiego, Instytut Języka Polskiego, Wydział Polonistyki). Zainteresowania badawcze: aspekt czasownika, rodzaj gramatyczny i pleć w języku, formy adresatywne i grzeczność językowa, wartościowanie nazw grupowych i poprawność polityczna, słowa klucze, lingwistyka korpusowa, w tym korpusy równoległe, współczesny język młodzieży. Koordynator Korpusu Języka Polskiego Wydawnictwa Naukowego PWN, członek konsorcjum Narodowego Korpusu Języka Polskiego. Autor pięciu książek i ponad pięćdziesięciu artykułów naukowych.