Histmag wspiera Korpus Dekady
Korpus Dekady
uzupełnia projekt Narodowego Korpusu Języka Polskiego, który uruchomiono w 2012 r. Został
zrealizowany na
zlecenie Ministerstwa Nauki i Szkolnictwa Wyższego. Jest to olbrzymia baza słów zbudowana na podstawie zróżnicowanych
tekstów literackich, naukowych, publicystycznych itd. Pomaga ona tworzyć
podręczniki, słowniki. Jest używana w zaawansowanej technologii językowej, np. w
tłumaczach komputerowych. Korpus uwzględnia odmianę czy składnię języka
polskiego, pomaga zrozumieć, w jakim kontekście można użyć danego słowa, w
sąsiedztwie jakich innych słów najczęściej używamy danego terminu, pomaga
wyszukać cytaty z określonym słowem. Dzięki korpusom językowym badania statystyczne
stają się łatwiejsze!
Korpus powinien ukazywać jakie poczucie językowe mieli Polacy w ostatniej dekadzie. Uwzględniona zostanie w nim rola komunikacji internetowej. Zrównoważona część podstawowa wszystkich materiałów korpusu to 100 milionów słów, ale zgromadzonych tekstów będzie o wiele więcej! Ta potężna baza danych posłuży nie tylko językoznawcom i innym badaczom tego, jak zmienia się nasz język. Pomoże każdemu z nas!
Działania prowadzone są w ramach projektu „Cyfrowa infrastruktura badawcza dla humanistyki i nauk o sztuce” (Dariah.lab). Korpus Dekady obejmie lata 2011-2020 i kolejne.