Prototyp programu przeszukującego korpus

Strefauczestnika
alt

W Laboratorium językowym powstał opracowany przez Jarosława Strojka prototyp programu przeszukującego korpus na podstawie wyszukiwarki NKJP Poliqarp, kompatybilny z programami NKJP, z interfejsem okienkowym wykorzystującym szkolne kategorie gramatyczne.

W ramach przygotowań do zbierania korpusu mówionego w dniu 29 stycznia 2014 odbyła się wycieczka do Polsko-
Japońskiej Szkoły Technik Komputerowych, gdzie uczestnicy projektu wysłuchali wykładu dr. Krzysztofa Szklannego na temat syntezy mowy polskiej. Wykładowi towarzyszyła demonstracja przetwarzającego dźwięki mowy i wyrazy avatara.

Uczniowie mogli zadawać mu zdania, które po wpisaniu do programu, avatar odtwarzał z odpowiednią intonacją i melodią zdania polskiego. Okazało się, że avatar dobrze naśladuje współczesną polszczyznę, trudniej jednak radzi sobie z cytatami z literatury średniowiecznej, na które nie był zaprogramowany.

Obecnie podczas warsztatów z zespołami młodzieżowymi uczniowie uczą się zbierania danych do korpusu mówionego oraz odpowiedniego znakowania zapisu mowy.

Zaczynamy tworzyć słownik języka młodzieży. Uczestnicy laboratorium via Internet zgłaszają propozycje haseł
do słownika języka młodzieży. W celu zgłoszenia hasła, muszą wypełnić odpowiedni formularz, ucząc się przy okazji definiowania znaczeń. Oto kilka propozycji haseł.