Matematická lingvistika - 15.6.2016

Vše o státnicích úspěšně završujících roky studia na naší alma mater.
Uživatelský avatar
strevlik
Matfyz(ák|ačka) level I
Příspěvky: 49
Registrován: 7. 3. 2006 10:56
Typ studia: Informatika Bc.
Kontaktovat uživatele:

Matematická lingvistika - 15.6.2016

Příspěvek od strevlik »

Tento obor zde není popsaný, tak přidávám vlastní zážitky.

Začátek byl trochu zmatený, na místnosti uvedené v SISu byl redirect na kabinet, kde nikdo nic nevěděl (ale tužky a papíry připraveny). Následně kabinet postupně navštívilo několik lidí (z vedení/sekretariátu) a roznášeli zprávu, že státnice budou. Byl jsem vpuštěn do kabinetu (po chvíli přišel i druhý - student přes Erasmus) a čekalo se (vařilo se kafe a zjevili se koláčky). Během čtvrt hodiny se postupně přišli podívat členové komise a odešli. Nakonec se podařilo všechny shromáždit v kabinetu. Celkem staří UFALí známí (O.Bojar, J.Hána, M.Lopatková, P.Pecina a J.Hric). Zadávání otázek bylo také trochu zmatečné, po delším studiu Karolínek (spíše pro inspiraci) jsme dostali otázky, navrhli pořadí a mohli jsme psát. Příprava na otázku byla jak člověk chce, ale průměrně 15 min. Při odpovídání na vás vždy musí koukat dva zkoušející (tzn. se čeká pokud došli).

Hešování - obecné principy + univerzální hešování (Hric)
Velmi tradiční, bez hešování státnice nejsou. Hlavní výhoda univerzálního je že nepředpokládám náhodnost dat (při tvorbě tabulky vždy vyberu náhodně funkci). Důkazy tolik nepotřeboval, stačilo jen že c-univerzální existuje.

Rekurzivní a rekurzivně spočetné množiny (Hric)
Nejvíce chtěl definice a generování. Důkazy stačily popisem ("pustím dva stroje a čekám...", generování RS je složitější). Je potřeba to chápat, formální vzorec čistě nepomůže.

Hodnocení ve vyhledávání informací - evaluace experimentů, postojová analýza (Hána)
Potřeba začít obecně a pak probírat jednotlivé body (zlatá data, co se dá použít abych nemusel vše ručně tagovat, postoj není jen sentiment ale i emoce).

Jazykové modelování, noisy channel, vyhlazování, specifika morfologicky bohatých jazyků (Bojar)
Zpracovaná otázka, nevěděl jsem "řetízkové pravidlo" ale alespoň podobnou markovovskou vlastnost. Většinu jsme se točili kolem bayese.

Systém rovin popisu jazyka (Lopatková)
Přesně jsem nevěděl co se otázkou myslí, jde o různé pohledy na zkoumání jazyka. Potřeba vědět rozdíl mezi FGD a jeho implementací v PDT (vybrat jedno a to popisovat). Tektogramatická rovina je sice nejhlubší, ale i nejvyšší (oblíbené funkce vs. forma "vyšší rovina je funkcí nižší"). Popsat i jiné, minimálně HPSG. Otázka mi zpětně přijde jako pěkný přechod mezi teorií a implementací.

Všichni byli celkově milý, chtějí z vás dostat informace, tak je lepší jim moc nebránit. Přijde mi ideální se na každou otázku naučit dobrý obrázek (strom, postup algoritmem, větší formuli) a mít ho dobře. Není důležité potřeba přesně zformulovat vzorec, ale vědět jak co pracuje (vzorce si pak stejně při implementaci každý způsob ohýbá). Velmi domácí prostředí. U kolegy se řešilo s Karolínkami co nemusí umět (myslím, že problém byla závislostní syntax/stromy). Během učení je dobré si všechny vzorce a případné důkazy opravdu ručně napsat. A určitě věnujte dva dny dohledávání informací podle aktuálních státnicových otázek (vždy je třeba vědět alespoň něco, co se pak otázkami víc rozvine). Ideálně si napsat ke každé body o kterých budete chtít mluvit (což jsem neudělal a u každé otázky jsem se zbytečně hned zaměřil na úzkou oblast a o té mluvil, ostatní způsoby mne ani nenapadly). GL
Odpovědět

Zpět na „Magisterské SZZ“