Test pozostával z desiatich otázok. Nebola tam hlboká teória, no učiť sa trebalo.
1. Loss function - čo to je, na čo to je, aké sú pri klasifikácii, aké pri regresii,...
2. Máte ttest, ako sa zmení interval spoľahlivosti ak máte 5x viac pozorovaní s rovnakou strdenou hodnotou aj rozptylom?
3. Otázky ohľadom X^2 testu, k čomu je a čo znamená p-hodnota.
4. Tabuľka predpovede a skutočnosti, vypočítajte Acc, Precision, Recall.
5. Naive Bayes klasifikátor - základný vzorec a prečo sa to volá "naivný"
6. Nakreslite Decision Tree k odpovedajúcemu obrázku. (bolo veľmi ľahké)
7. Máte naučené parametry logistickej regresie. Aká je pravdepodobnosť, že žiak spraví skúšky (veľmi podobné wiki:
https://en.wikipedia.org/wiki/Logistic_ ... s_of_study)
8. Nakreslite graf a zaznačte vývin Bias, Variance, general error, train error na závislosti komplexnosti modelu.
9. Nakreslite dendogram. Bola zadaná tabuľka vzdialenosťí 4 prvkov. Zapíšte aj výšky delení a nakreslite rez, ktorý to rozdelí na 2 clustre.
10. ROC krivky, čo to je, na čo to je, ktorá je najlepšia (bol daný graf niekoľkých).
Nie všetky otázky boli rovnako hodnotené. Napr. 1. bola za 4*5b, zatiaľ čo 6. bola za 3b. Neboli tam otázky na konkrétne algortimy, no chcelo to prehľad zo všetkého.
Test pozostával z desiatich otázok. Nebola tam hlboká teória, no učiť sa trebalo.
1. Loss function - čo to je, na čo to je, aké sú pri klasifikácii, aké pri regresii,...
2. Máte ttest, ako sa zmení interval spoľahlivosti ak máte 5x viac pozorovaní s rovnakou strdenou hodnotou aj rozptylom?
3. Otázky ohľadom X^2 testu, k čomu je a čo znamená p-hodnota.
4. Tabuľka predpovede a skutočnosti, vypočítajte Acc, Precision, Recall.
5. Naive Bayes klasifikátor - základný vzorec a prečo sa to volá "naivný"
6. Nakreslite Decision Tree k odpovedajúcemu obrázku. (bolo veľmi ľahké)
7. Máte naučené parametry logistickej regresie. Aká je pravdepodobnosť, že žiak spraví skúšky (veľmi podobné wiki: https://en.wikipedia.org/wiki/Logistic_regression#Example:_Probability_of_passing_an_exam_versus_hours_of_study)
8. Nakreslite graf a zaznačte vývin Bias, Variance, general error, train error na závislosti komplexnosti modelu.
9. Nakreslite dendogram. Bola zadaná tabuľka vzdialenosťí 4 prvkov. Zapíšte aj výšky delení a nakreslite rez, ktorý to rozdelí na 2 clustre.
10. ROC krivky, čo to je, na čo to je, ktorá je najlepšia (bol daný graf niekoľkých).
Nie všetky otázky boli rovnako hodnotené. Napr. 1. bola za 4*5b, zatiaľ čo 6. bola za 3b. Neboli tam otázky na konkrétne algortimy, no chcelo to prehľad zo všetkého.