od omikronn » 3. 2. 2009 14:03
1. Redudantni B-strom
Myslim, ze po tom deletu by tam nemela byt ta 12 - vzhledem k tomu, ze je to redundantni B-strom, tak na zacatku je ta 12 jen klicem a nepoji se k ni zadna data, takze se nesmi dostat do listu (muzeme ji s klidem vypustit). Tomu odpovidaly i Zemlickovy reakce na nekolik pisemek, co videl, i jeho komentar reseni po skonceni. (Tedy pokud jsem vsechno nepochopil uplne spatne, coz je taky moznost;))
2. Jak zapojit disky, kdyz mame docasna data, ktere prochazime sekvencne. Na co si dat pozor?
Podle toho, co rikal po skonceni, miril tou otazkou ke stripingu - s tim, ze "na co si mame davat pozor" bylo: neni to uplne spolehlive reseni, takze je treba si uvedomit, kolik nas vypocty tech docasnych dat staly - pokud by to byly vysledky nejakeho mnohahodinoveho pocitani, vyplatilo by se zvolit jeste neco spolehlivejsiho (treba prave ten mirroring).
3. Jak hledame dokumenty obsahujici vybranne slovo nebo fraze v kolekci pres invertovane soubory (tak to uplne nebylo)
Invertovany soubor - specialni pripad indexovaneho souboru, pouziva se typicky prave pro takovehle situace (ve skriptech je to trochu rozepsano). Struktura odpovida indexovanemu souboru: zaznam = dokument, nejvyssi uroven indexu tvori seznam slov (ktera se v dokumentech vyskytuji, prip. az na vyjimky - spojky apod.), za kazdym slovem je ukazatel do dalsi urovne, ve ktere je seznam id dokumentu, ve kterych se toto slovo nachazi (muze tam byt jeste info, na jakych pozicich se v tomto dokumentu vyskytuje).
Hledani dokumentu obsahujici nejaka slova je pak nasnade; pri hledani frazi by se to melo jeste nejak nakombinovat se vzdalenosti pozic tech nekolika slov, ktera tuto frazi tvori.
4. Hledani klice pri skupinovem stepeni.
Troch problem byl v tom, ze se ptal na obecny postup. Prakticky priklad bych i vyresil (taky diky Xerxesovi:)), ale dat z hlavy dohromady presne ten algoritmus...
Shrnul bych to tak - hlavni je pochopit, na co se Zemlicka v otazce pta (hlavne co chce slyset). Kdyz jsem sel na zkousku, mel jsem pocit, ze se v tom celkem orientuju. Bohuzel to nestacilo - zejmena u teoretickych otazek mam pocit, ze clovek potrebuje znat docela dost detailu (nebo OPRAVDU dobre pochopit, jak ta vec funguje, pripadne s ni pracovat v praxi;)). Mozna me bodovani po opraveni pisemek vyvede z omylu, ale dost o tom pochybuju.
[quote]1. Redudantni B-strom[/quote]
Myslim, ze po tom deletu by tam nemela byt ta 12 - vzhledem k tomu, ze je to redundantni B-strom, tak na zacatku je ta 12 jen klicem a nepoji se k ni zadna data, takze se nesmi dostat do listu (muzeme ji s klidem vypustit). Tomu odpovidaly i Zemlickovy reakce na nekolik pisemek, co videl, i jeho komentar reseni po skonceni. (Tedy pokud jsem vsechno nepochopil uplne spatne, coz je taky moznost;))
[quote]2. Jak zapojit disky, kdyz mame docasna data, ktere prochazime sekvencne. Na co si dat pozor?[/quote]
Podle toho, co rikal po skonceni, miril tou otazkou ke stripingu - s tim, ze "na co si mame davat pozor" bylo: neni to uplne spolehlive reseni, takze je treba si uvedomit, kolik nas vypocty tech docasnych dat staly - pokud by to byly vysledky nejakeho mnohahodinoveho pocitani, vyplatilo by se zvolit jeste neco spolehlivejsiho (treba prave ten mirroring).
[quote]3. Jak hledame dokumenty obsahujici vybranne slovo nebo fraze v kolekci pres invertovane soubory (tak to uplne nebylo)[/quote]
Invertovany soubor - specialni pripad indexovaneho souboru, pouziva se typicky prave pro takovehle situace (ve skriptech je to trochu rozepsano). Struktura odpovida indexovanemu souboru: zaznam = dokument, nejvyssi uroven indexu tvori seznam slov (ktera se v dokumentech vyskytuji, prip. az na vyjimky - spojky apod.), za kazdym slovem je ukazatel do dalsi urovne, ve ktere je seznam id dokumentu, ve kterych se toto slovo nachazi (muze tam byt jeste info, na jakych pozicich se v tomto dokumentu vyskytuje).
Hledani dokumentu obsahujici nejaka slova je pak nasnade; pri hledani frazi by se to melo jeste nejak nakombinovat se vzdalenosti pozic tech nekolika slov, ktera tuto frazi tvori.
[quote]4. Hledani klice pri skupinovem stepeni.[/quote]
Troch problem byl v tom, ze se ptal na obecny postup. Prakticky priklad bych i vyresil (taky diky Xerxesovi:)), ale dat z hlavy dohromady presne ten algoritmus...
Shrnul bych to tak - hlavni je pochopit, na co se Zemlicka v otazce pta (hlavne co chce slyset). Kdyz jsem sel na zkousku, mel jsem pocit, ze se v tom celkem orientuju. Bohuzel to nestacilo - zejmena u teoretickych otazek mam pocit, ze clovek potrebuje znat docela dost detailu (nebo OPRAVDU dobre pochopit, jak ta vec funguje, pripadne s ni pracovat v praxi;)). Mozna me bodovani po opraveni pisemek vyvede z omylu, ale dost o tom pochybuju.