Zkouška 8. 2. 2017 (Hoksza)

Logické a fyzické schéma souboru, logický a fyzický záznam. Základní databázové operace. Hierarchie pamětí, magnetická páska, magnetický disk, RAID, jukebox. Halda, sekvenční soubor, index-sekvenční soubor, indexovaný soubor. Bitové indexy. Jednoduchá hašovací schemata. Perfektní hašování. Dynamické hašování, skupinové štěpení stránek. Hašovací schemata na částečnou shodu. B-stromy, B+-stromy. B*-stromy, (a,b)-stromy. Srovnání paralelního přístupu pomocí B-stromů a (a,b)-stromů. Struktury pro vícerozměrnou indexaci: VB-stromy, vícerozměrná mřížka. n-cestný algoritmus třídění.
karamel
Matfyz(ák|ačka) level I
Příspěvky: 10
Registrován: 27. 1. 2017 16:30
Typ studia: Informatika Bc.

Zkouška 8. 2. 2017 (Hoksza)

Příspěvek od karamel »

Ahoj, tak tedy přispívám tím, co si pamatuji ze dnešní zkoušky (píše se přímo do zadání, takže otázky, které zde uvádím, jsou zkresleny tím, jak jsem je pochopil a jak si je pamatuji).
  1. Tradiční úloha na index-sekvenční soubor. Pokud si to dobře pamatuji, měli jsme 10 000 000 záznamů, každý měl velikost 128 B (včetně primárního klíče). Stránka měla velikost 4 KiB, ukazatel 8 B. Měli jsme sestrojit primární index podle klíče velikosti 16 B, uvést jeho výšku a místo zabrané tímto indexem na disku. Dále jsme měli sestrojit sekundární index podle klíče velikosti 32 B, uvést jeho výšku a vypočítat, kolik bude potřeba přístupů na disk pro result range 200 záznamů. 20 bodů
  2. Měli jsme zahashovat několik čísel v lineárním hashování podle Litwina, splitting policy byla taková, že se štěpí, pokud nějaká stránka přeteče. Pokud si to dobře pamatuji, měli jsme tam postupně vkládat čísla: 5, 10, 11, 13, 8, 16, 32. Měli jsme nakreslit jednotlivá štěpení. 20 bodů
  3. Měli jsme redundantní B-strom, ze kterého jsme nejdříve měli provést delete dvou prvků, pak tam jeden přidat. 15 bodů
  4. Popište dvě modifikace R-stromů. 10 bodů
  5. Popište rozdíl mezi statickým a dynamickým externím hashováním a uvést příklady. 10 bodů
  6. Co je to bulk loading B-stromu? K čemu slouží a jak funguje? 5 bodů
  7. K čemu je lepší použít bitmap index a k čemu index pomocí B-stromů? 5 bodů
  8. Popište způsoby mapování vícerozměrných indexů do jednoho rozměru. 5 bodů
  9. Popište rozdíl mezi clusterovaným a neclusterovaným indexem. 5 bodů
  10. Popište RAID 0 a RAID 1, v čem se liší a tak. 5 bodů
Velmi doporučuji si vzít kalkulačku. Zejména u první úlohy vám ušetří hafo času.

Na písemku je 60 minut (nakonec nám to prodloužili na 68). S přepočítáváním první úlohy, protože jsem tam nejdřív udělal chybu, jsem to stihl za 60 minut. Člověk tedy nemá moc čas vymýšlet, myslím, že mít 90 minut by vůbec neuškodilo.

Převod bodů na výsledky probíhá následovně:
  • 90—100 bodů
  • 75—89 bodů
  • 60—74 bodů
  • 0—59 bodů
Odpovědět

Zpět na „DBI007 Organizace a zpracování dat I“