du3

Vícejádrové procesory přináší možnost provádět paralelní výpočty i na běžných počítačích. Implementace aplikací využívajících paralelní výpočty je netriviální záležitostí. Cílem předmětu je proto seznámit studenty teoreticky i prakticky se současně používanými softwarovými technologiemi pro zápis paralelních algoritmů, naučit studenty ladit paralelní programy a v neposlední řadě naučit studenty ladit výkon paralelních programů.
Uživatelský avatar
Necroman
Supermatfyz(ák|ačka)
Příspěvky: 459
Registrován: 20. 1. 2005 19:46
Typ studia: Informatika Mgr.
Bydliště: Louny / kolej Jednota, Praha
Kontaktovat uživatele:

du3

Příspěvek od Necroman »

Jak s vam dari ve tretim ukolu? Pokousim se zparalelizovat muj algorimus, co byl tak uspesny v prvem ukolu a porad to na me hazi seg. fault errory, zkratka nejde to, jak bych si pral.

Dari se nekomu dosahnout zrychleni aspon 4? Nebo to berete pragmaticky a date obycejny algoritmus a spokojite se s cca 2x zrychlenim?
WANTED:
Dead or Alive
^-^
( ^ )
Schroedinger's Cat
Uživatelský avatar
luk
Matfyz(ák|ačka) level II
Příspěvky: 74
Registrován: 6. 6. 2005 18:32
Typ studia: Informatika Mgr.
Bydliště: Praha

Re: du3

Příspěvek od luk »

Ahoj, vysekal jsem z toho něco přes 9 na large a asi 7,2 na huge, ale stálo mne to celou sobotu a půlku neděle :?

Heh, ale teď koukám, že se parlab nějak špatně vyspal, protože mám u obou o jedna míň (8,1 a 6,2) :cry: A včera jsem určitě halucinace neměl!
jonny
Matfyz(ák|ačka) level II
Příspěvky: 53
Registrován: 14. 12. 2006 17:14

Re: du3

Příspěvek od jonny »

No ja jsem proste vzal TBB verzi, funktory prepsal na funkce, a pridal k nim #pragma omp parallel for a pocitam large za 6s. Ale je fakt, ze mi OMP vzalo sekundu. Na druhou stranu to bylo hotovy asi za 10 minut.. :P
127.0.0.1, C6H12O6 127.0.0.1
weetya
Matfyz(ák|ačka) level I
Příspěvky: 8
Registrován: 23. 4. 2007 21:21

Re: du3

Příspěvek od weetya »

Necroman píše:Jak s vam dari ve tretim ukolu? Pokousim se zparalelizovat muj algorimus, co byl tak uspesny v prvem ukolu a porad to na me hazi seg. fault errory, zkratka nejde to, jak bych si pral.
Me se to OpenMP taky nedari.
Treba seriovej kod dobehne za pul vteriny, kod s #pragma nedobehne vubec a podobny legrace.

Zrychleni je vetsinou dost chaby oproti seriove verzi. Zlaty TBB!

Jeste to zkusim zitra, pripadne odevzdam trivialni reseni (#pragma a 3 cykly)
Uživatelský avatar
Necroman
Supermatfyz(ák|ačka)
Příspěvky: 459
Registrován: 20. 1. 2005 19:46
Typ studia: Informatika Mgr.
Bydliště: Louny / kolej Jednota, Praha
Kontaktovat uživatele:

Re: du3

Příspěvek od Necroman »

Nakonec se mi podarilo to OpenMP rozchodit, bylo ale treba roztrhnout for cyklus na jeden podle y, ktery uvnitr vola funkci se zbytek for cyklu, aby ten prekladac asi jasne pochopil, kde se to ma paralelizovat.
Momentalne davam zrychleni cca 9, nejaka rezie tam je, ale celkem spokojenost.
WANTED:
Dead or Alive
^-^
( ^ )
Schroedinger's Cat
Odpovědět

Zpět na „NPRG042 Programování v paralelním prostředí“