Stránka 1 z 1

du3

Napsal: 20. 4. 2008 22:04
od Necroman
Jak s vam dari ve tretim ukolu? Pokousim se zparalelizovat muj algorimus, co byl tak uspesny v prvem ukolu a porad to na me hazi seg. fault errory, zkratka nejde to, jak bych si pral.

Dari se nekomu dosahnout zrychleni aspon 4? Nebo to berete pragmaticky a date obycejny algoritmus a spokojite se s cca 2x zrychlenim?

Re: du3

Napsal: 21. 4. 2008 07:30
od luk
Ahoj, vysekal jsem z toho něco přes 9 na large a asi 7,2 na huge, ale stálo mne to celou sobotu a půlku neděle :?

Heh, ale teď koukám, že se parlab nějak špatně vyspal, protože mám u obou o jedna míň (8,1 a 6,2) :cry: A včera jsem určitě halucinace neměl!

Re: du3

Napsal: 22. 4. 2008 00:26
od jonny
No ja jsem proste vzal TBB verzi, funktory prepsal na funkce, a pridal k nim #pragma omp parallel for a pocitam large za 6s. Ale je fakt, ze mi OMP vzalo sekundu. Na druhou stranu to bylo hotovy asi za 10 minut.. :P

Re: du3

Napsal: 22. 4. 2008 20:40
od weetya
Necroman píše:Jak s vam dari ve tretim ukolu? Pokousim se zparalelizovat muj algorimus, co byl tak uspesny v prvem ukolu a porad to na me hazi seg. fault errory, zkratka nejde to, jak bych si pral.
Me se to OpenMP taky nedari.
Treba seriovej kod dobehne za pul vteriny, kod s #pragma nedobehne vubec a podobny legrace.

Zrychleni je vetsinou dost chaby oproti seriove verzi. Zlaty TBB!

Jeste to zkusim zitra, pripadne odevzdam trivialni reseni (#pragma a 3 cykly)

Re: du3

Napsal: 23. 4. 2008 08:16
od Necroman
Nakonec se mi podarilo to OpenMP rozchodit, bylo ale treba roztrhnout for cyklus na jeden podle y, ktery uvnitr vola funkci se zbytek for cyklu, aby ten prekladac asi jasne pochopil, kde se to ma paralelizovat.
Momentalne davam zrychleni cca 9, nejaka rezie tam je, ale celkem spokojenost.