SW projekt - OCR (2012/2013)

Cílem předmětu je naučit studenty týmové práci na větším softwarovém projektu. Probíhá seminární formou v rozsahu obvykle 2 hodiny týdně, a to zpravidla po dobu jednoho akademického roku. Práci na projektu lze zahájit od zimního nebo od letního semestru (s přesahem do dalšího školního roku). Projekt je zakončen veřejnou obhajobou. Předmět je možné zapsat kdykoliv během akademického roku (zapisuje se až v době, když se předpokládá konání obhajoby), během celého studia ho však lze zapsat maximálně dvakrát.
Jakub

SW projekt - OCR (2012/2013)

Příspěvek od Jakub »

Hladame dalsich clenov do timu.

Zhruba o co ide:
Cílem softwarového projektu je vyvinout aplikaci, která z obrázku dokáže extrahovat text, určit typ dokumentu (např. faktura) na obrázku a ve formáte XML vrátit uživateli data na obrázku obsažená. Ty pak mohou být použity jako vstup jiné aplikace.
Aplikace umožní automatické rozeznávání typu dokumentu jako životopis, faktura nebo plakát. Výstupní XML dokument bude validní vůči předem známé XSD definice, která je závislá od jeho typu (faktura má jiné XSD než životopis).
Uživatel má k dispozici rozhraní, ve kterém je zobrazen originální obrázek a k němu vyextrahovaný text. Toto rozhraní umožňuje uživateli dodefinovat typ dokumentu, přiřadit význam jednotlivému textu/bloku nebo udělat korekturu v případě chybného přiřazení významu textu/bloku. Významem je myšleno jméno, adresa nebo položka na faktuře. Aplikace se tímto způsobem sama učí rozpoznávat typy dokumentů a přiřazovat význam k textu/bloku.

Strucne a vlastnymi slovami:
OCR je uz 1000x implementovane. Chceme do toho zaviest tu inteligenciu, ktora sama rozozna typ dokumentu, aby vedela vytvorit XML podla standardu (take XML je uz lahko importovatelne inymi aplikaciami).

Moznost upravy/rozsirenia zadania:
urcite ano - dobre napady su vitane

Jazyk:
prevazne Java (server), client-side este nie je rozhodnuty (v buducnosti by mala aplikacia moznost bezat aj na smartphone)

Odmena:
ano

Termin ukoncenia:
tento skolsky rok

Diplomka a SW projekt:
podla dohody - nieco urcite vymyslime :)

Veduci:
Doc. Tomas Skopal

Ak mate zaujem alebo otazky, piste na jakub.michalko (zav) seznam.cz
Odpovědět

Zpět na „NPRG023 Softwarový projekt“