SW projekt - OCR (2012/2013)

Odeslat odpověď

Smajlíci
:D :) :( :o :shock: :? 8) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen:

BBCode je zapnutý
[img] je zapnutý
[flash] je vypnutý
[url] je zapnuté
Smajlíci jsou zapnutí

Přehled tématu
   

Rozšířit náhled Přehled tématu: SW projekt - OCR (2012/2013)

SW projekt - OCR (2012/2013)

od Jakub » 12. 10. 2012 18:53

Hladame dalsich clenov do timu.

Zhruba o co ide:
Cílem softwarového projektu je vyvinout aplikaci, která z obrázku dokáže extrahovat text, určit typ dokumentu (např. faktura) na obrázku a ve formáte XML vrátit uživateli data na obrázku obsažená. Ty pak mohou být použity jako vstup jiné aplikace.
Aplikace umožní automatické rozeznávání typu dokumentu jako životopis, faktura nebo plakát. Výstupní XML dokument bude validní vůči předem známé XSD definice, která je závislá od jeho typu (faktura má jiné XSD než životopis).
Uživatel má k dispozici rozhraní, ve kterém je zobrazen originální obrázek a k němu vyextrahovaný text. Toto rozhraní umožňuje uživateli dodefinovat typ dokumentu, přiřadit význam jednotlivému textu/bloku nebo udělat korekturu v případě chybného přiřazení významu textu/bloku. Významem je myšleno jméno, adresa nebo položka na faktuře. Aplikace se tímto způsobem sama učí rozpoznávat typy dokumentů a přiřazovat význam k textu/bloku.

Strucne a vlastnymi slovami:
OCR je uz 1000x implementovane. Chceme do toho zaviest tu inteligenciu, ktora sama rozozna typ dokumentu, aby vedela vytvorit XML podla standardu (take XML je uz lahko importovatelne inymi aplikaciami).

Moznost upravy/rozsirenia zadania:
urcite ano - dobre napady su vitane

Jazyk:
prevazne Java (server), client-side este nie je rozhodnuty (v buducnosti by mala aplikacia moznost bezat aj na smartphone)

Odmena:
ano

Termin ukoncenia:
tento skolsky rok

Diplomka a SW projekt:
podla dohody - nieco urcite vymyslime :)

Veduci:
Doc. Tomas Skopal

Ak mate zaujem alebo otazky, piste na jakub.michalko (zav) seznam.cz

Nahoru