Hladame dalsich clenov do timu.
Zhruba o co ide:
Cílem softwarového projektu je vyvinout aplikaci, která z obrázku dokáže extrahovat text, určit typ dokumentu (např. faktura) na obrázku a ve formáte XML vrátit uživateli data na obrázku obsažená. Ty pak mohou být použity jako vstup jiné aplikace.
Aplikace umožní automatické rozeznávání typu dokumentu jako životopis, faktura nebo plakát. Výstupní XML dokument bude validní vůči předem známé XSD definice, která je závislá od jeho typu (faktura má jiné XSD než životopis).
Uživatel má k dispozici rozhraní, ve kterém je zobrazen originální obrázek a k němu vyextrahovaný text. Toto rozhraní umožňuje uživateli dodefinovat typ dokumentu, přiřadit význam jednotlivému textu/bloku nebo udělat korekturu v případě chybného přiřazení významu textu/bloku. Významem je myšleno jméno, adresa nebo položka na faktuře. Aplikace se tímto způsobem sama učí rozpoznávat typy dokumentů a přiřazovat význam k textu/bloku.
Strucne a vlastnymi slovami:
OCR je uz 1000x implementovane. Chceme do toho zaviest tu inteligenciu, ktora sama rozozna typ dokumentu, aby vedela vytvorit XML podla standardu (take XML je uz lahko importovatelne inymi aplikaciami).
Moznost upravy/rozsirenia zadania:
urcite ano - dobre napady su vitane
Jazyk:
prevazne Java (server), client-side este nie je rozhodnuty (v buducnosti by mala aplikacia moznost bezat aj na smartphone)
Odmena:
ano
Termin ukoncenia:
tento skolsky rok
Diplomka a SW projekt:
podla dohody - nieco urcite vymyslime
Veduci:
Doc. Tomas Skopal
Ak mate zaujem alebo otazky, piste na jakub.michalko (zav) seznam.cz
Hladame dalsich clenov do timu.
[b]Zhruba o co ide:[/b]
Cílem softwarového projektu je vyvinout aplikaci, která z obrázku dokáže extrahovat text, určit typ dokumentu (např. faktura) na obrázku a ve formáte XML vrátit uživateli data na obrázku obsažená. Ty pak mohou být použity jako vstup jiné aplikace.
Aplikace umožní automatické rozeznávání typu dokumentu jako životopis, faktura nebo plakát. Výstupní XML dokument bude validní vůči předem známé XSD definice, která je závislá od jeho typu (faktura má jiné XSD než životopis).
Uživatel má k dispozici rozhraní, ve kterém je zobrazen originální obrázek a k němu vyextrahovaný text. Toto rozhraní umožňuje uživateli dodefinovat typ dokumentu, přiřadit význam jednotlivému textu/bloku nebo udělat korekturu v případě chybného přiřazení významu textu/bloku. Významem je myšleno jméno, adresa nebo položka na faktuře. Aplikace se tímto způsobem sama učí rozpoznávat typy dokumentů a přiřazovat význam k textu/bloku.
[b]Strucne a vlastnymi slovami:[/b]
OCR je uz 1000x implementovane. Chceme do toho zaviest tu inteligenciu, ktora sama rozozna typ dokumentu, aby vedela vytvorit XML podla standardu (take XML je uz lahko importovatelne inymi aplikaciami).
[b]Moznost upravy/rozsirenia zadania:[/b]
urcite ano - dobre napady su vitane
[b]Jazyk:[/b]
prevazne Java (server), client-side este nie je rozhodnuty (v buducnosti by mala aplikacia moznost bezat aj na smartphone)
[b]Odmena: [/b]
ano
[b]Termin ukoncenia: [/b]
tento skolsky rok
[b]Diplomka a SW projekt:[/b]
podla dohody - nieco urcite vymyslime :)
[b]Veduci:[/b]
Doc. Tomas Skopal
Ak mate zaujem alebo otazky, piste na jakub.michalko (zav) seznam.cz