reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

CPen: a v životě už nebudete přepisovat ručně !

14.10.2002, Zdeněk Michálek, recenze
CPen: a v životě už nebudete přepisovat ručně !
Kolikrát jste si už říkali: "čert vezmi ty papíry, kdo to má stále do toho počítače přepisovat". Klasický scanner a OCR (program pro rozpoznávání písma) by sice pomohl, jenomže kdo to kvůli těm pár řádkům bude zapínat a nastavovat. Co tak se podívat na trochu netradiční řešení ?
Kapitoly článku:
  1. CPen: a v životě už nebudete přepisovat ručně !
  2. Další funkce, vyhodnocení
K recenzi C-Penu jsem se chystal už opravdu dlouho. Z tohoto prostého faktu se dá vyčíst, že se v žádném případě nejedná o žádnou novinku - na návodu i krabici je uveden copyright z roku 2001, přístroj sám je však k mání už od konce roku 1999, byť ve starším provedení.


Přesné označení přístroje je C Pen 600 MX. Na našem trhu se objevil poněkud později. Důvod je tentokrát jasný a pochopitelný - OCR program bez schopnosti rozpoznávat písmena s českou (slovenskou) diakritikou je v našich končinách prakticky nepoužitelný. Česká lokalizace (a nejen česká - existuje i lokalizace maďarská, polská, ruská, jak je ostatně patrné z nápisů na krabici) však byla naštěstí doplněna, takže zhruba od roku 2001 je C-Pen k mání i u nás.


Předně: co to vlastně C-Pen je ?

V první řadě to, co očekáváme: řádkový scanner s OCR programem, implementovaným přímo v firmware přístroje.

ParametrHodnota
Snímací prvekCMOS, CIF 285x384 bodů, 256 stupňů šedi
Snímaná oblast 6x8 mm, rozlišení 330 dpi
50 vzorků za sekund
C ReadRychlost snímání textu: 15 cm/s
Velikost fontu: 5-22 bodů
Procesor C Technologies Argus, 72MHz
Paměť ROM: 6 MB Flash
RAM: 4 MB
RozměryRozměry: 140x35x24 mm
Hmotnost: 80 g včetně baterií
Displejgrafický monochromatický LCD 168x33 bodů
KomunikaceIrDA 1.0 SIR
Serial RS232, 9,6 a 115,2 kb/s
Napájení2xAAA (mikrotužka), odběr: max 400 mA, v klidu 20 mA






Základní myšlenka je jasná a srozumitelná: přístroj uchopíme do ruky (levé nebo pravé - v software je možné nastavit), přiložíme na papír do místa, kde začíná řádka, stiskneme tlačítko a pomalu "jedeme" se snímačem až do konce řádky. V průběhu pohybu C-Pen snímá předlohu ve formě bitmapy.

Na konci řádky uvolníme tlačítko, což je signál pro C-Pen aby převedl nasnímanou bitmapu na znaky. Proces převedení trvá řádově sekundy (podle množství textu,kvality písma a podkladu). Rozpoznaný text se objeví na displeji a je možné pokračovat ve snímání další řádky (od předchozího textu je oddělena koncem řádky).


Po nasnímání celého textu je jej možné opravit a uložit (ve formě souboru) do paměti C-Penu, odkud je možné jej přenést do počítače, odeslat přes IrDA port do PDA nebo třeba do mobilu.

Chybovost rozpoznávání
je hodnotou, která je (alespoň pro mě) u zařízení podobného typu (a OCR obecně) určující. Můžete mít jakkoliv kvalitní nástavbový soft, pokud je chybovost velká, je zařízení nepoužitelné. Jak C-Pen dopadl ?

  • Sledování linie textu
    Je třeba podotknout, že C-Pen nad očekávání dobře zvládl problém, který bývá pro řádkové scannery určující. Když snímač vedete rukou, snadno se Vám stane, že "ujedete" nějaký ten milimetr nahoru nebo dolů. To ovšem (při malých písmenech) znamená, že se vám do "zorného pole" snímače dostane i řádek, který je nad nebo pod řádkem snímaným.
    C-Pen při stisknutí tlačítka START vyhodnotí, zda je v jeho zorném poli jeden řádek nebo více současně a zaměří se jen na ten, který je nejblíže středu zorného pole snímače. Ten pak bezchybně sleduje i pokud rukou "ujedete" - za tento bod velká jednička.
  • Adaptivnost na změnu rychlosti snímání
    Opět bez větších problémů. C-Pen v pohodě snímal při rychlosti posuvu od zhruba 3cm/s do 15cm/s, což je naprosto postačující rozsah.
  • Necitlivost na změnu úhlu čtení
    Tady už to bylo trochu horší. C-Pen je potřeba držet co nejkolměji k papíru - už úhel na obrázku v záhlaví tohoto článku způsobí zvýšení chybovosti na zhruba dvojnásobek.
  • Chybovost rozpoznávání
    Zde je třeba se zdržet o něco déle.

    Chybovost je obecně ovlivňována mnoha faktory, v první řadě však kvalitou podkladu a algoritmem OCR programu. To, jak program reaguje na méně obvyklý font, na nižší kontrast podkladu, na nezvyklou barevnost textu, na změnu velikosti písma atd. je většinou určující i pro cenovou hladinu toho kterého programu. "Lepší" programy mívají výukové módy, které umožní chybovost rozpoznávání s postupující prací výrazně snížit, adaptovat program na nezvyklý řez písma atd..

    C-Pen bohužel tyto možnosti nemá. V menu je sice položka "Kalibrace", vzhledem ke způsobu práce s ní (krouživý pohyb perem po podkladu) se však zřejmě jedná spíše o adaptaci nastavení jasových a kontrastních poměrů než o výukový mód. Kromě toho je možné již jen nastavit jen případný inverzní podklad - a to je vše

    Pro testování chybovosti byla jako podklad použita poslední strana manuálu k C-Penu (bezpatkové písmo stylu Helvetica o velikosti 8 bodů).
    Při kolmém držení pera se chybovost pohybovala mezi 1 - 3%, největší problémy dělaly háčky, které C-Pen občas rozpoznal jako čárky. Anglický text (bez diakritiky) byl prakticky bez problémů.

    O něco větší problémy byly s patkovým písmem - chybovost byla mezi 2 až 5% pro stejně vysoké písmo.

    Naprosto bez problémů bylo čtení čarových kódů - z cca 100 načtených kódů nebyl špatně žádný. Protože se nejedná o primární účel C-Penu, nezkoušeli jsme úplnost rozpoznávaných typů čarových kódů.

    Čtení méně běžných malých písem (např. na vizitkách) je provázeno o něco vyšší chybovostí. Pro přibližnou ilustraci - zkusil jsem načíst údaje z 20 vizitek, v průměru 3 znaky na vizitce byly rozpoznány chybně.

reklama