[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Neues bei den OCR-Programmen



Vor kurzem sind neue Versionen von Omnipage und Textbridge erschienen.
Aus diesem Grund schreibe ich hier mal ein paar Bemerkungen, auch zu
anderen OCR-Programmen.
 
Sowohl das neue Omnipage, als auch das neue Textbridge (von Xerox)
sollen automatisch invertierten Text erkennen. Das ist recht nuetzlich,
wenn Zeitschriften oder Broschueren gelesen werden. Die Firma
Arkenstone benutzt meines Wissens den Caere Erkennungsalgorhytmus,
Caere ist die Herstellerfirma von Omnipage. Ceare schreibt, dass das
neue Omnipage 8.0 um 62% besser erkennen soll, als Omnipage 7.
Ausserdem hat es Multithreading, das bedeutet, man kann waehrend des
Scannens schon frueher gescannte Texte lesen. Auch das ist bereits in
Open Book integriert. Aber ich moechte wenn moeglich keine speziell
fuer Blinde angepasste Software mehr nutzen. Auch die Erkennung des
neuen Textbridge Pro 98 wurde gegenueber Textbridge Pro 96 verbessert,
angeblich um 82%. Der Textbridge-Erkennungsalgorhytmus wird meines
Wissens von Kurzweil in den USA und von Baum fuer ihre an die
Beduerfnisse Blinder angepassten OCR-Programmversionen benutzt. Ich hoffe,
sowohl Omnipage 8.0 als auch Textbridge Pro 98 demnaechst testen zu
koennen und werde hier darueber berichten. Textbridge Classic aus dem
Jahr 1996 habe ich hier. Es ist kinderleicht zu bedienen, aber die
Erekennungsqualitaet ist nicht Stand der Technik.
 
In der Zeitschrift c't wurde vor kurzem ein Vergleich verschiedener
OCR-Programme veroeffentlicht. Ich habe das nicht gelesen, mir wurde
gesagt, dass den Vergleich das Programm Cuneiform gewonnen hat. Ueber
diese Software habe ich vor einigen Monaten schon mal im Blindnet
geschrieben. Man kann sich bei www.ocr.com eine Testversion saugen,
die einige Tage ohne Einschraenkungen laeuft. Cuneiform kann auch via
ftp unter ftp.ocr.com im Verzeichnis ocr/german gesaugt werden, dann
muss kein Formularkram ausgefuellt werden. Das Programm laeuft sowohl
unter Windows 95 als auch unter 3.11. Allerdings muss unter 3.11 eine
permanente Auslagerungsdatei angelegt werden. Ich habe Cuneiform
gekauft, und es erkennt fuer heutige Verhaeltnisse tatsaechlich sehr gut.
Im November ist die Version 3.0b erschienen, ich konnte umsonst von
einer aelteren Version, die auch schon die Nummer 3 trug updaten. Im
Gegensatz zu Omnipage und Textbridge hat Cuneiform keine automatische
Blattlagenerkennung und auch keine automatische Bildbegradigung.
Invertierter Text wird ebenfalls nicht automatisch erkannt. Aber in
manchen Faellen ist Cuneiform einfach besser, als das andere Programm,
was ich bis jetzt sonst immer verwende: Wordscan.
 
Bei Recognita (www.recognita.hu) hat sich in letzter Zeit nicht viel
getan. Unter Windows ist die aktuelle Version 3.2. Recognita bietet
immer noch eine DOS Version an, es ist 3.0, aber ich bezweifle, dass
die weiterentwickelt wird.
 
Hierzulande hat Open Book, bzw. die Lesesoftware, welche Open Book
benutzt, aber einen anderen Namen traegt (z. B. das Leseass) nur wenig
Konkurrenz. In den USA hat Kurzweil vor etwa einem Jahr Omni 1000
veroeffentlicht, und das uebertrifft Open Book schon in vielen Dingen.
So kann man z. B. bei Omni 1000 Seiten, die nichts geworden sind neu
einscannen. Das geht zwar auch bei Open Book, aber man kann Open Book
nicht sagen, dass es eine Seite verwerfen soll, neue Seiten werden
grundsaetzlich angehaengt. Man kann bei Omni 1000 auch Seiten
nachtraeglich einfuegen. Das ist praktisch, wenn beim Einscannen eines
Buches eine Seite ueberschlagen wurde.
 
          <***  ml  ***>