[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Umlaute



Hallo in die Runde!

wualex1_bEi_mvmhp64.ciw.uni-karlsruhe.de schrieb:
> Was macht das Programm genau? Ich frage deshalb, weil ich auf meiner
> Unix-Kiste ein Programm zur Umwandlung von Sonderzeichen verwende,
> das ich ohne Schwierigkeiten auch fuer DOS kompilieren koennte. Gruss,
Nachfolgend findest Du die Dokumentation zu dem  Programm.

Viele Gruesse

Detlef

(Dieses Programm erschien bereits in einer frueheren Ausgabe von "Display"  
in
einer sehr viel einfacheren Version unter dem Namen "Kor.Exe". Es wurde jetzt
weiter ausgebaut.)
"UMW" ist ein vielseitiges Korrekturprogramm, das sich vor allem dazu eignet,
gescannte Texte von permanent falsch gelesenen Zeichen zu befreien oder diese
umzuwandeln. "UMW" entfernt bzw. wandelt auch Steuerzeichen und Symbole in
Dateien, die auf dem Bildschirm das Auge nicht stoeren, bei laengerem Lesen mit
einer Sprachausgabe aber sehr laestig sein koennen.

Was kann "UMW"?

1. Innerhalb eines Unterverzeichnisses korrigiert "UMW" alle Dateien mit
derselben Extension in einem Arbeitsgang, sofern ein entsprechender Befehl
eingegeben wird. Eingabebeispiel: UMW *.txt. In diesem Fall erhalten alle
Txt-Dateien die Extrension *.out. Natuerlich lassen sich auch Einzeldateien
korrigieren sowie gezielte Bezeichnungen fuer die Zieldatei angeben.
Beispiel: UMW ABC.Dok Muster.Txt.

2. Alle zu aendernden oder zu loeschenden Buchstaben oder Strings sind in
Klammern zu setzen; Der nachfolgende Befehlsparameter kann mit Bindestrich oder
mit Schraegstrich eingeleitet werden.


3. Tauschfunktion. - Einzelzeichen oder Strings werden - mit einem
Leerzeichen getrennt - in die Eingabezeile geschrieben.
Parameter: -t oder /t
Beispiel: UMW Brief.Txt Read.Me (Stop Halt) -t
(alle "Stop" werden in "Halt" umgewandelt)

Sollen in einem Arbeitsgang gleich mehrere Buchstaben oder Strings getauscht
werden, so sind diese hintereinander zu schreiben. Der Austausch erfolgt dann
paarweise.
Beispiele: UMW Brief.Txt Liesmich.Txt (Begin Anfang End ende Yes ja no nein) -t

Es ist darauf zu achten, dass UMW die Tauscheingaben von links nach rechts
abarbeitet.
Beispiel: UMW Muster.Brf (a e e i i o o u) -t  - In der Ausgabedatei gibt es als
Vokal nur noch das u.
Bei Steuerzeichen und Funktionssymbolen interpretiert der PC solche Eingaben
allerdings oft als Ausfuehrungsanweisung. Hierfuer bietet UMW die Moeglichkeit,
saemtliche Zeichen auch mit ihrem Asciiwert hinter der Buchstabenfolge ASC
einzugeben.
So passiert es oft, dass in einem gescannten Text die
Anfuehrungszeichen durch die Symbole "kleiner als" und "groesser als" eingelesen
werden. Die Korrektur laesst sich mit folgender Eingabe durchfuehren:
UMW Buch.txt Buch.neu (Asc60 " Asc62 ") -t
Man kann natuerlich auch eingeben:
UMW Buch.Txt *.neu (Asc60 Asc34 Asc62 Asc34) -t
Sollen aus irgendeinem Grund die Leerfelder eines Textes durch ein Zeichen
ausgefuellt werden, so heisst die Eingabe:
UMW Buch.Txt *.neu (Asc32 X) -t
oder:
UMW Buch.Txt *.neu (Blank X) -t

4. Loeschfunktion.
Nach demselben Prinzip funktioniert das Loeschen von
Zeichen oder Strings.
Parameter: -l oder /l

Hier unterscheidet UMW 4 Moeglichkeiten:
a) Loeschen von Einzelbuchstaben oder Strings:
UMW Buch.Txt *.neu (") -l (alle Anfuehrungszeichen werden geloescht)
UMW Buch-Txt *.neu (Asc60 Asc62 Blank) -l (alle Kleiner-als- und
  Groesser-als-Zeichen sowie alle Leerfelder werden geloescht)

b) Loeschen von ganzen Woertern einschliesslich eines Blank
(Das zu loeschende ganze Wort muss in Anfuehrungszeichen gesetzt werden):
UMW Buch.Txt *.neu ("Seite") -l
  Das Wort "seite" wird ueberall dort, wo es frei steht, sowie ein Leerzeichen
  geloescht, waehrend Kombinationen wie: seitenweise, Titelseite usw erhalten
  bleiben. Sollte dem Wort "Seite" ein Satzzeichen folgen, so muessen Sie dieses
  natuerlich im Loeschstring mit angeben, also etwa: "Seite."

c) Loeschen von Woertern, die mit einem bestimmten Buchstaben odr String
beginnen einschliesslich eines Blanks:
UMW Buch.txt *.neu (ge*) -l
Alle Woerter, die mit "ge" beginnen, sowie ein Leerzeichen werden geloescht.

d) Loeschen von Woertern, in denen sich - gleichgueltig, ob am Anfang, in der
Mitte oder am Ende ein Buchstabe oder ein String befindet:
UMW Buch.Txt *.neu (*er*) -l
Es werden alle Woerter wie: Erde, Herbst, Laeufer usw geloescht.

5. Zeilenloeschfunktion
Parameter: -k = kill
UMW Buch.Txt *.neu (Seite) -k
Alle Zeilen, in denen das Wort "Seite" vorkommt, werden geloescht.

Natuerlich sind diese Beispiele unrealistisch; sie sollten lediglich den Umfang
der Moeglichkeiten von UMW zeigen. Ein Signalton und ein Eintrag oberhalb der
Cursorzeile zeigen an, dass die Korrektur abgeschlossen ist. Ferner finden Sie
in der darueber liegenden Zeile die Anzahl der Aenderungen angegeben.

Ich bedanke mich wiederum bei dem Programmautor des bewaehrten "Terminwaechters"
Markus Wendel auch fuer dieses Tool.
Gerhard Reiter, Hannover