[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Kurzschrift Rueckuebersetzung



Hallo Gerhard, inzwischen habe ich das Programm selbst einmal getestet.
Ich habe spontan einige Text-Phrasen geschrieben, diese in Kurzschrift
gewandelt und die gekuerzte Fassung mit 1tk-demo wieder in Vollschrift
rueckuebersetzt. Das Ergebnis moechte ich zur allgemeinen Diskussion hier
veroeffentlichen. Vielleicht ergeben sich dadurch fuer dich
Verbesserungsvorschlaege fuer die naechste Programmversion.

Es sei noch einmal daran erinnert, dass es hier um eine Aufgabe geht, die
mit einem Programm praktisch niemals 100prozentig geloest werden kann.
Das Ergebnis laesst sich allenfalls durch lange Ausnahmelisten und
besondere Verfahren wie die von Wolfgang Hubert angesprochene
Trigrammanalyse verbessern. Ich denke, dass jedoch auch die bisherigen
Regeln erweitert werden koennen, um einige typische Fehler auszumerzen.
Z. B. werden einformige Kuerzungen nicht erkannt, wenn sie am Anfang
eines Wortes vorkommen wie "beispiel", "beispielsweise", "Gegenstand"
etc.

mein Originaltext
-----------------
Vervielfaeltigungsapparat

ein Gegenstand

viele Gegenstaende

in diesem Beispiel

oder beispielsweise

die Stadt Lutwigslust liegt in Mecklemburg-Vorpommern.

Das ueberschreitet die verhaeltnismaessigkeit der Mittel.

Hoeren Sie nun unsere Sendung "aus Religion und Zeitgeschichte".

Er hiess Herrmann.

Er war ein Mathematiker

und Philosoph zugleich.

Oder war er ein hollaendischer Liedermacher?

Das weiss ich auch nicht mehr.

Demokratie bedeutet "Herrschaft des Volkes".

Die "Kyniker" waren die "Hundephilosophen",

waehrend die "Stoiker" im Garten herumliefen.

Historischer Materialismus

ist keineswegs dasselbe wie

dialektischer Materialismus.

Das hoechste Glueck der Erde, liegt auf dem Ruecken der Pferde.

die gekuerzte Fassung
--------------------
-VLF_bEi_LT>USAPP)AT

6 G,]

VLE G!]E

* 0[ B,0

O B,0S,3E

0 ]ADT LUTW>SLU] L0GT * ME$L[BURG-,?POX7N.

D ,85R3(T 0 VHM_bEi_^>K R MT.

H9RC S N/ /S7E SCDU (1S RY>ION U ZT&5#().

7 H0^ h7rm+n.

7 ) 6 MATH[ATIK7

U PH ,ZG4.

O ) 7 6 HOQ_bEi_NDI57 L0D7M<7?

D W3^ # \ N =.

DT0 ;D2(T (RR5AFT . VK%).

0 (K'YNIK7) )C 0 (H/DEPHC),

_bEi_D 0 (]OIK7) - G)TC H7UML0FC.

HI]?I57 ML!I

] K6%WGS DSE 2

DI:EKTI57 ML!I.

D H94]E G$ R 7DE, L0GT 1 [ R$C R PF7DE.

und nun die Rueckuebersetzung
---------------------------
vervielfaeletztigusapparat

ein gstand

viele gstaende

in diesem beispiel

oder bspielsweise

die stadt lutwenigslust liegt in mecklemburegier- vorpommern.

das ueberschreitet die vhmaessigkeit der mittel.

hoeren sie nun unsere sendung (aus religion und zeitgeschichte).

er hiess herrmann.

er war ein mathematiker

und philosoph zugleich.

oder war er ein hollaendischer lwiederermacher?

das weiss ich auch nicht mehr.

demokratie bedeutet (rrschaft des vkes).

die (kyniker) aren die (hundephen),

waehrend die (stoiker) im garten herumliefen.

historischer mlismus

ist keineswegs dasselbe wie

dialekonntischer mlismus.

das hoechste glueck der erde, liegt auf dem ruecken der pferde.


p.s.
Als Programmierer interessieren mich auch Fragen der Performance. Daher
noch zwei Anmerkungen dazu, die aber gemessen an der Aufgabenstellung
und meinen Testbedingungen nur eine untergeordnete Rolle spielen und
daher auch nicht als Kritik, sondern als Fachsimpellei unter
Programmierern gedacht sind.

Mir ist aufgefallen, dass du den Text offenbar nicht als ganzes in den
Speicher laedst, sondern in kleineren Einheiten (Wort oder Zeile) aus der
Datei liesst. Das ist besonders unter Dos sehr vorteilhaft, weil so keine
Speicherprobleme entstehen. Das Programm arbeitet im Realmode. Dennoch
konnte ich eine 2 mByte grosse Datei umwandeln.

Fuer eine 130 kByte grosse Datei braucht das Programm auf einem Pentium
200 mHz immerhin 25 Sekunden. Wenn man bedenkt, dass ichden Test auf
einer Ramdisk gemacht habe, um die Zeit fuer Lese/Schreib-Zugriffe zu
minimieren, ist das schon beachtlich langsam.

Das haengt aber moeglicherweise mit Quick Basic 4.5 zusammen. Weisst du, ob
qb-Programme wirklich in Maschinensprache uebersetzt oder aber nur mit
dem Interpreter verlinkt werden?

herzliche Gruesse