[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: CT-Artikel auf ASCII ISO-Umwandlung



Hallo Thomas
sz2308_bEi_rzmail.uni-erlangen.de meinte neulich zum Thema Re: CT-Artikel auf
 ASCII ISO-Umwandlung
> Zur Unwandlung des Zeichensatzes kann das kleine Programm RECODE verwen
det
> werden, das unter UNIX ueblich ist. der Quellcode kann sicher auch unte
r
> DOS uebersetzt werden.

Vielen Dank fuer deinen Hinweis. Ich habe mir daraufhin den Source-Code
besorgt und mit der Entwicklungsumgebung djgpp fuer Dos uebersetzt.
DieDos-Version steht auf meiner Homepage zum Download bereit.

http://pinneberg.netsurf.de/~h.karahasan/

> Mit Recode koennen viele Zeichensaetze ineinander umgewandelt werden.
Die neueste Version 3.4 kennt 150 Zeichensaetze, zwischen denen hin- und
hergewandelt werden kann.

> Fuer diese zwecke ist wohl eine Umwandlung in IBMPC hilfreich
Jain, einmal ist der Zeichensatz umzuwandeln, zum anderen die
Zeilenumbrueche. Ich kannte das Programm bisher nicht. Mein erster
Versuch hat nur die Iso-Umlaute wandeln koennen, aber nicht die harten
Absatzschaltungen. Recode allein reicht daher u. U. nicht aus. Das macht
aber nichts. Ich habe es dennoch uebersetzt, weil sich sicher haeufig
Einsatzmoeglichkeiten finden lassen.

Fuer unser konkretes Problem ist ein spezielles Ct-Programm besser
geeignet, was alles in einem Rutsch erledigt. Dieses habe ich bereits
geschrieben. Darueberhinaus verfuegen die meisten von uns ohnehin ueber
Programme, die diese Aufgaben erledigen.

Da waere einmal Michael Lang's "tab" zu nennen, was mit der Option -i
oder mit alt+i im Programm aus Iso-Zeichen Ibm-Zeichen macht.
Gleichzeitig bricht es an Position 80 wortgerecht um. Tab kann jedoch
mit den Absatzschaltungen 0x0d nichts anfangen. Daher zieht es sich den
gesamten Text als eine Zeile rein. Man muss also vor der Benutzung
jedes 0x0d durch die Zeichenfolge {0x0d, 0x0a, 0x0d, 0x0a} ersetzen.
Dann hat man schon einmal richtige Absaetze also Textbloecke, die durch
eine Leerzeile getrennt sind. Diese kann Tab dann richtig umbrechen.

Viele von uns verwenden als Editor unter Dos den "tse" (the semware
editor). Der Tse ist der Nachfolger und grosse Bruder des Qedit. Er
verfuegt ueber eine sehr maechtige c-aehnliche Makrosprache. Theoretisch
kann man alle zum konfortablen Lesen der Ct-Dateien erforderlichen
Umwandlungen und Ersetzungen auch allein mit dem Tse ohne Zusatztools
durchfuehren und das sogar im Batch ueber alle Dateien in einem
Verzeichnis.