[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Projekt Gutenberg



Hallo Leseratten
Ich moechte ein paar Tipps zum Handling von Projekt Gutenberg weitergeben,  
freilich haben nur Lynxer ggf. was davon. Erster Einstieg:
lynx -dump >output http://gutenberg.aol.de/autoren.htm (der Name fuer  
"output" ist freibleibend, das Umleitungszeichen muss aber sein.)
Ergebnis ist eine Datei, die im ersten Teil alle  Autorennamen (324) mit  
einer Ziffer versehen auflistet, im zweiten Teil kommen die urls wiederum  
mit Ziffer. Kleiner Ausschnitt:
   A
   [1]Abraham a S. C.
   [2]Aesop
   [3]Aischylos
   [4]Alexis
   [5]Allais

References
   1. http://gutenberg.aol.de/autoren/abraham.htm
   2. http://gutenberg.aol.de/autoren/aesop.htm
   3. http://gutenberg.aol.de/autoren/aischylo.htm
   4. http://gutenberg.aol.de/autoren/alexis.htm
   5. http://gutenberg.aol.de/autoren/allais.htm

Als naechstes kann ich mir einen Autor naeher anschauen, Beispiel Droste- 
Huelshoff:

lynx -dump >droste http://gutenberg.aol.de/autoren/droste.htm In der Datei  
"Droste" finde ich dann einen Kurzen Text ueber die Autorin und die Urls,  
die zu ihren Werken fuehren. Jetzt noch ein Beispiel, wie ich mir ein Buch  
runterladen kann, "die Judenbuche"; die "Arbeit" mach ich in dem fall off- 
line mit dem Zusammenstellen nachfolgender Zeilen:
lynx -dump >>juden http://gutenberg.aol.de/droste/juden/juden001.htm
lynx -dump >>juden http://gutenberg.aol.de/droste/juden/juden002.htm
lynx -dump >>juden http://gutenberg.aol.de/droste/juden/juden003.htm
Mit diesen drei Zeilen ist das Buch sicher nicht vollstaendig, aber die  
Fortsetzung duerfte klar sein. Ich bin so nur sehr kurz online. Man muss dan  
noch ein paar "Fremdkoerper" entfernen Zeilen wie http... referende usw.
Hoffentlich wars nicht zu knapp, sonst halt nachfragen.
ciao Rule