Name | Last modified | Size | Description | |
---|---|---|---|---|
Parent Directory | - | |||
README.CONF.html | 2015-06-02 12:25 | 44K | ||
README.CONF | 2015-06-02 12:25 | 37K | ||
README.html | 2015-06-02 12:25 | 31K | ||
CHANGES.CONF | 2015-06-02 12:25 | 9.8K | ||
INSTALL | 2015-06-02 12:25 | 6.6K | ||
NEWS | 2015-06-02 12:25 | 5.1K | ||
README.1st | 2015-06-02 12:25 | 3.1K | ||
Im Online Modus:
Im Offline Modus:
Automatischer Download
Funktionen:
Allgemeines:
localhost
sein, au�er Sie benutzen WWWOFFLE in einem
lokalen Netzwerk mit mehreren Rechnern. Die Portnummer wird, au�er Sie
haben die Standardeinstellungen ver�ndert, 8080 sein.
Automatische Konfiguration (Netscape ab Version 2.0):
Sie haben es einfach :-) In den Proxy-Einstellungen von Netscape einfach
auf "Automatische Konfiguration" klicken und
http://localhost:8080/wwwoffle.pac
in die Eingabezeile eingeben.
Manuelle Konfiguration:
localhost
als Rechner und 8080
als Port
(oder je nach dem wie Ihr Netzwerk aussieht) eingeben.
setenv http_proxy http://localhost:8080/
(bei
C-Shells) oder export http_proxy http://localhost:8080/
(bei
Bourne Shells). Genauso verfahren Sie mit ftp_proxy
.
Manche Browser besitzen au�erdem zwei Varianten, eine Seite erneut zu laden: eine stellt nur die Seite neu dar, bzw. stellt sicher, da� alles komplett da ist, die andere Variante zwingt auch s�mtliche zwischen Quelle und Ihnen liegenden 'Agents' (also z.B. Proxies), die Seite(n) neu anzufordern. Bei der Benutzung von WWWOFFLE ist die letzte Option sinnvoll. (Anm.d.�bers.: Bei Netscape soll das gehen, indem man die SHIFT Taste gedr�ckt h�lt, w�hrend man auf den "Reload" Knopf dr�ckt).
Die neusten Informationen bez�glich der Kompatibilit�t von WWWOFFLE im Bezug auf verschiedene Browser gibt es bei http://www.gedanken.demon.co.uk/wwwoffle/version-2.4/browser.html.
Die wichtigste Informationsquelle f�r WWWOFFLE-Benutzer ist die Homepage bei http://www.gedanken.demon.co.uk/wwwoffle, oder besser noch die WWWOFFLE Users Page bei http://www.gedanken.demon.co.uk/wwwoffle/version-2.4/user.html, die diese Version von WWWOFFLE insbesondere behandelt.
[Und die komplette �bersetzung ist nat�rlich auch vorhanden: http://www.gedanken.demon.co.uk/wwwoffle/version-2.4/de/, Anm.d.�bers.]
wwwoffle
Kommandozeilenprogramm enthalten.
Um zum Beispiel eine bestimmte URL jeden Sonntag morgen zu holen, geben Sie folgendes ein:
Month of year : all Day of Month : all Day of Week : Sunday Hour of Day : 0 (24 hour clock)
wwwoffle
.
Ebenfalls gibt es eine M�glichkeit, Seiten aus dem Cache oder aus der
Bestellliste zu l�schen.
Hier gibt es ebenfalls eine Seite, um die Konfigurationsdatei von WWWOFFLE zu bearbeiten. Die Kommentare aus der Datei werden mit angezeigt, so da� man die entsprechende Referenz gleich zur Hand hat.
ht://Dig
(Version 3.08 oder neuer)
installiert haben (Sie bekommen es bei http://htdig.sdsu.edu/), k�nnen Sie damit
eine Such-Datenbank aus dem WWWOFFLE Cache aufbauen, und diese
schnell durchsuchen. Die Seite http://localhost:8080/search/htdig/
liefert daf�r das entsprechende Suchformular. N�here Informationen, wie man
WWWOFFLE und ht://Dig
zur Zusammenarbeit bringt,
liefert die Datei README.htdig
.
http://localhost:8080/local/
auf dem WWWOFFLE Rechner zeigen, werden von WWWOFFLE aus dem
Verzeichnis /html/local/
bedient. Es ist hiermit m�glich,
einen trivialen Web-Server aufzubauen (keine CGIs, keine Skripte, keine
Spielereien) f�r kleine interne Web-Seiten. Die MIME-Types (f�r die
HTTP-Kommunikation zwischen Server und Browser) werden der
Konfigurationsdatei entnommen.
Achtung: Der Web-Server folgt symbolischen Links im Dateisystem, liefert aber nur Dateien, die auf dem System sowieso jeder lesen k�nnte. Siehe auch das Kapitel zur Sicherheit in der FAQ. |
Jeder kann auf jeden Fall seine eigenen Bestellungen sofort nach deren Aufgabe l�schen (falls man sich schnell umentschieden hat :), indem er auf den "L�schen" Knopf gleich nach der Best�tigungsmeldung von WWWOFFLE klickt. Diese Funktion beinhaltet ein Einweg-Kennwort.
Diese Funktion ist f�r den Benutzer nicht mehr und nicht weniger transparent als die Fehlermeldung vom Server selbst, genauso viel oder wenig Benutzereingriffe sind also notwendig wie ohne Proxy.
Sollte der erste Proze� die Datei nicht innerhalb einer bestimmten Zeit freigeben, wird der zweite Proze� eine entsprechende Fehlermeldung an Ihren Browser weiterleiten.
http/www.gedanken.demon.co.uk/
).
In jedem dieser Verzeichnisse sind f�r jede Seite zwei Dateien: eine beginnt mit 'D' und enth�lt die Daten, die andere beginnt mit 'U' und enth�lt die URL. Die Namen sind ansonsten identisch (wenn auch kryptisch, Anm.d.�bers. ;).
Das Verzeichnis mit den Bestellungen ("outgoing") enth�lt auch wieder zwei Dateien pro Bestellung, beginnend mit jeweils 'O' f�r die eigentliche Bestellung und 'U' f�r die URL.
Das "lasttime" Verzeichnis (die letzten geholten Seiten, s.o.) enth�lt einen Link zur wirklichen Datei, der mit 'D' beginnt, und eine Datei beginnend mit 'U', die die URL enth�lt.
Falls eines der "Rechnernamen"-Verzeichnisse ein symbolischer Link in ein anderes Verzeichnis innerhalb des WWWOFFLE-Baumes ist, dann werden die beiden Rechner als gegenseitige Spiegel ("mirrors") betrachtet, i.e. was sich in dem einen �ndert, �ndert sich auch in dem anderen, und es ist egal, welche Adresse man in seinem Browser aufruft.
wwwoffles
und wwwoffled
sind
seit Version 1.1 zu einem Programm zusammengeschmolzen, dies erleichtert
die Wartung des Servers und ist f�r sp�tere Erweiterungen besser ger�stet.
Die Konfigurationsdatei wwwoffle.conf
enth�lt alle
Einstellungen, die festlegen wie die ganze WWWOFFLE-Programmsuite
sich der Au�enwelt gegen�ber verhalten soll.
wwwoffle
stellt die Schnittstelle zum
'browser-losen' Benutzer ;) dar, und wird zum Festlegen der Betriebsmodi
(online, offline, autodial) benutzt, damit der Server wei�, wann und wie er
auf welche Anfragen reagieren mu�/darf.
wwwoffle -online |
Den WWWOFFLE Daemon in den 'online' Modus schalten. |
wwwoffle -autodial |
Den WWWOFFLE Daemon in den 'autodial' Modus schalten. |
wwwoffle -offline |
Den WWWOFFLE Daemon in den 'offline' Modus schalten. |
wwwoffle -fetch |
Den WWWOFFLE Daemon dazu bringen, bestellte/abonnierte Seiten zu holen.
Dies funktioniert nur, wenn vorher wwwoffle -online
ausgef�hrt wurde! |
wwwoffle -config |
Den WWWOFFLE Daemon die Konfigurationsdatei neu einlesen lassen. |
wwwoffle -purge |
Den WWWOFFLE Daemon zum Aufr�umen des Caches veranlassen, d.h. es werden alle Seiten, die �lter sind als die in der Konfigurationsdatei angegebenen Werte, gel�scht. |
wwwoffle -kill |
Den WWWOFFLE Daemon dazu bringen, s�mtliche Unterprozesse zu beenden und sich dann sauber zu beenden. Falls einige Prozesse noch am Herunterladen sind, kann dies etwas dauern. |
Man kann mit wwwoffle
allerdings auch Auftr�ge an den Daemon
weitergeben:
wwwoffle <URL> |
WWWOFFLE holt die angegebenen URLs sofort (wenn 'online'), ansonsten werden sie bestellt. |
wwwoffle <DATEI.html> |
WWWOFFLE liest die angegebene HTML Datei ein und behandelt dort enthaltene Links als Bestellungen. |
wwwoffle -F <URL> |
WWWOFFLE wird gezwungen die URL neu zu laden, auch wenn sie schon vorhanden ist. |
wwwoffle -g[Sisfo] |
WWWOFFLE wird die heruntergeladene(n) Seite(n) auf Stylesheets("s"), Bilder (Images, "i"), Skripts ("s") und Frames ("f") untersuchen und diese ggf. auch mit herunterladen. |
wwwoffle -r[X] |
WWWOFFLE wird die angegebene Seite X-fach rekursiv holen, d.h. auch Links auf der heruntergeladenen Seite werden verfolgt. Hier bleibt WWWOFFLE jedoch auf dem gleichen Server. |
wwwoffle -R[X] |
Hier nicht mehr! (Vorsicht, Rekursionstiefen �ber 3 sind selten sinnvoll!) [Anm.d.�bers.] |
wwwoffle -d[X] |
Diese Option ist noch einschr�nkender als die vorherige, hier werden nur Verweise ber�cksichtigt, deren Ziele im gleichen Verzeichnis (oder innerhalb Unterverzeichnissen) liegen. |
wwwoffle
erlaubt es einem auch, selektiv Dateien aus dem Cache
zu extrahieren, ohne die Verzeichnisstruktur durchw�hlen zu m�ssen:
wwwoffle -o <URL> |
WWWOFFLE holt die entsprechende URL aus dem Cache und gibt sie auf der Standardausgabe (STDOUT) aus. |
wwwoffle -O <URL> |
WWWOFFLE holt die entsprechende URL und gibt sie inklusive der HTTP Headerzeilen auf der Standardausgabe aus. |
Der wichtigste Modus von wwwoffle
ist nat�rlich folgender:
wwwoffle -h |
WWWOFFLE gibt eine Zusammenfassung der verf�gbaren Optionen aus. |
An s�mtliche der oben angegebenen Optionen kann noch folgendes angeh�ngt werden:
-c <configfile> |
Die Konfigurationsdatei explizit angeben. Dies wird ben�tigt, wenn Sie WWWOFFLE mit einem Kennwort gesch�tzt haben!. |
-p <host>[<port>] |
Den Port, auf dem der WWWOFFLE Server auf Steuernachrichten bzw. Proxybefehle horcht, explizit angeben. |
$WWWOFFLE_PROXY |
Eine Umgebungsvariable, die den WWWOFFLE Hostnamen/Port beinhaltet. Die
Syntax f�r die Variable ist �hnlich wie in der Kommandozeile, es k�nnen
hier aber beide Ports angegeben werden, z.B.:
WWWOFFLE_PROXY="localhost:8080:8081" |
wwwoffled
fungiert als HTTP Proxy und akzeptiert
nebenbei Steuerbefehle von wwwoffle
. Er verwaltet und
koordiniert die verschiedenen Modi von WWWOFFLE (online, offline,
etc) und die Parameter in der Konfigurationsdatei und startet bei HTTP
Proxy Anfragen Serverprozesse (via 'fork'), die die angeforderten Daten
holen (das ist der oben angesprochene wwwoffles
Teil). Der
Server kann sich u.U. auch selbst 'fork'en.
wwwoffled -c <configfile> |
Startet den HTTP Proxy mit der angegebenen Konfigurationsdatei. |
wwwoffled -d [X] |
Startet den HTTP Proxy im DEBUG Modus: Er l�uft nicht im Hintergrund,
sondern gibt je nach Debugging-Level 'X' (0 bis 5) auf dem Terminal, auf
dem er gestartet wurde, mehr oder weniger Status- und Fehlermeldungen
aus. Falls nicht angegeben, wird der Wert aus log-level aus
der Konfigurationsdatei benutzt. |
-h |
Gibt eine kurze Erkl�rung der Kommandozeilenoptionen aus. |
Es gibt eine Anzahl von Status- und Fehlermeldungen, die w�hrend des
Betriebes von WWWOFFLE generiert werden k�nnen. Standardm��ig werden
diese an den syslog
Dienst weitergeleitet, mit dem
-d
Parameter werden sie zus�tzlich auf dem Terminal angezeigt,
auf dem wwwoffled
gestartet wurde.
Mit den Optionen run-uid / run-gid
aus der Konfigurationsdatei
ist es m�glich, wwwoffled
als ganz bestimmten Benutzer laufen
zu lassen. Dies erfordert allerdings, da� das Programm von root
gestartet wurde (sonst kann es nicht seine eigenen Benutzerrechte anpassen)
und da� der "Zielbenutzer" s�mtliche Rechte im Spool-Verzeichnis hat.
Real Mode | Der normale Betrieb. Das System ist online, agiert als Proxy f�r einen
Browser (pro wwwoffles -Proze�). Jede Anfrage nach einer URL
erzeugt einen neuen Server, der diese Anfrage an den Zielhost weiterleitet,
die Seite abholt, sie an den Browser schickt und zus�tzlich im Spool-
Verzeichnis ablegt. Existiert diese Seite schon im Spool-Verzeichnis,
wird der Zielhost vorher gefragt, ob eine neuere Version existiert, sonst
wird einfach die Seite aus dem Cache benutzt. |
SpoolOrReal Mode | Der 'autodial'-Betrieb. Hier wird erst bei einer Anfrage entschieden, ob diese sofort aus dem Cache (ohne jeden Verbindungsaufbau nach au�en) bedient wird oder ob eine Verbindung aufgebaut wird, wenn diese Seite nicht existiert. |
Spool Mode | Das System ist offline, es existiert keine Verbindung nach au�en und es wird auch keine aufgebaut. Die angeforderte Seite wird entweder aus dem Cache bedient, oder es wird eine 'Dummy-Seite' geliefert, mit der der Benutzer (je nach Konfiguration) die angeforderte Seite ggf. bestellen kann. Falls die Seite im Cache eine Fehlermeldung war (z.B. ein fehlgeschlagener Download), wird sie hiernach gel�scht, so da� eine erneute Anfrage ggf. einen weiteren Downloadversuch starten kann. |
Fetch Mode | Es werden bestellte und abonnierte Seiten nach Bedarf aus den entsprechenden Verzeichnissen heruntergeladen. Diese Seiten werden im Cache gespeichert, kein Browser bekommt sie (vorerst) zu sehen. |
Zus�tzlich gibt es noch die folgenden Modi, die prim�r davon abh�ngen, ob angeforderte Dateien im Spool existieren oder nicht.
RealNoCache Mode | Es werden Seiten geholt, aber nicht im Spool gespeichert. Siehe
DontCache Abschnitt in der Konfigurationsdatei. |
RealRefresh Mode | Eine Seite wird noch einmal heruntergeladen, obwohl sie schon im Cache existiert. Diese Funktion wird von der "Aktualisieren"-Funktion am Fu� jeder HTML-Seite benutzt. |
RealPassword Mode | Wird benutzt, wenn ein Kennwort angegeben wurde, und zwei Exemplare der Seite ben�tigt werden, eine mit und eine ohne Kennwort. |
SpoolGet Mode | Wenn eine Seite nicht im Cache existiert, angefordert wurde und sie in die Bestellliste eingetragen werden mu�. |
SpoolWillGet Mode | Wenn eine Seite nicht im Cache existiert, angefordert wurde, sie aber schon in der Bestellliste eingetragen wurde. |
SpoolRefresh Mode | Wenn die "Aktualisieren"-Funktion am Fu� einer HTML-Seite benutzt wurde, aber WWWOFFLE nicht 'online' ist, wird eine Bestellung gespeichert und die momentane Version der Seite aber beibehalten. |
SpoolPragma Mode | Wenn ein Browser die Seite mittels "Pragma: no-cache"
aktualisieren will. Die momentane Seite wird behalten und eine Bestellung
wird gespeichert. |
wwwoffle-rm |
URLs aus dem Cache l�schen. Allerdings ist dies nur f�r einzelne URLs gut -- um einen ganzen Host zu l�schen, kann man auch direkt das Verzeichnis aus dem Cache l�schen, das st�rt WWWOFFLE �berhaupt nicht. (Oder einen Browser benutzen.) |
wwwoffle-mv |
URLs im Cache verschieben. Da die URL selbst in den 'kryptischen' Namen
der Dateien im Cache enthalten ist, wird man mit 'mv' nicht
weit kommen. Stattdessen benutze man bitte 'wwwoffle-mv' .
|
wwwoffle-ls |
Den Cache-Inhalt anzeigen, im Stil von 'ls -l' . |
wwwoffle-write |
Eine URL direkt in den Cache schreiben. Achtung: es wird ein korrekter
HTTP-Header ben�tigt, sonst kommen viele Browser durcheinander! z.B:
( echo "HTTP/1.0 200 OK" ; echo "" ; cat bar.html ) | \ wwwoffle-write http://www.foo.com/bar.html |
'audit-usage.pl'
analysiert die Logdateien des
wwwoffled
Servers und kann bei entsprechend hohem Loglevel
(mindestens 4) genaue Informationen herausfiltern, wer wann welche URL �ber
den Proxy angefordert hat. (mit "Wer" ist hier "welcher Rechner" gemeint.)
wwwoffled -c /etc/wwwoffle/wwwoffle.conf -d 4 >> /tmp/audit.log &liefert die Datei
audit.log
, welche dann von
audit-usage.pl
ausgewertet werden kann.
testprogs
befinden sich zwei kleine
Testprogramme, die bei Bedarf kompiliert werden k�nnen. Sie werden f�r den
normalen Betrieb nicht ben�tigt, aber falls Sie WWWOFFLE
weitergehend anpassen m�chten oder den HTML Parser f�r die automatisch
generierten Seiten �berpr�fen, dann k�nnten sie n�tzlich sein.
Diese sind allerdings noch viel mehr 'dirty hacks' als die "wwwoffle-tools", also benutzen Sie sie auf eigene Gefahr!
The two programs wwwoffle and wwwoffled were written by Andrew M. Bishop in
1996,97,98 and are copyright Andrew M. Bishop 1996,97,98.
The programs update-cache, endian-cache and the programs known as wwwoffle-tools were written by Andrew M. Bishop in 1997,98 and are copyright Andrew M. Bishop 1997,98. The Perl scripts update-config.pl and audit-usage.pl were written by Andrew M. Bishop in 1998 and are copyright Andrew M. Bishop 1998. They can be freely distributed according to the terms of the GNU General Public License (see the file `COPYING'). If you wish to submit bug reports or other comments about the programs then email the author [email protected] and put wwwoffle in the subject line. The htdig package is copyright Andrew Scherpbier <[email protected]>. The icons in the html/htdig directory come from htdig as do the html/htdig/search.html and html/htdig/conf/htsearch.conf files with modifications by myself.
With Source Code contributions from: Yannick Versley <[email protected]> Initial syslog code (much rewritten before inclusion). Axel Rasmus Wienberg <[email protected]> Code to run wwwoffled as a specified uid/gid. Andreas Dietrich <[email protected]> Code to detach the program from the terminal like a *real* demon. Ullrich von Bassewitz <[email protected]> Better handling of signals. Optimisation of the file handling in the outgoing directory. The log-level, max-servers and max-fetch-servers config options. Tilman Bohn <[email protected]> Autodial mode. Walter Pfannenmueller <[email protected]> Fetching objects (applets) |