Pavuk
Pavuk è un ottimo programma per salvare
i siti internet su disco fisso, per poi consultarli con calma.
Per il download consultare il sito: http://www.idata.sk/~ondrej/pavuk/
Pavuk è distribuito con licenza GPL,
per capire meglio cos'è la licenza GPL, consulatre
la pagina "Che cos'è
Linux".
Io qui ne parlo a proposito di Linux, ma
di Pavuk esistono i seguenti porting:
-Digital Unix 3.2 (cc and gcc),4.0 (cc and
egcs)
-Ultrix 4.4 (cc,egcs)
-NetBSD (sparc , mips) (gcc)
-GNU win32 (gcc + cygwin)
-Solaris 7 (x86) (gcc)
-In corso di sviluppo anche per MacOs
X, OS/2, e per altri sistemi Unix
La ricompilazione del programma è
andata a buon fine al primo tentativo.
Dopo averlo installato per provarlo in modalità
grafica digitare:
pavuk -X
Riporto alcune caratteristiche essenziali
del programma.
- Recupero in modo ricorsivo di documenti
da server di tipo: HTTP, HTTP con connessione sicura, FTP,
FTP con connessione sicura, Gopher.
- Supporta i server di tipo HTTP/1.1 con
connessioni persistenti.
- Supporta richieste da parte del server
HTTP di tipo Post.
- Sincronizzazione delle copie dei documenti
prelevati con quelli presenti sul server remoto.
- Recupero parziale del contenuto di un
server, questo vale solo per quelli che supportano questa
funzionalità (FTP e HTTP/1.1).
- Segue automaticamnete i documenti che
hanno cambiato di posizione.
- Supporta l'esclusione del prelievo di
documenti tramite i "robots.txt" standard.
- Supporta i Proxy Servers (per
chi non sa cosa sono) HTTP e FTP.
- Supporta autenticazioni su server HTTP.
- Supporta i cookies su server HTTP.
- Supporta i socket proxy(di tipo 4 e 5)
- Programma sia a linea di comando che con
interfaccia grafica.
- Pavuk è in grado di utilizzare
i comandi "AT".
- E' possibile salvare la configurazione
e le restrizioni per un successivo utilizzo.
- Si possono eseguire più istanze
dello stesso programma, senza perdita di dati, infatti l'applicazione
blocca i files che sono in corso di memorizzazione.
- I Documenti prelevati e i link degli stessi
vengono rimappati in base al percorso relativo alla memorizzazione
sul nostro disco.
- E' possibile prelevare i documenti dalla
cache del Browser Netscape.
- E' possibile filtrare i banner pubblicitari.
- Con questo programma si può costringere
un proxy server a recuperare determinati documenti da un
sito (modalità dontstore).
- Si può eseguire anche in background.
|