Mnoho uživatelů Windows je tak zvyklých na grafické rozhraní a webový prohlížeč jako na univerzální nástroj, který si volí, že zapomínají, že existuje celá řada dalších nástrojů. Wget je nástroj příkazového řádku GNU populární především v komunitách Linuxu a Unixu, který se používá především ke stahování souborů z internetu. Existuje však verze wget pro Windows a pomocí ní si můžete stáhnout cokoli, co chcete, od celých webových stránek po filmy, hudbu, podcasty a velké soubory odkudkoli online.
O tomto úhledném nástroji neví mnoho uživatelů Microsoftu, a proto jsem napsal tuto příručku pro začátečníky k používání wget ve Windows. Máme tendenci používat náš prohlížeč na všechno, což je v pořádku, ale ne vždy to není ten nejefektivnější způsob, jak něčeho dosáhnout. Wget je jen jedním z mnoha nástrojů, které existují po věky, ale jen velmi málo lidí o nich ví.
Získání wget pro Windows
Získání wget je velmi snadné. Při instalaci a konfiguraci wget postupujte podle tohoto průvodce.
- Stáhněte si wget odtud a nainstalujte jej. Ujistěte se, že se jedná o instalační program a ne pouze o zdroj, jinak to nebude fungovat.
- Po instalaci byste nyní měli mít přístup k příkazu wget z okna příkazového řádku. Otevřete okno CMD jako správce a zadejte „wget -h“ pro testování. Pokud to funguje, jste zlatí, pokud dostanete „nerozpoznaný příkaz“, stáhli jste špatný balíček. Zkus to znovu.
- Nastavte adresář pro stahování, do kterého se budou ukládat všechny soubory. Zadejte „název adresáře md“ pro vytvoření adresáře pro stahování. Nazval jsem svůj ‚downloadz‘, aby byl rozpoznatelný.
Po instalaci jste připraveni začít pracovat. Níže jsem uvedl výběr oblíbených příkazů wget, které mohou dosáhnout široké škály věcí.
Stáhnout jeden soubor
wget //website.com/file.zip
Stáhněte si jeden soubor, ale uložte jej jako něco jiného
wget ‐‐output-document=newname.html website.com
Stáhnout do konkrétní složky
wget ‐‐directory-prefix=složka/podsložka website.com/file.zip
Obnovte přerušené stahování
wget ‐‐continue website.com /file.zip
Stáhněte si novější verzi souboru
wget ‐‐continue ‐‐timestamping website.com/file.zip
Stáhnout více webových stránek
K tomu je třeba vytvořit seznam v poznámkovém bloku nebo jiném textovém editoru. Přidejte novou úplnou adresu URL (s //) na samostatný řádek. Poté přejděte wget na soubor. V tomto příkladu jsem pojmenoval soubor Filelist.txt a uložil jej do složky wget.
wget ‐‐vstup Filelist.txt
Stáhněte si celý web
wget ‐‐execute robots=off ‐‐rekurzivní ‐‐žádný rodič ‐‐pokračovat ‐‐no-clobber //website.com
Možná zjistíte, jak to často dělám já, že weboví hostitelé blokují příkazy wget. Tyto bloky se můžete pokusit zfalšovat tím, že se budete vydávat za Googlebota. Zkuste napsat toto:
wget –user-agent=”Googlebot/2.1 (+//www.googlebot.com/bot.html)” -r //website.com
Stáhněte si konkrétní typ souboru z webu
wget ‐‐level=1 ‐‐rekurzivní ‐‐bez rodiče ‐‐accept FILETYPE //website.com / FILETYPE/
Například změňte FILETYPE na MP3, MP4, .zip nebo cokoliv jiného.
Stáhněte si všechny obrázky webových stránek
wget ‐‐directory-prefix=files/pictures ‐‐žádné adresáře ‐‐rekurzivní ‐‐no-clobber ‐‐accept jpg,gif,png,jpeg //website.com/images/
Zkontrolujte webové stránky, zda neobsahují nefunkční odkazy
wget ‐‐output-file=logfile.txt ‐‐rekurzivní ‐‐spider //website.com
Stahujte soubory bez přetížení webového serveru
wget ‐‐limit-rate=20k ‐‐wait=60 ‐‐random-wait ‐‐mirror //website.com
Existují stovky, ne-li tisíce příkazů wget a zde jsem vám ukázal jen několik z nich. Nyní, když jste se seznámili s nástrojem a jeho fungováním, je jen na vás, k čemu jej použijete!
Máte nějaké skvělé příkazy, které dokážou dosáhnout zázraků? Podělte se o ně s námi níže!