Что такое команда Wget и как ее использовать

Это руководство покажет вам, как использовать команду wget в Linux. Мы также предоставим 12 полезных примеров команды wget. К концу вы будете знать все о команде wget и сможете использовать ее для загрузки файлов из всемирной паутины.

Что такое команда Wget?

Wget  - это компьютерный инструмент, созданный проектом GNU. Вы можете использовать его для получения контента и файлов с различных веб-серверов. Название представляет собой комбинацию слова "всемирная паутина" и слова "получить" . Он поддерживает загрузку через FTP, SFTP, HTTP и HTTPS.
Wget создается на переносимом языке C и может использоваться в любой системе Unix. Также возможно реализовать на Mac OS X, Microsoft Windows, AmigaOS и других популярных платформах.

Как установить Wget?

Для этой демонстрации команды wget мы будем использовать Ubuntu 16.04. Но синтаксис будет работать и в любом другом дистрибутиве Linux.
Во-первых, получите доступ к вашему серверу через SSH:
ssh user@your_server_ip -port
Чтобы установить wget на Ubuntu 18.04 или аналогичный, выполните следующую команду:
sudo apt-get install wget
Чтобы установить wget на CentOS 7 или его предыдущие дистрибутивы, используйте:
sudo yum install wget
После завершения настройки вы будете готовы к использованию. Кроме того, знание основных команд SSH может упростить задачу.

Примеры команд Wget

Для начала мы предоставим 12 примеров команд wget, которые вы можете использовать для повседневных задач. Имейте в виду, что вы также можете вызывать эту функцию из скриптов и заданий cron!

Использование команды Wget для загрузки отдельных файлов

Один из самых простых примеров команды wget - это загрузка одного файла и сохранение его в текущем рабочем каталоге. Например, вы можете получить последнюю версию WordPress, используя следующее:
wget https://wordpress.org/latest.zip
Вот результат, который вы увидите:
--2018-02-23 12:53:10-- https://wordpress.org/latest.zip
Resolving wordpress.org (wordpress.org)... 198.143.164.252
Connecting to wordpress.org (wordpress.org)|198.143.164.252|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 9332728 (8,9M) [application/zip]
Saving to: 'latest.zip'

latest.zip 100%[===================>] 8,90M 6,88MB/s in 1,3s

2018-02-23 12:53:14 (6,88 MB/s) - 'latest.zip' saved [9332728/9332728]
В этом примере файл с именем  latest.zip  будет загружен в текущий рабочий каталог. Вы также увидите дополнительную информацию, такую как ход загрузки, скорость, размер, время и дату.

Использование команды Wget для загрузки нескольких файлов

Мы можем сделать еще один шаг в использовании wget и загрузить сразу несколько файлов. Для этого нам нужно будет создать текстовый документ и поместить туда URL-адреса для загрузки. В этом примере мы получим последние версии WordPress, Joomla и Drupal с помощью wget. Введите следующее:
nano example.txt
Это создаст файл example.txt и откроет интерфейс текстового редактора. Вставьте эти ссылки туда:
https://wordpress.org/latest.zip

https://downloads.joomla.org/cms/joomla3/3-8-5/Joomla_3-8-5-Stable-Full_Package.zip

https://ftp.drupal.org/files/projects/drupal-8.4.5.zip
После этого вы можете использовать -i,  чтобы получить все файлы, хранящиеся в вашем примере текстового файла:
wget -i example.txt
Подождите, пока процесс завершится, и вы получите установку трех самых популярных систем управления контентом.

Использование команды Wget для получения файлов под разными именами

В этом примере wget мы сохраним файл под другим именем с помощью опции -O :
wget -O wordpress-install.zip https://wordpress.org/latest.zip
В этом случае загруженный ресурс будет сохранен как wordpress-install.zip вместо исходного имени.

Использование команды Wget для сохранения файлов в указанном каталоге

Вы можете использовать wget для помещения файла в другой каталог с помощью функции -P :
wget -P documents/archives/ https://wordpress.org/latest.zip
Файл, полученный с использованием этого синтаксиса, появится в папке documents / archives / .

Использование команды Wget для ограничения скорости загрузки

С помощью wget вы также можете ограничить скорость загрузки. Это полезно при извлечении огромных файлов и предотвратит использование всей вашей пропускной способности. В этом примере wget будет установлено ограничение на 500 КБ:
wget --limit-rate=500k https://wordpress.org/latest.zip

Использование команды Wget для установки повторных попыток

Проблемы с подключением к Интернету могут привести к прерыванию загрузки. Чтобы решить эту проблему, мы можем увеличить количество повторных попыток с  помощью функции -tries :
wget -tries=100 https://wordpress.org/latest.zip

Использование команды Wget для загрузки в фоновом режиме

Для очень больших файлов вы можете воспользоваться функцией -b  . Он загрузит ваш контент в фоновом режиме.
wget -b http://example.com/beefy-file.tar.gz
В вашем рабочем каталоге появится журнал wget  , который можно использовать для проверки прогресса и статуса загрузки. Эта команда также поможет:
tail -f wget-log

Использование команды Wget для загрузки через FTP

Команда также может использоваться с FTP. Вам нужно только указать имя пользователя и пароль, как в этом примере wget:
wget --ftp-user=YOUR_USERNAME --ftp-password=YOUR_PASSWORD ftp://example.com/something.tar

Использование команды Wget для продолжения прерванных загрузок

Ваша загрузка может быть прервана, если вы потеряете подключение к Интернету или столкнетесь с отключением электроэнергии. Это довольно частое явление при получении больших файлов. Вместо того, чтобы начинать заново, можно продолжить загрузку с помощью функции -c :
wget -c https://example/very-big-file.zip
Если вы продолжите без функции -c  , в конце нового файла будет добавлено .1,  поскольку он уже существует.

Использование команды Wget для получения целых веб-сайтов

Также можно использовать команду wget для загрузки содержимого всего сайта. Это позволит вам просматривать его локально без подключения к Интернету. Вот пример:
wget --mirror --convert-links --page-requisites --no-parent -P documents/websites/ https://some-website.com
Давайте проанализируем состав этой команды wget:
-зеркалоЭто делает вашу загрузку рекурсивной.
–Convert-linksВсе ссылки будут преобразованы для правильного использования в автономном режиме.
–Page-RequisitesСледующее будет включать все необходимые файлы, такие как CSS, JS и изображения.
–Нет родителяЭто гарантирует, что каталоги  выше иерархии не будут извлечены.
-P документы / веб-сайты /Это гарантирует, что весь контент попадет в наш указанный каталог.
После завершения процесса вы сможете открыть загруженный веб-сайт локально и найти все файлы в папке « документы / веб-сайты / ».

Использование команды Wget для поиска неработающих ссылок

Попробуем что-нибудь посложнее. Мы можем использовать команду wget, чтобы найти все неработающие URL-адреса, отображающие ошибку 404 на определенном веб-сайте. Начните с выполнения следующего:
wget -o wget-log -r -l 5 --spider http://example.com
Собирает вывод в файл для дальнейшего использования.
-lЗадает уровень рекурсии.
Делает загрузку рекурсивной.
–ПаукУстанавливает wget в режим паука.
Теперь мы можем исследовать   файл wget-log, чтобы найти список неработающих ссылок. Вот как это сделать:
grep -B 2 '404' wget-log | grep "http" | cut -d " " -f 4 | sort -u

Использование команды Wget для загрузки нумерованных файлов

Если у вас есть файлы или изображения, пронумерованные в определенном списке, вы можете легко загрузить их все со следующим синтаксисом:
wget http://example.com/images/{1..50}.jpg

Добавить комментарий

Автору будет очень приятно узнать обратную связь о своем руководстве.

Комментариев 0