GNU Wget

ウェブサーバからコンテンツを取得するダウンローダ
Wgetから転送)

GNU Wget( Wget)GNU(WWW)get()WgetTCP/IPHTTPHTTPSFTP 
GNU Wget
Ubuntu上で動くwget。本項目の英語版記事をダウンロードしている。
開発元 GNUプロジェクト
最新版

1.24.5[1] ウィキデータを編集 / 10 3月 2024

リポジトリ ウィキデータを編集
プログラミング
言語
C言語
対応OS AmigaOS
BSDOS
Linux
macOS
Windows
OpenVMS
Unix系OS
プラットフォーム クロスプラットフォーム
対応言語 アイルランド語、イギリスの英語、イタリア語、インドネシア語、ウクライナ語、英語、エストニア語、エスペラント語、オランダ語、カタルーニャ語、ガリシア語、ギリシア語、クロアチア語、スウェーデン語、スペイン語、スロバキア語、スロベニア語、セルビア語、チェコ語、中国語(台湾、中国)、デンマーク語、ドイツ語、トルコ語、日本語、ノルウェー語(ブークモール)、バスク語、ハンガリー語、フィンランド語、フランス語、ブルガリア語、ベトナム語、ヘブライ語、ベラルーシ語、ポーランド語、ポルトガル語(ブラジル、ポルトガル)、リトアニア語、ルーマニア語、ロシア語
サポート状況 開発中
種別 ダウンロードマネージャ
ライセンス GNU General Public Licensev3+[2]
公式サイト www.gnu.org/software/wget/
テンプレートを表示

WgetHTML

Wget1996UNIXLinuxCWgetUnixmacOSWindowsOpenVMSAmigaOS

WgetGNOMEGWgetKDEKGetGUIWget

特徴

編集

確実性

編集

Wgetは低速あるいは不安定なネットワーク接続でも確実に動作するように設計されている。もしダウンロードネットワークの問題によって完了しなかった場合、Wgetは自動的にダウンロードが停止した箇所からダウンロードを継続するように試み、ファイル全体が取得されるまでこれを繰り返す。Wgetは、この機能を利用するため、当時としては新しかったRangeHTTPヘッダをもっとも早期に採用したクライアントの一つとなった。

再帰的ダウンロード

編集

WgetWgetHTMLHTTPWgetHTML調(-e robots=off)WgetRobots Exclusion Standard

FTPWgetLISTURLFTPURL

HTTPFTPWget調HTTPFTPrsyncWget

非対話性

編集

Wgetは非対話的なプログラムである。つまり、一度起動すれば、Wgetはユーザーとの対話を必要とせずTTYをコントロールする必要もなく、進捗状況は(後の調査のため)別のファイルに記録しておくこともできるということである。そういった非対話的な形でユーザーはWgetを起動し、プログラムを監視することもせずログアウトすることができる。対照的に、ほとんどのグラフィカルユーザインタフェースあるいはテキストユーザインタフェースウェブブラウザは、ユーザーがログインし続けることと、失敗したダウンロードを手動で再度スタートすることを求める。これは大量のデータを転送する際には大きな障害となりうる。

移植性

編集

WgetCWgetCTCP/IPBSDWgetUnixUNIXUnixWindowsmacOS

その他の特徴

編集

Wget

WgetHTTP

IPv6

OpenSSLSSL/TLS

322GiB

使調

Wgetの使い方

編集

基本的な使い方

編集

URLを(1個以上)引数にして Wget をコマンドラインから呼ぶのが、典型的な使い方である。(下表ではコマンドは読み易すくするために複数行で記述してあるが、実際には改行のない一行である。)

コマンド 機能
wget
  http://www.example.com/
www.example.com」のタイトルページをダウンロードし「index.html」という名前のファイルに保存する。
wget
  ftp://ftp.gnu.org/pub/gnu/wget/wget-latest.tar.gz
GNUのftpサイトからWgetのソースコードをダウンロードする。

より複雑な使い方として、複数のURLを階層を保ったままディレクトリに自動的にダウンロードする、というのもある。

コマンド 機能
wget
  --execute robots=off
  --recursive
  --level=1
  --no-parent
  ---accept .gif
  http://www.server.com/dir/
ウェブサイトから拡張子が「.gif」であるすべてのファイルをダウンロードする。(wget 'http://www.server.com/dir/*.gif')のようなワイルドカードの展開はFTPにおいてのみ可能)
wget
  --page-requisites
  --convert-links
  http://www.example.com/
www.example.com」のタイトルページを、ページを表示するのに必要な画像とスタイルシートとともにダウンロードし、その中にあるURLがローカルで利用可能なコンテンツを参照するように変換する。
wget
  --recursive
  --level=0
  http://www.example.com/
www.example.com」の全てのコンテンツをダウンロードする

進んだ使い方

編集
コマンド 機能
wget
  --tries=7
  --wait=5
  --waitretry=14
  --random-wait
  --mirror
  --convert-links
  --backup-converted
  --execute robots=off
  --output-file=./session.log
  http://www.oreilly.com/catalog/upt3/errata/
購入したばかりの本の正誤表をダウンロードする。全てのローカルのリンクを再帰的にダウンロードしファイルをオフラインでの閲覧に適したものにする。ファイル取得の間に5×0.5秒から5×1.5秒のランダムな待ち時間を設ける。ファイル取得に失敗したときには7回まで取得を試みる。その際には14秒ずつ間を空ける。アクセス結果をローカルのファイル「./session.log」に記録する。
wget
  --tries=22
  --waitretry=48
  --wait=30
  --random-wait
  --execute robots=off
  --output-file=./my_movies.log
  --directory-prefix=/movies
  --input-file=./my_movies.txt
ローカルのファイル「my_movies.txt」に一行ごとに記述されたリンクのみを取得する。ファイル取得の間に15秒から45秒のランダムな間隔をあける。ファイル取得に失敗した場合には48秒の間隔をあけて22回まで再試行する。HTTPリクエストヘッダーにはuser-agentを含めない。ロボット排除は無視する。取得した全てのファイルをディレクトリ「/movies」に保存し、全てのアクセス結果をファイル「my_movies.log」に保存する。名前のわかった特定の画像もしくはその他のファイルだけをダウンロードする場合に適する。
wget
  --cookies=on
  --keep-session-cookies
  --save-cookies=cookie.txt
  http://first_page
Wget をレファラーとクッキーで保護されたコンテンツをダウンロードするのに用いる。ベースとなるURLを取得しそのクッキーをファイルに保存する。
wget
  --referer=http://first_page
  --cookies=on
  --load-cookies=cookie.txt
  --keep-session-cookies
  --save-cookies=cookie.txt
  http://second_page
Wget をレファラーとクッキーで保護されたコンテンツをダウンロードするのに用いる。保存されたクッキーを利用して保護されたコンテンツを取得する。
wget
  --mirror
  --wait=2
  --page-requisites
  --html-extension
  --convert-links
  --directory-prefix=DIRECTORY
  http://www.yourdomain.com
ウェブサイトをミラーしローカルでの閲覧のための静的なコピーを作る。つまり、全てのリンクはローカルのファイルを示すように変換される。注: --html-extension はCGI、ASPあるいはPHPにより生成されたファイルをHTMLに変換する。

主要なコマンドラインオプション

編集
オプション 機能
  • -r
  • --recursive
ダウンロードを再帰的にする。
  • -A LIST
  • --accept=LIST
ダウンロードするファイル名を LIST で指定する。
  • -D LIST
  • --domain=LIST
ドメイン名LIST で指定する。
  • -O FILE
出力先のファイル名指定する。ファイル名として「-」を指定すると出力先は標準出力になる。
  • -V
  • --version
バージョン情報を表示する。
  • -h
  • --help
ヘルプを表示する。
  • -b
  • --background
バックグラウンド モードにする。
  • --header=STRING
HTTPヘッダ STRING を指定する。
  • -e COMMAND
  • --execute COMMAND
コマンド COMMAND を実行する。(ファイル .wgetrc と同じ形式)

著者と著作権

編集

GNU WgetHrvoje NikšićDan HarklessIan AbbottMauro TortonesiWget稿稿AUTHORSchangelogWgetGiuseppe Scrivano

WgetGNU稿[1]

歴史

編集

初期

編集

WgetGeturlGeturl1995[3]AmigaAREXXGetURLWget

Wget1990HTTPFTP(NcFTPdl)FTP()PerlWgetHTTPFTPUnixWget

Unix

主なリリース

編集

WgetWgetNEWS[2].

Geturl 1.0 (19961)  稿6Geturl 1.3.4

Wget 1.4.0 (199611)WgetGPLGeturl

Wget 1.4.3 (19972)GNU project

Wget 1.5.3 (19989)Linux

Wget 1.6 (199912)1.5.3Dan Harkless

Wget 1.7 (20016)SSL

Wget 1.8 (200112)調

Wget 1.9 (200310)IPv6HTTPPOST

Wget 1.10 (20056)2GiBdual-familyIPv6NTLM SSLMauro Tortonesi

Wget 1.11 (20081)GPL3CGIContent-DispositionHTTPMicah Cowan

Wget 1.12 (20099)CSSURL(IRI)

Wget 1.13 (20118)HTTP/1.1OpenSSLGnuTLS[4]

Wget 1.14 (20139)WARCRFC2617GNU TLSGNU TLS使

Wget 1.15 (20144)--https-only--methodURLMD5-SESS

Wget 1.16 (201410) --no-config--start-POS

Wget 1.17 (201511) FTPFTPS--if-modified-since

Wget 1.18 (20166) CVE-2016-4971--bind-dns-address--dns-servers

Wget 1.19 (20172) Metalink1.19.1HTTP--retry-on-http-error

Wget 1.20 (201811) --retry-on-host-errorFTP--accept-regex--reject-regex

Wget 1.21 (202012) alloca  --enable-fsanitize-ubsan--enable-fsanitize-asan--enable-fsanitize-msan for gcc and clangOpenSSL gettext  0.19.3+ 

開発とリリースのサイクル

編集

Wgetの開発はオープンな流儀で行われている。ほとんどの設計上の決定は、通常はユーザーと開発者が参加する公開のメーリングリスト[3]で行われている。バグリポートとパッチも同じメーリングリストに流される。

ソースの投稿

編集

Wget稿diffWget[4]稿wiki[5]

1.5.3MercurialSubversionCVS

リリース

編集

WgetGNUFTP

..()Wget 1.11Wget 1.8.2Wget Wget 1.111.11.0

ライセンス

編集

GNU WgetGNU General Public License3OpenSSL:[2]


Additional permission under GNU GPL version 3 section 7
If you modify this program, or any covered work, by linking or combining it with the OpenSSL project's OpenSSL library (or a modified version of that library), containing parts covered by the terms of the OpenSSL or SSLeay licenses, the Free Software Foundation grants you additional permission to convey the resulting work. Corresponding Source for a non-source form of such a combination shall include the source code for the parts of OpenSSL used as well as that of the covered work.

WgetGnuTLS

Wget  TexinfoGNU Free Documentation License1.2Unixman pageTexinfo

国際化

編集

WgetGNU gettextUnixWget-1.1230
Wget2
初版 2021年9月26日 (2年前) (2021-09-26)
最新版

Lua エラー モジュール:Wd 内、2009 行目: attempt to concatenate a nil value / 31 8月 2023

リポジトリ gitlab.com/gnuwget/wget2
ライセンス GPL-3.0-or-later[5]
公式サイト www.gnu.org/software/wget/
テンプレートを表示

GNU Wget22.0.02021926Wget2GNU General Public License3LibwgetGNU Lesser General Public License3[5]Wget2WgetWget2Wget1.x[6]

脚注

編集


(一)^ wget-1.24.5 released [stable] (10 3 2024). 22 3 2024

(二)^ abREADME file. 2010619

(三)^ : James Burton

(四)^ OpenSSL使

(五)^ abGNU Wget2 2.0.0 released. gnu.org (2021926). 2022123

(六)^ wget2. GitLab. 2022123

関連項目

編集

外部リンク

編集