Hướng dẫn wget invalid syntax python - wget cú pháp không hợp lệ wget python

Tôi đang cố gắng sử dụng mã sau, nhưng nó tiếp tục cho tôi thấy cú pháp không hợp lệ.

Show
!wget -O file_name.csv https://website.com/file_name.csv

Bất cứ ai có thể cung cấp bất kỳ hướng dẫn?

Hướng dẫn wget invalid syntax python - wget cú pháp không hợp lệ wget python

Barmar

706K53 Huy hiệu vàng475 Huy hiệu bạc589 Huy hiệu đồng53 gold badges475 silver badges589 bronze badges

Đã hỏi ngày 3 tháng 5 lúc 23:49May 3 at 23:49

3

Cái đó "!" Cú pháp là một tính năng của Jupyter. Nó không phải là một phần của Python, và nó không phải là một phần của VSCode. Bạn có thể sử dụng cửa sổ thiết bị đầu cuối trong VSCODE để nhập lệnh

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
2 của bạn (không có "!").

Đã trả lời ngày 4 tháng 5 lúc 5:33May 4 at 5:33

Hướng dẫn wget invalid syntax python - wget cú pháp không hợp lệ wget python

Tim Robertstim RobertsTim Roberts

42K3 Huy hiệu vàng19 Huy hiệu bạc28 Huy hiệu đồng3 gold badges19 silver badges28 bronze badges

Đảm bảo bạn sử dụng vỏ chính xác trước tiên.

Và xóa "!" trước khi wget. Tôi không thể hiểu tại sao "!" đã được thêm vào trước lệnh wget.

Đã trả lời ngày 4 tháng 5 lúc 5:27May 4 at 5:27

MingJie-MSFTMingJie-MSFTMingJie-MSFT

2.7811 Huy hiệu vàng1 Huy hiệu bạc11 Huy hiệu đồng1 gold badge1 silver badge11 bronze badges

2

SSL:

Các tùy chọn HTTPS (SSL/TLS)

Các tùy chọn HTTPS (SSL/TLS)

Các tùy chọn HTTPS (SSL/TLS)

Các tùy chọn HTTPS (SSL/TLS)


Các tùy chọn HTTPS (SSL/TLS)

Chứng chỉ SSL:

Cơ quan chứng chỉ SSL:

  • Loại chứng chỉ SSL, chỉ định:
  • Chứng chỉ SSL, Kiểm tra:
  • SSL CRL, Danh sách thu hồi chứng chỉ:
  • Giao thức SSL, chọn:
  • Pin khóa công khai SSL:
  • vị trí bắt đầu:
  • Các tính năng tích hợp cung cấp các cơ chế để điều chỉnh các liên kết bạn muốn theo dõi (xem các liên kết sau).
  • Tiến trình của các bản tải xuống riêng lẻ được truy tìm bằng cách sử dụng một thước đo tiến độ. Các bản tải xuống tương tác được theo dõi bằng cách sử dụng máy đo kiểu nhiệt kế của nhiệt kế, trong khi các loại không tương tác được theo dõi bằng các chấm, mỗi dấu chấm đại diện cho một lượng dữ liệu cố định nhận được (theo mặc định 1kb). Một trong hai thước đo có thể được tùy chỉnh theo sở thích của bạn.
  • Hầu hết các tính năng đều có thể cấu hình hoàn toàn, thông qua các tùy chọn dòng lệnh hoặc thông qua tệp khởi tạo .wgetRC (xem tệp khởi động). WGET cho phép bạn xác định các tệp khởi động toàn cầu (/usr/local/etc/wgetrc theo mặc định) cho các cài đặt trang web. Bạn cũng có thể chỉ định vị trí của một tệp khởi động với tùy chọn trên mạng. Để vô hiệu hóa việc đọc các tệp config, hãy sử dụng mật bản-config. Nếu cả hai conconfig và clemno-config được đưa ra, thì không thể bỏ qua.
  • Cuối cùng, GNU WGET là phần mềm miễn phí. Điều này có nghĩa là mọi người có thể sử dụng nó, phân phối lại nó và/hoặc sửa đổi nó theo các điều khoản của Giấy phép công cộng GNU, như được xuất bản bởi Quỹ phần mềm miễn phí (xem tệp sao chép đi kèm với GNU WGE, để biết chi tiết).

2 Gọi

Theo mặc định, WGET rất đơn giản để gọi. Cú pháp cơ bản là:

WGET chỉ đơn giản là tải xuống tất cả các URL được chỉ định trên dòng lệnh. URL là một công cụ định vị tài nguyên thống nhất, như được định nghĩa dưới đây.

Tuy nhiên, bạn có thể muốn thay đổi một số tham số mặc định của WGET. Bạn có thể thực hiện theo hai cách: vĩnh viễn, thêm lệnh thích hợp vào .wgetrc (xem tệp khởi động) hoặc chỉ định nó trên dòng lệnh.


Định dạng URL 2.1

URL là từ viết tắt của Trình định vị tài nguyên thống nhất. Trình định vị tài nguyên thống nhất là một đại diện chuỗi nhỏ gọn cho một tài nguyên có sẵn thông qua Internet. Wget nhận ra cú pháp URL theo RFC1738. Đây là biểu mẫu được sử dụng rộng rãi nhất (dấu ngoặc vuông biểu thị các phần tùy chọn):

http://host[:port]/directory/file
ftp://host[:port]/directory/file

Bạn cũng có thể mã hóa tên người dùng và mật khẩu của mình trong URL:

ftp://user:password@host/path
http://user:password@host/path

Người dùng hoặc mật khẩu hoặc cả hai, có thể bị bỏ lại. Nếu bạn để lại tên người dùng hoặc mật khẩu HTTP, sẽ không có xác thực nào được gửi. Nếu bạn bỏ tên người dùng FTP, ‘Ẩn danh sẽ được sử dụng. Nếu bạn bỏ mật khẩu FTP, địa chỉ email của bạn sẽ được cung cấp dưới dạng mật khẩu mặc định.1

Lưu ý quan trọng: Nếu bạn chỉ định URL chứa mật khẩu trên dòng lệnh, tên người dùng và mật khẩu sẽ được hiển thị rõ ràng cho tất cả người dùng trên hệ thống, bằng cách

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
3. Trên các hệ thống nhiều người dùng, đây là một rủi ro bảo mật lớn. Để làm việc xung quanh nó, hãy sử dụng
wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
4 và cung cấp cho các URL cho đầu vào tiêu chuẩn của WGET, mỗi dòng trên một dòng riêng biệt, bị chấm dứt bởi C-D.
: if you specify a password-containing URL on the command line, the username and password will be plainly visible to all users on the system, by way of
wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
3. On multi-user systems, this is a big security risk. To work around it, use
wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
4 and feed the URLs to Wget’s standard input, each on a separate line, terminated by C-d.

Bạn có thể mã hóa các ký tự không an toàn trong URL là ‘%XY,

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
5 là đại diện thập lục phân của giá trị ASCII của nhân vật. Một số ký tự không an toàn phổ biến bao gồm ‘%, (được trích dẫn là‘%25,), ‘: Tham khảo RFC1738 để biết danh sách toàn diện các ký tự không an toàn.

WGET cũng hỗ trợ tính năng

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
6 cho URL FTP. Theo mặc định, các tài liệu FTP được truy xuất ở chế độ nhị phân (loại ‘I,), có nghĩa là chúng được tải xuống không thay đổi. Một chế độ hữu ích khác là chế độ ‘A (ASCII), chuyển đổi các trình phân cách dòng giữa các hệ điều hành khác nhau và do đó hữu ích cho các tệp văn bản. Đây là một ví dụ:

ftp://host/directory/file;type=a

Hai biến thể thay thế của đặc tả URL cũng được hỗ trợ, vì lý do lịch sử (cuồng loạn?) Và sử dụng rộng rãi của chúng.

Cú pháp chỉ FTP (được hỗ trợ bởi

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
7):

Cú pháp chỉ có HTTP (được giới thiệu bởi

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
8):

Hai hình thức thay thế này không được chấp nhận và có thể ngừng được hỗ trợ trong tương lai.

Nếu bạn không hiểu sự khác biệt giữa các ký hiệu này hoặc không biết sử dụng cái nào, chỉ cần sử dụng định dạng thông thường mà bạn sử dụng với trình duyệt yêu thích của bạn, như

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
9 hoặc
wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
8.


2.2 Cú pháp tùy chọn

Vì WGET sử dụng GNU GetOpt để xử lý các đối số dòng lệnh, mọi tùy chọn đều có một hình thức dài cùng với hình ngắn. Tùy chọn dài thuận tiện hơn để nhớ, nhưng hãy dành thời gian để gõ. Bạn có thể tự do trộn các kiểu tùy chọn khác nhau hoặc chỉ định các tùy chọn sau các đối số dòng lệnh. Vì vậy, bạn có thể viết:

wget -r --tries=10 http://fly.srk.fer.hr/ -o log

Không gian giữa tùy chọn chấp nhận một đối số và đối số có thể được bỏ qua. Thay vì ‘-o log, bạn có thể viết‘ -olog.

Bạn có thể đặt một số tùy chọn không yêu cầu đối số với nhau, như:

Điều này hoàn toàn tương đương với:

Vì các tùy chọn có thể được chỉ định sau các đối số, bạn có thể chấm dứt chúng bằng ‘-. Vì vậy, những điều sau đây sẽ cố gắng tải xuống URL ‘-X, báo cáo không đăng nhập:

Các tùy chọn chấp nhận danh sách phân tách bằng dấu phẩy đều tôn trọng quy ước chỉ định một danh sách trống xóa giá trị của nó. Điều này có thể hữu ích để xóa cài đặt .wgetrc. Chẳng hạn, nếu .wgetrc của bạn đặt

wget --spider --force-html -i bookmarks.html
1 thành /cgi-bin, ví dụ sau đây sẽ đặt lại trước tiên, sau đó đặt nó thành loại trừ /~ không ai và /~ ai đó. Bạn cũng có thể xóa các danh sách trong .wgetrc (xem cú pháp WGETRC).

wget -X '' -X /~nobody,/~somebody

Hầu hết các tùy chọn không chấp nhận các đối số là các tùy chọn boolean, vì vậy được đặt tên bởi vì trạng thái của chúng có thể được ghi lại bằng biến có hoặc không (Boo Boolean)). Ví dụ: ‘--foll-ftp, bảo WGET theo các liên kết FTP từ các tệp HTML và mặt khác,‘--no-glob, cho biết họ không thực hiện tệp globbing trên URL FTP. Một tùy chọn Boolean là khẳng định hoặc tiêu cực (bắt đầu bằng ‘-không,). Tất cả các tùy chọn như vậy chia sẻ một số thuộc tính.

Trừ khi có quy định khác, người ta cho rằng hành vi mặc định trái ngược với những gì tùy chọn thực hiện. Ví dụ: sự tồn tại được ghi lại của ‘-foll-ftp, giả định rằng mặc định là không tuân theo các liên kết FTP từ các trang HTML.

Các tùy chọn khẳng định có thể được phủ định bằng cách dành cho tên tùy chọn; Các tùy chọn tiêu cực có thể được phủ định bằng cách bỏ qua tiền tố ‘--no-. Điều này có vẻ không cần thiết, nếu mặc định cho một tùy chọn khẳng định là không làm điều gì đó, vậy tại sao lại cung cấp một cách để tắt nó một cách rõ ràng? Nhưng tập tin khởi động trên thực tế có thể thay đổi mặc định. Chẳng hạn, sử dụng

wget --spider --force-html -i bookmarks.html
2 trong .wgetrc tạo WGET theo các liên kết FTP theo mặc định và sử dụng ‘--no-foll-ftp, là cách duy nhất để khôi phục mặc định của nhà máy từ dòng lệnh.


2.3 Tùy chọn khởi động cơ bản

‘-V,‘-phiên bản

Hiển thị phiên bản của WGET.

‘-H xông‘-giúp đỡ

In một thông báo trợ giúp mô tả tất cả các tùy chọn dòng lệnh của WGET.

‘-B,‘-nền tảng

Đi đến nền ngay sau khi khởi động. Nếu không có tệp đầu ra được chỉ định thông qua ‘-o, đầu ra được chuyển hướng đến WGET-Log.

‘-E lệnh,‘-thực thi lệnh

Thực thi lệnh như thể nó là một phần của .wgetrc (xem tệp khởi động). Do đó, một lệnh được gọi sẽ được thực thi sau các lệnh trong .wgetrc, do đó được ưu tiên hơn chúng. Nếu bạn cần chỉ định nhiều hơn một lệnh wgetrc, hãy sử dụng nhiều phiên bản của ‘-e.


2.4 Tùy chọn tệp ghi nhật ký và đầu vào

‘-O logfile,‘-đầu ra-file = logfile

Đăng nhập tất cả các tin nhắn vào logfile. Các tin nhắn thường được báo cáo cho lỗi tiêu chuẩn.

‘-A logfile,--

Chuẩn bị vào logfile. Điều này giống như ‘-o, chỉ có nó nối vào LogFile thay vì ghi đè lên tệp nhật ký cũ. Nếu logfile không tồn tại, một tệp mới sẽ được tạo.

‘-D,‘-gỡ lỗi

Bật đầu ra gỡ lỗi, có nghĩa là thông tin khác nhau quan trọng đối với các nhà phát triển của WGET nếu nó không hoạt động đúng. Quản trị viên hệ thống của bạn có thể đã chọn biên dịch WGET mà không cần hỗ trợ gỡ lỗi, trong trường hợp đó -d, sẽ không hoạt động. Xin lưu ý rằng việc biên dịch với hỗ trợ gỡ lỗi luôn an toàn, được biên dịch với hỗ trợ gỡ lỗi sẽ không in bất kỳ thông tin gỡ lỗi nào trừ khi được yêu cầu với ‘-d. Xem các lỗi báo cáo, để biết thêm thông tin về cách sử dụng ‘-d, để gửi báo cáo lỗi.

Tắt đầu ra WGET.

‘-V,--Verbose

Bật đầu ra Verbose, với tất cả các dữ liệu có sẵn. Đầu ra mặc định là dài dòng.

‘-NV,‘-không có động cơ

TẮT Verbose mà không hoàn toàn im lặng (sử dụng ‘-Q, cho điều đó), điều đó có nghĩa là các thông báo lỗi và thông tin cơ bản vẫn được in.

-

Băng thông đầu ra như loại. Giá trị duy nhất được chấp nhận là ‘bit.

‘-I tệp

Đọc URL từ một tập tin cục bộ hoặc bên ngoài. Nếu ‘-được chỉ định là tệp, URL được đọc từ đầu vào tiêu chuẩn. (Sử dụng.

Nếu chức năng này được sử dụng, không cần URL nào trên dòng lệnh. Nếu có các URL cả trên dòng lệnh và trong một tệp đầu vào, những người trên các dòng lệnh sẽ là những người đầu tiên được truy xuất. Nếu ‘--force-html, không được chỉ định, thì tệp phải bao gồm một loạt các URL, một trên mỗi dòng.

Tuy nhiên, nếu bạn chỉ định ‘--force-html, tài liệu sẽ được coi là‘ html. Trong trường hợp đó, bạn có thể gặp vấn đề với các liên kết tương đối, bạn có thể giải quyết bằng cách thêm

wget --spider --force-html -i bookmarks.html
3 vào các tài liệu hoặc bằng cách chỉ định ‘-cơ sở = url trên dòng lệnh.

Nếu tệp là một tệp bên ngoài, tài liệu sẽ được coi là ‘HTML, nếu loại nội dung khớp với‘ văn bản/html. Hơn nữa, vị trí của tập tin sẽ được sử dụng hoàn toàn làm cơ sở HREF nếu không được chỉ định.

‘-input-metalink = file

Tải xuống các tập tin được đề cập trong tệp Metalink cục bộ. Metalink phiên bản 3 và 4 được hỗ trợ.

-

Tiếp tục tải xuống các tệp Metalink, với một hàm băm xấu. Nó nối thêm .Badhash vào tên của các tệp Metalink, có sự không phù hợp trong tổng kiểm tra, ngoại trừ không ghi đè lên các tệp hiện có.

---metalink-over-http

Các vấn đề yêu cầu đầu HTTP thay vì lấy và trích xuất siêu dữ liệu metalink từ các tiêu đề phản hồi. Sau đó, nó chuyển sang tải xuống Metalink. Nếu không tìm thấy siêu dữ liệu metalink hợp lệ, nó sẽ quay trở lại tải xuống HTTP thông thường. Cho phép tải xuống/xử lý các tệp nội dung: Ứng dụng/metalink4+XML.

‘--metalink-index = số

Đặt Metalink ‘Ứng dụng/Metalink4+XML, Metaurl Số thứ tự. Từ 1 đến tổng số ứng dụng/Metalink4+XML có sẵn. Chỉ định 0 hoặc ‘inf, để chọn cái tốt đầu tiên. Các metaurls, chẳng hạn như các metaurls từ một ’-metalink-over-http, có thể đã được sắp xếp theo giá trị khóa ưu tiên; Hãy ghi nhớ điều này để chọn đúng số.

----preferred-location

Đặt vị trí ưa thích cho tài nguyên Metalink. Điều này có hiệu lực nếu có nhiều tài nguyên có cùng mức độ ưu tiên.

‘--Xattr

Cho phép sử dụng các thuộc tính mở rộng của hệ thống tệp để lưu URL gốc và giá trị tiêu đề HTTP của người giới thiệu nếu được sử dụng.

Xin lưu ý rằng URL có thể chứa thông tin cá nhân như mã thông báo truy cập hoặc thông tin đăng nhập.

‘-F,‘-lực lượng-html

Khi đầu vào được đọc từ một tệp, buộc nó phải được coi là một tệp HTML. Điều này cho phép bạn truy xuất các liên kết tương đối từ các tệp HTML hiện có trên đĩa cục bộ của bạn, bằng cách thêm

wget --spider --force-html -i bookmarks.html
3 vào HTML hoặc sử dụng tùy chọn dòng lệnh ‘-cơ sở.

‘-B url,‘-cơ sở = url

Giải quyết các liên kết tương đối bằng URL làm điểm tham chiếu, khi đọc các liên kết từ tệp HTML được chỉ định thông qua tùy chọn '-i'/'-đầu vào' (cùng với '--force-html' hoặc khi tệp đầu vào đã được tìm nạp từ xa từ một máy chủ mô tả nó là HTML). Điều này tương đương với sự hiện diện của thẻ

wget --spider --force-html -i bookmarks.html
5 trong tệp đầu vào HTML, với URL là giá trị cho thuộc tính
wget --spider --force-html -i bookmarks.html
6.

Chẳng hạn, nếu bạn chỉ định 'http: //foo/bar/a.html' cho url và wget đọc '../baz/b.html' từ tệp đầu vào, nó sẽ được giải quyết thành 'http: // foo/baz/b.html '.

‘--config = Tệp

Chỉ định vị trí của tệp khởi động bạn muốn sử dụng thay vì một (các) mặc định. Sử dụng mậtNo-config để vô hiệu hóa đọc các tệp cấu hình. Nếu cả hai conconfig và clemno-config được đưa ra, thì không thể bỏ qua.

‘-Rejected-log = logfile

Ghi nhật ký tất cả các từ chối URL vào logfile dưới dạng các giá trị phân tách bằng dấu phẩy. Các giá trị bao gồm lý do từ chối, URL và URL cha mẹ được tìm thấy trong.


2.5 Tùy chọn tải xuống

‘-Bind-address = địa chỉ

Khi tạo các kết nối TCP/IP của máy khách, liên kết với địa chỉ trên máy cục bộ. Địa chỉ có thể được chỉ định là tên máy chủ hoặc địa chỉ IP. Tùy chọn này có thể hữu ích nếu máy của bạn bị ràng buộc với nhiều IPS.

‘-Bind-dns-address = địa chỉ

[Chỉ LibCares] Địa chỉ này ghi đè tuyến đường cho các yêu cầu DNS. Nếu bạn cần phá vỡ các cài đặt tiêu chuẩn từ /etc/resolv.conf, tùy chọn này cùng với ‘--DNS-servers, là bạn của bạn. Địa chỉ phải được chỉ định dưới dạng địa chỉ IPv4 hoặc IPv6. WGE cần được xây dựng với LibCares cho tùy chọn này có sẵn.

‘--DNS-servers = địa chỉ

[Chỉ LibCares] Địa chỉ đã cho (ES) ghi đè các địa chỉ máy chủ tên tiêu chuẩn, ví dụ: như được cấu hình trong /etc/resolv.conf. Địa chỉ có thể được chỉ định dưới dạng địa chỉ IPv4 hoặc IPv6, được phân tách bằng dấu phẩy. WGE cần được xây dựng với LibCares cho tùy chọn này có sẵn.

‘-T số,‘-cố gắng = số

Đặt số lần thử thành số. Chỉ định 0 hoặc ‘inf, cho thử lại vô hạn. Mặc định là thử lại 20 lần, ngoại trừ các lỗi gây tử vong như kết nối từ chối từ chối hoặc không tìm thấy (404), không được thử lại.

‘-O tệp

Các tài liệu sẽ không được ghi vào các tệp thích hợp, nhưng tất cả sẽ được nối với nhau và được ghi vào tệp. Nếu ‘-được sử dụng làm tệp, các tài liệu sẽ được in ra đầu ra tiêu chuẩn, vô hiệu hóa chuyển đổi liên kết. (Sử dụng.

Sử dụng ‘-o, không có ý định chỉ đơn giản là sử dụng tệp tên thay vì tệp trong URL; Thay vào đó, nó tương tự như chuyển hướng shell: ‘wget -o tệp http: // foo, dự định hoạt động như‘ wget -o -http: // foo> file Tệp sẽ bị cắt ngắn ngay lập tức và tất cả nội dung đã tải xuống sẽ được viết ở đó.

Vì lý do này, ‘-N, (đối với kiểm tra dấu thời gian) không được hỗ trợ kết hợp với‘ -o, vì tệp luôn mới được tạo, nó sẽ luôn có dấu thời gian rất mới. Một cảnh báo sẽ được đưa ra nếu sự kết hợp này được sử dụng.

Tương tự, bằng cách sử dụng '-r' hoặc '-p' với '-o' có thể không hoạt động như bạn mong đợi: wget sẽ không tải xuống tệp đầu tiên xuống tệp và sau đó tải xuống phần còn lại về tên bình thường của chúng: tất cả nội dung đã tải xuống sẽ là được đặt trong tập tin. Điều này đã bị vô hiệu hóa trong phiên bản 1.11, nhưng đã được khôi phục (với cảnh báo) trong 1.11.2, vì có một số trường hợp hành vi này thực sự có thể sử dụng.

Một sự kết hợp với ‘-nc, chỉ được chấp nhận nếu tệp đầu ra đã cho không tồn tại.

Lưu ý rằng sự kết hợp với ‘-K, chỉ được phép khi tải xuống một tài liệu duy nhất, vì trong trường hợp đó, nó sẽ chỉ chuyển đổi tất cả các URI tương đối sang các tài liệu bên ngoài; ‘-K không có ý nghĩa gì đối với nhiều URI khi tất cả họ được tải xuống một tệp duy nhất; ‘-K chỉ có thể được sử dụng khi đầu ra là một tệp thông thường.

Nếu một tệp được tải xuống nhiều lần trong cùng một thư mục, hành vi của WGET, phụ thuộc vào một vài tùy chọn, bao gồm ‘-NC. Trong một số trường hợp nhất định, tệp cục bộ sẽ bị clobbered hoặc ghi đè, khi tải xuống lặp đi lặp lại. Trong các trường hợp khác, nó sẽ được bảo tồn.

Khi chạy wget mà không có '-n', '-nc', '-r' hoặc '-p', việc tải xuống cùng một tệp trong cùng một thư mục sẽ dẫn đến bản sao gốc của tệp được bảo quản và bản sao thứ hai được đặt tên ' Tệp.1 '. Nếu tệp đó được tải xuống một lần nữa, bản sao thứ ba sẽ được đặt tên ‘File.2, v.v. . 'tập tin'. Do đó, ____ ____777, thực sự là một cách hiểu sai trong chế độ này, nó không bị cồng kềnh mà Lừa đã ngăn chặn (vì các hậu tố số đã ngăn chặn bị clobbering), mà là nhiều phiên bản tiết kiệm mà không bị ngăn chặn.

Khi chạy wget với ‘-r, hoặc‘ -p, nhưng không có ‘-n,‘ -nd, hoặc ‘-nc, tải lại một tệp sẽ dẫn đến bản sao mới chỉ đơn giản là ghi đè lên cũ. Thêm ‘-NC, sẽ ngăn chặn hành vi này, thay vào đó, việc phiên bản gốc được bảo tồn và bất kỳ bản sao mới nào trên máy chủ bị bỏ qua.

Khi chạy wget với '-n', có hoặc không có '-r' hoặc '-p', quyết định có nên tải xuống một bản sao mới hơn của tệp hay không phụ thuộc vào dấu thời gian và kích thước cục bộ và kích thước của tệp ( Xem thời gian đóng dấu). ‘-Nc, có thể không được chỉ định cùng lúc với‘ -n.

Một sự kết hợp với ‘-o,/‘-tài liệu đầu ra chỉ được chấp nhận nếu tệp đầu ra đã cho không tồn tại.

Lưu ý rằng khi ‘-nc, được chỉ định, các tệp có hậu tố‘ .html, hoặc ‘.htm, sẽ được tải từ đĩa cục bộ và phân tích cú pháp như thể chúng đã được lấy từ web.

‘--backups = bản sao lưu

Trước khi (trên) viết một tệp, sao lưu một tệp hiện có bằng cách thêm một hậu tố ‘.1 .1 (‘ _1 trên VMS) vào tên tệp. Các tệp sao lưu như vậy được xoay thành ‘.2,‘ .3, v.v., lên đến các bản sao lưu (và bị mất ngoài điều đó).

‘--No-Netrc,

Không cố gắng để có được thông tin đăng nhập từ tệp .Netrc. Theo mặc định. Tệp

‘-C xông‘-Tiếp tục

Tiếp tục nhận được một tập tin tải xuống một phần. Điều này rất hữu ích khi bạn muốn hoàn thành tải xuống bắt đầu bởi một phiên bản trước của WGET hoặc bởi một chương trình khác. Ví dụ:

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z

Nếu có một tệp có tên ls-lr.z trong thư mục hiện tại, wget sẽ cho rằng đó là phần đầu tiên của tệp từ xa và sẽ yêu cầu máy chủ tiếp tục truy xuất từ ​​độ lệch bằng chiều dài của tệp cục bộ .

Lưu ý rằng bạn không cần chỉ định tùy chọn này nếu bạn chỉ muốn gọi WGE hiện tại để thử lại việc tải xuống một tệp nếu kết nối bị mất giữa chừng. Đây là hành vi mặc định. ‘-C chỉ ảnh hưởng đến việc nối lại các bản tải xuống bắt đầu trước khi gọi WGET này và các tệp cục bộ vẫn đang ngồi xung quanh.

Không có ‘-c, ví dụ trước sẽ chỉ tải xuống tệp từ xa xuống ls-lr.z.1, chỉ để lại tệp ls-lr.z bị cắt cụt một mình.

Nếu bạn sử dụng ‘-c, trên một tệp không trống và máy chủ không hỗ trợ tiếp tục tải xuống, WGET sẽ khởi động lại tải xuống từ đầu và ghi đè hoàn toàn tệp hiện có.

Bắt đầu với WGET 1.7, nếu bạn sử dụng ‘-c, trên một tệp có kích thước bằng nhau như cái trên máy chủ, WGET sẽ từ chối tải xuống tệp và in một thông báo giải thích. Điều tương tự cũng xảy ra khi tệp nhỏ hơn trên máy chủ so với cục bộ (có lẽ là do nó đã được thay đổi trên máy chủ vì lần thử tải xuống cuối cùng của bạn)

Ở phía bên kia của đồng xu, trong khi sử dụng ‘-c, bất kỳ tệp nào lớn hơn trên máy chủ so với địa phương sẽ được coi là tải xuống không đầy đủ và chỉ các byte

wget --spider --force-html -i bookmarks.html
8 sẽ được tải xuống và giải quyết vào cuối tệp cục bộ. Chẳng hạn, hành vi này có thể được mong muốn trong một số trường hợp nhất định, bạn có thể sử dụng ‘WGET -C, để tải xuống phần mới mà Lừa được thêm vào tệp thu thập dữ liệu hoặc tệp nhật ký.

Tuy nhiên, nếu tệp lớn hơn trên máy chủ vì nó đã được thay đổi, trái ngược với chỉ được thêm vào, bạn sẽ kết thúc với một tệp bị cắt xén. WGET không có cách nào để xác minh rằng tệp cục bộ thực sự là một tiền tố hợp lệ của tệp từ xa. Bạn cần đặc biệt cẩn thận với điều này khi sử dụng ‘-c, kết hợp với‘ -r, vì mỗi tệp sẽ được coi là ứng cử viên "tải xuống không đầy đủ".

Một trường hợp khác trong đó bạn sẽ nhận được một tệp bị cắt xén nếu bạn cố gắng sử dụng ‘-c, là nếu bạn có proxy HTTP khập khiễng chèn một chuỗi bị gián đoạn của nhóm vào tệp cục bộ. Trong tương lai, một tùy chọn rollback rollback có thể được thêm vào để đối phó với trường hợp này.

Lưu ý rằng ‘-c, chỉ hoạt động với các máy chủ FTP và với các máy chủ HTTP hỗ trợ tiêu đề

wget --spider --force-html -i bookmarks.html
9.

‘-start-pos = offset,

Bắt đầu tải xuống ở độ lệch vị trí dựa trên 0. Offset có thể được thể hiện bằng byte, kilobyte với hậu tố ‘k, hoặc megabyte với hậu tố‘ m, v.v.

‘-Start-Pos, có quyền ưu tiên cao hơn‘-Continue. Khi ‘-start-pos, và‘-continue, cả hai đều được chỉ định, WGE sẽ phát ra cảnh báo sau đó tiến hành như thể không có.

Hỗ trợ máy chủ để tiếp tục tải xuống là bắt buộc, nếu không ‘-start-pos không thể giúp được. Xem ‘-c để biết chi tiết.

Chọn loại chỉ báo tiến trình bạn muốn sử dụng. Các chỉ số pháp lý là Dot dot và và Bar Bar.

Chỉ báo Bar Bar được sử dụng theo mặc định. Nó vẽ một đồ họa thanh tiến trình ASCII (màn hình a.k.a nhiệt kế nhiệt kế) cho biết trạng thái truy xuất. Nếu đầu ra không phải là TTY, thanh DOT DOT sẽ được sử dụng theo mặc định.

Sử dụng ‘--ProTHER = DOT, để chuyển sang màn hình DOT dot. Nó theo dõi việc truy xuất bằng cách in các dấu chấm trên màn hình, mỗi dấu chấm đại diện cho một lượng dữ liệu đã tải xuống cố định.

Loại tiến độ cũng có thể lấy một hoặc nhiều tham số. Các tham số khác nhau dựa trên loại được chọn. Các tham số sang loại được truyền bằng cách nối chúng vào loại được cấp bởi một dấu hai chấm (:) như thế này: ‘--Progros = type: tham số1: tham số2.

Khi sử dụng truy xuất chấm chấm, bạn có thể đặt kiểu bằng cách chỉ định loại là ‘dấu chấm: style. Các kiểu khác nhau gán ý nghĩa khác nhau cho một dấu chấm. Với kiểu

No options        -> ftp.xemacs.org/pub/xemacs/
-nH               -> pub/xemacs/
-nH --cut-dirs=1  -> xemacs/
-nH --cut-dirs=2  -> .

--cut-dirs=1      -> ftp.xemacs.org/xemacs/
...
0, mỗi dấu chấm đại diện cho 1K, có mười chấm trong một cụm và 50 dấu chấm trong một dòng. Phong cách
No options        -> ftp.xemacs.org/pub/xemacs/
-nH               -> pub/xemacs/
-nH --cut-dirs=1  -> xemacs/
-nH --cut-dirs=2  -> .

--cut-dirs=1      -> ftp.xemacs.org/xemacs/
...
1 có định hướng giống như máy tính khác, các điểm 8K, cụm 16-chấm và 48 chấm trên mỗi dòng (tạo ra 384k dòng). Kiểu
No options        -> ftp.xemacs.org/pub/xemacs/
-nH               -> pub/xemacs/
-nH --cut-dirs=1  -> xemacs/
-nH --cut-dirs=2  -> .

--cut-dirs=1      -> ftp.xemacs.org/xemacs/
...
2 phù hợp để tải xuống các tệp lớn, DOT DOT đại diện cho 64K được truy xuất, có tám chấm trong một cụm và 48 dấu chấm trên mỗi dòng (vì vậy mỗi dòng chứa 3M). Nếu
No options        -> ftp.xemacs.org/pub/xemacs/
-nH               -> pub/xemacs/
-nH --cut-dirs=1  -> xemacs/
-nH --cut-dirs=2  -> .

--cut-dirs=1      -> ftp.xemacs.org/xemacs/
...
2 là không đủ thì bạn có thể sử dụng kiểu
No options        -> ftp.xemacs.org/pub/xemacs/
-nH               -> pub/xemacs/
-nH --cut-dirs=1  -> xemacs/
-nH --cut-dirs=2  -> .

--cut-dirs=1      -> ftp.xemacs.org/xemacs/
...
4 DOT DOT DOT đại diện cho 1M được truy xuất, có tám chấm trong một cụm và 32 dấu chấm trên mỗi dòng (vì vậy mỗi dòng chứa 32m).

Với ‘--ProTHER = Bar, hiện có hai tham số có thể, lực và noscroll.

Khi đầu ra không phải là một tty, thanh tiến trình luôn rơi trở lại với Dot dot, ngay cả khi ‘-protrogress = thanh đã được chuyển cho wget trong quá trình gọi. Hành vi này có thể bị ghi đè và đầu ra của thanh Bar BAR bị ép buộc bằng cách sử dụng tham số lực lượng của Force Force như ‘-ProTHER = Bar: Force.

Theo mặc định, thanh tiến trình kiểu Bar Bar Bar cuộn tên của tệp từ trái sang phải cho tệp được tải xuống nếu tên tệp vượt quá độ dài tối đa được phân bổ cho màn hình của nó. Trong một số trường hợp nhất định, chẳng hạn như với ‘-ProTHER = Bar: Force, người ta có thể không muốn tên tệp cuộn trong thanh tiến trình. Bằng cách vượt qua tham số Noscroll, WGE có thể bị buộc phải hiển thị càng nhiều tên tệp càng tốt mà không cần cuộn qua nó.

Lưu ý rằng bạn có thể đặt kiểu mặc định bằng lệnh

No options        -> ftp.xemacs.org/pub/xemacs/
-nH               -> pub/xemacs/
-nH --cut-dirs=1  -> xemacs/
-nH --cut-dirs=2  -> .

--cut-dirs=1      -> ftp.xemacs.org/xemacs/
...
5 trong .wgetrc. Cài đặt đó có thể được ghi đè từ dòng lệnh. Ví dụ: để buộc đầu ra thanh mà không cần cuộn, sử dụng ‘--ProTHER = Bar: Force: Noscroll.

--

Buộc WGET để hiển thị thanh tiến trình trong bất kỳ câu chuyện.

Theo mặc định, WGET chỉ hiển thị thanh tiến trình ở chế độ Verbose. Tuy nhiên, người ta có thể muốn WGET hiển thị thanh tiến trình trên màn hình kết hợp với bất kỳ chế độ xác suất nào khác như ‘--no-verbose, hoặc‘ --quiet. Đây thường là một thuộc tính mong muốn khi gọi WGET để tải xuống một số tệp nhỏ/lớn. Trong trường hợp như vậy, WGET có thể đơn giản được gọi với tham số này để có được đầu ra sạch hơn nhiều trên màn hình.

Tùy chọn này cũng sẽ buộc thanh tiến trình được in ra Stderr khi được sử dụng cùng với tùy chọn ‘--Output-File.

‘-N xông-Dấu thời gian

Bật thời gian đóng dấu. Xem thời gian đóng dấu, để biết chi tiết.

‘--No-if-modified-since

Không gửi tiêu đề IF-REDified-Since ở chế độ ‘-N. Gửi yêu cầu đầu sơ bộ thay thế. Điều này chỉ có hiệu lực trong chế độ ‘-N.

‘--No-sử dụng máy chủ thời gian

Don Tiết đặt tập tin cục bộ dấu thời gian của một trên máy chủ.

Theo mặc định, khi một tệp được tải xuống, dấu thời gian của nó được đặt để khớp với các tệp từ tệp từ xa. Điều này cho phép sử dụng ‘-Timestamping trên các lời mời tiếp theo của WGET. Tuy nhiên, đôi khi rất hữu ích khi dựa trên dấu thời gian tập tin cục bộ khi nó thực sự được tải xuống; Với mục đích đó, tùy chọn ‘--no-use-server thời gian đã được cung cấp.

‘-S,--phản hồi máy chủ

In các tiêu đề được gửi bởi các máy chủ HTTP và phản hồi được gửi bởi các máy chủ FTP.

--Spider

Khi được gọi với tùy chọn này, WGE sẽ hoạt động như một con nhện web, điều đó có nghĩa là nó sẽ không tải xuống các trang, chỉ cần kiểm tra xem chúng có ở đó không. Ví dụ: bạn có thể sử dụng WGET để kiểm tra dấu trang của mình:

wget --spider --force-html -i bookmarks.html

Tính năng này cần nhiều công việc hơn cho WGET để đến gần chức năng của các nhện web thực sự.

‘-T giây

Đặt thời gian chờ mạng thành giây giây. Điều này tương đương với việc chỉ định ‘--DNS-TIMEOUT,‘-kết nối thời gian, và ‘-thời gian đọc sách, tất cả cùng một lúc.

Khi tương tác với mạng, WGET có thể kiểm tra thời gian chờ và hủy bỏ hoạt động nếu mất quá nhiều thời gian. Điều này ngăn chặn sự bất thường như treo đọc và kết nối vô hạn. Thời gian chờ duy nhất được bật theo mặc định là thời gian chờ đọc 900 giây. Đặt thời gian chờ thành 0 vô hiệu hóa hoàn toàn. Trừ khi bạn biết những gì bạn đang làm, tốt nhất là không thay đổi cài đặt thời gian chờ mặc định.

Tất cả các tùy chọn liên quan đến thời gian chờ đều chấp nhận các giá trị thập phân, cũng như các giá trị phụ. Ví dụ, ‘0,1 giây là một lựa chọn thời gian chờ hợp pháp (mặc dù không khôn ngoan). Thời gian chờ dưới mức rất hữu ích để kiểm tra thời gian phản hồi của máy chủ hoặc để kiểm tra độ trễ của mạng.

‘--DNS-Timeout = giây

Đặt thời gian chờ của DNS thành giây giây. Các tra cứu DNS mà don hoàn thành trong thời gian quy định sẽ thất bại. Theo mặc định, không có thời gian chờ khi tra cứu DNS, ngoài việc được thực hiện bởi các thư viện hệ thống.

‘-kết nối-thời gian ra = giây

Đặt thời gian chờ kết nối thành giây giây. Các kết nối TCP mất nhiều thời gian hơn để thiết lập sẽ bị hủy bỏ. Theo mặc định, không có thời gian chờ kết nối, ngoài việc được thực hiện bởi các thư viện hệ thống.

‘-thời gian đọc sách = giây

Đặt thời gian đọc (và viết) thành giây giây. Thời gian của thời gian chờ của thời gian chờ này đề cập đến thời gian nhàn rỗi: nếu, tại bất kỳ điểm nào trong quá trình tải xuống, không có dữ liệu nào được nhận trong nhiều hơn số giây được chỉ định, việc đọc không thành công và tải xuống được khởi động lại. Tùy chọn này không ảnh hưởng trực tiếp đến thời lượng của toàn bộ tải xuống.

Tất nhiên, máy chủ từ xa có thể chọn chấm dứt kết nối sớm hơn tùy chọn này yêu cầu. Thời gian chờ đọc mặc định là 900 giây.

‘--Limit-Rate = số tiền

Giới hạn tốc độ tải xuống đến số byte số tiền mỗi giây. Số lượng có thể được thể hiện bằng byte, kilobyte với hậu tố ‘k, hoặc megabyte với hậu tố‘ m. Ví dụ: ‘-tỷ lệ-limit = 20K, sẽ giới hạn tỷ lệ truy xuất ở mức 20kb/s. Điều này rất hữu ích khi, vì bất kỳ lý do gì, bạn không muốn WGET tiêu thụ toàn bộ băng thông có sẵn.

Tùy chọn này cho phép sử dụng các số thập phân, thường kết hợp với các hậu tố nguồn; Ví dụ: ‘--limit-l-l-late = 2,5K, là một giá trị pháp lý.

Lưu ý rằng WGET thực hiện giới hạn bằng cách ngủ thời gian thích hợp sau khi đọc mạng mất ít thời gian hơn so với quy định của tốc độ. Cuối cùng, chiến lược này làm cho việc chuyển TCP chậm lại xấp xỉ tốc độ quy định. Tuy nhiên, có thể mất một thời gian để đạt được sự cân bằng này, vì vậy, don rất ngạc nhiên nếu giới hạn tỷ lệ không hoạt động tốt với các tệp rất nhỏ.

‘-W giây,‘-chờ = giây

Đợi số giây được chỉ định giữa các lần truy xuất. Việc sử dụng tùy chọn này được khuyến nghị, vì nó làm sáng tải máy chủ bằng cách làm cho các yêu cầu ít thường xuyên hơn. Thay vì trong vài giây, thời gian có thể được chỉ định trong vài phút bằng cách sử dụng hậu tố

No options        -> ftp.xemacs.org/pub/xemacs/
-nH               -> pub/xemacs/
-nH --cut-dirs=1  -> xemacs/
-nH --cut-dirs=2  -> .

--cut-dirs=1      -> ftp.xemacs.org/xemacs/
...
6, trong giờ sử dụng hậu tố
No options        -> ftp.xemacs.org/pub/xemacs/
-nH               -> pub/xemacs/
-nH --cut-dirs=1  -> xemacs/
-nH --cut-dirs=2  -> .

--cut-dirs=1      -> ftp.xemacs.org/xemacs/
...
7 hoặc trong vài ngày sử dụng hậu tố
No options        -> ftp.xemacs.org/pub/xemacs/
-nH               -> pub/xemacs/
-nH --cut-dirs=1  -> xemacs/
-nH --cut-dirs=2  -> .

--cut-dirs=1      -> ftp.xemacs.org/xemacs/
...
8.

Việc chỉ định một giá trị lớn cho tùy chọn này là hữu ích nếu mạng hoặc máy chủ đích bị hỏng, để WGE có thể chờ đủ lâu để mong đợi lỗi mạng sẽ được sửa trước khi thử lại. Khoảng thời gian chờ được chỉ định bởi hàm này bị ảnh hưởng bởi

No options        -> ftp.xemacs.org/pub/xemacs/
-nH               -> pub/xemacs/
-nH --cut-dirs=1  -> xemacs/
-nH --cut-dirs=2  -> .

--cut-dirs=1      -> ftp.xemacs.org/xemacs/
...
9, xem.

‘--waitretry = giây

Nếu bạn không muốn Wget chờ đợi giữa mỗi lần truy xuất, nhưng chỉ giữa các lần thử tải thất bại, bạn có thể sử dụng tùy chọn này. WGE sẽ sử dụng backoff tuyến tính, chờ 1 giây sau lần thất bại đầu tiên trên một tệp đã cho, sau đó chờ 2 giây sau lần thất bại thứ hai trên tệp đó, tối đa số giây bạn chỉ định.

Theo mặc định, WGET sẽ giả định giá trị 10 giây.

--ngẫu nhiên-chờ đợi

Một số trang web có thể thực hiện phân tích nhật ký để xác định các chương trình truy xuất như WGET bằng cách tìm kiếm những điểm tương đồng có ý nghĩa thống kê trong thời gian giữa các yêu cầu. Tùy chọn này khiến thời gian giữa các yêu cầu thay đổi trong khoảng 0,5 đến 1,5 * Chờ vài giây, trong đó chờ được chỉ định bằng tùy chọn ‘-wait, để che dấu sự hiện diện của WGET từ phân tích đó.

Một bài viết năm 2001 trong một ấn phẩm dành cho sự phát triển trên một nền tảng tiêu dùng phổ biến đã cung cấp mã để thực hiện phân tích này một cách nhanh chóng. Tác giả của nó đề nghị chặn ở cấp địa chỉ lớp C để đảm bảo các chương trình truy xuất tự động bị chặn mặc dù thay đổi địa chỉ do DHCP cung cấp.

Tùy chọn ‘-Random-Wait, được lấy cảm hứng từ đề xuất không được khuyến khích này để chặn nhiều người dùng không liên quan khỏi một trang web do hành động của một.

'--không có proxy'

Don Tiết sử dụng proxy, ngay cả khi biến môi trường

wget --no-cookies --header "Cookie: name=value"
0 thích hợp được xác định.

Xem proxy, để biết thêm thông tin về việc sử dụng proxy với WGET.

Chỉ định tải xuống hạn ngạch cho truy xuất tự động. Giá trị có thể được chỉ định trong byte (mặc định), kilobyte (với hậu tố ‘K K) hoặc megabyte (với hậu tố‘ M,).

Lưu ý rằng hạn ngạch sẽ không bao giờ ảnh hưởng đến việc tải xuống một tệp. Vì vậy, nếu bạn chỉ định ‘wget -q10k https://example.com/ls-lr.gz, tất cả các ls-lr.gz sẽ được tải xuống. Điều tương tự cũng xảy ra ngay cả khi một số URL được chỉ định trên dòng lệnh. Hạn ngạch chỉ được kiểm tra ở cuối mỗi tệp đã tải xuống, vì vậy nó sẽ không bao giờ dẫn đến một tệp được tải xuống một phần. Do đó, bạn có thể gõ an toàn ‘WGET -Q2M -I Các trang web Tải xuống sẽ bị hủy bỏ sau khi tệp làm cạn kiệt hạn ngạch được tải xuống hoàn toàn.

Đặt hạn ngạch thành 0 hoặc để ‘Inf, không giới hạn hạn ngạch tải xuống.

‘--No-DNS-Cache,

Tắt bộ đệm của bộ tra cứu DNS. Thông thường, WGET nhớ các địa chỉ IP mà nó tra cứu từ DNS để nó không phải liên lạc nhiều với máy chủ DNS cho cùng một bộ máy chủ nhỏ (thường là nhỏ) mà nó lấy từ. Bộ đệm này chỉ tồn tại trong bộ nhớ; Một cuộc chạy WGET mới sẽ liên hệ lại với DNS.

Tuy nhiên, đã có báo cáo rằng trong một số tình huống, không mong muốn tên máy chủ lưu trữ, ngay cả trong thời gian của một ứng dụng chạy ngắn như WGET. Với tùy chọn này, WGET phát hành Tra cứu DNS mới (chính xác hơn là một cuộc gọi mới đến

wget --no-cookies --header "Cookie: name=value"
1 hoặc
wget --no-cookies --header "Cookie: name=value"
2) mỗi khi nó thực hiện kết nối mới. Xin lưu ý rằng tùy chọn này sẽ không ảnh hưởng đến bộ đệm có thể được thực hiện bởi thư viện giải quyết hoặc bởi một lớp bộ đệm bên ngoài, chẳng hạn như NSCD.

Nếu bạn không hiểu chính xác những gì tùy chọn này làm, có lẽ bạn đã thắng cần nó.

‘-R-Res-file-names = modes

Thay đổi các ký tự được tìm thấy trong các URL từ xa phải được thoát ra trong quá trình tạo tên tệp cục bộ. Các ký tự bị hạn chế bởi tùy chọn này được thoát ra, tức là được thay thế bằng ‘%HH, trong đó‘ HH, là số thập lục phân tương ứng với ký tự bị hạn chế. Tùy chọn này cũng có thể được sử dụng để buộc tất cả các trường hợp theo thứ tự bảng chữ cái có thể thấp hơn hoặc chữ hoa.

Theo mặc định, WGET thoát khỏi các ký tự không hợp lệ hoặc an toàn như một phần tên tệp trên hệ điều hành của bạn, cũng như các ký tự điều khiển thường không thể in được. Tùy chọn này rất hữu ích cho việc thay đổi các mặc định này, có lẽ vì bạn đang tải xuống một phân vùng không bản địa hoặc vì bạn muốn vô hiệu hóa việc thoát các ký tự điều khiển hoặc bạn muốn giới hạn các ký tự hơn nữa chỉ trong phạm vi giá trị ASCII.

Các chế độ là một tập hợp các giá trị văn bản được phân tách bằng dấu phẩy. Các giá trị có thể chấp nhận được là ‘Unix,‘ Windows, ‘Nocontrol,‘ ascii, ‘chữ thường, và‘ chữ hoa. Các giá trị ‘Unix, và‘ Windows, loại trừ lẫn nhau (cái này sẽ ghi đè lên các giá trị khác), cũng như ‘chữ thường và‘ chữ hoa. Những trường hợp cuối cùng đó là những trường hợp đặc biệt, vì chúng không thay đổi tập hợp các ký tự sẽ bị thoát ra, mà là buộc các đường dẫn tệp cục bộ phải được chuyển đổi thành thấp hơn hoặc dưới đây.

Khi UNIX UNIX được chỉ định, WGET thoát khỏi ký tự ‘/và các ký tự điều khiển trong phạm vi 0 Ném31 và 128 Phản159. Đây là mặc định trên các hệ điều hành giống UNIX.

Khi Windows Windows được đưa ra, wget thoát khỏi các ký tự '\', '|', '/', ':', '?', '"', '*', '', Và các ký tự điều khiển trong phạm vi 0 Ngoài ra, 31 và 128 tên tệp từ phần còn lại. Do đó, một URL sẽ được lưu dưới dạng 'www.xemacs.org:4300/search.pl?input=blah' trong chế độ Unix sẽ được lưu dưới dạng 'www.xemacs.org+4300/ search.pl@input=blah 'ở chế độ Windows. Chế độ này là mặc định trên Windows.

Nếu bạn chỉ định ‘nocontrol, thì việc thoát các ký tự điều khiển cũng bị tắt. Tùy chọn này có thể có ý nghĩa khi bạn tải xuống các URL có tên chứa các ký tự UTF-8, trên một hệ thống có thể lưu và hiển thị tên tệp trong UTF-8 (một số giá trị byte có thể được sử dụng trong chuỗi byte UTF-8 nằm trong phạm vi giá trị được chỉ định bởi wget như là điều khiển của người Viking).

Chế độ ‘ASCII được sử dụng để chỉ định rằng bất kỳ byte nào có giá trị nằm ngoài phạm vi của các ký tự ASCII (nghĩa là, lớn hơn 127) sẽ được thoát ra. Điều này có thể hữu ích khi lưu tên tệp có mã hóa không khớp với tên mã được sử dụng tại địa phương.

‘-4,‘-chỉ trong Inet4-6-6---chỉ inet6 chỉ

Buộc kết nối với địa chỉ IPv4 hoặc IPv6. Với ‘-chỉ dành cho-et4, hoặc‘ -4, WGET sẽ chỉ kết nối với máy chủ IPv4, bỏ qua các bản ghi AAAA trong DNS và từ chối kết nối với các địa chỉ IPv6 được chỉ định trong URL. Ngược lại, với ‘-chỉ có một-inet6, hoặc‘ -6, WGET sẽ chỉ kết nối với máy chủ IPv6 và bỏ qua các bản ghi và địa chỉ IPv4.

Không có tùy chọn nào nên cần thiết bình thường. Theo mặc định, WGET nhận biết IPv6 sẽ sử dụng họ địa chỉ được chỉ định bởi bản ghi DNS của máy chủ. Nếu DNS phản hồi với cả địa chỉ IPv4 và IPv6, WGET sẽ thử chúng theo trình tự cho đến khi tìm thấy một địa chỉ có thể kết nối. (Cũng xem tùy chọn

wget --no-cookies --header "Cookie: name=value"
3 được mô tả bên dưới.)

Các tùy chọn này có thể được sử dụng để cố tình buộc sử dụng các gia đình địa chỉ IPv4 hoặc IPv6 trên các hệ thống gia đình kép, thường là để hỗ trợ gỡ lỗi hoặc xử lý cấu hình mạng bị hỏng. Chỉ có thể chỉ có một trong số ‘-chỉ có thể chỉ định được chỉ định cùng một lúc. Không có tùy chọn nào có sẵn trong WGET được biên dịch mà không có hỗ trợ IPv6.

‘--prefer-family = none/ipv4/ipv6

Khi được lựa chọn một số địa chỉ, hãy kết nối với các địa chỉ với gia đình địa chỉ được chỉ định trước. Thứ tự địa chỉ được trả về bởi DNS được sử dụng mà không thay đổi theo mặc định.

Điều này tránh các lỗi giả và kết nối các nỗ lực khi truy cập các máy chủ quyết tâm đến cả địa chỉ IPv6 và IPv4 từ các mạng IPv4. Ví dụ: www.kame.net, giải quyết thành ‘2001: 200: 0: 8002: 203: 47ff: FEA5: 3085, và đến 203.178.141.194. Khi gia đình ưa thích là

wget --no-cookies --header "Cookie: name=value"
4, địa chỉ IPv4 được sử dụng đầu tiên; Khi gia đình ưa thích là
wget --no-cookies --header "Cookie: name=value"
5, địa chỉ IPv6 được sử dụng đầu tiên; Nếu giá trị được chỉ định là
wget --no-cookies --header "Cookie: name=value"
6, thứ tự địa chỉ được DNS trả về mà không có thay đổi.

Không giống như ‘-4, và‘ -6, tùy chọn này không ức chế quyền truy cập vào bất kỳ gia đình địa chỉ nào, nó chỉ thay đổi thứ tự truy cập địa chỉ. Cũng lưu ý rằng việc sắp xếp lại được thực hiện bởi tùy chọn này là ổn định, nó không ảnh hưởng đến thứ tự địa chỉ của cùng một gia đình. Đó là, thứ tự tương đối của tất cả các địa chỉ IPv4 và của tất cả các địa chỉ IPv6 vẫn còn nguyên vẹn trong mọi trường hợp.

‘--retry-connrefuss

Hãy xem xét kết nối từ chối từ chối một lỗi thoáng qua và thử lại. Thông thường WGET từ bỏ trên URL khi không thể kết nối với trang web vì việc không kết nối được lấy làm dấu hiệu cho thấy máy chủ hoàn toàn không chạy và việc thử lại sẽ không giúp ích gì. Tùy chọn này là để phản ánh các trang web không đáng tin cậy có máy chủ có xu hướng biến mất trong thời gian ngắn.

‘--User = người dùng,‘-mật khẩu = mật khẩu

Chỉ định mật khẩu người dùng và mật khẩu người dùng cho cả truy xuất tệp FTP và HTTP. Các tham số này có thể được ghi đè bằng các tùy chọn ‘--FTP-user và‘ --ftp-password, cho các kết nối FTP và các tùy chọn ‘--http-user và‘--http-password, các tùy chọn cho các kết nối HTTP.

-

Nhắc nhở mật khẩu cho mỗi kết nối được thiết lập. Không thể được chỉ định khi ‘--password, đang được sử dụng, vì chúng loại trừ lẫn nhau.

-

Nhắc cho người dùng và mật khẩu bằng lệnh được chỉ định. Nếu không có lệnh nào được chỉ định thì lệnh trong biến môi trường wget_askpass được sử dụng. Nếu wget_askpass không được đặt thì lệnh trong biến môi trường ssh_askpass được sử dụng.

Bạn có thể đặt lệnh mặc định để sử dụng-askPass trong .wgetrc. Cài đặt đó có thể được ghi đè từ dòng lệnh.

---Không-Iri

Tắt hỗ trợ URI (IRI) quốc tế hóa. Sử dụng ‘--IRI, để bật nó lên. Hỗ trợ IRI được kích hoạt theo mặc định.

Bạn có thể đặt trạng thái mặc định của hỗ trợ IRI bằng lệnh

wget --no-cookies --header "Cookie: name=value"
7 trong .wgetrc. Cài đặt đó có thể được ghi đè từ dòng lệnh.

‘-Mã hóa địa phương = mã hóa

Buộc WGET sử dụng mã hóa làm mã hóa hệ thống mặc định. Điều đó ảnh hưởng đến cách WGET chuyển đổi các URL được chỉ định là đối số từ địa phương sang UTF-8 để hỗ trợ IRI.

WGET sử dụng hàm

wget --no-cookies --header "Cookie: name=value"
8 và sau đó là biến môi trường
wget --no-cookies --header "Cookie: name=value"
9 để có được địa phương. Nếu nó thất bại, ASCII được sử dụng.

Bạn có thể đặt mã hóa cục bộ mặc định bằng lệnh

http://host[:port]/directory/file
ftp://host[:port]/directory/file
00 trong .wgetrc. Cài đặt đó có thể được ghi đè từ dòng lệnh.

--mã hóa-remote-mã hóa = mã hóa

Buộc WGET sử dụng mã hóa làm mã hóa máy chủ từ xa mặc định. Điều đó ảnh hưởng đến cách WGET chuyển đổi URI được tìm thấy trong các tệp từ mã hóa từ xa sang UTF-8 trong quá trình tìm nạp đệ quy. Tùy chọn này chỉ hữu ích cho hỗ trợ IRI, để giải thích các ký tự không phải ASCII.

Đối với HTTP, mã hóa từ xa có thể được tìm thấy trong tiêu đề HTTP ____101 và trong thẻ meta HTML

http://host[:port]/directory/file
ftp://host[:port]/directory/file
02.

Bạn có thể đặt mã hóa mặc định bằng lệnh

http://host[:port]/directory/file
ftp://host[:port]/directory/file
03 trong .wgetrc. Cài đặt đó có thể được ghi đè từ dòng lệnh.

---UnLink

Buộc WGET để hủy liên kết tệp thay vì clobbering tệp hiện có. Tùy chọn này rất hữu ích để tải xuống thư mục với các liên kết cứng.


2.6 Tùy chọn thư mục

‘-Nd,‘

Không tạo ra một hệ thống phân cấp các thư mục khi lấy lại đệ quy. Với tùy chọn này được bật, tất cả các tệp sẽ được lưu vào thư mục hiện tại, mà không cần clobbering (nếu một tên hiển thị nhiều lần, tên tệp sẽ nhận được các phần mở rộng ‘.n đấm).

Điều ngược lại với ‘-nd xông, tạo ra một hệ thống phân cấp các thư mục, ngay cả khi người ta không được tạo ra khác. Ví dụ. Wget -x http://fly.srk.fer.hr/robots.txt, sẽ lưu tệp đã tải xuống để fly.srk.fer.hr/robots.txt.

‘-NH,‘--no-host-Directories

Vô hiệu hóa thế hệ của các thư mục máy chủ. Theo mặc định, việc gọi wget với ‘-r http://fly.srk.fer.hr/, sẽ tạo ra một cấu trúc của các thư mục bắt đầu bằng fly.srk.fer.hr/. Tùy chọn này vô hiệu hóa hành vi đó.

-

Sử dụng tên giao thức làm thành phần thư mục của tên tệp cục bộ. Ví dụ: với tùy chọn này, ‘wget -r http: // máy chủ lưu trữ sẽ lưu vào‘ http/host/...

‘--cut-dirs = số

Bỏ qua các thành phần thư mục số. Điều này rất hữu ích để có được sự kiểm soát hạt mịn đối với thư mục nơi sẽ được truy xuất đệ quy.

Lấy ví dụ, thư mục tại ‘ftp://ftp.xemacs.org/pub/xemacs/. Nếu bạn lấy nó bằng ‘-r, nó sẽ được lưu cục bộ theo ftp.xemacs.org/pub/xemacs/. Mặc dù tùy chọn ‘-NH, có thể loại bỏ phần ftp.xemacs.org/, bạn vẫn bị mắc kẹt với pub/ xemacs. Đây là nơi ‘--cut-dirs, có ích; Nó làm cho wget không phải là xem các thành phần thư mục từ xa số. Dưới đây là một số ví dụ về cách thức hoạt động của tùy chọn ‘--cut-dirs.

No options        -> ftp.xemacs.org/pub/xemacs/
-nH               -> pub/xemacs/
-nH --cut-dirs=1  -> xemacs/
-nH --cut-dirs=2  -> .

--cut-dirs=1      -> ftp.xemacs.org/xemacs/
...

Nếu bạn chỉ muốn loại bỏ cấu trúc thư mục, tùy chọn này tương tự như sự kết hợp của ‘-nd, và‘ -p. Tuy nhiên, không giống như '-nd', '--cut-dirs' không thua với các thư mục con người ta sẽ mong đợi.

‘-P tiền tố,‘-thư mục-prefix = tiền tố

Đặt tiền tố thư mục thành tiền tố. Tiền tố thư mục là thư mục trong đó tất cả các tệp và thư mục con khác sẽ được lưu vào, tức là đỉnh của cây truy xuất. Mặc định là ‘. ((Thư mục hiện tại).


Tùy chọn 2.7 HTTP

‘--default-page = tên

Sử dụng tên làm tên tệp mặc định khi nó được biết đến (tức là, đối với các URL kết thúc bằng một dấu gạch chéo), thay vì index.html.

‘-E xông‘-điều chỉnh-mở rộng

Nếu một tệp loại 'Ứng dụng/XHTML+XML' hoặc 'TEXT/HTML' được tải xuống và URL không kết thúc với RegEXP '\. [HH] [TT] [MM] [LL]?' khiến hậu tố '.html' được thêm vào tên tệp cục bộ. Điều này rất hữu ích, ví dụ, khi bạn phản chiếu một trang web từ xa sử dụng các trang .asp, nhưng bạn muốn các trang được nhân đôi có thể xem được trên máy chủ Apache Stock của bạn. Một cách sử dụng tốt khác cho việc này là khi bạn tải xuống các tài liệu do CGI tạo ra. Một URL như ‘http://site.com/article.cgi?25, sẽ được lưu dưới dạng bài viết.cgi? 25.html.

Lưu ý rằng các tên tệp đã thay đổi theo cách này sẽ được tải xuống lại mỗi khi bạn lấy lại một trang web, vì wget không thể nói rằng tệp X.html cục bộ tương ứng với URL 'X' từ xa (vì nó chưa biết rằng URL tạo ra đầu ra của loại 'văn bản/html' hoặc 'application/xhtml+xml'.

Kể từ phiên bản 1.12, WGET cũng sẽ đảm bảo rằng mọi tệp được tải xuống thuộc loại ‘Text/CSS, kết thúc trong hậu tố‘ .css, và tùy chọn được đổi tên từ ‘ Tên tùy chọn cũ vẫn được chấp nhận, nhưng bây giờ nên được coi là không dùng nữa.

Kể từ phiên bản 1.19.2, WGET cũng sẽ đảm bảo rằng mọi tệp được tải xuống với

http://host[:port]/directory/file
ftp://host[:port]/directory/file
04 của 'BR', 'nén', 'xì hơi' hoặc 'gzip' kết thúc trong hậu tố '.br', '.z', '. zlib 'và' .gz 'tương ứng.

Tại một số điểm trong tương lai, tùy chọn này có thể được mở rộng để bao gồm các hậu tố cho các loại nội dung khác, bao gồm các loại nội dung không được phân tích bởi WGET.

‘--http-user = người dùng’-http-password = mật khẩu

Chỉ định mật khẩu người dùng và mật khẩu người dùng trên máy chủ HTTP. Theo loại thử thách, WGET sẽ mã hóa chúng bằng cách sử dụng

http://host[:port]/directory/file
ftp://host[:port]/directory/file
05 (không an toàn), sơ đồ xác thực
http://host[:port]/directory/file
ftp://host[:port]/directory/file
06 hoặc Windows
http://host[:port]/directory/file
ftp://host[:port]/directory/file
07.

Một cách khác để chỉ định tên người dùng và mật khẩu nằm trong chính URL (xem định dạng URL). Một trong hai phương thức tiết lộ mật khẩu của bạn cho bất kỳ ai làm phiền để chạy

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
3. Để ngăn chặn mật khẩu được nhìn thấy, hãy sử dụng ‘--use-askPass, hoặc lưu trữ chúng trong. Nếu mật khẩu thực sự quan trọng, đừng để chúng nằm trong các tệp đó hoặc chỉnh sửa các tệp và xóa chúng sau khi WGET đã bắt đầu tải xuống.

‘--No-http-keep-live

Tắt tính năng của Keep Keep-Alive để tải xuống HTTP. Thông thường, WGET yêu cầu máy chủ giữ kết nối mở để khi bạn tải xuống nhiều tài liệu từ cùng một máy chủ, chúng sẽ được chuyển qua cùng một kết nối TCP. Điều này tiết kiệm thời gian và đồng thời giảm tải trên máy chủ.

Tùy chọn này rất hữu ích khi, vì một số lý do, các kết nối liên tục (Keep-Alive) không hoạt động cho bạn, ví dụ như do lỗi máy chủ hoặc do các tập lệnh phía máy chủ không thể đối phó với các kết nối.

‘--Không có cache

Tắt bộ đệm phía máy chủ. Trong trường hợp này, WGET sẽ gửi các chỉ thị phù hợp của máy chủ từ xa (‘Bộ đệm kiểm soát: No-Cache, và‘ Pragma: No-Cache,) để lấy tệp từ dịch vụ từ xa, thay vì trả về phiên bản được lưu trữ. Điều này đặc biệt hữu ích để truy xuất và xóa các tài liệu lỗi thời trên các máy chủ proxy.

Bộ nhớ đệm được cho phép theo mặc định.

‘--Không có-cookies

Tắt việc sử dụng cookie. Cookies là một cơ chế để duy trì trạng thái phía máy chủ. Máy chủ gửi cho máy khách một cookie bằng tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
10 và máy khách trả lời với cùng một cookie theo các yêu cầu tiếp theo. Vì cookie cho phép chủ sở hữu máy chủ theo dõi khách truy cập và các trang web để trao đổi thông tin này, một số người coi họ là vi phạm quyền riêng tư. Mặc định là sử dụng cookie; Tuy nhiên, việc lưu trữ cookie không được bật theo mặc định.

‘-tập tin tải-cookies

Tải cookie từ tập tin trước khi truy xuất HTTP đầu tiên. Tệp là một tệp văn bản ở định dạng ban đầu được sử dụng bởi tệp Cookies.txt của NetScape.

Thông thường bạn sẽ sử dụng tùy chọn này khi các trang web phản chiếu yêu cầu bạn phải đăng nhập để truy cập một số hoặc tất cả nội dung của chúng. Quá trình đăng nhập thường hoạt động bởi máy chủ web phát hành cookie HTTP khi nhận và xác minh thông tin đăng nhập của bạn. Cookie sau đó phẫn nộ bởi trình duyệt khi truy cập vào phần đó của trang web và do đó chứng minh danh tính của bạn.

Phản ánh một trang web như vậy yêu cầu WGET gửi cùng một cookie mà trình duyệt của bạn gửi khi giao tiếp với trang web. Điều này đạt được bằng cách mô tả chỉ đơn giản là chỉ điểm của tệp cookie.txt và nó sẽ gửi cùng một cookie mà trình duyệt của bạn sẽ gửi trong cùng một tình huống. Các trình duyệt khác nhau giữ các tệp cookie văn bản ở các vị trí khác nhau:

Netscape 4.x.

Các cookie nằm trong ~/.Netscape/cookies.txt.

Mozilla và Netscape 6.x.

Tệp cookie Mozilla cũng được đặt tên là Cookies.txt, nằm ở đâu đó dưới ~/.mozilla, trong thư mục hồ sơ của bạn. Đường dẫn đầy đủ thường kết thúc trông giống như ~/.mozilla/mặc định/một số chuỗi-cookies/cookies.txt.

Trình duyệt web IE.

Bạn có thể tạo một tệp cookie wget có thể sử dụng bằng cách sử dụng menu tệp, nhập và xuất, xuất cookie. Điều này đã được thử nghiệm với Internet Explorer 5; Nó không được đảm bảo để làm việc với các phiên bản trước đó.

Những trình duyệt khác.

Nếu bạn đang sử dụng một trình duyệt khác để tạo cookie của mình, ‘--load-cookies, sẽ chỉ hoạt động nếu bạn có thể định vị hoặc tạo tệp cookie ở định dạng Netscape mà wget mong đợi.

Nếu bạn không thể sử dụng ‘-load-cookies, vẫn có thể có một sự thay thế. Nếu trình duyệt của bạn hỗ trợ một người quản lý cookie cookie, bạn có thể sử dụng nó để xem cookie được sử dụng khi truy cập trang web mà bạn phản ánh. Viết tên và giá trị của cookie, và hướng dẫn thủ công WGET gửi những cookie đó, bỏ qua hỗ trợ cookie chính thức của Cameron:

wget --no-cookies --header "Cookie: name=value"

‘-Save-Cookies File

Lưu cookie vào tập tin trước khi thoát. Điều này sẽ không tiết kiệm cookie đã hết hạn hoặc không có thời gian hết hạn (cái gọi là cookie phiên phiên,), nhưng cũng xem ‘-người làm việc-cookies.

-

Khi được chỉ định, gây ra ‘-save-cookies, cũng lưu cookie phiên. Cookie phiên thường không được lưu vì chúng có nghĩa là được giữ trong bộ nhớ và bị lãng quên khi bạn thoát khỏi trình duyệt. Tiết kiệm chúng rất hữu ích trên các trang web yêu cầu bạn đăng nhập hoặc truy cập trang chủ trước khi bạn có thể truy cập một số trang. Với tùy chọn này, nhiều lần chạy WGET được coi là một phiên trình duyệt duy nhất theo như trang web có liên quan.

Vì định dạng tệp cookie thường không mang cookie phiên, WGET đánh dấu chúng bằng dấu thời gian hết hạn là 0. WGET, ‘-load-cookies, nhận ra chúng là cookie phiên, nhưng nó có thể gây nhầm lẫn cho các trình duyệt khác. Cũng lưu ý rằng cookie được tải sẽ được coi là cookie phiên khác, điều đó có nghĩa là nếu bạn muốn ‘-save-cookies, để bảo quản chúng một lần nữa, bạn phải sử dụng lại‘-giữ lại-cookies.

--chiều dài

Thật không may, một số máy chủ HTTP (các chương trình CGI, chính xác hơn) gửi tiêu đề không có thật Bạn có thể phát hiện ra hội chứng này nếu WGET thử lại nhận được cùng một tài liệu nhiều lần, mỗi lần tuyên bố rằng kết nối (nếu không) đã đóng trên cùng một byte.

Với tùy chọn này, WGE sẽ bỏ qua tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
11 như nếu nó không bao giờ tồn tại.

‘-tiêu đề = tiêu đề-line

Gửi tiêu đề cùng với phần còn lại của các tiêu đề trong mỗi yêu cầu HTTP. Tiêu đề được cung cấp được gửi AS-IS, điều đó có nghĩa là nó phải chứa tên và giá trị được phân tách bằng đại tràng, và không được chứa các dòng mới.

Bạn có thể xác định nhiều hơn một tiêu đề bổ sung bằng cách chỉ định ‘-tiêu đề nhiều lần.

http://host[:port]/directory/file
ftp://host[:port]/directory/file
0

Đặc điểm kỹ thuật của một chuỗi trống vì giá trị tiêu đề sẽ xóa tất cả các tiêu đề do người dùng định nghĩa trước đó.

Kể từ WGET 1.10, tùy chọn này có thể được sử dụng để ghi đè các tiêu đề khác được tạo tự động. Ví dụ này hướng dẫn WGET kết nối với localhost, nhưng để chỉ định ‘foo.bar, trong tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
13:

http://host[:port]/directory/file
ftp://host[:port]/directory/file
1

Trong các phiên bản của WGET trước 1.10 Việc sử dụng ‘-tiêu đề đã gây ra việc gửi các tiêu đề trùng lặp.

‘--compression = loại

Chọn loại nén sẽ được sử dụng. Các giá trị pháp lý là ‘tự động,‘ gzip, và ‘không có gì.

Nếu ‘tự động, hoặc‘ gzip, được chỉ định, WGET yêu cầu máy chủ nén tệp bằng định dạng nén GZIP. Nếu máy chủ nén tệp và trả lời trường tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
04 được đặt một cách thích hợp, tệp sẽ được giải nén tự động.

Nếu ‘không được chỉ định, WGET sẽ không yêu cầu máy chủ nén tệp và sẽ không giải nén bất kỳ phản hồi máy chủ nào. Đây là mặc định.

Hỗ trợ nén hiện đang thử nghiệm. Trong trường hợp nó được bật, vui lòng báo cáo bất kỳ lỗi nào cho

http://host[:port]/directory/file
ftp://host[:port]/directory/file
15.

‘--max-redirect = số

Chỉ định số lượng chuyển hướng tối đa để tuân theo tài nguyên. Mặc định là 20, thường nhiều hơn mức cần thiết. Tuy nhiên, trong những dịp mà bạn muốn cho phép nhiều hơn (hoặc ít hơn), đây là tùy chọn sử dụng.

‘--Proxy-user = user us

Chỉ định mật khẩu người dùng và mật khẩu người dùng để xác thực trên máy chủ proxy. WGET sẽ mã hóa chúng bằng sơ đồ xác thực

http://host[:port]/directory/file
ftp://host[:port]/directory/file
05.

Các cân nhắc về bảo mật tương tự như những người có ‘--http-password cũng liên quan đến đây.

‘-Refeferer = url,

Bao gồm ‘Người giới thiệu: Tiêu đề URL, trong yêu cầu HTTP. Hữu ích để truy xuất các tài liệu với xử lý phía máy chủ, giả sử rằng chúng luôn được truy xuất bởi các trình duyệt web tương tác và chỉ xuất hiện đúng khi người giới thiệu được đặt thành một trong các trang hướng đến chúng.

---Save-Headers

Lưu các tiêu đề được gửi bởi máy chủ HTTP vào tệp, trước các nội dung thực tế, với một dòng trống làm dấu phân cách.

‘-U chuỗi tác nhân,’-agent-agent = agent-sling

Xác định là chuỗi tác nhân cho máy chủ HTTP.

Giao thức HTTP cho phép khách hàng tự nhận mình bằng cách sử dụng trường tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
17. Điều này cho phép phân biệt phần mềm WWW, thường là cho các mục đích thống kê hoặc theo dõi các vi phạm giao thức. Wget thường xác định là ‘wget/phiên bản, phiên bản là số phiên bản hiện tại của wget.

Tuy nhiên, một số trang web đã được biết là áp đặt chính sách điều chỉnh đầu ra theo thông tin do ________ 117 cung cấp. Mặc dù đây không phải là một ý tưởng tồi trong lý thuyết, nhưng nó đã bị lạm dụng bởi các máy chủ từ chối thông tin cho các khách hàng khác ngoài (lịch sử) Netscape hoặc, thường xuyên hơn, Microsoft Internet Explorer. Tùy chọn này cho phép bạn thay đổi dòng

http://host[:port]/directory/file
ftp://host[:port]/directory/file
17 do WGET ban hành. Sử dụng tùy chọn này là không được khuyến khích, trừ khi bạn thực sự biết những gì bạn đang làm.

Chỉ định tác nhân người dùng trống với ‘--User-agent =" "Hướng dẫn hướng dẫn không gửi tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
17 trong các yêu cầu HTTP.

Sử dụng POST làm phương thức cho tất cả các yêu cầu HTTP và gửi dữ liệu được chỉ định trong thân yêu cầu. ‘--Post-data, gửi chuỗi dưới dạng dữ liệu, trong khi--post-file, gửi nội dung của tệp. Ngoài ra, họ làm việc chính xác theo cùng một cách. Cụ thể, cả hai đều mong đợi nội dung của mẫu

http://host[:port]/directory/file
ftp://host[:port]/directory/file
21, với mã hóa phần trăm cho các ký tự đặc biệt; Sự khác biệt duy nhất là người ta mong đợi nội dung của nó như một tham số dòng lệnh và cái kia chấp nhận nội dung của nó từ một tệp. Cụ thể, ‘-post-file, không phải để truyền các tệp dưới dạng tệp đính kèm biểu mẫu: chúng phải xuất hiện dưới dạng dữ liệu
http://host[:port]/directory/file
ftp://host[:port]/directory/file
22 (với mã phần trăm phù hợp) giống như mọi thứ khác. WGET hiện không hỗ trợ
http://host[:port]/directory/file
ftp://host[:port]/directory/file
23 để truyền dữ liệu bài; Chỉ
http://host[:port]/directory/file
ftp://host[:port]/directory/file
24. Chỉ có một trong số ‘-post-data, và‘-post-file, nên được chỉ định.

Xin lưu ý rằng WGET không yêu cầu nội dung ở dạng

http://host[:port]/directory/file
ftp://host[:port]/directory/file
21 và nó cũng không kiểm tra cho nó. WGE sẽ chỉ đơn giản là truyền bất kỳ dữ liệu nào được cung cấp cho nó. Tuy nhiên, hầu hết các máy chủ mong đợi dữ liệu bài đăng ở định dạng trên khi xử lý các hình thức HTML.

Khi gửi yêu cầu POST bằng tùy chọn ‘-post-file, WGET coi tệp dưới dạng tệp nhị phân và sẽ gửi mọi ký tự trong yêu cầu POST mà không cần vứt bỏ các ký tự mới của dòng hoặc formfeed. Bất kỳ ký tự điều khiển nào khác trong văn bản cũng sẽ được gửi theo yêu cầu POST.

Xin lưu ý rằng WGET cần biết kích thước của dữ liệu bài trước. Do đó, đối số của

http://host[:port]/directory/file
ftp://host[:port]/directory/file
26 phải là một tệp thông thường; Chỉ định một FIFO hoặc một cái gì đó như /dev /stdin đã giành được công việc. Nó không hoàn toàn rõ ràng cách làm việc xung quanh giới hạn này vốn có trong HTTP/1.0. Mặc dù HTTP/1.1 giới thiệu chuyển khoản được chia nhỏ mà không yêu cầu biết độ dài yêu cầu trước, nhưng một khách hàng có thể sử dụng chunked trừ khi nó biết nó nói chuyện với máy chủ HTTP/1.1. Và nó có thể biết rằng cho đến khi nó nhận được phản hồi, điều này yêu cầu yêu cầu đã được hoàn thành-một vấn đề gà và trứng.

Lưu ý: Tính đến phiên bản 1.15 nếu WGET được chuyển hướng sau khi hoàn thành yêu cầu POST, hành vi của nó sẽ phụ thuộc vào mã phản hồi được máy chủ trả về. Trong trường hợp 301 di chuyển vĩnh viễn, 302 đã di chuyển tạm thời hoặc 307 chuyển hướng tạm thời, WGE sẽ, theo RFC2616, tiếp tục gửi yêu cầu POST. Trong trường hợp máy chủ muốn máy khách thay đổi phương thức yêu cầu khi chuyển hướng, nó sẽ gửi 303 xem mã phản hồi khác.

Ví dụ này cho thấy cách đăng nhập vào máy chủ bằng Post và sau đó tiến hành tải xuống các trang mong muốn, có lẽ chỉ có thể truy cập được cho người dùng được ủy quyền:

http://host[:port]/directory/file
ftp://host[:port]/directory/file
2

Nếu máy chủ đang sử dụng cookie phiên để theo dõi xác thực người dùng, thì ở trên sẽ không hoạt động vì ‘-save-cookies, sẽ không lưu chúng (và các trình duyệt sẽ không) và tệp cookies.txt sẽ trống. Trong trường hợp đó, hãy sử dụng ‘-người lưu hành-cookies, cùng với‘-save-cookies, để buộc tiết kiệm cookie phiên.

‘--method = http-method

Với mục đích của tập lệnh RESTful, WGET cho phép gửi các phương thức HTTP khác mà không cần thiết lập rõ ràng chúng bằng cách sử dụng ‘-tiêu đề = tiêu đề-line. WGE sẽ sử dụng bất kỳ chuỗi nào được truyền cho nó sau ‘--Method, làm phương thức HTTP cho máy chủ.

-

Phải được đặt khi dữ liệu bổ sung cần được gửi đến máy chủ cùng với phương thức được chỉ định bằng cách sử dụng ‘-method. ‘--body-data, gửi chuỗi dưới dạng dữ liệu, trong khi‘--body-file, gửi nội dung của tệp. Ngoài ra, họ làm việc chính xác theo cùng một cách.

Hiện tại, ‘--body-file, không phải là để truyền các tệp nói chung. WGET hiện không hỗ trợ

http://host[:port]/directory/file
ftp://host[:port]/directory/file
23 để truyền dữ liệu; Chỉ
http://host[:port]/directory/file
ftp://host[:port]/directory/file
24. Trong tương lai, điều này có thể được thay đổi để WGET gửi tệp file ‘-cơ thể dưới dạng một tệp hoàn chỉnh thay vì gửi nội dung của nó đến máy chủ. Xin lưu ý rằng WGET cần biết nội dung của dữ liệu cơ thể trước và do đó đối số thành ‘--body-file, nên là một tệp thông thường. Xem ‘--Post-File để biết giải thích chi tiết hơn. Chỉ có một trong số ‘--body-data, và‘--body-file, nên được chỉ định.

Nếu WGET được chuyển hướng sau khi hoàn thành yêu cầu, WGE sẽ tạm dừng phương thức hiện tại và gửi yêu cầu GET cho đến khi chuyển hướng hoàn tất. Điều này đúng với tất cả các mã phản hồi chuyển hướng ngoại trừ 307 chuyển hướng tạm thời được sử dụng để chỉ định rõ ràng rằng phương thức yêu cầu không nên thay đổi. Một ngoại lệ khác là khi phương thức được đặt thành

http://host[:port]/directory/file
ftp://host[:port]/directory/file
29, trong trường hợp đó, các quy tắc chuyển hướng được chỉ định theo ‘-post-data, được tuân thủ.

-

Nếu điều này được đặt thành BẬT, hỗ trợ thử nghiệm (không có chức năng đầy đủ) cho các tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
30 được bật. Điều này hiện có thể dẫn đến các chuyến đi khứ hồi thêm đến máy chủ cho yêu cầu
http://host[:port]/directory/file
ftp://host[:port]/directory/file
31 và được biết là bị một vài lỗi, đó là lý do tại sao nó hiện không được bật theo mặc định.

Tùy chọn này rất hữu ích cho một số chương trình CGI tải xuống tệp sử dụng các tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
30 để mô tả tên của tệp đã tải xuống là gì.

Khi kết hợp với ‘--metalink-over-http, và‘--trust-server-name, một tệp ‘nội dung: application/metalink4+xml, được đặt tên bằng cách sử dụng trường tệp

http://host[:port]/directory/file
ftp://host[:port]/directory/file
30, nếu có.

---Content-on-error

Nếu điều này được đặt thành Bật, WGET sẽ không bỏ qua nội dung khi máy chủ phản hồi với mã trạng thái HTTP cho biết lỗi.

-

Nếu điều này được đặt, trên một chuyển hướng, tên tệp cục bộ sẽ dựa trên URL chuyển hướng. Theo mặc định, tên tệp cục bộ dựa trên URL gốc. Khi thực hiện truy xuất đệ quy, điều này có thể hữu ích vì trong nhiều trang web được chuyển hướng các URL tương ứng với cấu trúc tệp cơ bản, trong khi các URL liên kết thì không.

‘--Auth-không thử thách

Nếu tùy chọn này được đưa ra, WGET sẽ gửi thông tin xác thực HTTP cơ bản (Tên người dùng và mật khẩu của PlainText) cho tất cả các yêu cầu, giống như WGET 1.10.2 và trước đó đã làm theo mặc định.

Việc sử dụng tùy chọn này không được khuyến nghị và chỉ nhằm mục đích hỗ trợ một số máy chủ tối nghĩa, không bao giờ gửi các thách thức xác thực HTTP, nhưng chấp nhận thông tin auth không được yêu cầu, ngoài việc xác thực dựa trên biểu mẫu.

‘--Retry-on-host-error

Hãy xem xét các lỗi của máy chủ, chẳng hạn như lỗi tạm thời trong độ phân giải tên, như các lỗi không gây tử vong, thoáng qua.

‘--retry-on-http-error = code [, code, ...]

Xem xét các mã phản hồi HTTP là lỗi không gây tử vong, thoáng qua. Cung cấp một danh sách được phân tách bằng dấu phẩy của mã phản hồi HTTP 3 chữ số làm đối số. Hữu ích để làm việc xung quanh các trường hợp đặc biệt khi yêu cầu thử lại, nhưng máy chủ trả lời bằng mã lỗi thường không được WGET thử lại. Các lỗi như vậy có thể là 503 (dịch vụ không có sẵn) và 429 (quá nhiều yêu cầu). Trọng lại được kích hoạt bởi tùy chọn này được thực hiện theo thời gian thử lại thông thường và giới hạn đếm thử lại của WGET.

Sử dụng tùy chọn này chỉ nhằm hỗ trợ các trường hợp sử dụng đặc biệt và thường không được khuyến nghị, vì nó có thể buộc phải thử lại ngay cả trong trường hợp máy chủ thực sự đang cố gắng giảm tải. Vui lòng sử dụng một cách khôn ngoan và chỉ khi bạn biết bạn đang làm gì.


Các tùy chọn 2.8 HTTPS (SSL/TLS)

Để hỗ trợ tải xuống HTTP (HTTPS) được mã hóa, WGET phải được biên dịch với thư viện SSL bên ngoài. Mặc định hiện tại là gnutls. Ngoài ra, WGET cũng hỗ trợ HSTS (HTTP Strict Transport Security). Nếu WGET được biên dịch mà không có hỗ trợ SSL, không có tùy chọn nào trong số này có sẵn.

‘-an toàn-protocol = giao thức

Chọn giao thức an toàn sẽ được sử dụng. Các giá trị pháp lý là ‘tự động,‘ SSLV2, ‘SSLV3,‘ TLSV1, ‘TLSV1_1,‘ TLSV1_2, ‘TLSV1_3, và‘ PFS. Nếu ’tự động được sử dụng, thư viện SSL được tự động chọn giao thức thích hợp, đạt được bằng cách gửi lời chào TLSV1. Đây là mặc định.

Chỉ định ‘SSLV2,‘ SSLV3, ‘TLSV1,‘ TLSV1_1, ‘TLSV1_2, hoặc‘ TLSV1_3, buộc việc sử dụng giao thức tương ứng. Điều này rất hữu ích khi nói chuyện với các triển khai máy chủ SSL cũ và lỗi khiến thư viện SSL cơ bản khó chọn phiên bản giao thức chính xác. May mắn thay, các máy chủ như vậy là khá hiếm.

Chỉ định ‘PFS, thực thi việc sử dụng các bộ mật mã bảo mật chuyển tiếp hoàn hảo. Nói tóm lại, PFS thêm bảo mật bằng cách tạo khóa một lần cho mỗi kết nối SSL. Nó có tác động CPU hơn một chút đối với máy khách và máy chủ. Chúng tôi sử dụng được biết là mật mã an toàn (ví dụ: không có MD4) và giao thức TLS. Chế độ này cũng loại trừ rõ ràng các phương thức trao đổi khóa không PFS, chẳng hạn như RSA.

---https chỉ

Khi ở chế độ đệ quy, chỉ theo các liên kết HTTPS.

--comphers

Đặt chuỗi danh sách mật mã. Thông thường, chuỗi này đặt các bộ mật mã và các tùy chọn SSL/TLS khác mà người dùng mong muốn nên được sử dụng, theo thứ tự được thiết lập ưu tiên (Gnutls gọi nó là Chuỗi ưu tiên của Google). Chuỗi này sẽ được cho ăn nguyên văn cho động cơ SSL/TLS (OpenSSL hoặc Gnutls) và do đó định dạng và cú pháp của nó phụ thuộc vào điều đó. WGE sẽ không xử lý hoặc thao túng nó theo bất kỳ cách nào. Tham khảo tài liệu OpenSSL hoặc GNUTLS để biết thêm thông tin.

‘--Không-Check-Certificate

Don Tiết kiểm tra chứng chỉ máy chủ đối với cơ quan chứng chỉ có sẵn. Ngoài ra don don yêu cầu tên máy chủ URL phù hợp với tên chung được trình bày bởi chứng chỉ.

Kể từ WGET 1.10, mặc định là xác minh chứng chỉ máy chủ đối với cơ quan chứng chỉ được công nhận, phá vỡ bắt tay SSL và hủy bỏ tải xuống nếu xác minh không thành công. Mặc dù điều này cung cấp các bản tải xuống an toàn hơn, nhưng nó không có khả năng tương tác với một số trang web hoạt động với các phiên bản WGET trước đó, đặc biệt là các trang web sử dụng chứng chỉ tự ký, hết hạn hoặc không hợp lệ. Tùy chọn này buộc một chế độ hoạt động không an toàn của người Viking biến các lỗi xác minh chứng chỉ thành cảnh báo và cho phép bạn tiến hành.

Nếu bạn gặp phải xác minh chứng chỉ của Viking, các lỗi hoặc các lỗi nói rằng tên phổ biến không phù hợp với tên máy chủ được yêu cầu, bạn có thể sử dụng tùy chọn này để bỏ qua việc xác minh và tiến hành tải xuống. Chỉ sử dụng tùy chọn này nếu bạn bị thuyết phục về tính xác thực của trang web, hoặc nếu bạn thực sự không quan tâm đến tính hợp lệ của chứng chỉ của nó. Hầu như luôn luôn là một ý tưởng tồi để không kiểm tra chứng chỉ khi truyền dữ liệu bí mật hoặc quan trọng. Đối với chứng chỉ tự ký/nội bộ, bạn nên tải xuống chứng chỉ và xác minh chống lại điều đó thay vì buộc chế độ không an toàn này. Nếu bạn thực sự chắc chắn về việc không mong muốn bất kỳ xác minh chứng chỉ nào, bạn có thể chỉ định CapeCheck-C-C-cress = im lặng để nói với WGET không in bất kỳ cảnh báo nào về chứng chỉ không hợp lệ, mặc dù trong hầu hết các trường hợp, đây là điều sai.

Sử dụng chứng chỉ máy khách được lưu trữ trong tập tin. Điều này là cần thiết cho các máy chủ được cấu hình để yêu cầu chứng chỉ từ các máy khách kết nối với chúng. Thông thường một chứng chỉ là không bắt buộc và công tắc này là tùy chọn.

Chỉ định loại chứng chỉ máy khách. Các giá trị pháp lý là ‘PEM, (giả định theo mặc định) và‘ der, còn được gọi là ‘asn1.

‘-provate-key = Tệp

Đọc khóa riêng từ tập tin. Điều này cho phép bạn cung cấp khóa riêng trong một tệp tách biệt với chứng chỉ.

-

Chỉ định loại khóa riêng. Các giá trị được chấp nhận là ‘PEM, (mặc định) và‘ der.

‘--ca-certificate = file

Sử dụng tệp làm tệp với gói của các cơ quan chứng chỉ (CA CA) để xác minh các đồng nghiệp. Các chứng chỉ phải ở định dạng PEM.

Nếu không có tùy chọn này, WGET tìm chứng chỉ CA tại các vị trí do hệ thống chỉ định, được chọn tại thời gian cài đặt OpenSSL.

‘--ca-directory = thư mục

Chỉ định thư mục chứa chứng chỉ CA ở định dạng PEM. Mỗi tệp chứa một chứng chỉ CA và tên tệp dựa trên giá trị băm có nguồn gốc từ chứng chỉ. Điều này đạt được bằng cách xử lý một thư mục chứng chỉ với tiện ích

http://host[:port]/directory/file
ftp://host[:port]/directory/file
34 được cung cấp với OpenSSL. Sử dụng ‘--CA-Directory, hiệu quả hơn so với‘-ca-cderificate khi nhiều chứng chỉ được cài đặt vì nó cho phép WGET tìm nạp chứng chỉ theo yêu cầu.

Nếu không có tùy chọn này, WGET tìm chứng chỉ CA tại các vị trí do hệ thống chỉ định, được chọn tại thời gian cài đặt OpenSSL.

‘--ca-directory = thư mục

Chỉ định thư mục chứa chứng chỉ CA ở định dạng PEM. Mỗi tệp chứa một chứng chỉ CA và tên tệp dựa trên giá trị băm có nguồn gốc từ chứng chỉ. Điều này đạt được bằng cách xử lý một thư mục chứng chỉ với tiện ích

http://host[:port]/directory/file
ftp://host[:port]/directory/file
34 được cung cấp với OpenSSL. Sử dụng ‘--CA-Directory, hiệu quả hơn so với‘-ca-cderificate khi nhiều chứng chỉ được cài đặt vì nó cho phép WGET tìm nạp chứng chỉ theo yêu cầu.

‘--Crl-file = file

Chỉ định một tệp CRL trong tệp. Điều này là cần thiết cho các chứng chỉ đã được CAS hủy bỏ.

‘-PinnedPubKey = File/băm

Yêu cầu WGET sử dụng tệp khóa công khai (hoặc băm) được chỉ định để xác minh ngang hàng. Đây có thể là một đường dẫn đến một tệp có chứa một khóa công khai duy nhất ở định dạng PEM hoặc DER hoặc bất kỳ số lượng BASE được mã hóa Base64 nào trước đó là SHA256 // và được phân tách bởi

Khi đàm phán kết nối TLS hoặc SSL, máy chủ sẽ gửi chứng chỉ cho biết danh tính của nó. Một khóa công khai được trích xuất từ ​​chứng chỉ này và nếu nó không khớp chính xác (các) khóa công khai được cung cấp cho tùy chọn này, WGE sẽ hủy bỏ kết nối trước khi gửi hoặc nhận bất kỳ dữ liệu nào.

‘-random-file = file

.

Trên các hệ thống như vậy, thư viện SSL cần một nguồn ngẫu nhiên bên ngoài để khởi tạo. Tính ngẫu nhiên có thể được cung cấp bởi EGD (xem ‘--file, bên dưới) hoặc đọc từ một nguồn bên ngoài được chỉ định bởi người dùng. Nếu tùy chọn này không được chỉ định, WGET tìm dữ liệu ngẫu nhiên trong
http://host[:port]/directory/file
ftp://host[:port]/directory/file
35 hoặc, nếu đó là không đặt, trong $ home/.rnd.

Nếu bạn nhận được những người không thể gieo hạt prng prng; Vô hiệu hóa SSL. Lỗi, bạn nên cung cấp dữ liệu ngẫu nhiên bằng một số phương thức được mô tả ở trên.

‘--Gd-file = file

[Chỉ openSSL] Sử dụng tệp làm ổ cắm EGD. EGD là viết tắt của Entropy Gathering Daemon, một chương trình không gian người dùng thu thập dữ liệu từ các nguồn hệ thống không thể đoán trước khác nhau và cung cấp cho các chương trình khác có thể cần nó. Phần mềm mã hóa, chẳng hạn như thư viện SSL, cần các nguồn ngẫu nhiên không lặp lại để gieo hạt trình tạo số ngẫu nhiên được sử dụng để tạo ra các khóa mạnh về mặt mật mã.

OpenSSL cho phép người dùng chỉ định nguồn entropy của riêng mình bằng biến môi trường
http://host[:port]/directory/file
ftp://host[:port]/directory/file
36. Nếu biến này không được đặt hoặc nếu tệp được chỉ định không tạo ra đủ ngẫu nhiên, OpenSSL sẽ đọc dữ liệu ngẫu nhiên từ ổ cắm EGD được chỉ định bằng tùy chọn này.

Nếu tùy chọn này không được chỉ định (và lệnh khởi động tương đương không được sử dụng), EGD không bao giờ được liên hệ. EGD không cần thiết trên các hệ thống Unix hiện đại hỗ trợ /dev /urandom.

‘--Không-hsts

WGET hỗ trợ HSTS (HTTP Strict Transport Security, RFC 6797) theo mặc định. Sử dụng ‘--no-hsts, để làm cho wget hoạt động như một UA không tuân thủ HSTS. Do đó, WGET sẽ bỏ qua tất cả các tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
37 và sẽ không thực thi bất kỳ chính sách HSTS hiện có nào.

‘--hsts-file = file

Một dòng nhập HSTS bao gồm một số trường được phân tách bằng một hoặc nhiều khoảng trắng:

http://host[:port]/directory/file
ftp://host[:port]/directory/file
40

Các trường HostName và Cổng chỉ ra tên máy chủ và cổng mà chính sách HSTS đã cho được áp dụng. Trường cổng có thể bằng không, và trong hầu hết các trường hợp. Điều đó có nghĩa là số cổng sẽ không được tính đến khi quyết định liệu chính sách HSTS đó có nên được áp dụng cho một yêu cầu nhất định hay không (chỉ tên máy chủ sẽ được đánh giá). Khi cổng khác với 0, cả tên máy chủ đích và cổng sẽ được đánh giá và chính sách HSTS sẽ chỉ được áp dụng nếu cả hai đều khớp. Tính năng này đã được bao gồm cho mục đích thử nghiệm/phát triển. Wget TestSuite (trong TestenV/) tạo cơ sở dữ liệu HSTS với các cổng rõ ràng với mục đích đảm bảo hành vi chính xác của WGET. Áp dụng các chính sách HSTS cho các cổng khác ngoài các chính sách mặc định không được RFC 6797 không khuyến khích (xem Phụ lục B "Sự khác biệt giữa chính sách HSTS và chính sách đồng nghĩa"). Do đó, chức năng này không nên được sử dụng trong môi trường sản xuất và cổng thường sẽ bằng không. Ba lĩnh vực cuối cùng làm những gì họ dự kiến. Trường bao gồm_subdomains có thể là

http://host[:port]/directory/file
ftp://host[:port]/directory/file
41 hoặc
http://host[:port]/directory/file
ftp://host[:port]/directory/file
42 và nó báo hiệu liệu các tên miền phụ của miền đích cũng có phải là một phần của chính sách HSTS đã cho hay không. Các trường được tạo và tuổi tối đa giữ các giá trị dấu thời gian của khi mục nhập đó được tạo (lần đầu tiên được nhìn thấy bởi WGET) và giá trị do HSTS xác định Kể từ thời gian được lưu trữ trong tạo. Khi thời gian đó trôi qua, chính sách HSTS sẽ không còn hợp lệ và cuối cùng sẽ bị xóa khỏi cơ sở dữ liệu.

Nếu bạn cung cấp cơ sở dữ liệu HSTS của riêng mình thông qua ‘--HSTS-File, hãy lưu ý rằng WGET có thể sửa đổi tệp được cung cấp nếu có bất kỳ thay đổi nào xảy ra giữa các chính sách HSTS được yêu cầu bởi các máy chủ từ xa và các máy chủ trong tệp. Khi WGET thoát, nó cập nhật hiệu quả cơ sở dữ liệu HSTS bằng cách viết lại tệp cơ sở dữ liệu với các mục mới.

Nếu tệp được cung cấp không tồn tại, WGE sẽ tạo một tệp. Tệp này sẽ chứa các mục HSTS mới. Nếu không có mục nhập HSTS nào được tạo (không có tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
37 nào được gửi bởi bất kỳ máy chủ nào) thì không có tệp nào sẽ được tạo, thậm chí không phải là một tệp trống. Hành vi này cũng áp dụng cho tệp cơ sở dữ liệu mặc định (~/.wget-hsts): Nó sẽ không được tạo cho đến khi một số máy chủ thực thi chính sách HSTS.

Chăm sóc được thực hiện để không ghi đè các thay đổi có thể được thực hiện bởi các quy trình WGET khác cùng một lúc trong cơ sở dữ liệu HSTS. Trước khi bỏ các mục HSTS được cập nhật trên tệp, WGET sẽ đọc lại nó và hợp nhất các thay đổi.

Sử dụng cơ sở dữ liệu HSTS tùy chỉnh và/hoặc sửa đổi một cơ sở hiện có không được khuyến khích. Để biết thêm thông tin về các mối đe dọa bảo mật tiềm năng phát sinh từ thực tiễn đó, hãy xem phần 14 "Cân nhắc bảo mật" của RFC 6797, đặc biệt là phần 14.9 "thao tác sáng tạo của Cửa hàng chính sách HSTS".

‘--warc-file = file

Sử dụng tệp làm tệp WARC đích.

‘--warc-meader = String,

Sử dụng chuỗi vào như bản ghi Warcinfo.

‘--warc-max-size = kích thước

Đặt kích thước tối đa của các tệp WARC thành kích thước.

‘--Warc-CDx,

Viết tệp chỉ mục CDX.

‘--warc-dedup = file

Không lưu trữ hồ sơ được liệt kê trong tệp CDX này.

--Không-warc-compression

Không nén các tệp WARC với GZIP.

‘--No-Warc-Digests

Không tính toán tiêu hóa SHA1.

‘--No-Warc-keep-log

Không lưu trữ tệp nhật ký trong bản ghi WARC.

‘--warc-tempdir = dir

Chỉ định vị trí cho các tệp tạm thời được tạo bởi người viết Warc.


2.9 Tùy chọn FTP

‘--Ftp-user = người dùng’-ftp-password = mật khẩu

Chỉ định mật khẩu người dùng và mật khẩu người dùng trên máy chủ FTP. Không có điều này, hoặc tùy chọn khởi động tương ứng, mật khẩu mặc định là ‘-wget@, thường được sử dụng cho FTP ẩn danh.

Một cách khác để chỉ định tên người dùng và mật khẩu nằm trong chính URL (xem định dạng URL). Một trong hai phương thức tiết lộ mật khẩu của bạn cho bất kỳ ai làm phiền để chạy

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
3. Để ngăn chặn mật khẩu được nhìn thấy, hãy lưu trữ chúng trong. Nếu mật khẩu thực sự quan trọng, đừng để chúng nằm trong các tệp đó hoặc chỉnh sửa các tệp và xóa chúng sau khi WGET đã bắt đầu tải xuống.

---Không xua đuổi

Don Tiết loại bỏ các tệp .listing tạm thời được tạo bởi các truy xuất FTP. Thông thường, các tệp này chứa các danh sách thư mục RAW nhận được từ các máy chủ FTP. Không loại bỏ chúng có thể hữu ích cho mục đích gỡ lỗi hoặc khi bạn muốn có thể dễ dàng kiểm tra nội dung của các thư mục máy chủ từ xa (ví dụ: để xác minh rằng một gương mà bạn đang chạy đã hoàn tất).

Lưu ý rằng mặc dù WGET viết cho một tên tệp đã biết cho tệp này, nhưng đây không phải là lỗ bảo mật trong kịch bản của người dùng tạo. Hãy liệt kê một liên kết tượng trưng đến /etc /passwd hoặc một cái gì đó và yêu cầu

http://host[:port]/directory/file
ftp://host[:port]/directory/file
46 chạy WGET trong thư mục của anh ấy hoặc cô ấy . Tùy thuộc vào các tùy chọn được sử dụng, WGET sẽ từ chối viết cho. Listing, làm cho hoạt động Globbing/Recur đến một tập tin .listing.number.

Mặc dù tình huống này không phải là một vấn đề, tuy nhiên,

http://host[:port]/directory/file
ftp://host[:port]/directory/file
46 không bao giờ nên chạy WGET trong một thư mục người dùng không truy xuất. Người dùng có thể làm một cái gì đó đơn giản như liên kết chỉ mục.html với /etc /passwd và yêu cầu
http://host[:port]/directory/file
ftp://host[:port]/directory/file
46 chạy wget với ‘-n, hoặc‘ -r, vì vậy tệp sẽ bị ghi đè.

---Không-glob

Tắt FTP Globbing. Globbing đề cập đến việc sử dụng các ký tự đặc biệt giống như vỏ (Wildcards), như ‘*,,‘?

http://host[:port]/directory/file
ftp://host[:port]/directory/file
3

Theo mặc định, Globbing sẽ được bật nếu URL chứa một ký tự toàn cầu. Tùy chọn này có thể được sử dụng để bật hoặc tắt vĩnh viễn.

Bạn có thể phải trích dẫn URL để bảo vệ nó khỏi được mở rộng bởi vỏ của bạn. Globbing làm cho WGET tìm kiếm một danh sách thư mục, đó là dành riêng cho hệ thống. Đây là lý do tại sao nó hiện chỉ hoạt động với các máy chủ UNIX FTP (và các máy chủ mô phỏng đầu ra UNIX

http://host[:port]/directory/file
ftp://host[:port]/directory/file
49).

‘--no-passive-ftp

Vô hiệu hóa việc sử dụng chế độ chuyển FTP thụ động. FTP thụ động bắt buộc máy khách kết nối với máy chủ để thiết lập kết nối dữ liệu thay vì cách khác.

Nếu máy được kết nối trực tiếp với Internet, cả FTP thụ động và hoạt động sẽ hoạt động tốt như nhau. Đằng sau hầu hết các cấu hình tường lửa và NAT thụ động FTP có cơ hội làm việc tốt hơn. Tuy nhiên, trong một số cấu hình tường lửa hiếm hoi, FTP hoạt động thực sự hoạt động khi FTP thụ động không có. Nếu bạn nghi ngờ đây là trường hợp, hãy sử dụng tùy chọn này hoặc đặt

http://host[:port]/directory/file
ftp://host[:port]/directory/file
50 trong tệp init của bạn.

--permissions-permissions

Bảo tồn quyền của tệp từ xa thay vì các quyền được đặt bởi UMASK.

--retr-symlinks

Theo mặc định, khi truy xuất các thư mục FTP một cách đệ quy và liên kết tượng trưng gặp phải, liên kết tượng trưng được chuyển qua và các tệp chỉ ra được lấy lại. Hiện tại, WGET không đi qua các liên kết tượng trưng đến các thư mục để tải xuống chúng một cách đệ quy, mặc dù tính năng này có thể được thêm vào trong tương lai.

Khi ‘-retr-symlinks = không được chỉ định, tệp liên kết-đến không được tải xuống. Thay vào đó, một liên kết tượng trưng phù hợp được tạo trên hệ thống tập tin cục bộ. Tệp chỉ vào sẽ không được truy xuất trừ khi việc truy xuất đệ quy này đã gặp riêng nó và tải xuống nó bằng mọi cách. Tùy chọn này đặt ra rủi ro bảo mật trong đó máy chủ FTP độc hại có thể khiến WGET ghi vào các tệp bên ngoài các thư mục dự định thông qua một tệp .listing được chế tạo đặc biệt.

Lưu ý rằng khi truy xuất một tệp (không phải là một thư mục) vì nó được chỉ định trên dòng lệnh, thay vì vì nó được đặt lại, tùy chọn này không có hiệu lực. Các liên kết tượng trưng luôn luôn đi qua trong trường hợp này.

2.10 Tùy chọn FTPS

---ftps-isplicit

Tùy chọn này bảo WGET sử dụng FTPS ngầm. FTPS tiềm ẩn bao gồm khởi tạo SSL/TLS ngay từ đầu kết nối điều khiển. Tùy chọn này không gửi lệnh

http://host[:port]/directory/file
ftp://host[:port]/directory/file
51: Nó giả sử máy chủ nói FTPS và trực tiếp khởi động kết nối SSL/TLS. Nếu nỗ lực thành công, phiên tiếp tục giống như FTP thông thường (
http://host[:port]/directory/file
ftp://host[:port]/directory/file
52 và
http://host[:port]/directory/file
ftp://host[:port]/directory/file
53 được gửi, v.v.). FTPS ngầm không còn là một yêu cầu đối với việc triển khai FTPS và do đó nhiều máy chủ có thể không hỗ trợ nó. Nếu '--ftps-isplicit' được truyền và không có số cổng rõ ràng được chỉ định, cổng mặc định cho FTPS ngầm, 990, sẽ được sử dụng, thay vì cổng mặc định cho FTP "bình thường" (rõ ràng) giống như của FTP, 21.

‘--no-ftps-resume-ssl

Không tiếp tục phiên SSL/TLS trong kênh dữ liệu. Khi bắt đầu kết nối dữ liệu, WGET cố gắng tiếp tục phiên SSL/TLS đã bắt đầu trước đó trong kết nối điều khiển. Việc nối lại phiên SSL/TLS tránh thực hiện một cái bắt tay hoàn toàn mới bằng cách sử dụng lại các tham số SSL/TLS của phiên trước. Thông thường, các máy chủ FTPS muốn nó theo cách đó, vì vậy WGE đã thực hiện điều này theo mặc định. Tuy nhiên, trong những trường hợp hiếm hoi, người ta có thể muốn bắt đầu một phiên SSL/TLS hoàn toàn mới trong mỗi kết nối dữ liệu. Đây là những gì ‘--no-ftps-resume-ssl là dành cho.

---ftps-clear-data kết nối

Tất cả các kết nối dữ liệu sẽ có trong văn bản đơn giản. Chỉ kết nối điều khiển sẽ nằm trong SSL/TLS. WGET sẽ gửi lệnh

http://host[:port]/directory/file
ftp://host[:port]/directory/file
54 để đạt được điều này, phải được máy chủ chấp thuận.

‘--Ftps-fallback-to-ftp

Bị rơi vào FTP nếu FTPS không được hỗ trợ bởi máy chủ đích. Vì lý do bảo mật, tùy chọn này không được xác nhận theo mặc định. Hành vi mặc định là thoát với một lỗi. Nếu một máy chủ không trả lời thành công lệnh

http://host[:port]/directory/file
ftp://host[:port]/directory/file
51 ban đầu hoặc trong trường hợp FTPS ngầm, nếu cố gắng kết nối SSL/TLS ban đầu bị từ chối, thì người máy chủ đó không hỗ trợ FTPS.


2.11 Tùy chọn truy xuất đệ quy

‘-R,‘-đệ quy

Bật truy xuất đệ quy. Xem Tải xuống đệ quy, để biết thêm chi tiết. Độ sâu tối đa mặc định là 5.

‘-L Độ sâu,‘-Level = độ sâu

Đặt số lượng thư mục con tối đa mà WGET sẽ tái phát vào độ sâu. Để ngăn chặn một người vô tình tải xuống các trang web rất lớn khi sử dụng đệ quy, điều này được giới hạn ở độ sâu 5 theo mặc định, tức là, nó sẽ đi qua nhiều nhất 5 thư mục bắt đầu từ URL được cung cấp. Đặt ‘-L 0, hoặc‘ -l inf, cho độ sâu đệ quy vô hạn.

http://host[:port]/directory/file
ftp://host[:port]/directory/file
4

Lý tưởng nhất, người ta sẽ mong đợi điều này sẽ tải xuống chỉ 1.html. Nhưng thật không may, đây không phải là trường hợp, bởi vì ‘-l 0, tương đương với‘ -l inf inf, đó là đệ quy vô hạn. Để tải xuống một trang HTML duy nhất (hoặc một số trong số chúng), chỉ định tất cả chúng trên dòng lệnh và bỏ đi ‘-r, và‘ -l. Để tải xuống các mục thiết yếu để xem một trang HTML duy nhất, hãy xem trang Điều kiện cần thiết.

---Delete-sau

Tùy chọn này bảo WGET xóa mọi tệp mà nó tải xuống, sau khi đã làm như vậy. Nó rất hữu ích cho việc tìm kiếm trước các trang phổ biến thông qua proxy, ví dụ:

http://host[:port]/directory/file
ftp://host[:port]/directory/file
5

Tùy chọn ‘-r, là lấy lại đệ quy và‘ -nd, để không tạo thư mục.

Lưu ý rằng ‘--Delete-sau khi xóa các tệp trên máy cục bộ. Chẳng hạn, nó không phát hành lệnh ‘dele, đối với các trang FTP từ xa. Cũng lưu ý rằng khi ‘--delete-after, được chỉ định,‘--convert-links, bị bỏ qua, do đó, các tệp .orig, đơn giản là không được tạo ngay từ đầu.

‘-K,--chuyển đổi-liên kết

Sau khi tải xuống hoàn tất, hãy chuyển đổi các liên kết trong tài liệu để làm cho chúng phù hợp để xem cục bộ. Điều này không chỉ ảnh hưởng đến các siêu liên kết có thể nhìn thấy, mà bất kỳ phần nào của tài liệu liên kết với nội dung bên ngoài, chẳng hạn như hình ảnh nhúng, liên kết đến các bảng kiểu, siêu liên kết với nội dung không HTML, v.v.

Mỗi liên kết sẽ được thay đổi theo một trong hai cách:

  • Các liên kết đến các tệp đã được WGET tải xuống sẽ được thay đổi để tham khảo tệp mà chúng chỉ ra là một liên kết tương đối.

    Ví dụ: Nếu tệp đã tải xuống /foo/doc.html liên kết đến /bar/img.gif, cũng được tải xuống, thì liên kết trong doc.html sẽ được sửa đổi để trỏ đến ‘../bar/img.gif. Loại chuyển đổi này hoạt động đáng tin cậy cho sự kết hợp tùy ý của các thư mục.

  • Các liên kết đến các tệp chưa được WGET tải xuống sẽ được thay đổi để bao gồm tên máy chủ và đường dẫn tuyệt đối của vị trí mà chúng chỉ ra.

    Ví dụ: Nếu tệp đã tải xuống /foo/doc.html liên kết đến /bar/img.gif (hoặc đến ../bar/img.gif), thì liên kết trong doc.html sẽ được sửa đổi để trỏ đến http: // tên máy chủ/thanh/img.gif.

Bởi vì điều này, trình duyệt cục bộ hoạt động một cách đáng tin cậy: Nếu một tệp được liên kết được tải xuống, liên kết sẽ đề cập đến tên địa phương của nó; Nếu nó không được tải xuống, liên kết sẽ đề cập đến địa chỉ internet đầy đủ của nó thay vì trình bày một liên kết bị hỏng. Thực tế là các liên kết trước đây được chuyển đổi thành các liên kết tương đối đảm bảo rằng bạn có thể chuyển hệ thống phân cấp đã tải xuống sang một thư mục khác.

Lưu ý rằng chỉ ở cuối bản tải xuống mới có thể biết liên kết nào đã được tải xuống. Do đó, công việc được thực hiện bởi ‘-K, sẽ được thực hiện vào cuối tất cả các bản tải xuống.

---Convert-File chỉ dành cho

Tùy chọn này chỉ chuyển đổi phần tệp của URL, khiến phần còn lại của các URL không bị ảnh hưởng. Phần tệp này đôi khi được gọi là "tên cơ sở", mặc dù chúng tôi tránh thuật ngữ đó ở đây để không gây nhầm lẫn.

Nó hoạt động đặc biệt tốt khi kết hợp với ‘-adjust-extension, mặc dù khớp nối này không được thực thi. Nó chứng minh hữu ích để điền vào bộ nhớ cache Internet với các tệp được tải xuống từ các máy chủ khác nhau.

Ví dụ: Nếu một số liên kết trỏ đến //foo.com/bar.cgi?xyz với '--adjust-extension' được khẳng định và điểm đến địa phương của nó được dự định là ./foo.com/bar.cgi?xyz.css, sau đó Liên kết sẽ được chuyển đổi thành //foo.com/bar.cgi?xyz.css. Lưu ý rằng chỉ có phần tệp đã được sửa đổi. Phần còn lại của URL đã bị bỏ lại, bao gồm cả đường dẫn ròng (

http://host[:port]/directory/file
ftp://host[:port]/directory/file
56) sẽ được WGET xử lý và chuyển đổi sang sơ đồ hiệu quả (ví dụ:
http://host[:port]/directory/file
ftp://host[:port]/directory/file
57).

‘-K,‘-

Khi chuyển đổi một tệp, hãy sao lưu phiên bản gốc với hậu tố ‘.orig. Ảnh hưởng đến hành vi của ‘-n, (xem nội bộ đóng dấu thời gian HTTP).

‘-M,‘-gương

Bật tùy chọn phù hợp cho phản chiếu. Tùy chọn này bật đệ quy và dập thời gian, đặt độ sâu đệ quy vô hạn và giữ danh sách thư mục FTP. Nó hiện tương đương với ‘-r -n -l inf--no-remove-listing.

-P

Tùy chọn này khiến WGET tải xuống tất cả các tệp cần thiết để hiển thị đúng trang HTML đã cho. Điều này bao gồm những thứ như hình ảnh, âm thanh và các kiểu dáng được tham chiếu.

Thông thường, khi tải xuống một trang HTML duy nhất, bất kỳ tài liệu cần thiết nào có thể cần thiết để hiển thị nó không được tải xuống đúng. Sử dụng ‘-r, cùng với‘ -l, có thể giúp đỡ, nhưng vì WGET không phân biệt thông thường giữa các tài liệu bên ngoài và nội bộ, nên người ta thường bị bỏ lại với các tài liệu lá của lá mà thiếu các vật dụng cần thiết của chúng.

Chẳng hạn, giả sử tài liệu 1.html chứa thẻ

http://host[:port]/directory/file
ftp://host[:port]/directory/file
58 tham chiếu 1.gif và thẻ
http://host[:port]/directory/file
ftp://host[:port]/directory/file
59 trỏ đến tài liệu bên ngoài 2.html. Nói rằng 2.html là tương tự nhưng hình ảnh của nó là 2.gif và nó liên kết đến 3.html. Nói điều này tiếp tục lên đến một số số lượng cao tùy ý.

Nếu một người thực thi lệnh:

http://host[:port]/directory/file
ftp://host[:port]/directory/file
6

sau đó 1.html, 1.gif, 2.html, 2.gif và 3.html sẽ được tải xuống. Như bạn có thể thấy, 3.html không có điều cần thiết 3.gif vì wget chỉ đơn giản là đếm số lượng hoa bia (lên đến 2) từ 1.html để xác định nơi dừng lại. Tuy nhiên, với lệnh này:

http://host[:port]/directory/file
ftp://host[:port]/directory/file
7

Tất cả các tệp trên và 3.html, cần thiết 3.gif sẽ được tải xuống. Tương tự,

http://host[:port]/directory/file
ftp://host[:port]/directory/file
8

sẽ gây ra 1.html, 1.gif, 2.html và 2.gif được tải xuống. Người ta có thể nghĩ rằng:

http://host[:port]/directory/file
ftp://host[:port]/directory/file
9

Sẽ tải xuống chỉ 1.html và 1.gif, nhưng thật không may, đây không phải là trường hợp, bởi vì ‘-l 0, tương đương với‘ -l inf inf, đó là đệ quy vô hạn. Để tải xuống một trang HTML duy nhất (hoặc một số trong số chúng, tất cả được chỉ định trên dòng lệnh hoặc trong tệp đầu vào URL '-i' ':

ftp://user:password@host/path
http://user:password@host/path
0

Lưu ý rằng WGE sẽ hoạt động như thể đã được chỉ định, nhưng chỉ có một trang duy nhất đó và các yêu cầu của nó sẽ được tải xuống. Liên kết từ trang đó đến các tài liệu bên ngoài sẽ không được theo dõi. Trên thực tế, để tải xuống một trang duy nhất và tất cả các điều kiện cần thiết của nó (ngay cả khi chúng tồn tại trên các trang web riêng biệt) và đảm bảo rằng lô hiển thị đúng địa phương, tác giả này thích sử dụng một vài tùy chọn ngoài ‘-p,:

ftp://user:password@host/path
http://user:password@host/path
1

Để hoàn thành chủ đề này, nó đáng để biết rằng ý tưởng của WGE về liên kết tài liệu bên ngoài là bất kỳ URL nào được chỉ định trong thẻ

http://host[:port]/directory/file
ftp://host[:port]/directory/file
59, thẻ
http://host[:port]/directory/file
ftp://host[:port]/directory/file
61 hoặc thẻ
http://host[:port]/directory/file
ftp://host[:port]/directory/file
62 khác ngoài
http://host[:port]/directory/file
ftp://host[:port]/directory/file
63.

--Strict-Comments

Bật phân tích nghiêm ngặt các bình luận HTML. Mặc định là chấm dứt các bình luận khi xuất hiện đầu tiên của ‘->.

Theo thông số kỹ thuật, các bình luận HTML được thể hiện dưới dạng khai báo SGML. Tuyên bố là dấu hiệu đặc biệt bắt đầu bằng ‘, chẳng hạn như‘, có thể chứa các bình luận giữa một cặp ‘-Delimiter. Nhận xét của HTML là các tuyên bố trống rỗng, các tuyên bố của SGML mà không có bất kỳ văn bản không bình thường nào. Do đó, ‘, là một bình luận hợp lệ, và‘ cũng vậy, nhưng ’thì thì không.

Mặt khác, hầu hết các nhà văn HTML đều không nhận xét nhận xét như bất cứ điều gì khác ngoài văn bản được phân định bằng ‘, không hoàn toàn giống nhau. Ví dụ, một cái gì đó như ‘, hoạt động như một nhận xét hợp lệ miễn là số lượng dấu gạch ngang là bội số của bốn (!). Nếu không, bình luận về mặt kỹ thuật kéo dài cho đến lần tiếp theo--, có thể ở đầu kia của tài liệu. Bởi vì điều này, nhiều trình duyệt phổ biến hoàn toàn bỏ qua thông số kỹ thuật và thực hiện những gì người dùng đã mong đợi: các nhận xét được phân định bằng ‘.

Cho đến phiên bản 1.9, WGET đã giải thích các bình luận một cách nghiêm ngặt, dẫn đến việc thiếu các liên kết trong nhiều trang web hiển thị tốt trong trình duyệt, nhưng không may là chứa các nhận xét không tuân thủ. Bắt đầu với phiên bản 1.9, WGET đã gia nhập hàng ngũ các khách hàng thực hiện các bình luận của người Hồi giáo, chấm dứt mỗi bình luận khi xuất hiện đầu tiên của ‘->.

Nếu, vì bất kỳ lý do gì, bạn muốn phân tích cú pháp nhận xét nghiêm ngặt, hãy sử dụng tùy chọn này để bật nó lên.


2.12 Các tùy chọn chấp nhận/từ chối đệ quy

‘-A Acclist --Ccept Acclist,‘-R Rejlist-Rejection Rejlist

Chỉ định danh sách được phân tách bằng dấu phẩy của các hậu tố hoặc mẫu tên tệp để chấp nhận hoặc từ chối (xem các loại tệp). Lưu ý rằng nếu bất kỳ ký tự ký tự đại diện nào, ‘*,,‘? Trong trường hợp này, bạn phải gửi mẫu vào các trích dẫn để ngăn chặn vỏ của bạn mở rộng nó, giống như trong ‘-a"*.mp3 ", hoặc‘ -a '*.mp3'.

-

Chỉ định một biểu thức thông thường để chấp nhận hoặc từ chối URL hoàn chỉnh.

--regextype loại-regex

Chỉ định loại biểu thức chính quy. Các loại có thể là ‘posix, hoặc‘ pcre. Lưu ý rằng để có thể sử dụng loại ‘PCRE, WGET phải được biên dịch với hỗ trợ LibPCRE.

‘-D Danh sách miền Danh sách tên miền‘-Tên miền = Danh sách tên miền

Đặt tên miền sẽ được tuân theo. Danh sách miền là một danh sách các tên miền được phân tách bằng dấu phẩy. Lưu ý rằng nó không bật ’-h.

--Exexclude-DOMAIN Danh sách miền Danh sách

Chỉ định các tên miền không được tuân theo (xem các máy chủ bao gồm).

--foll-ftp

Theo liên kết FTP từ các tài liệu HTML. Nếu không có tùy chọn này, WGE sẽ bỏ qua tất cả các liên kết FTP.

WGET có một bảng nội bộ của các cặp thẻ / thuộc tính HTML mà nó xem xét khi tìm kiếm các tài liệu được liên kết trong quá trình truy xuất đệ quy. Tuy nhiên, nếu người dùng chỉ muốn một tập hợp con của các thẻ đó được xem xét, anh ta hoặc cô ta nên chỉ định các thẻ đó trong danh sách được phân tách bằng dấu phẩy với tùy chọn này.

-

Đây là điều ngược lại với tùy chọn ‘--follow-Tags. Để bỏ qua một số thẻ HTML nhất định khi tìm kiếm các tài liệu để tải xuống, chỉ định chúng trong danh sách được phân tách bằng dấu phẩy.

Trước đây, tùy chọn này là đặt cược tốt nhất để tải xuống một trang duy nhất và các điều kiện cần thiết của nó, sử dụng dòng lệnh như:

ftp://user:password@host/path
http://user:password@host/path
2

Tuy nhiên, tác giả của tùy chọn này đã bắt gặp một trang với các thẻ như

http://host[:port]/directory/file
ftp://host[:port]/directory/file
64 và nhận ra rằng việc chỉ định các thẻ để bỏ qua là không đủ. Người ta có thể chỉ cần nói với WGET để bỏ qua
http://host[:port]/directory/file
ftp://host[:port]/directory/file
62, bởi vì sau đó các kiểu dáng sẽ không được tải xuống. Bây giờ đặt cược tốt nhất để tải xuống một trang duy nhất và các điều kiện cần thiết của nó là tùy chọn dành riêng cho các yêu cầu.

'--bỏ qua trường hợp'

Bỏ qua trường hợp khi khớp các tập tin và thư mục. Điều này ảnh hưởng đến hành vi của các tùy chọn -r, -a, -i và -x, cũng như toàn cầu được thực hiện khi tải xuống từ các trang web FTP. Ví dụ: với tùy chọn này, ‘-a"*.txt ", sẽ khớp với‘ file1.txt, nhưng cũng ‘file2.txt,‘ file3.txt, v.v. Các trích dẫn trong ví dụ là để ngăn chặn vỏ mở rộng mẫu.

‘-H xông‘-span-hosts

Cho phép trải dài trên các máy chủ khi thực hiện truy xuất đệ quy (xem các máy chủ kéo dài).

‘-L,--tương đối

Chỉ theo liên kết tương đối. Hữu ích để truy xuất một trang chủ cụ thể mà không có bất kỳ sự mất tập trung nào, ngay cả những người từ cùng một máy chủ (xem liên kết tương đối).

‘-I Danh sách,‘-bao gồm các thư mục = Danh sách

Chỉ định danh sách các thư mục được phân tách bằng dấu phẩy mà bạn muốn theo dõi khi tải xuống (xem giới hạn dựa trên thư mục). Các yếu tố của danh sách có thể chứa ký tự đại diện.

Danh sách -x

Chỉ định danh sách các thư mục được phân tách bằng dấu phẩy mà bạn muốn loại trừ khỏi tải xuống (xem giới hạn dựa trên thư mục). Các yếu tố của danh sách có thể chứa ký tự đại diện.

‘-Np,‘-không có cha mẹ

Đừng bao giờ lên thư mục cha mẹ khi lấy lại đệ quy. Đây là một tùy chọn hữu ích, vì nó đảm bảo rằng chỉ các tệp bên dưới một hệ thống phân cấp nhất định sẽ được tải xuống. Xem giới hạn dựa trên thư mục, để biết thêm chi tiết.


2.13 Trạng thái thoát

WGE có thể trả về một trong một số mã lỗi nếu nó gặp sự cố.

0

Không có vấn đề gì xảy ra.

1

Mã lỗi chung.

2

Ví dụ, lỗi phân tích cú pháp, khi phân tích các tùy chọn dòng lệnh, ‘.wgetrc, hoặc‘ .Netrc, ...

3

Tệp lỗi I/O.

4

Lỗi mạng.

5

Thất bại xác minh SSL.

6

Tên người dùng/Mật khẩu thất bại.

7

Lỗi giao thức.

8

Máy chủ đã phát hành một phản hồi lỗi.

Với các ngoại lệ là 0 và 1, các mã thoát được đánh số thấp hơn được ưu tiên hơn các mã số cao hơn, khi gặp nhiều loại lỗi.

Trong các phiên bản của WGET trước 1.12, trạng thái thoát WGET có xu hướng không có ích và không nhất quán. Tải xuống đệ quy hầu như luôn luôn trả về 0 (thành công), bất kể bất kỳ vấn đề nào gặp phải và các Fetches không nhận được chỉ trả về trạng thái tương ứng với bản tải xuống gần đây nhất.


3 Tải xuống đệ quy

GNU WGET có khả năng đi qua các phần của web (hoặc một máy chủ HTTP hoặc FTP duy nhất), theo các liên kết và cấu trúc thư mục. Chúng tôi đề cập đến điều này như để thu hồi đệ quy, hoặc đệ quy.

Với URL HTTP, WGET truy xuất và phân tích các HTML hoặc CSS từ URL đã cho, lấy các tệp mà tài liệu đề cập đến, thông qua đánh dấu như

wget --spider --force-html -i bookmarks.html
6 hoặc
http://host[:port]/directory/file
ftp://host[:port]/directory/file
67 hoặc các giá trị URI CSS được chỉ định bằng cách sử dụng ký hiệu chức năng URL (). Nếu tệp mới được tải xuống cũng thuộc loại
http://host[:port]/directory/file
ftp://host[:port]/directory/file
68,
http://host[:port]/directory/file
ftp://host[:port]/directory/file
69 hoặc
http://host[:port]/directory/file
ftp://host[:port]/directory/file
70, nó sẽ được phân tích cú pháp và theo sau.

Truy xuất đệ quy của nội dung HTTP và HTML/CSS là chiều rộng đầu tiên. Điều này có nghĩa là trước tiên, WGE sẽ tải xuống tài liệu được yêu cầu, sau đó các tài liệu được liên kết từ tài liệu đó, sau đó các tài liệu được liên kết bởi chúng, v.v. Nói cách khác, WGET trước tiên tải xuống các tài liệu ở độ sâu 1, sau đó là những tài liệu ở độ sâu 2, và cứ thế cho đến khi độ sâu tối đa được chỉ định.

Độ sâu tối đa mà việc truy xuất có thể xuống được chỉ định với tùy chọn ‘-L. Độ sâu tối đa mặc định là năm lớp.

Khi lấy URL FTP đệ quy, WGET sẽ lấy tất cả dữ liệu từ cây thư mục đã cho (bao gồm các thư mục con cho đến độ sâu được chỉ định) trên máy chủ từ xa, tạo hình ảnh phản chiếu cục bộ. Truy xuất FTP cũng bị giới hạn bởi tham số

http://host[:port]/directory/file
ftp://host[:port]/directory/file
71. Không giống như đệ quy HTTP, đệ quy FTP được thực hiện chiều sâu đầu tiên.

Theo mặc định, WGET sẽ tạo một cây thư mục cục bộ, tương ứng với nguồn được tìm thấy trên máy chủ từ xa.

Truy xuất đệ quy có thể tìm thấy một số ứng dụng, trong đó quan trọng nhất là phản ánh. Nó cũng hữu ích cho các bài thuyết trình của WWW và bất kỳ cơ hội nào khác trong đó các kết nối mạng chậm nên được bỏ qua bằng cách lưu trữ các tệp cục bộ.

Bạn nên được cảnh báo rằng các bản tải xuống đệ quy có thể làm quá tải các máy chủ từ xa. Do đó, nhiều quản trị viên cau mày với họ và có thể cấm truy cập từ trang web của bạn nếu họ phát hiện tải rất nhanh số lượng lớn nội dung. Khi tải xuống từ các máy chủ Internet, hãy xem xét sử dụng tùy chọn ‘-w, để giới thiệu độ trễ giữa các truy cập vào máy chủ. Việc tải xuống sẽ mất nhiều thời gian hơn, nhưng quản trị viên máy chủ sẽ không bị báo động bởi sự thô lỗ của bạn.

Tất nhiên, tải xuống đệ quy có thể gây ra vấn đề trên máy của bạn. Nếu để lại để chạy không được kiểm soát, nó có thể dễ dàng lấp đầy đĩa. Nếu tải xuống từ mạng cục bộ, nó cũng có thể lấy băng thông trên hệ thống, cũng như tiêu thụ bộ nhớ và CPU.

Cố gắng chỉ định các tiêu chí phù hợp với loại tải xuống bạn đang cố gắng đạt được. Nếu bạn chỉ muốn tải xuống một trang, hãy sử dụng ‘--page-aborites, mà không có bất kỳ đệ quy bổ sung nào. Nếu bạn muốn tải xuống mọi thứ trong một thư mục, hãy sử dụng ‘-np, để tránh tải xuống mọi thứ từ các thư mục khác. Nếu bạn muốn tải xuống tất cả các tệp từ một thư mục, hãy sử dụng ‘-L 1, để đảm bảo độ sâu đệ quy không bao giờ vượt quá một. Xem các liên kết sau, để biết thêm thông tin về điều này.

Truy xuất đệ quy nên được sử dụng một cách chăm sóc. Don lồng nói rằng bạn đã không được cảnh báo.


4 liên kết sau

Khi lấy lại một cách đệ quy, người ta không muốn truy xuất vô số dữ liệu không cần thiết. Hầu hết thời gian người dùng ghi nhớ chính xác những gì họ muốn tải xuống và muốn Wget chỉ tuân theo các liên kết cụ thể.

Ví dụ: nếu bạn muốn tải xuống kho lưu trữ âm nhạc từ ‘fly.srk.fer.hr, bạn sẽ không muốn tải xuống tất cả các trang chủ xảy ra được tham chiếu bởi một phần tối nghĩa của kho lưu trữ.

Wget sở hữu một số cơ chế cho phép bạn tinh chỉnh những liên kết mà nó sẽ theo.


4.1 Máy chủ kéo dài

Việc truy xuất đệ quy WGET thường không từ chối truy cập máy chủ khác với loại bạn đã chỉ định trên dòng lệnh. Đây là một mặc định hợp lý; Không có nó, mọi truy xuất sẽ có khả năng biến WGE của bạn thành một phiên bản nhỏ của Google.

Tuy nhiên, truy cập các máy chủ khác nhau, hoặc bao gồm máy chủ, đôi khi là một lựa chọn hữu ích. Có thể các hình ảnh được phục vụ từ một máy chủ khác. Có thể bạn phản ánh một trang web bao gồm các trang được liên kết giữa ba máy chủ. Có thể máy chủ có hai tên tương đương và các trang HTML đề cập đến cả hai có thể thay thế cho nhau.

Kéo dài đến bất kỳ máy chủ nào

Tùy chọn ‘-H, bật lên máy chủ, do đó cho phép chạy đệ quy WGET, truy cập bất kỳ máy chủ nào được tham chiếu bởi một liên kết. Trừ khi có đủ các tiêu chí giới hạn đệ quy được áp dụng độ sâu, các máy chủ nước ngoài này thường sẽ liên kết đến nhiều máy chủ hơn, và cứ thế cho đến khi Wget kết thúc việc hút nhiều dữ liệu hơn bạn dự định.

Giới hạn kéo dài đến một số miền nhất định

Tùy chọn ‘-d, cho phép bạn chỉ định các tên miền sẽ được tuân theo, do đó chỉ giới hạn đệ quy đối với các máy chủ thuộc về các miền này. Rõ ràng, điều này có ý nghĩa chỉ kết hợp với ‘-H. Một ví dụ điển hình sẽ là tải xuống nội dung của ‘www.example.com, nhưng cho phép tải xuống từ‘ hình ảnh.example.com, v.v. ::

ftp://user:password@host/path
http://user:password@host/path
3

Bạn có thể chỉ định nhiều địa chỉ bằng cách tách chúng bằng dấu phẩy, ví dụ: ‘-Ddomain1.com, domain2.com.

Giữ tải xuống một số miền nhất định

Nếu có các tên miền bạn muốn loại trừ cụ thể, bạn có thể làm điều đó với ‘-Exclude-Domains, chấp nhận cùng loại đối số của‘ -D, nhưng sẽ loại trừ tất cả các tên miền được liệt kê. Ví dụ: nếu bạn muốn tải xuống tất cả các máy chủ từ tên miền ‘foo.edu, ngoại trừ‘ sunsite.foo.edu, bạn có thể làm điều đó như thế này:

ftp://user:password@host/path
http://user:password@host/path
4


4.2 Các loại tệp

Khi tải xuống tài liệu từ web, bạn sẽ thường muốn hạn chế truy xuất chỉ ở một số loại tệp nhất định. Ví dụ: nếu bạn quan tâm đến việc tải xuống GIF, bạn sẽ không vui mừng khi nhận được vô số tài liệu PostScript và ngược lại.

WGET cung cấp hai tùy chọn để giải quyết vấn đề này. Mỗi mô tả tùy chọn liệt kê một tên ngắn, một tên dài và lệnh tương đương trong .wgetrc.

‘-A Acclist,‘-Chấp nhận Acclist KhănAcept = Acclist, ‘-Accept-regex urlregex Muff‘accept-regex = urlregex,

Đối số cho tùy chọn ‘ Một hậu tố là phần kết thúc của một tập tin và bao gồm các chữ cái bình thường, ví dụ: Gif Gif hoặc ‘.jpg. Một mẫu phù hợp chứa các ký tự đại diện giống như vỏ, ví dụ: Sách*, hoặc ‘Zelazny*196 [0-9]*.

Vì vậy, chỉ định ‘wget -a gif, jpg, sẽ chỉ làm cho wget tải xuống chỉ các tệp kết thúc bằng‘ gif, hoặc ‘jpg, tức là gifs và jpegs. Mặt khác, ‘wget -a" Zelazny*196 [0-9]*", sẽ chỉ tải xuống các tệp bắt đầu bằng‘ Zelazny, và chứa các số từ năm 1960 đến 1969 ở bất cứ đâu trong. Tra cứu hướng dẫn sử dụng vỏ của bạn để biết mô tả về cách kết hợp mẫu hoạt động.

Tất nhiên, bất kỳ số lượng hậu tố và mẫu nào cũng có thể được kết hợp thành một danh sách được phân tách bằng dấu phẩy, và được đưa ra như một đối số cho ‘-a.

Đối số cho tùy chọn ‘--Ccept-regex, là một biểu thức thông thường được khớp với URL hoàn chỉnh.

Tùy chọn ‘-Reject, hoạt động giống như‘ --Ccept, chỉ có logic của nó là ngược lại; WGE sẽ tải xuống tất cả các tệp ngoại trừ các tệp khớp với các hậu tố (hoặc mẫu) trong danh sách.

Vì vậy, nếu bạn muốn tải xuống toàn bộ trang ngoại trừ các tệp MPEG và .AU cồng kềnh, bạn có thể sử dụng ‘WGET -R MPG, MPEG, AU. Tương tự, để tải xuống tất cả các tệp ngoại trừ các tệp bắt đầu bằng ‘Bjork, hãy sử dụng‘ wget -r "bjork*". Các trích dẫn là để ngăn chặn sự mở rộng của vỏ.

Đối số cho tùy chọn ‘--Ccept-regex, là một biểu thức thông thường được khớp với URL hoàn chỉnh.

Lưu ý rằng hai tùy chọn này không ảnh hưởng đến việc tải xuống các tệp HTML (như được xác định bởi tiền tố ‘.htm, hoặc‘ .html, tiền tố tên tệp). Hành vi này có thể không mong muốn cho tất cả người dùng và có thể được thay đổi cho các phiên bản WGET trong tương lai.

Cũng lưu ý rằng các chuỗi truy vấn (chuỗi ở cuối URL bắt đầu bằng dấu câu hỏi ('?') Tệp cục bộ. Dự kiến ​​một phiên bản WGET trong tương lai sẽ cung cấp một tùy chọn để cho phép khớp với các chuỗi truy vấn.

Cuối cùng, điều đáng chú ý là các danh sách chấp nhận/từ chối được khớp hai lần với các tệp đã tải xuống: một lần so với phần tên tệp URL, để xác định xem tệp có nên được tải xuống ngay từ đầu hay không; Sau đó, sau khi nó đã được chấp nhận và tải xuống thành công, tên tệp cục bộ cũng được kiểm tra đối với danh sách chấp nhận/từ chối để xem liệu nó có nên được xóa không. Lý do là, vì các tệp .htm và ‘.html luôn được tải xuống bất kể các quy tắc chấp nhận/từ chối, chúng nên được xóa sau khi được tải xuống và quét cho các liên kết, nếu chúng phù hợp với danh sách chấp nhận/từ chối. Tuy nhiên, điều này có thể dẫn đến kết quả bất ngờ, vì tên tệp cục bộ có thể khác với tên tệp URL ban đầu theo các cách sau, tất cả đều có thể thay đổi xem quy tắc chấp nhận/từ chối có khớp với quy tắc hay không:

  • Nếu tệp cục bộ đã tồn tại và ‘--No-Dưới được chỉ định, một hậu tố số sẽ được nối vào tên gốc.
  • Nếu ‘--Adjust-extension, được chỉ định, tên tệp cục bộ có thể có .html, được thêm vào nó. Nếu wget được gọi bằng '-e -a.php', tên tệp như 'index.php' sẽ được chấp nhận, nhưng khi tải xuống sẽ được đặt tên là 'index.php.html', không còn khớp, và do đó Tệp sẽ bị xóa.
  • Các chuỗi truy vấn không đóng góp cho việc khớp URL, nhưng được bao gồm trong tên tệp cục bộ, và do đó, đóng góp cho việc khớp tên tệp.

Hành vi này cũng vậy, được coi là không mong muốn và có thể thay đổi trong một phiên bản tương lai của WGET.


4.3 Giới hạn dựa trên thư mục

Bất kể các cơ sở theo liên kết khác, thường rất hữu ích khi đặt giới hạn các tệp nào cần truy xuất dựa trên các thư mục mà các tệp đó được đặt. Có thể có nhiều lý do cho điều này ; hoặc một số thư mục có thể chứa thông tin vô dụng, ví dụ: /CGI-bin hoặc /Dev thư mục.

WGET cung cấp ba tùy chọn khác nhau để đối phó với yêu cầu này. Mỗi mô tả tùy chọn liệt kê một tên ngắn, một tên dài và lệnh tương đương trong .wgetrc.

‘-I Danh sách,-bao gồm danh sách

Tùy chọn-Tôi chấp nhận một danh sách các thư mục được phân tách bằng dấu phẩy có trong phần truy xuất. Bất kỳ thư mục khác sẽ chỉ đơn giản là bị bỏ qua. Các thư mục là những con đường tuyệt đối.

Vì vậy, nếu bạn muốn tải xuống từ ‘http: // host/people/bozo/xông chỉ theo liên kết đến các đồng nghiệp của Bozo, trong thư mục/People và các tập lệnh không có thật trong/cgi-bin, bạn có thể chỉ định:

ftp://user:password@host/path
http://user:password@host/path
5

‘-X Danh sách,‘-loại trừ danh sách

Tùy chọn ‘-x chính xác là ngược lại của‘ -i, Đây là danh sách các thư mục bị loại trừ khỏi bản tải xuống. Ví dụ. Nếu bạn không muốn wget tải xuống các thứ từ thư mục /cgi-bin, hãy chỉ định ‘-x /cgi-bin, trên dòng lệnh.

Giống như với ‘-a,/‘-r, hai tùy chọn này có thể được kết hợp để có được sự tinh chỉnh tốt hơn về việc tải xuống các thư mục con. Ví dụ. Nếu bạn muốn tải tất cả các tệp từ hệ thống phân cấp/quán rượu ngoại trừ/pub/vô giá trị, chỉ định ‘-I/pub -x/pub/vô giá trị.

‘-Np,‘-không có cha mẹ

Cách đơn giản nhất và thường rất hữu ích để hạn chế các thư mục là không cho phép truy xuất các liên kết đề cập đến hệ thống phân cấp ở trên so với thư mục bắt đầu, tức là không được phép đi lên thư mục/thư mục phụ huynh.

Tùy chọn ‘--No-cha mẹ (ngắn‘ -np,) rất hữu ích trong trường hợp này. Sử dụng nó đảm bảo rằng bạn sẽ không bao giờ rời khỏi hệ thống phân cấp hiện có. Giả sử bạn phát hành wget với:

ftp://user:password@host/path
http://user:password@host/path
6

Bạn có thể yên tâm rằng không có tài liệu tham khảo nào đến/~ cô gái của anh ấy-HomePage/hoặc/~ luzer/All-my-mpegs/sẽ được theo dõi. Chỉ có kho lưu trữ bạn quan tâm sẽ được tải xuống. Về cơ bản, ‘--No-cha mẹ tương tự như‘ -i/~ luzer/My-Archive, chỉ có nó xử lý các chuyển hướng theo cách thông minh hơn.

Lưu ý rằng, đối với HTTP (và HTTPS), dấu gạch chéo kéo dài là rất quan trọng đối với ‘--no-cha mẹ. HTTP không có khái niệm về một thư mục của người Viking, một người khác dựa vào bạn để chỉ ra những gì mà một thư mục và những gì không phải là. Trong 'http: // foo/bar/', wget sẽ coi 'thanh' là một thư mục, trong khi trong 'http: // foo/barb' (không có dấu vết dấu vết), 'thanh' sẽ được coi là tên tệp (vì vậy '--Không cha mẹ' sẽ vô nghĩa, vì cha mẹ của nó là '/'). that, for HTTP (and HTTPS), the trailing slash is very important to ‘--no-parent’. HTTP has no concept of a “directory”—Wget relies on you to indicate what’s a directory and what isn’t. In ‘http://foo/bar/’, Wget will consider ‘bar’ to be a directory, while in ‘http://foo/bar’ (no trailing slash), ‘bar’ will be considered a filename (so ‘--no-parent’ would be meaningless, as its parent is ‘/’).


4.4 Liên kết tương đối

Khi ‘-l, được bật, chỉ có các liên kết tương đối được theo dõi. Các liên kết tương đối ở đây được xác định các liên kết không đề cập đến gốc máy chủ web. Ví dụ, các liên kết này là tương đối:

ftp://user:password@host/path
http://user:password@host/path
7

Các liên kết này không tương đối:

ftp://user:password@host/path
http://user:password@host/path
8

Sử dụng tùy chọn này đảm bảo rằng việc truy xuất đệ quy sẽ không kéo dài các máy chủ, ngay cả khi không có ‘-h. Trong các trường hợp đơn giản, nó cũng cho phép tải xuống để chỉ làm việc mà không cần phải chuyển đổi các liên kết.

Tùy chọn này có lẽ không hữu ích lắm và có thể bị xóa trong một bản phát hành trong tương lai.


4.5 Liên kết FTP sau

Các quy tắc cho FTP có phần cụ thể, vì nó là cần thiết cho chúng. Các liên kết FTP trong các tài liệu HTML thường được bao gồm cho các mục đích tham khảo và thường bất tiện khi tải xuống theo mặc định.

Để có các liên kết FTP theo các tài liệu HTML, bạn cần chỉ định tùy chọn ‘--foll-ftp. Đã thực hiện điều đó, các liên kết FTP sẽ trải rộng trên máy chủ bất kể cài đặt --HH. Điều này là hợp lý, vì các liên kết FTP hiếm khi chỉ vào cùng một máy chủ nơi máy chủ HTTP cư trú. Vì những lý do tương tự, các tùy chọn ‘-L không có ảnh hưởng đến các bản tải xuống như vậy. Mặt khác, các quy tắc chấp nhận tên miền (‘-d,) và các quy tắc hậu tố (‘ -a, và ‘-r,) áp dụng bình thường.

Cũng lưu ý rằng các liên kết theo các thư mục FTP sẽ không được truy xuất đệ quy thêm.


5 lần đóng dấu thời gian

Một trong những khía cạnh quan trọng nhất của thông tin phản ánh từ Internet là cập nhật tài liệu lưu trữ của bạn.

Tải xuống toàn bộ kho lưu trữ hết lần này đến lần khác, chỉ để thay thế một vài tệp đã thay đổi là tốn kém, cả về băng thông và tiền lãng phí, và thời gian để thực hiện cập nhật. Đây là lý do tại sao tất cả các công cụ phản chiếu cung cấp tùy chọn cập nhật gia tăng.

Một cơ chế cập nhật như vậy có nghĩa là máy chủ từ xa được quét để tìm kiếm các tệp mới. Chỉ những tệp mới đó sẽ được tải xuống ở vị trí của các tệp cũ.

Một tệp được coi là mới nếu một trong hai điều kiện này được đáp ứng:

  1. Một tập tin của tên đó chưa tồn tại cục bộ.
  2. Một tệp của tên đó tồn tại, nhưng tệp từ xa đã được sửa đổi gần đây hơn so với tệp cục bộ.

Để thực hiện điều này, chương trình cần phải nhận thức được thời gian sửa đổi cuối cùng của cả tệp cục bộ và từ xa. Chúng tôi gọi thông tin này là dấu thời gian của một tập tin.

Việc đóng dấu thời gian trong GNU WGET được bật bằng cách sử dụng tùy chọn ‘-TimeStamping (‘ -n,) hoặc thông qua chỉ thị

http://host[:port]/directory/file
ftp://host[:port]/directory/file
72 trong .wgetrc. Với tùy chọn này, đối với mỗi tệp mà nó dự định tải xuống, WGET sẽ kiểm tra xem một tệp cục bộ cùng tên có tồn tại hay không. Nếu có, và tệp từ xa không mới hơn, WGE sẽ không tải xuống.

Nếu tệp cục bộ không tồn tại hoặc kích thước của các tệp không khớp, WGE sẽ tải xuống tệp từ xa cho dù dấu thời gian nói gì.


5.1 Sử dụng thời gian

Việc sử dụng thời gian đóng dấu là đơn giản. Giả sử bạn muốn tải xuống một tệp để nó giữ ngày sửa đổi.

ftp://user:password@host/path
http://user:password@host/path
9

Một

http://host[:port]/directory/file
ftp://host[:port]/directory/file
73 đơn giản cho thấy dấu thời gian trên tệp cục bộ bằng trạng thái của tiêu đề
http://host[:port]/directory/file
ftp://host[:port]/directory/file
74, được trả về bởi máy chủ. Như bạn có thể thấy, thông tin đóng dấu thời gian được bảo tồn tại địa phương, ngay cả khi không có ‘-n, (ít nhất là đối với HTTP).

Vài ngày sau, bạn muốn WGET kiểm tra xem tệp từ xa đã thay đổi và tải xuống nếu nó có.

ftp://host/directory/file;type=a
0

WGE sẽ yêu cầu máy chủ cho ngày được sửa đổi cuối cùng. Nếu tệp cục bộ có cùng dấu thời gian với máy chủ hoặc tệp mới hơn, tệp từ xa sẽ không được tìm nạp lại. Tuy nhiên, nếu tệp từ xa gần đây hơn, WGE sẽ tiến hành tìm nạp nó.

Điều tương tự cũng xảy ra với FTP. Ví dụ:

ftp://host/directory/file;type=a
1

(Các trích dẫn xung quanh url đó là để ngăn chặn vỏ cố gắng diễn giải ‘*.)

Sau khi tải xuống, một danh sách thư mục cục bộ sẽ cho thấy dấu thời gian phù hợp với các danh sách trên máy chủ từ xa. Việc phát hành lại lệnh với ‘-N, sẽ chỉ làm cho WGE tìm nạp lại các tệp đã được sửa đổi kể từ lần tải xuống cuối cùng.

Nếu bạn muốn phản ánh kho lưu trữ GNU mỗi tuần, bạn sẽ sử dụng một lệnh như sau, hàng tuần:

ftp://host/directory/file;type=a
2

Lưu ý rằng việc đóng dấu thời gian sẽ chỉ hoạt động cho các tệp mà máy chủ đưa ra dấu thời gian. Đối với HTTP, điều này phụ thuộc vào việc nhận tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
74. Đối với FTP, điều này phụ thuộc vào việc có được một danh sách thư mục với các ngày ở định dạng mà WGE có thể phân tích (xem phần bên trong dấu thời gian FTP).


5.2 HTTP Damping Stamping Internals

Việc đóng dấu thời gian trong HTTP được triển khai bằng cách kiểm tra tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
74. Nếu bạn muốn truy xuất tệp foo.html thông qua http, wget sẽ kiểm tra xem foo.html có tồn tại cục bộ hay không. Nếu nó không có, foo.html sẽ được lấy lại vô điều kiện.

Nếu tệp tồn tại cục bộ, trước tiên, WGET sẽ kiểm tra dấu thời gian cục bộ của nó (tương tự như cách

http://host[:port]/directory/file
ftp://host[:port]/directory/file
73 kiểm tra nó), sau đó gửi yêu cầu
http://host[:port]/directory/file
ftp://host[:port]/directory/file
31 đến máy chủ từ xa, yêu cầu thông tin trên tệp từ xa.

Tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
74 được kiểm tra để tìm tệp nào đã được sửa đổi gần đây (điều này làm cho nó mới hơn). Nếu tệp từ xa mới hơn, nó sẽ được tải xuống; Nếu nó già hơn, WGE sẽ bỏ cuộc.2

Khi '--Backup chuyển đổi' ('-k') được chỉ định cùng với '-n', tệp máy chủ 'x' được so sánh với tệp cục bộ 'X.orig', nếu còn tồn tại, thay vì được so sánh với tệp cục bộ 'X', sẽ luôn khác nhau nếu nó được chuyển đổi bởi '--convert-links' ('-k').

Có thể cho rằng, việc đóng dấu thời gian HTTP nên được thực hiện bằng yêu cầu

http://host[:port]/directory/file
ftp://host[:port]/directory/file
80.


5,3 FTP Nội bộ đóng dấu thời gian

Về lý thuyết, việc đóng dấu thời gian FTP hoạt động giống như HTTP, chỉ FTP không có tiêu đề Tiêu chuẩn thời gian phải được đưa ra khỏi danh sách thư mục.

Nếu tải xuống FTP là đệ quy hoặc sử dụng Globbing, WGET sẽ sử dụng lệnh FTP

http://host[:port]/directory/file
ftp://host[:port]/directory/file
81 để nhận danh sách tệp cho thư mục chứa (các) tệp mong muốn. Nó sẽ cố gắng phân tích danh sách, coi nó giống như đầu ra
http://host[:port]/directory/file
ftp://host[:port]/directory/file
73, trích xuất các dấu thời gian. Phần còn lại giống hệt như đối với HTTP. Lưu ý rằng khi truy xuất các tệp riêng lẻ từ máy chủ FTP mà không sử dụng Globbing hoặc Recursion, việc liệt kê các tệp sẽ không được tải xuống (và do đó các tệp sẽ không được dán thời gian) trừ khi được chỉ định.

Giả định rằng mọi danh sách thư mục là một danh sách theo kiểu UNIX nghe có vẻ cực kỳ hạn chế, nhưng trong thực tế, không, vì nhiều máy chủ FTP không phải là UNIX sử dụng định dạng danh sách Unixoid vì hầu hết (tất cả?) Của khách hàng đều hiểu. Hãy nhớ rằng RFC959 xác định không có cách nào để có được danh sách tệp, chứ đừng nói đến các dấu thời gian. Chúng ta chỉ có thể hy vọng rằng một tiêu chuẩn trong tương lai sẽ xác định điều này.

Một giải pháp không chuẩn khác bao gồm việc sử dụng lệnh

http://host[:port]/directory/file
ftp://host[:port]/directory/file
83 được hỗ trợ bởi một số máy chủ FTP (bao gồm cả
http://host[:port]/directory/file
ftp://host[:port]/directory/file
84 phổ biến), trả về thời gian chính xác của tệp được chỉ định. WGE có thể hỗ trợ lệnh này trong tương lai.


6 Tệp khởi động

Khi bạn biết cách thay đổi cài đặt mặc định của WGET thông qua các đối số dòng lệnh, bạn có thể muốn thực hiện một số cài đặt đó vĩnh viễn. Bạn có thể làm điều đó một cách thuận tiện bằng cách tạo tệp khởi động WGET.

Bên cạnh đó .wgetrc là tệp khởi tạo chính của trực tuyến, thật thuận tiện khi có một cơ sở đặc biệt để lưu trữ mật khẩu. Do đó, wget đọc và diễn giải nội dung của $ home/.Netrc, nếu nó tìm thấy nó. Bạn có thể tìm thấy định dạng .Netrc trong hướng dẫn hệ thống của bạn.

WGET đọc .wgetrc khi khởi động, nhận ra một bộ lệnh giới hạn.


6.1 Vị trí WGetRC

Khi khởi tạo, WGET sẽ tìm kiếm một tệp khởi động toàn cầu,/usr/local/etc/wgetrc theo mặc định (hoặc một số tiền tố khác ngoài/usr/local, nếu wget không được cài đặt ở đó) và đọc các lệnh từ đó, nếu nó tồn tại.

Sau đó, nó sẽ tìm kiếm tệp người dùng. Nếu biến môi trường

http://host[:port]/directory/file
ftp://host[:port]/directory/file
85 được đặt, WGE sẽ cố gắng tải tệp đó. Thất bại điều đó, sẽ không có nỗ lực nào nữa sẽ được thực hiện.

Nếu

http://host[:port]/directory/file
ftp://host[:port]/directory/file
85 không được đặt, WGE sẽ cố gắng tải $ home/.wgetrc.

Thực tế là các cài đặt của người dùng được tải sau khi các cài đặt trên toàn hệ thống có nghĩa là trong trường hợp người dùng va chạm, WGETRC ghi đè lên WGETRC trên toàn hệ thống (trong/usr/local/etc/wgetrc theo mặc định). Quản trị phát xít, đi!


6.2 Cú pháp WGETRC

Cú pháp của lệnh wgetrc rất đơn giản:

Biến cũng sẽ được gọi là lệnh. Các giá trị hợp lệ là khác nhau cho các lệnh khác nhau.

Các lệnh là trường hợp-, nhấn mạnh và trừ không nhạy cảm. Do đó, ‘Dir__prefix,‘ Dir-Prefix, và ‘Dirprefix, giống nhau. Các dòng trống, các đường bắt đầu bằng ‘#và các dòng chứa không gian trắng chỉ bị loại bỏ.

Các lệnh mong đợi một danh sách được phân tách bằng dấu phẩy sẽ xóa danh sách trên một lệnh trống. Vì vậy, nếu bạn muốn thiết lập lại danh sách từ chối được chỉ định trong toàn cầu WGETRC, bạn có thể làm điều đó với:


6.3 Các lệnh WGETRC

Các bộ lệnh hoàn chỉnh được liệt kê dưới đây. Giá trị pháp lý được liệt kê sau ‘=. Các giá trị boolean đơn giản có thể được đặt hoặc mở khóa bằng cách sử dụng ‘trên và’ off, hoặc ‘1, và’ 0.

Một số lệnh lấy các giá trị giả. Các giá trị địa chỉ có thể là tên máy chủ hoặc địa chỉ IP quadted-Quad. n có thể là bất kỳ số nguyên dương, hoặc ‘inf, cho vô cùng, khi thích hợp. Giá trị chuỗi có thể là bất kỳ chuỗi không trống.

Hầu hết các lệnh này có tương đương dòng lệnh trực tiếp. Ngoài ra, bất kỳ lệnh WGETRC nào cũng có thể được chỉ định trên dòng lệnh bằng cách sử dụng công tắc ‘--Execute (xem các tùy chọn khởi động cơ bản.)

Chấp nhận/Từ chối = Chuỗi

Giống như ‘-a,/‘-r, (xem các loại tệp).

add_hostdir = bật/tắt

Bật/tắt tên tệp máy chủ lưu trữ máy chủ. ‘-Nh, vô hiệu hóa nó.

Ask_Password = BẬT/TẮT

Nhắc nhở mật khẩu cho mỗi kết nối được thiết lập. Không thể được chỉ định khi ‘--password, đang được sử dụng, vì chúng loại trừ lẫn nhau. Tương đương với ‘--Ask-password.

auth_no_challenge = bật/tắt

Nếu tùy chọn này được đưa ra, WGET sẽ gửi thông tin xác thực HTTP cơ bản (Tên người dùng và mật khẩu của PlainText) cho tất cả các yêu cầu. Xem ‘--Auth-Không thử thách.

nền = bật/tắt

Bật/vô hiệu hóa đi vào nền giống như ‘-b, (cho phép nó).

sao lưu_converted = bật/tắt

Bật/tắt/tắt lưu các tệp được chuyển đổi trước với hậu tố ‘.orig, giống như‘ -k, (cho phép nó).

sao lưu = số

Sử dụng các bản sao lưu số cho một tập tin. Các bản sao lưu được xoay bằng cách thêm một bộ đếm gia tăng bắt đầu ở ‘1. Mặc định là ‘0.

cơ sở = chuỗi

Xem xét các URL tương đối trong các tệp đầu vào (được chỉ định thông qua lệnh 'đầu vào' hoặc tùy chọn '-input-file'/'-i', cùng với 'force_html' hoặc '--force-html') giống như '--base = String'.

BIND_ADDRESS = Địa chỉ

Liên kết với địa chỉ, như ‘--Bind-address = địa chỉ.

Ca_Certificate = Tệp

Đặt tập tin gói chứng chỉ cho tập tin. Giống như ‘--ca-c-cression = file.

ca_directory = thư mục

Đặt thư mục được sử dụng cho cơ quan chứng chỉ. Giống như ‘--ca-directory = thư mục.

bộ nhớ cache = bật/tắt

Khi được đặt thành TẮT, không cho phép lưu trữ máy chủ. Xem tùy chọn ‘--no-cache.

Chứng chỉ = Tệp

Đặt tên tệp chứng chỉ máy khách thành tệp. Giống như ‘--c-crict = file.

Chứng chỉ_Type = Chuỗi

Chỉ định loại chứng chỉ máy khách, các giá trị pháp lý là ‘PEM, (mặc định) và‘ der, (còn gọi là ASN1). Giống như ‘--cressificate-type = String.

Check_certificate = BẬT/TẮT

Nếu điều này được đặt thành TẮT, chứng chỉ máy chủ không được kiểm tra đối với các cơ quan khách hàng được chỉ định. Mặc định là trên mạng. Giống như ‘--Check-oltectificate.

Connect_Timeout = n

Đặt thời gian chờ kết nối giống như ‘-kết nối thời gian ra.

content_disp vị trí = bật/tắt

Bật nhận dạng của tiêu đề HTTP (không theo tiêu chuẩn) (không chuẩn), nếu không có tính toán nội dung, nếu được đặt thành ‘trên trên, giống như‘-liên kết nội dung.

Trust_Server_Names = BẬT/TẮT

Nếu được đặt thành Bật, xây dựng tên tệp cục bộ từ các URL chuyển hướng thay vì URL gốc.

Tiếp tục = BẬT/TẮT

Nếu được đặt thành BẬT, lực lượng tiếp tục của các tệp được truy xuất một phần. Xem ‘-c trước khi thiết lập nó.

Convert_Links = BẬT/TẮT

Chuyển đổi các liên kết không liên quan cục bộ. Giống như ‘-K.

cookie = bật/tắt

Khi được đặt để tắt, không cho phép cookie. Xem tùy chọn ‘--cookies.

cut_dirs = n

Bỏ qua n thành phần thư mục từ xa. Tương đương với ‘--cut-dirs = n.

gỡ lỗi = bật/tắt

Chế độ gỡ lỗi, giống như ‘-d.

Default_Page = String

Tên trang mặc định giống như ‘--default-page = String.

Delete_After = BẬT/TẮT

Xóa sau khi tải xuống giống như ‘--delete-sau đó.

dir_prefix = chuỗi

Top of thư mục Cây giống như ‘-p String.

dirstruct = bật/tắt

Bật Dirstruct ON hoặc TẮT giống như ‘-x, hoặc‘ -nd, tương ứng.

dns_cache = bật/tắt

Bật/tắt bộ nhớ đệm DNS. Do bộ đệm DNS được bật theo mặc định, tùy chọn này thường được sử dụng để tắt nó và tương đương với ‘--no-dns-cache.

dns_timeout = n

Đặt thời gian chờ DNS giống như ‘--DNS-TIMEOUT.

miền = chuỗi

Giống như ‘-d, (xem các máy chủ bao gồm).

dot_bytes = n

Chỉ định số lượng byte có chứa trong một dấu chấm, như đã thấy trong suốt quá trình truy xuất (1024 theo mặc định). Bạn có thể gửi lại giá trị với ‘K, hoặc‘ M, lần lượt đại diện cho kilobyte và megabyte. Với cài đặt DOT, bạn có thể điều chỉnh việc truy xuất dấu chấm phù hợp với nhu cầu của bạn hoặc bạn có thể sử dụng các kiểu được xác định trước (xem Tùy chọn tải xuống).

dot_spaces = n

Chỉ định số lượng dấu chấm trong một cụm duy nhất (10 theo mặc định).

Dots_in_line = n

Chỉ định số lượng dấu chấm sẽ được in trong mỗi dòng trong suốt phần truy xuất (50 theo mặc định).

EGD_FILE = Tệp

Sử dụng chuỗi làm tên tệp ổ cắm EGD. Giống như ‘--gd-file = file.

loại trừ_directories = chuỗi

Chỉ định một danh sách các thư mục được phân tách bằng dấu phẩy mà bạn muốn loại trừ khỏi tải xuống giống như ‘-x String, (xem giới hạn dựa trên thư mục).

loại trừ_domains = chuỗi

Giống như ‘--Exclude-domains = String, (xem các máy chủ bao gồm).

Theo dõi_FTP = BẬT/TẮT

Theo dõi các liên kết FTP từ các tài liệu HTML giống như ‘--foll-ftp.

Theo dõi_tags = chuỗi

Chỉ tuân theo một số thẻ HTML nhất định khi thực hiện truy xuất đệ quy, giống như ‘--follow-ta-tag = String.

Force_html = BẬT/TẮT

Nếu được đặt thành Bật, buộc tên tệp đầu vào phải được coi là một tài liệu HTML giống như ‘-f.

ftp_password = chuỗi

Đặt mật khẩu FTP của bạn thành chuỗi. Không có cài đặt này, mật khẩu mặc định là ‘-wget@, đây là một mặc định hữu ích cho quyền truy cập FTP ẩn danh.

Lệnh này được đặt tên là

http://host[:port]/directory/file
ftp://host[:port]/directory/file
87 trước WGET 1.10.

ftp_proxy = chuỗi

Sử dụng chuỗi làm proxy FTP, thay vì một quy định trong môi trường.

ftp_user = chuỗi

Đặt người dùng FTP thành chuỗi.

Lệnh này được đặt tên là

http://host[:port]/directory/file
ftp://host[:port]/directory/file
88 trước WGET 1.10.

GLOB = BẬT/TẮT

Bật/tắt toàn cầu giống như ‘--glob, và‘--no-glob.

tiêu đề = chuỗi

Xác định tiêu đề cho các bản tải xuống HTTP, như sử dụng ‘-tiêu đề = chuỗi.

nén = chuỗi

Chọn loại nén sẽ được sử dụng. Các giá trị pháp lý là ‘tự động (mặc định),‘ gzip, và ‘không có gì. Giống như ‘--compression = chuỗi.

điều chỉnh_extension = bật/tắt

Thêm tiện ích mở rộng '. '.Z', '.zlib' hoặc '.gz' để nén các tệp như '-e'. Trước đây được đặt tên là ‘html_extension, (vẫn có thể chấp nhận được, nhưng không dùng nữa).

http_keep_alive = BẬT/TẮT

BẬT hoặc TẮT Tính năng BẬT-BẬT (mặc định là BẬT). Tắt nó là tương đương với ‘--no-http-keep-alive.

http_password = chuỗi

Đặt mật khẩu HTTP, tương đương với ‘--http-password = chuỗi.

http_proxy = chuỗi

Sử dụng Chuỗi làm proxy HTTP, thay vì một điều được chỉ định trong môi trường.

http_user = chuỗi

Đặt người dùng HTTP thành chuỗi, tương đương với ‘--http-user = chuỗi.

https_only = bật/tắt

Khi ở chế độ đệ quy, chỉ các liên kết HTTPS được theo dõi (mặc định là TẮT).

https_proxy = chuỗi

Sử dụng Chuỗi làm proxy HTTPS, thay vì một điều được chỉ định trong môi trường.

bỏ qua_case = bật/tắt

Khi được đặt thành Bật, khớp các tệp và thư mục trường hợp một cách vô cảm; Giống như ‘

bỏ qua_length = bật/tắt

Khi được đặt thành BẬT, bỏ qua tiêu đề

http://host[:port]/directory/file
ftp://host[:port]/directory/file
11; Giống như ‘-chiều dài.

bỏ qua_tags = chuỗi

Bỏ qua một số thẻ HTML nhất định khi thực hiện truy xuất đệ quy, như ‘--ignore-tags = String.

Bao gồm_directories = chuỗi

Chỉ định một danh sách các thư mục được phân tách bằng dấu phẩy mà bạn muốn theo dõi khi tải xuống giống như ‘-i String.

iri = bật/tắt

Khi được đặt thành BẬT, hỗ trợ URI (IRI) quốc tế hóa; Giống như ‘--Iri.

inet4_only = BẬT/TẮT

Lực lượng kết nối với địa chỉ IPv4, TẮT theo mặc định. Bạn có thể đặt điều này trong tệp init toàn cầu để vô hiệu hóa các nỗ lực của WGET, để giải quyết và kết nối với máy chủ IPv6. Chỉ có sẵn nếu WGET được biên dịch với hỗ trợ IPv6. Giống như ‘--onet4 chỉ có hoặc‘ -4.

inet6_only = bật/tắt

Lực lượng kết nối với địa chỉ IPv6, TẮT theo mặc định. Chỉ có sẵn nếu WGET được biên dịch với hỗ trợ IPv6. Giống như ‘-chỉ có một-et6 hoặc‘ -6.

Input = Tệp

Đọc các URL từ Chuỗi, như tệp -i.

keep_session_cookies = bật/tắt

Khi được chỉ định, nguyên nhân ‘Save_Cookies = On, để lưu cookie phiên. Xem ‘-giữ-session-cookies.

giới hạn_rate = Tỷ lệ

Giới hạn tốc độ tải xuống không quá tốc độ byte mỗi giây. Giống như ‘--limit-l-l-late = RATE.

load_cookies = Tệp

Tải cookie từ tập tin. Xem ‘-tải-cookies tập tin.

local_encoding = mã hóa

Buộc WGET sử dụng mã hóa làm mã hóa hệ thống mặc định. Xem ‘-Mã hóa địa phương.

logfile = Tệp

Đặt logfile thành tệp, giống như tệp ‘-o.

MAX_REDIRECT = Số

Chỉ định số lượng chuyển hướng tối đa để tuân theo tài nguyên. Xem ‘--max-redirect = số.

gương = bật/tắt

Bật/tắt phản chiếu. Giống như ‘-m.

netrc = bật/tắt

Bật hoặc tắt đọc NetRC.

NO_CLOBBER = BẬT/TẮT

Giống như ‘-nc.

NO_PARENT = BẬT/TẮT

Không cho phép truy xuất bên ngoài hệ thống phân cấp thư mục, như ‘--no-cha mẹ (xem giới hạn dựa trên thư mục).

no_proxy = chuỗi

Sử dụng chuỗi làm danh sách các tên miền được phân tách bằng dấu phẩy để tránh trong tải proxy, thay vì bảng được chỉ định trong môi trường.

output_document = Tệp

Đặt tên tệp đầu ra giống như tệp ‘-o.

Page_Requisites = BẬT/TẮT

Tải xuống tất cả các tài liệu phụ trợ cần thiết cho một trang HTML duy nhất để hiển thị đúng cách giống như ‘-p.

thụ động_ftp = bật/tắt

Thay đổi cài đặt của FTP thụ động, tương đương với tùy chọn ‘-passive-ftp.

Mật khẩu = chuỗi

Chỉ định chuỗi mật khẩu cho cả truy xuất tệp FTP và HTTP. Lệnh này có thể được ghi đè bằng lệnh ‘ftp_password và‘ http_password, cho ftp và http tương ứng.

post_data = chuỗi

Sử dụng POST làm phương thức cho tất cả các yêu cầu HTTP và gửi chuỗi trong thân yêu cầu. Giống như ‘--post-data = chuỗi.

post_file = Tệp

Sử dụng POST làm phương thức cho tất cả các yêu cầu HTTP và gửi nội dung của tệp trong thân yêu cầu. Giống như ‘--post-file = file.

ưa thích_f Family = none/ipv4/ipv6

Khi được lựa chọn một số địa chỉ, hãy kết nối với các địa chỉ với gia đình địa chỉ được chỉ định trước. Thứ tự địa chỉ được trả về bởi DNS được sử dụng mà không thay đổi theo mặc định. Giống như ‘--prefer-family, trong đó xem một cuộc thảo luận chi tiết về lý do tại sao điều này hữu ích.

Private_Key = Tệp

Đặt tệp khóa riêng thành tệp. Giống như ‘--private-key = file.

private_key_type = chuỗi

Chỉ định loại khóa riêng, các giá trị pháp lý là ‘PEM, (mặc định) và‘ der, (AKA ASN1). Giống như ‘--loại kiểu = chuỗi.

tiến trình = chuỗi

Đặt loại của chỉ báo tiến trình. Các loại pháp lý là ‘dot, và‘ thanh. Tương đương với ‘--ProTHER = String.

protucol_directories = BẬT/TẮT

Khi được đặt, sử dụng tên giao thức làm thành phần thư mục của tên tệp cục bộ. Giống như ‘--protocol-định hướng.

proxy_password = chuỗi

Đặt mật khẩu xác thực proxy thành chuỗi, như ‘--proxy-password = chuỗi.

proxy_user = chuỗi

Đặt tên người dùng xác thực proxy thành chuỗi, như ‘--Proxy-user = chuỗi.

yên tĩnh = bật/tắt

Chế độ yên tĩnh giống như ‘-Q.

Hạn ngạch = hạn ngạch

Chỉ định hạn ngạch tải xuống, rất hữu ích để đưa vào WGETRC toàn cầu. Khi tải xuống hạn ngạch được chỉ định, WGE sẽ ngừng truy xuất sau khi tổng tải xuống đã trở nên lớn hơn hạn ngạch. Hạn ngạch có thể được chỉ định trong byte (mặc định), kbytes ‘k, được nối) hoặc mbytes (‘ m, được thêm vào). Do đó ‘hạn ngạch = 5m, sẽ đặt hạn ngạch thành 5 megabyte. Lưu ý rằng tệp khởi động của người dùng ghi đè cài đặt hệ thống.

Random_file = Tệp

Sử dụng tệp như một nguồn ngẫu nhiên trên các hệ thống thiếu /dev /ngẫu nhiên.

Random_wait = BẬT/TẮT

Bật hoặc tắt ngẫu nhiên giữa thời gian chờ đợi. Giống như ‘--random-wait.

read_timeout = n

Đặt thời gian chờ đọc (và viết) giống như ‘-thời gian đọc sách = n.

Reclevel = n

Mức độ đệ quy (độ sâu) giống như ‘-l n.

đệ quy = bật/tắt

Kiếm lại/tắt, giống như ‘-r.

người giới thiệu = chuỗi

Đặt http ‘người giới thiệu: Tiêu đề giống như‘-referer = chuỗi. (Lưu ý rằng chính những người đã viết thông số HTTP, người đã đánh vần sai của người giới thiệu.)

tương đối_only = bật/tắt

Chỉ tuân theo các liên kết tương đối, giống như ‘-L, (xem các liên kết tương đối).

remote_encoding = mã hóa

Buộc WGET sử dụng mã hóa làm mã hóa máy chủ từ xa mặc định. Xem ‘--Remote-Recoding.

remove_listing = bật/tắt

Nếu được đặt thành BẬT, hãy xóa danh sách FTP được tải xuống bởi WGET. Đặt nó thành TẮT cũng giống như ‘--No-Remove-Listing.

restrict_file_names = unix/windows

Hạn chế tên tệp được tạo bởi WGET từ URL. Xem ‘--R-R-File-namams, để biết mô tả chi tiết hơn.

ret_symlinks = bật/tắt

Khi được đặt thành BẬT, hãy truy xuất các liên kết tượng trưng như thể chúng là các tệp đơn giản; Giống như ‘-retr-symlinks.

retry_connnrefuss = on/off

Khi được đặt thành BẬT, hãy xem xét kết nối của người Viking đã từ chối một lỗi thoáng qua, giống như ‘-retry-connrefuse.

robot = bật/tắt

Chỉ định xem quy ước Norobots có được WGET tôn trọng hay không, theo mặc định. Công tắc này điều khiển cả /robots.txt và khía cạnh ‘nofollow của thông số kỹ thuật. Xem loại trừ robot, để biết thêm chi tiết về điều này. Hãy chắc chắn rằng bạn biết những gì bạn đang làm trước khi tắt nó.

Save_Cookies = Tệp

Lưu cookie vào tệp. Giống như tập tin ‘--save-cookies.

save_headers = bật/tắt

Giống như ‘--save-have-mealers.

Secure_Protocol = String

Chọn giao thức an toàn sẽ được sử dụng. Các giá trị pháp lý là ‘tự động (mặc định),‘ SSLV2, ‘SSLV3, và‘ TLSV1. Giống như ‘-an toàn-protocol = chuỗi.

server_response = BẬT/TẮT

Chọn xem có hay không in các phản hồi của máy chủ HTTP và FTP giống như ‘-s.

show_all_dns_entries = bật/tắt

Khi một tên DNS được giải quyết, hãy hiển thị tất cả các địa chỉ IP, không chỉ là ba địa chỉ đầu tiên.

span_hosts = bật/tắt

Giống như ‘-h.

nhện = bật/tắt

Giống như ‘-Spider.

strict_comments = bật/tắt

Giống như ‘-Strict-comments.

Thời gian chờ = n

Đặt tất cả các giá trị thời gian chờ áp dụng thành N, giống như ‘-t n.

Dấu thời gian = BẬT/TẮT

Bật/tắt dấu thời gian. Giống như ‘-n, (xem thời gian đóng dấu).

use_server_timestamp = BẬT/TẮT

Nếu được đặt thành ‘OFF, thì WGE đã giành được tập tin Dấu thời gian cục bộ bởi cái trên máy chủ (giống như‘--no-use-server-thời gian trước).

cố gắng = n

Đặt số lần thử lại trên mỗi URL, giống như ‘-t n.

use_proxy = bật/tắt

Khi được đặt thành TẮT, don lồng sử dụng proxy ngay cả khi các biến môi trường liên quan đến proxy được đặt. Trong trường hợp đó, nó giống như sử dụng ‘--no-proxy.

người dùng = chuỗi

Chỉ định chuỗi tên người dùng cho cả truy xuất tệp FTP và HTTP. Lệnh này có thể được ghi đè bằng lệnh ‘ftp_user và‘ http_user, cho ftp và http tương ứng.

user_agent = chuỗi

Nhận dạng tác nhân người dùng được gửi đến máy chủ HTTP giống như ‘--User-agent = String.

Verbose = BẬT/TẮT

Bật/tắt dài dòng giống như ‘-v,/‘-nv.

Chờ = n

Chờ n giây giữa các lần truy xuất, giống như ‘-w n.

Wait_retry = n

Đợi đến n giây giữa các lần thử lại của các lần truy xuất thất bại chỉ giống như ‘--waitretry = n. Lưu ý rằng điều này được bật theo mặc định trong WGETRC toàn cầu.


6.4 Mẫu WGetRC

Đây là tệp khởi tạo mẫu, như được đưa ra trong phân phối. Nó được chia thành hai phần, một phần cho việc sử dụng toàn cầu (phù hợp cho tệp khởi động toàn cầu) và một phần cho việc sử dụng địa phương (phù hợp với $ home/.wgetrc). Hãy cẩn thận về những điều bạn thay đổi.

Lưu ý rằng hầu hết tất cả các dòng được nhận xét. Để một lệnh có bất kỳ hiệu ứng nào, bạn phải xóa ký tự ‘#ở đầu dòng của nó.

ftp://host/directory/file;type=a
3


7 ví dụ

Các ví dụ được chia thành ba phần lỏng lẻo dựa trên sự phức tạp của chúng.


7.1 Sử dụng đơn giản

  • Giả sử bạn muốn tải xuống một url. Chỉ loại:

    ftp://host/directory/file;type=a
    
    4

  • Nhưng điều gì sẽ xảy ra nếu kết nối chậm và tệp dài? Kết nối có thể sẽ thất bại trước khi toàn bộ tệp được truy xuất, hơn một lần. Trong trường hợp này, WGET sẽ cố gắng lấy tệp cho đến khi nó nhận được toàn bộ nó hoặc vượt quá số lần thử lại mặc định (đây là 20). Thật dễ dàng để thay đổi số lần thử thành 45, để đảm bảo rằng toàn bộ tệp sẽ đến nơi an toàn:

    ftp://host/directory/file;type=a
    
    5

  • Bây giờ, hãy để WGE để WGET hoạt động trong nền và viết tiến trình của nó vào nhật ký nhật ký. Nó thật mệt mỏi khi gõ ‘-Intries, vì vậy chúng ta sẽ sử dụng‘ -t.

    ftp://host/directory/file;type=a
    
    6

    Các ampers và ở cuối dòng đảm bảo rằng WGET hoạt động ở chế độ nền. Để không giới hạn số lần thử lại, hãy sử dụng inf inf inf.

  • Việc sử dụng FTP là đơn giản. WGE sẽ chăm sóc đăng nhập và mật khẩu.

    ftp://host/directory/file;type=a
    
    7

  • Nếu bạn chỉ định một thư mục, WGE sẽ truy xuất danh sách thư mục, phân tích nó và chuyển đổi nó thành HTML. Thử:

    ftp://host/directory/file;type=a
    
    8


7.2 Sử dụng nâng cao

  • Bạn có một tệp chứa các URL bạn muốn tải xuống? Sử dụng công tắc ‘-i,:

    Nếu bạn chỉ định ‘-tên là tên tệp, các URL sẽ được đọc từ đầu vào tiêu chuẩn.

  • Tạo một hình ảnh phản chiếu sâu năm cấp của trang web GNU, với cùng một cấu trúc thư mục mà bản gốc có, chỉ có một lần thử cho mỗi tài liệu, lưu nhật ký của các hoạt động vào gnulog:

    ftp://host/directory/file;type=a
    
    9

  • Giống như ở trên, nhưng chuyển đổi các liên kết trong các tệp đã tải xuống để trỏ đến các tệp cục bộ, do đó bạn có thể xem các tài liệu ngoại tuyến:

    wget -r --tries=10 http://fly.srk.fer.hr/ -o log
    
    0

  • Chỉ truy xuất một trang HTML, nhưng đảm bảo rằng tất cả các yếu tố cần thiết cho trang được hiển thị, chẳng hạn như hình ảnh nội tuyến và bảng kiểu bên ngoài, cũng được tải xuống. Đồng thời đảm bảo trang đã tải xuống tham chiếu các liên kết đã tải xuống.

    wget -r --tries=10 http://fly.srk.fer.hr/ -o log
    
    1

    Trang HTML sẽ được lưu vào www.example.com/dir/page.html và hình ảnh, bảng kiểu, v.v., ở đâu đó dưới www.example.com/, tùy thuộc vào nơi chúng ở trên máy chủ từ xa.

  • Giống như ở trên, nhưng không có thư mục www.example.com/. Trên thực tế, tôi không muốn có tất cả các thư mục máy chủ ngẫu nhiên dù sao cũng chỉ lưu tất cả các tệp đó theo một thư mục tải xuống/ thư mục của thư mục hiện tại.

    wget -r --tries=10 http://fly.srk.fer.hr/ -o log
    
    2

  • Truy xuất chỉ mục.html của ‘www.lycos.com, hiển thị các tiêu đề máy chủ gốc:

    wget -r --tries=10 http://fly.srk.fer.hr/ -o log
    
    3

  • Lưu các tiêu đề máy chủ với tệp, có lẽ để xử lý hậu kỳ.

    wget -r --tries=10 http://fly.srk.fer.hr/ -o log
    
    4

  • Lấy hai cấp độ đầu tiên của ‘wuarchive.wustl.edu, lưu chúng vào /TMP.

    wget -r --tries=10 http://fly.srk.fer.hr/ -o log
    
    5

  • Bạn muốn tải xuống tất cả các GIF từ một thư mục trên máy chủ HTTP. Bạn đã thử ‘wget http://www.example.com/dir/*.gif, nhưng điều đó đã không hoạt động vì truy xuất HTTP không hỗ trợ toàn cầu. Trong trường hợp đó, sử dụng:

    wget -r --tries=10 http://fly.srk.fer.hr/ -o log
    
    6

    Nhiều dòng chảy hơn, nhưng hiệu ứng là như nhau. '-r -l1' có nghĩa là lấy lại một cách đệ quy (xem tải xuống đệ quy), với độ sâu tối đa là 1. '--no-parent' có nghĩa là các tham chiếu đến thư mục mẹ bị bỏ qua (xem giới hạn dựa trên thư mục) và '-A .gif 'có nghĩa là chỉ tải xuống các tệp GIF. ‘-A"*.gif "cũng đã hoạt động.

  • Giả sử bạn đang ở giữa việc tải xuống, khi WGET bị gián đoạn. Bây giờ bạn không muốn clobber các tập tin đã có. Nó sẽ là:

    wget -r --tries=10 http://fly.srk.fer.hr/ -o log
    
    7

  • Nếu bạn muốn mã hóa tên người dùng và mật khẩu của riêng mình thành HTTP hoặc FTP, hãy sử dụng cú pháp URL thích hợp (xem định dạng URL).

    wget -r --tries=10 http://fly.srk.fer.hr/ -o log
    
    8

    Tuy nhiên, lưu ý rằng việc sử dụng này không được khuyến khích trên các hệ thống nhiều người dùng vì nó tiết lộ mật khẩu của bạn cho bất kỳ ai nhìn vào đầu ra của

    wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
    
    3.

  • Bạn muốn các tài liệu đầu ra đi đến đầu ra tiêu chuẩn thay vì các tệp?

    wget -r --tries=10 http://fly.srk.fer.hr/ -o log
    
    9

    Bạn cũng có thể kết hợp hai tùy chọn và tạo các đường ống để truy xuất các tài liệu từ danh sách nóng từ xa:

    wget -X '' -X /~nobody,/~somebody
    
    0


7.3 Cách sử dụng rất tiên tiến

  • Nếu bạn muốn Wget giữ một tấm gương của một trang (hoặc các thư mục con FTP), hãy sử dụng ‘-mirror, (‘ -m,), là tốc ký cho ‘-r -l inf -n. Bạn có thể đặt WGET trong tệp Crontab yêu cầu nó kiểm tra lại một trang web vào mỗi Chủ nhật:

    wget -X '' -X /~nobody,/~somebody
    
    1

  • Ngoài các điều trên, bạn muốn các liên kết được chuyển đổi để xem cục bộ. Nhưng, sau khi đọc hướng dẫn này, bạn biết rằng chuyển đổi liên kết không chơi tốt với dấu thời gian, vì vậy bạn cũng muốn WGET sao lưu các tệp HTML ban đầu trước khi chuyển đổi. Lời cầu khẩn của WGE sẽ trông như thế này:

    wget -X '' -X /~nobody,/~somebody
    
    2

  • Nhưng bạn cũng nhận thấy rằng việc xem cục bộ không hoạt động tốt khi các tệp HTML được lưu dưới các phần mở rộng khác với ‘.html, có lẽ vì chúng được phục vụ dưới dạng index.cgi. Vì vậy, bạn đã thích WGET để đổi tên tất cả các tệp được phục vụ với loại nội dung ‘Text/HTML, hoặc‘ Ứng dụng/XHTML+XML, thành tên.html.

    wget -X '' -X /~nobody,/~somebody
    
    3

    Hoặc, với ít gõ hơn:

    wget -X '' -X /~nobody,/~somebody
    
    4


8 khác nhau

Chương này chứa tất cả những thứ không thể phù hợp với bất cứ nơi nào khác.


8.1 proxy

Proxy là các máy chủ HTTP có mục đích đặc biệt được thiết kế để chuyển dữ liệu từ các máy chủ từ xa sang máy khách cục bộ. Một cách sử dụng điển hình của proxy là tải trọng mạng cho người dùng phía sau kết nối chậm. Điều này đạt được bằng cách kênh tất cả các yêu cầu HTTP và FTP thông qua proxy lưu trữ dữ liệu được chuyển. Khi một tài nguyên được lưu trữ được yêu cầu lại, proxy sẽ trả về dữ liệu từ bộ đệm. Một cách sử dụng khác cho proxy là dành cho các công ty tách biệt (vì lý do bảo mật) mạng nội bộ của họ với phần còn lại của Internet. Để có được thông tin từ web, người dùng của họ kết nối và truy xuất dữ liệu từ xa bằng proxy được ủy quyền.

WGET hỗ trợ các proxy cho cả truy xuất HTTP và FTP. Cách tiêu chuẩn để chỉ định vị trí proxy, WGET nhận ra, là sử dụng các biến môi trường sau:

http://host[:port]/directory/file
ftp://host[:port]/directory/file
91
http://host[:port]/directory/file
ftp://host[:port]/directory/file
92

Nếu được đặt, các biến

http://host[:port]/directory/file
ftp://host[:port]/directory/file
91 và
http://host[:port]/directory/file
ftp://host[:port]/directory/file
92 phải chứa các URL của các proxy cho các kết nối HTTP và HTTPS tương ứng.

http://host[:port]/directory/file
ftp://host[:port]/directory/file
95

Biến này phải chứa URL của proxy cho các kết nối FTP. Điều khá phổ biến là

http://host[:port]/directory/file
ftp://host[:port]/directory/file
91 và
http://host[:port]/directory/file
ftp://host[:port]/directory/file
95 được đặt thành cùng một URL.

http://host[:port]/directory/file
ftp://host[:port]/directory/file
98

Biến này phải chứa một danh sách phân tách dấu phẩy của proxy phần mở rộng miền không nên được sử dụng cho. Chẳng hạn, nếu giá trị của

http://host[:port]/directory/file
ftp://host[:port]/directory/file
98 là ‘.mit.edu, proxy sẽ không được sử dụng để truy xuất tài liệu từ MIT.

Ngoài các biến môi trường, vị trí proxy và cài đặt có thể được chỉ định từ bên trong chính WGET.

‘--no-proxy

Tùy chọn này và lệnh tương ứng có thể được sử dụng để ngăn chặn việc sử dụng proxy, ngay cả khi các biến môi trường thích hợp được đặt.

Http_proxy = url hè‘https_proxy = url hè‘ftp_proxy = url hè‘no_proxy = String

Các biến tệp khởi động này cho phép bạn ghi đè các cài đặt proxy được chỉ định bởi môi trường.

Một số máy chủ proxy yêu cầu ủy quyền để cho phép bạn sử dụng chúng. Ủy quyền bao gồm tên người dùng và mật khẩu, phải được gửi bởi WGET. Như với ủy quyền HTTP, một số sơ đồ xác thực tồn tại. Đối với ủy quyền, chỉ có sơ đồ xác thực

ftp://user:password@host/path
http://user:password@host/path
00 hiện đang được thực hiện.

Bạn có thể chỉ định tên người dùng và mật khẩu của mình thông qua URL proxy hoặc thông qua các tùy chọn dòng lệnh. Giả sử rằng proxy của công ty được đặt tại ‘proxy.company.com tại PORT 8001, một vị trí URL proxy có chứa dữ liệu ủy quyền có thể trông giống như thế này:

wget -X '' -X /~nobody,/~somebody
5

Ngoài ra, bạn có thể sử dụng các tùy chọn ‘proxy-user và‘ proxy-password, và cài đặt .wgetrc tương đương

ftp://user:password@host/path
http://user:password@host/path
01 và
ftp://user:password@host/path
http://user:password@host/path
02 để đặt tên người dùng và mật khẩu proxy.


8.2 Phân phối

Giống như tất cả các tiện ích GNU, phiên bản mới nhất của WGET có thể được tìm thấy tại trang web lưu trữ Master GNU ftp.gnu.org và gương của nó. Ví dụ: có thể tìm thấy WGET 1.21.1-Dirty tại https://ftp.gnu.org/pub/gnu/wget/wget-1.21.1-dirty.tar.gz


8.3 Trang web

Trang web chính thức cho GNU WGET là tại https // www.gnu.org/phần mềm/wget/. Tuy nhiên, hầu hết các thông tin hữu ích cư trú tại các wget wgiki, http://wget.addictivecode.org/.


8.4 Danh sách gửi thư

Danh sách chính

Danh sách gửi thư chính để thảo luận, báo cáo lỗi hoặc câu hỏi về GNU WGET là tại. Để đăng ký, gửi email đến hoặc truy cập https://lists.gnu.org/mailman/listinfo/bug-wget.

Bạn không cần phải đăng ký để gửi tin nhắn vào danh sách; Tuy nhiên, xin lưu ý rằng các tin nhắn không được đăng ký được kiểm duyệt và có thể mất một lúc trước khi họ nhấn vào danh sách thường xuyên vào khoảng một ngày. Nếu bạn muốn tin nhắn của bạn hiển thị ngay lập tức, vui lòng đăng ký danh sách trước khi đăng. Lưu trữ cho danh sách có thể được tìm thấy tại https://lists.gnu.org/archive/html/bug-wget/.usually around a day. If you want your message to show up immediately, please subscribe to the list before posting. Archives for the list may be found at https://lists.gnu.org/archive/html/bug-wget/.

Một cổng NNTP/USENETTISH cũng có sẵn thông qua GMANE. Bạn có thể xem Lưu trữ Gmane tại http://news.gmane.org/gmane.comp.web.wget.general. Lưu ý rằng Lưu trữ GMANE một cách thuận tiện bao gồm các tin nhắn từ cả danh sách hiện tại và tài liệu trước đó. Các tin nhắn cũng xuất hiện trong kho lưu trữ Gmane sớm hơn so với họ tại https://lists.gnu.org.

Danh sách lỗi thời

Trước đây, danh sách gửi thư đã được sử dụng làm danh sách thảo luận chính và một danh sách khác, đã được sử dụng để gửi và thảo luận về các bản vá cho GNU WGET.

Tin nhắn từ được lưu trữ tại

  • & nbsp; https://www.mail-archive.com/wget%40sunsite.dk/ và tại
  • & nbsp; http://news.gmane.org/gmane.comp.web.wget.general (cũng tiếp tục lưu trữ danh sách hiện tại,).

Tin nhắn từ được lưu trữ tại

  • & nbsp; https://www.mail-archive.com/wget%40sunsite.dk/ và tại

& nbsp; http://news.gmane.org/gmane.comp.web.wget.general (cũng tiếp tục lưu trữ danh sách hiện tại,).

Ngoài các danh sách gửi thư, chúng tôi cũng có một kênh hỗ trợ được thiết lập thông qua IRC tại

ftp://user:password@host/path
http://user:password@host/path
03,
ftp://user:password@host/path
http://user:password@host/path
04. Hãy đến kiểm tra nó ra!


8.6 Lỗi báo cáo

Bạn có thể gửi báo cáo lỗi thông qua Trình theo dõi lỗi GNU WGET (xem https://savannah.gnu.org/bugs/?func=additem&group=wget) hoặc vào danh sách gửi thư của chúng tôi.

Truy cập https://lists.gnu.org/mailman/listinfo/bug-wget để có thêm thông tin (cách đăng ký, liệt kê lưu trữ, ...).

Trước khi thực sự gửi báo cáo lỗi, vui lòng cố gắng làm theo một vài hướng dẫn đơn giản.

  1. Vui lòng cố gắng xác định rằng hành vi bạn thấy thực sự là một lỗi. Nếu Wget gặp sự cố, thì đó là một lỗi. Nếu WGET không hoạt động như tài liệu, thì đó là một lỗi. Nếu mọi thứ hoạt động kỳ lạ, nhưng bạn không chắc chắn về cách chúng được cho là hoạt động, thì đó có thể là một lỗi, nhưng bạn có thể muốn kiểm tra lại tài liệu và danh sách gửi thư (xem danh sách gửi thư).
  2. Cố gắng lặp lại lỗi trong hoàn cảnh đơn giản nhất có thể. Ví dụ. Nếu wget gặp sự cố trong khi tải xuống 'wget -rl0 -kke -t5 -no -proxy http://example.com -O/tmp/log', bạn nên thử xem sự cố có thể lặp lại và nếu sẽ xảy ra tập hợp các tùy chọn đơn giản hơn. Bạn thậm chí có thể cố gắng bắt đầu tải xuống tại trang nơi xảy ra sự cố để xem liệu trang đó có kích hoạt sự cố hay không.

    Ngoài ra, trong khi tôi có thể sẽ quan tâm để biết nội dung của tệp .wgetrc của bạn, chỉ cần đổ nó vào thông báo gỡ lỗi có lẽ là một ý tưởng tồi. Thay vào đó, trước tiên bạn nên cố gắng xem lỗi có lặp lại với .wgetrc đã di chuyển ra khỏi đường không. Chỉ khi nó chỉ ra rằng cài đặt .wgetrc ảnh hưởng đến lỗi, hãy gửi cho tôi các phần có liên quan của tệp.

  3. Vui lòng bắt đầu WGET với tùy chọn ‘-D, và gửi cho chúng tôi đầu ra kết quả (hoặc các phần có liên quan của chúng). Nếu WGET được biên dịch mà không cần hỗ trợ gỡ lỗi, hãy biên dịch lại nó, việc truy tìm các lỗi với hỗ trợ gỡ lỗi sẽ dễ dàng hơn nhiều.

    Lưu ý: Vui lòng đảm bảo xóa bất kỳ thông tin có khả năng nhạy cảm nào khỏi nhật ký gỡ lỗi trước khi gửi nó đến địa chỉ lỗi.

    ftp://user:password@host/path
    http://user:password@host/path
    
    05 đã giành được sự cố gắng để thu thập thông tin nhạy cảm, nhưng nhật ký sẽ chứa một bảng điểm khá đầy đủ của giao tiếp WGET, với máy chủ, có thể bao gồm mật khẩu và các đoạn dữ liệu đã tải xuống. Vì địa chỉ lỗi được lưu trữ công khai, bạn có thể cho rằng tất cả các báo cáo lỗi đều hiển thị cho công chúng.

  4. Nếu WGET đã bị sập, hãy cố gắng chạy nó trong một trình gỡ lỗi, ví dụ:
    ftp://user:password@host/path
    http://user:password@host/path
    
    06 và gõ
    ftp://user:password@host/path
    http://user:password@host/path
    
    07 để có được backtrace. Điều này có thể không hoạt động nếu quản trị viên hệ thống đã vô hiệu hóa các tệp lõi, nhưng sẽ an toàn để thử.

8.7 Tính di động

Giống như tất cả phần mềm GNU, WGET hoạt động trên hệ thống GNU. Tuy nhiên, vì nó sử dụng GNU AutoConf để xây dựng và định cấu hình, và chủ yếu tránh sử dụng các tính năng đặc biệt của các đặc điểm của bất kỳ Unix, nên nên biên dịch (và hoạt động) trên tất cả các hương vị Unix thông thường.

Các phiên bản WGET khác nhau đã được biên dịch và thử nghiệm theo nhiều loại hệ thống UNIX, bao gồm GNU/Linux, Solaris, Sunos 4.x, Mac OS X, OSF (còn gọi là UNIX hoặc Tru64), Ultrix, *BSD, IRIX, AIX, và khác. Một số hệ thống đó không còn được sử dụng rộng rãi và có thể không thể hỗ trợ các phiên bản gần đây của WGET. Nếu WGET không biên dịch trên hệ thống của bạn, chúng tôi muốn biết về nó.

Nhờ những người đóng góp tử tế, phiên bản WGET biên dịch này và hoạt động trên các nền tảng Microsoft Windows 32 bit. Nó đã được biên dịch thành công bằng cách sử dụng các trình biên dịch MS Visual C ++ 6.0, Watcom, Borland C và GCC. Đương nhiên, nó bị tê liệt với một số tính năng có sẵn trên Unix, nhưng nó sẽ hoạt động như một sự thay thế cho những người bị mắc kẹt với Windows. Lưu ý rằng các phần Windows dành riêng cho WGET không được đảm bảo sẽ được hỗ trợ trong tương lai, mặc dù điều này đã xảy ra trong thực tế trong nhiều năm nay. Tất cả các câu hỏi và vấn đề trong việc sử dụng Windows nên được báo cáo cho danh sách gửi thư của WGET tại nơi các tình nguyện viên duy trì các tính năng liên quan đến Windows có thể nhìn vào chúng.

Hỗ trợ xây dựng trên MS-DOS thông qua DJGPP đã được Gisle Vanem đóng góp; Một cổng đến VMS được duy trì bởi Steven Schweda và có sẵn tại https://antinode.info/dec/sw/wget.html.


8.8 Tín hiệu

Vì mục đích của WGET là công việc nền, nó bắt được tín hiệu treo (

ftp://user:password@host/path
http://user:password@host/path
08) và bỏ qua nó. Nếu đầu ra trên đầu ra tiêu chuẩn, nó sẽ được chuyển hướng đến một tệp có tên WGET-LOG. Nếu không,
ftp://user:password@host/path
http://user:password@host/path
08 bị bỏ qua. Điều này thuận tiện khi bạn muốn chuyển hướng đầu ra của WGET sau khi đã bắt đầu nó.

wget -X '' -X /~nobody,/~somebody
6

Ngoài ra, WGET sẽ không cố gắng can thiệp vào các tín hiệu theo bất kỳ cách nào. C-C,

ftp://user:password@host/path
http://user:password@host/path
10 và
ftp://user:password@host/path
http://user:password@host/path
11 sẽ tiêu diệt nó giống nhau.


9 Phụ lục

Chương này chứa một số tài liệu tham khảo tôi cho là hữu ích.


9.1 Loại trừ robot

Nó là cực kỳ dễ dàng để làm cho Wget Wander vô mục đích xung quanh một trang web, hút tất cả các dữ liệu có sẵn đang được tiến hành. Trang web wget -r, và bạn đã thiết lập. Tuyệt quá? Không dành cho quản trị viên máy chủ.

Miễn là WGET chỉ truy xuất các trang tĩnh và thực hiện nó với tốc độ hợp lý (xem tùy chọn ‘--wait,), không có vấn đề gì. Vấn đề là WGE có thể nói lên sự khác biệt giữa trang tĩnh nhỏ nhất và CGI đòi hỏi khắt khe nhất. Một trang web mà tôi biết có một phần được xử lý bởi tập lệnh CGI Perl chuyển đổi các tệp thông tin thành HTML khi đang bay. Kịch bản là chậm, nhưng hoạt động đủ tốt để người dùng xem tệp thông tin không thường xuyên. Tuy nhiên, khi wget đệ quy của ai đó, tải xuống trên trang chỉ mục liên kết với tất cả các tệp thông tin thông qua tập lệnh, hệ thống được đưa đến đầu gối của nó mà không cung cấp bất cứ điều gì hữu ích cho người dùng (nhiệm vụ chuyển đổi các tệp thông tin này có thể được thực hiện cục bộ và truy cập để thông tin tài liệu cho tất cả phần mềm GNU đã cài đặt trên một hệ thống có sẵn từ lệnh

ftp://user:password@host/path
http://user:password@host/path
12).

Để tránh loại tai nạn này, cũng như để bảo tồn quyền riêng tư cho các tài liệu cần được bảo vệ khỏi các robot cư xử tốt, khái niệm loại trừ robot đã được phát minh. Ý tưởng là các quản trị viên máy chủ và tác giả tài liệu có thể chỉ định phần nào của trang web họ muốn bảo vệ khỏi robot và những người họ sẽ cho phép truy cập.

Cơ chế phổ biến nhất và tiêu chuẩn thực tế được hỗ trợ bởi tất cả các robot chính, là tiêu chuẩn loại trừ robot của robot (RES) được viết bởi Martijn Koster et al. Vào năm 1994. Nó chỉ định định dạng của một tệp văn bản chứa các chỉ thị hướng dẫn các robot mà các đường dẫn URL cần tránh. Để được tìm thấy bởi các robot, các thông số kỹ thuật phải được đặt trong /robots.txt trong root máy chủ, mà các robot dự kiến ​​sẽ tải xuống và phân tích cú pháp.

Mặc dù WGET không phải là một robot web theo nghĩa nghiêm ngặt nhất của từ này, nhưng nó có thể tải xuống các phần lớn của trang web mà không cần sự can thiệp của người dùng để tải xuống một trang riêng lẻ. Do đó, WGET Honours Res khi tải xuống đệ quy. Ví dụ, khi bạn phát hành:

wget -X '' -X /~nobody,/~somebody
7

Đầu tiên, chỉ mục của ‘www.example.com sẽ được tải xuống. Nếu WGET thấy rằng họ muốn tải xuống nhiều tài liệu hơn từ máy chủ đó, nó sẽ yêu cầu ‘http://www.example.com/robots.txt, và, nếu tìm thấy, hãy sử dụng nó để tải xuống thêm. Robots.txt chỉ được tải một lần cho mỗi mỗi máy chủ.

Cho đến phiên bản 1.8, WGET đã hỗ trợ phiên bản đầu tiên của tiêu chuẩn, được viết bởi Martijn Koster vào năm 1994 và có sẵn tại http://www.robotstxt.org/orig.html. Kể từ phiên bản 1.8, WGET đã hỗ trợ các chỉ thị bổ sung được chỉ định trong bản nháp Internet ‘có tiêu đề là một phương thức cho các robot web điều khiển. Bản nháp, theo như tôi biết không bao giờ được thực hiện cho RFC, có sẵn tại http://www.robotstxt.org/norobots-rfc.txt.

Hướng dẫn này không còn bao gồm văn bản của tiêu chuẩn loại trừ robot.

Cơ chế thứ hai, ít được biết đến, cho phép tác giả của một tài liệu riêng lẻ chỉ định xem họ có muốn các liên kết từ tệp được theo sau bởi một robot hay không. Điều này đạt được bằng cách sử dụng thẻ

ftp://user:password@host/path
http://user:password@host/path
13, như thế này:

wget -X '' -X /~nobody,/~somebody
8

Điều này được giải thích trong một số chi tiết tại http://www.robotstxt.org/meta.html. WGET hỗ trợ phương pháp loại trừ robot này ngoài loại trừ /robots.txt thông thường.

Nếu bạn biết những gì bạn đang làm và thực sự thực sự muốn tắt loại trừ robot, hãy đặt biến

ftp://user:password@host/path
http://user:password@host/path
14 thành ‘off, trong .wgetrc của bạn. Bạn có thể đạt được hiệu ứng tương tự từ dòng lệnh bằng cách sử dụng công tắc
ftp://user:password@host/path
http://user:password@host/path
15, ví dụ: Wget -e robot = off url ...


9.2 Cân nhắc bảo mật

Khi sử dụng WGET, bạn phải biết rằng nó sẽ gửi mật khẩu không được mã hóa thông qua mạng, có thể đưa ra vấn đề bảo mật. Dưới đây là những vấn đề chính, và một số giải pháp.

  1. Mật khẩu trên dòng lệnh có thể nhìn thấy bằng cách sử dụng
    wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
    
    3. Cách tốt nhất xung quanh nó là sử dụng
    wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
    
    4 và cung cấp cho các URL cho đầu vào tiêu chuẩn của WGET, mỗi dòng trên một dòng riêng biệt, bị chấm dứt bởi C-D. Một cách giải quyết khác là sử dụng .Netrc để lưu trữ mật khẩu; Tuy nhiên, việc lưu trữ mật khẩu không được mã hóa cũng được coi là rủi ro bảo mật.
  2. Sử dụng sơ đồ xác thực cơ bản không an toàn, mật khẩu không được mã hóa được truyền qua các bộ định tuyến và cổng mạng.
  3. Mật khẩu FTP cũng không được mã hóa. Không có giải pháp tốt cho điều này vào lúc này.
  4. Mặc dù đầu ra thông thường của WGE của WGET cố gắng ẩn mật khẩu, các bản ghi gỡ lỗi hiển thị chúng, dưới mọi hình thức. Vấn đề này được tránh bằng cách cẩn thận khi bạn gửi nhật ký gỡ lỗi (vâng, ngay cả khi bạn gửi chúng cho tôi).

9.3 Người đóng góp

GNU WGET được viết bởi Hrvoje Nikšić,

Tuy nhiên, sự phát triển của WGET không bao giờ có thể đi xa như nó, nếu không phải là sự giúp đỡ của nhiều người, với các báo cáo lỗi, đề xuất tính năng, bản vá hoặc thư nói cảm ơn!

Cảm ơn đặc biệt đến những người sau (không có thứ tự cụ thể):

  • Dan Harkless đã đối phó với rất nhiều mã và tài liệu có chất lượng cực cao, cũng như
    ftp://user:password@host/path
    http://user:password@host/path
    
    18 và các tùy chọn liên quan. Ông là người bảo trì chính trong một thời gian và phát hành WGET 1.6.
  • Ian Abbott, các bản sửa lỗi được đối nhiên, các bản sửa lỗi liên quan đến Windows và cung cấp một triển khai nguyên mẫu của bản tải xuống đệ quy đầu tiên trên chiều rộng. WGET được duy trì trong chu kỳ phát hành 1.8.
  • Phi hành đoàn Dotsrc.org, đặc biệt là các tài nguyên hệ thống được phân phối của Karsten Thygesen, như danh sách gửi thư, không gian web, không gian FTP và kho lưu trữ kiểm soát phiên bản, cùng với rất nhiều thời gian để làm cho chúng thực sự hoạt động. Christian Reiniger là sự giúp đỡ vô giá trong việc thiết lập lật đổ.
  • Heiko Herold đã cung cấp các bản dựng Windows chất lượng cao và đóng góp các báo cáo và xây dựng các báo cáo trong nhiều năm.
  • Shawn McHorse, báo cáo và các bản vá.
  • Kaveh R. Ghazi, trên fly ____ ____ 219-ization. Rất nhiều sửa chữa tính di động.
  • Gordon Matzigkeit. Hỗ trợ.
  • Zlatko alušić, Tomislav Vujec và Dražen Kačar gợi ý về các cuộc thảo luận và các cuộc thảo luận về triết học.
  • Darko Budor, cổng thông thường đến Windows.
  • Antonio Rosella, Help và các đề xuất, cộng với bản dịch tiếng Ý ban đầu.
  • Tomislav Petrović, Mario Mikočević, nhiều báo cáo và đề xuất lỗi.
  • Françis Pinard, nhiều báo cáo và thảo luận về lỗi kỹ lưỡng.
  • Karl Eichwalder, những người giúp đỡ quốc tế hóa, bố trí makefile và nhiều thứ khác.
  • Junio ​​Hamano, hỗ trợ hỗ trợ cho xác thực OPIE và HTTP ____220.
  • Hỗ trợ IPv6 đã được cải thiện của Mauro Tàu, thêm hỗ trợ cho các hệ thống gia đình kép. Tái cấu trúc và tăng cường mã IPv6 FTP. Duy trì GNU WGE từ năm 20042002007.
  • Christopher G. Lewis, đặc biệt của phiên bản Windows của GNU WGE.
  • Gisle Vanem, nhiều bản vá và cải tiến hữu ích, đặc biệt là hỗ trợ Windows và MS-DOS.
  • RALF Wildenhues đã đối phó với các bản vá để chuyển đổi WGET để sử dụng Automake như một phần của quá trình xây dựng và các lỗi khác nhau.
  • Steven Schubiger, nhiều bản vá hữu ích, lỗi và cải tiến. Đáng chú ý, chuyển đổi WGET để sử dụng các mô-đun trích dẫn và trích dẫn gnulib và việc bổ sung các lời nhắc mật khẩu tại bảng điều khiển, thông qua mô-đun Gnulib getPasswd-GNU.
  • Ted Mielczarek, hỗ trợ cho CSS.
  • Saint Xavier, hỗ trợ cho IRIS (RFC 3987).
  • Tim Rühsen, các bản vá hữu ích, đặc biệt là hỗ trợ làm mờ và tích hợp liên tục. Người bảo trì từ năm 2014.
  • Darshit Shah, nhiều bản vá hữu ích. Hỗ trợ cộng đồng trên các nền tảng khác nhau. Người bảo trì từ năm 2014.
  • Những người cung cấp quyên góp cho sự phát triển, bao gồm cả Brian Gough.

Những người sau đây đã cung cấp các bản vá, báo cáo lỗi/xây dựng, đề xuất hữu ích, dịch vụ kiểm tra beta, thư của người hâm mộ và tất cả những thứ khác giúp bảo trì rất nhiều niềm vui:

Tim Adam, Adrian Aichner, Martin Baehr, Dieter Baron, Roger Beeman, Dan Berger, T. Bharath, Christian Biere, Paul Bludov, Daniel Bodea, Mark Boyns, John Burden, Julien Buty, Wanderlei Cavassin Cragg, Kristijan ononkaš, John Daily, Andreas Damm, Ahmon Dancy, Andrew Davison, Bertrand Demiddelaer, Alexander Dergachev, Andrew Deryabin, Ulrich Drepper Ferreira, Christian Fraenkel, David Fritz, Mike Frysinger, Charles C. Fu, Fujishima Satsuki, Masashi Fujita, Howard Gayle, Marcel Gerrit Hosaagrahara, Hirose Masaaki, Ulf Harnhammar, Gregor Hoffleit, Erik Magnus Hulthen, Richard Huveneers, Jonas Jensen, Larry Jones, Simon Josefsson, Mario Jurić, Hack Kampbjrn , Fila Kolodny, Alexander Kourakos, Martin Kraemer, Sami Krank, Jay Krell, , Aurelien Marchand, Matthew J. Mellon, Jordan Mendelson, Ted Mielczarek, Robert Millan, Lin Zhe Min, Jan Minar, Tim Mooney, Keith Moore, Adam D. Moss, Simon Munton, Charlie Negyesi, R. K. Owen, Jim Paris, Kenny Parnell . , Heinz Salzmann, Robert Schmidt, Nicolas Schodet, Benno Schulenberg, Andreas Schwab, Steven M. Schweda, Chris Sewood, Pranab Shenoy, Dennis Smit, Toomas Soome, Tage Stabell-Kulo John Summerfield, Szakacsits Szabolcs, Mike Philipp Thomas, Mauro: Dave Turner, Gisle Vanem, Rabin Vincent, Russell Vincent, željko Vrba, Charles G Waldman, Douglas E. Wegscheid, Ralf Wildenhues, Joshua David, , Bojan ždrnja, Kristijan Zimmer, Xin Zou.

Xin lỗi tất cả những người mà tôi vô tình bỏ qua, và cảm ơn tất cả những người đăng ký danh sách gửi thư của WGET.


Phụ lục A Sao chép hướng dẫn này


A.1 Giấy phép tài liệu miễn phí GNU

Phiên bản 1.3, ngày 3 tháng 11 năm 2008

wget -X '' -X /~nobody,/~somebody
9

  1. Lời mở đầu

    Mục đích của giấy phép này là làm cho một thủ công, sách giáo khoa hoặc tài liệu hữu ích và chức năng khác miễn phí theo nghĩa tự do: đảm bảo cho mọi người sự tự do hiệu quả để sao chép và phân phối lại nó, có hoặc không sửa đổi nó, về mặt thương mại hoặc phi thương mại. Thứ hai, giấy phép này bảo tồn cho tác giả và nhà xuất bản một cách để có được tín dụng cho công việc của họ, trong khi không được coi là chịu trách nhiệm cho các sửa đổi do người khác thực hiện.

    Giấy phép này là một loại copyleft, có nghĩa là các tác phẩm phái sinh của tài liệu phải tự do theo nghĩa tương tự. Nó bổ sung cho Giấy phép Công cộng GNU, là giấy phép Copyleft được thiết kế cho phần mềm miễn phí.

    Chúng tôi đã thiết kế giấy phép này để sử dụng nó cho hướng dẫn sử dụng phần mềm miễn phí, bởi vì phần mềm miễn phí cần tài liệu miễn phí: một chương trình miễn phí nên đi kèm với các hướng dẫn cung cấp các quyền tự do tương tự như phần mềm. Nhưng giấy phép này không giới hạn trong hướng dẫn phần mềm; Nó có thể được sử dụng cho bất kỳ tác phẩm văn bản, bất kể chủ đề hay liệu nó được xuất bản dưới dạng một cuốn sách in. Chúng tôi đề nghị giấy phép này chủ yếu cho các công trình có mục đích là hướng dẫn hoặc tham khảo.

  2. Khả năng ứng dụng và định nghĩa

    Giấy phép này áp dụng cho bất kỳ hướng dẫn sử dụng hoặc công việc nào khác, trong bất kỳ phương tiện nào, chứa thông báo được đặt bởi người giữ bản quyền nói rằng nó có thể được phân phối theo các điều khoản của giấy phép này. Một thông báo như vậy sẽ cấp một giấy phép trên toàn thế giới, miễn phí bản quyền, không giới hạn trong thời gian, để sử dụng công việc đó trong các điều kiện được nêu trong tài liệu này. Các tài liệu của người Viking, bên dưới, đề cập đến bất kỳ hướng dẫn hoặc công việc nào như vậy. Bất kỳ thành viên nào của công chúng đều là người được cấp phép, và được gọi là bạn. Bạn chấp nhận giấy phép nếu bạn sao chép, sửa đổi hoặc phân phối công việc theo cách yêu cầu cho phép theo luật bản quyền.

    Một phiên bản sửa đổi của người Viking, tài liệu có nghĩa là bất kỳ công việc nào chứa tài liệu hoặc một phần của nó, đã sao chép nguyên văn hoặc với các sửa đổi và/hoặc dịch sang ngôn ngữ khác.

    Một phần thứ cấp của người Vik là một phụ lục được đặt tên hoặc phần trước của tài liệu liên quan đến mối quan hệ của các nhà xuất bản hoặc tác giả của tài liệu với chủ đề chung của tài liệu (hoặc các vấn đề liên quan) và không chứa gì có thể rơi trực tiếp rơi vào trực tiếp Trong chủ đề tổng thể đó. . hoặc vị trí chính trị liên quan đến họ.

    Các phần bất biến của người Viking là các phần thứ cấp nhất định có tiêu đề được chỉ định, là phần của các phần bất biến, trong thông báo nói rằng tài liệu này được phát hành theo giấy phép này. Nếu một phần không phù hợp với định nghĩa ở trên của thứ cấp thì nó không được phép được chỉ định là bất biến. Tài liệu có thể chứa các phần bất biến bằng không. Nếu tài liệu không xác định bất kỳ phần bất biến thì không có phần nào.

    Các văn bản bìa của Google là một số đoạn văn bản ngắn nhất định được liệt kê, dưới dạng văn bản che phủ phía trước hoặc văn bản che chắn, trong thông báo nói rằng tài liệu được phát hành theo giấy phép này. Một văn bản che phủ phía trước có thể nhiều nhất là 5 từ và một văn bản che phủ có thể nhiều nhất là 25 từ.

    Một bản sao trong suốt của tài liệu có nghĩa là một bản sao có thể đọc được bằng máy, được biểu thị theo định dạng có thông số kỹ thuật có sẵn cho công chúng, phù hợp để sửa đổi tài liệu một cách đơn giản với các trình chỉnh sửa văn bản chung hoặc (đối với hình ảnh bao gồm pixel) các chương trình hoặc (cho bản vẽ) một số trình soạn thảo vẽ có sẵn rộng rãi và phù hợp cho các định dạng đầu vào cho văn bản hoặc để dịch tự động sang nhiều định dạng phù hợp cho các định dạng đầu vào cho văn bản. Một bản sao được thực hiện ở định dạng tệp trong suốt khác có đánh dấu hoặc không có đánh dấu, đã được sắp xếp để cản trở hoặc không khuyến khích sửa đổi tiếp theo của độc giả là không minh bạch. Một định dạng hình ảnh không minh bạch nếu được sử dụng cho bất kỳ số lượng văn bản đáng kể nào. Một bản sao không phải là trong suốt trong suốt được gọi là Opa Opaque.

    Ví dụ về các định dạng phù hợp cho các bản sao trong suốt bao gồm ASCII đơn giản mà không cần đánh dấu, định dạng đầu vào TexInfo, định dạng đầu vào latex, SGML hoặc XML sử dụng DTD có sẵn công khai và HTML, PostScript hoặc PDF phù hợp tiêu chuẩn được thiết kế để sửa đổi con người. Ví dụ về các định dạng hình ảnh trong suốt bao gồm PNG, XCF và JPG. Các định dạng mờ bao gồm các định dạng độc quyền có thể được đọc và chỉnh sửa chỉ bởi các trình xử lý văn bản độc quyền, SGML hoặc XML mà DTD và/hoặc các công cụ xử lý thường không có sẵn và HTML do máy, PostScript hoặc PDF tạo ra Chỉ mục đích đầu ra.

    Trang tiêu đề của người Viking có nghĩa là, đối với một cuốn sách in, chính trang tiêu đề, cộng với các trang sau đây là cần thiết để giữ, rõ ràng, tài liệu giấy phép này yêu cầu để xuất hiện trong trang tiêu đề. Đối với các tác phẩm ở các định dạng không có bất kỳ trang tiêu đề nào như vậy, trang tiêu đề của Nhật Bản có nghĩa là văn bản gần diện mạo nổi bật nhất của tiêu đề tác phẩm, trước khi bắt đầu phần thân của văn bản.

    Nhà xuất bản của người Viking có nghĩa là bất kỳ cá nhân hoặc tổ chức nào phân phối các bản sao của tài liệu cho công chúng.

    Một phần có tên XYZ, có nghĩa là một tiểu đơn vị có tên của tài liệu có tiêu đề chính xác là XYZ hoặc chứa XYZ trong ngoặc đơn sau văn bản dịch XYZ bằng ngôn ngữ khác. . Vẫn là một phần có tên XYZ, theo định nghĩa này.

    Tài liệu có thể bao gồm từ chối trách nhiệm bảo hành bên cạnh thông báo nêu rõ rằng giấy phép này áp dụng cho tài liệu. Những từ chối bảo hành này được coi là được đưa vào bằng cách tham khảo trong giấy phép này, nhưng chỉ liên quan đến việc từ chối bảo hành: bất kỳ ngụ ý nào khác rằng những từ chối bảo hành này có thể có là vô hiệu và không ảnh hưởng đến ý nghĩa của giấy phép này.

  3. Sao chép nguyên văn

    Bạn có thể sao chép và phân phối tài liệu theo bất kỳ phương tiện nào, về mặt thương mại hoặc phi thương mại, với điều kiện là giấy phép này, thông báo bản quyền và thông báo giấy phép nói rằng giấy phép này áp dụng cho tài liệu được sao chép trong tất cả các bản sao và bạn không thêm điều kiện nào khác cho những người của giấy phép này. Bạn không được sử dụng các biện pháp kỹ thuật để cản trở hoặc kiểm soát việc đọc hoặc sao chép thêm các bản sao bạn thực hiện hoặc phân phối. Tuy nhiên, bạn có thể chấp nhận bồi thường để trao đổi với các bản sao. Nếu bạn phân phối một số lượng đủ lớn các bản sao, bạn cũng phải tuân theo các điều kiện trong Phần 3.

    Bạn cũng có thể cho vay các bản sao, trong cùng điều kiện đã nêu ở trên và bạn có thể hiển thị công khai các bản sao.

  4. Sao chép với số lượng

    Nếu bạn xuất bản các bản sao in (hoặc bản sao trên phương tiện thường có bìa in) của tài liệu, đánh số hơn 100 và thông báo giấy phép của tài liệu yêu cầu các văn bản bìa, bạn phải gửi lại các bản sao trong bìa, rõ ràng và rõ ràng, tất cả các bản Các văn bản bìa: Các văn bản che phủ phía trước trên bìa trước và các văn bản che phủ ở mặt sau. Cả hai bìa cũng phải xác định rõ ràng và rõ ràng bạn là nhà xuất bản của các bản sao này. Bìa trước phải trình bày tiêu đề đầy đủ với tất cả các từ của tiêu đề nổi bật như nhau và có thể nhìn thấy. Bạn có thể thêm các tài liệu khác trên các bìa ngoài ra. Sao chép với những thay đổi giới hạn ở các bìa, miễn là chúng bảo tồn tiêu đề của tài liệu và đáp ứng các điều kiện này, có thể được coi là sao chép nguyên văn ở các khía cạnh khác.

    Nếu các văn bản cần thiết cho một trong hai bìa quá lớn để phù hợp, bạn nên đặt những văn bản đầu tiên được liệt kê (nhiều như phù hợp một cách hợp lý) trên bìa thực tế và tiếp tục phần còn lại vào các trang liền kề.

    Nếu bạn xuất bản hoặc phân phối các bản sao mờ đục của việc đánh số tài liệu hơn 100, bạn phải bao gồm một bản sao trong suốt có thể đọc được bằng máy cùng với mỗi bản sao mờ hoặc trạng thái trong hoặc với mỗi bản sao mờ một vị trí mạng máy tính mà từ đó mạng chung- Sử dụng công khai có quyền truy cập để tải xuống bằng các giao thức mạng tiêu chuẩn công khai một bản sao hoàn chỉnh của tài liệu, không có tài liệu bổ sung. Nếu bạn sử dụng tùy chọn sau, bạn phải thực hiện các bước thận trọng một cách hợp lý, khi bạn bắt đầu phân phối các bản sao mờ với số lượng, để đảm bảo rằng bản sao trong suốt này sẽ vẫn có thể truy cập được tại vị trí đã nêu cho đến ít nhất một năm sau khi bạn phân phối một Bản sao mờ (trực tiếp hoặc thông qua các đại lý hoặc nhà bán lẻ của bạn) của phiên bản đó cho công chúng.

    Điều này được yêu cầu, nhưng không bắt buộc, bạn liên hệ với các tác giả của tài liệu trước khi phân phối lại bất kỳ số lượng lớn nào, để cho họ cơ hội cung cấp cho bạn một phiên bản cập nhật của tài liệu.

  5. Sửa đổi

    Bạn có thể sao chép và phân phối phiên bản sửa đổi của tài liệu theo các điều kiện của Phần 2 và 3 ở trên, miễn là bạn phát hành phiên bản sửa đổi theo giấy phép này, với phiên bản sửa đổi đảm nhận vai trò của tài liệu, do đó cấp phép phân phối và sửa đổi Phiên bản sửa đổi cho bất cứ ai sở hữu một bản sao của nó. Ngoài ra, bạn phải làm những việc này trong phiên bản sửa đổi:

    1. Sử dụng trong trang tiêu đề (và trên bìa, nếu có) một tiêu đề khác biệt với tài liệu và từ các phiên bản trước (nếu có, nếu có, được liệt kê trong phần Lịch sử của tài liệu). Bạn có thể sử dụng cùng một tiêu đề như phiên bản trước nếu nhà xuất bản gốc của phiên bản đó cho phép.
    2. Liệt kê trên trang tiêu đề, dưới dạng tác giả, một hoặc nhiều người hoặc thực thể chịu trách nhiệm về quyền tác giả của các sửa đổi trong phiên bản sửa đổi, cùng với ít nhất năm trong số các tác giả chính của tài liệu (tất cả các tác giả chính của nó, nếu nó có ít hơn Năm), trừ khi họ giải phóng bạn khỏi yêu cầu này.
    3. Trạng thái trên trang tiêu đề Tên của nhà xuất bản phiên bản sửa đổi, với tư cách là nhà xuất bản.
    4. Bảo tồn tất cả các thông báo bản quyền của tài liệu.
    5. Thêm một thông báo bản quyền thích hợp cho các sửa đổi của bạn liền kề với các thông báo bản quyền khác.
    6. Bao gồm, ngay sau các thông báo bản quyền, thông báo giấy phép cho phép công chúng sử dụng phiên bản sửa đổi theo các điều khoản của giấy phép này, trong biểu mẫu được hiển thị trong phụ lục bên dưới.
    7. Bảo tồn trong thông báo giấy phép đó danh sách đầy đủ các phần bất biến và các văn bản bìa cần thiết được đưa ra trong thông báo giấy phép tài liệu.
    8. Bao gồm một bản sao không thay đổi của giấy phép này.
    9. Bảo tồn phần có tên Lịch sử, bảo tồn tiêu đề của nó và thêm vào đó là một mục nêu ít nhất là tiêu đề, năm, tác giả mới và nhà xuất bản của phiên bản sửa đổi như được đưa ra trên trang tiêu đề. Nếu không có phần nào có tên là Lịch sử, trong tài liệu, hãy tạo một bản ghi tiêu đề, năm, tác giả và nhà xuất bản của tài liệu như được đưa ra trên trang tiêu đề của nó, thì hãy thêm một mục mô tả phiên bản sửa đổi như đã nêu trong câu trước.
    10. Bảo tồn vị trí mạng, nếu có, được đưa ra trong tài liệu để truy cập công khai vào một bản sao minh bạch của tài liệu và tương tự như vậy, các vị trí mạng được cung cấp trong tài liệu cho các phiên bản trước đó dựa trên. Chúng có thể được đặt trong phần Lịch sử của người Viking. Bạn có thể bỏ qua một vị trí mạng cho một tác phẩm được xuất bản ít nhất bốn năm trước chính tài liệu hoặc nếu nhà xuất bản gốc của phiên bản mà nó đề cập đến cho phép.
    11. Đối với bất kỳ phần nào có tựa đề là sự xác nhận của người Viking, hoặc các bản deles, bảo tồn tiêu đề của phần và bảo tồn trong phần tất cả các chất và giai điệu của mỗi người nhận được sự thừa nhận và/hoặc các cống hiến được đưa ra trong đó.
    12. Bảo tồn tất cả các phần bất biến của tài liệu, không thay đổi trong văn bản của họ và trong tiêu đề của họ. Số phần hoặc tương đương không được coi là một phần của tiêu đề phần.
    13. Xóa bất kỳ phần nào có tên là chứng thực của người Viking. Một phần như vậy có thể không được bao gồm trong phiên bản sửa đổi.
    14. Không trả lại bất kỳ phần hiện tại nào có tên là chứng thực của người Hồi giáo hoặc để xung đột trong tiêu đề với bất kỳ phần bất biến nào.
    15. Bảo tồn bất kỳ từ chối trách nhiệm bảo hành.

    Nếu phiên bản sửa đổi bao gồm các phần hoặc các phụ lục mới có đủ điều kiện là phần phụ và không chứa tài liệu nào được sao chép từ tài liệu, bạn có thể chỉ định một số hoặc tất cả các phần này là bất biến. Để làm điều này, hãy thêm các tiêu đề của họ vào danh sách các phần bất biến trong thông báo giấy phép phiên bản sửa đổi. Những tiêu đề này phải khác biệt với bất kỳ tiêu đề phần nào khác.

    Bạn có thể thêm một phần có tựa đề chứng thực trực tuyến, miễn là nó không chứa gì ngoài việc chứng thực phiên bản sửa đổi của bạn bởi các bên khác nhau, ví dụ, các tuyên bố đánh giá ngang hàng hoặc văn bản đã được một tổ chức phê duyệt là định nghĩa có thẩm quyền của một tiêu chuẩn.

    Bạn có thể thêm một đoạn văn lên đến năm từ dưới dạng văn bản bảo hiểm phía trước và đoạn văn lên tới 25 từ dưới dạng văn bản che phủ, đến cuối danh sách các văn bản bìa trong phiên bản sửa đổi. Chỉ có một đoạn văn của văn bản che phủ phía trước và một văn bản che phủ có thể được thêm bằng (hoặc thông qua các sắp xếp được thực hiện bởi) bất kỳ một thực thể nào. Nếu tài liệu đã bao gồm một văn bản bìa cho cùng một bìa, trước đó được thêm bởi bạn hoặc bằng cách sắp xếp được thực hiện bởi cùng một thực thể bạn đang hành động thay mặt, bạn không thể thêm một thực thể khác; Nhưng bạn có thể thay thế cái cũ, với sự cho phép rõ ràng từ nhà xuất bản trước đó đã thêm cái cũ.

    Tác giả và nhà xuất bản của tài liệu không bằng giấy phép này cho phép sử dụng tên của họ để công khai hoặc để khẳng định hoặc ngụ ý chứng thực của bất kỳ phiên bản sửa đổi nào.

  6. Kết hợp tài liệu

    Bạn có thể kết hợp tài liệu với các tài liệu khác được phát hành theo giấy phép này, theo các điều khoản được xác định trong Phần 4 ở trên cho các phiên bản sửa đổi, miễn là bạn bao gồm trong kết hợp tất cả các phần bất biến của tất cả các tài liệu gốc, không được sửa đổi và liệt kê tất cả Là các phần bất biến trong công việc kết hợp của bạn trong thông báo giấy phép của nó và bạn bảo vệ tất cả các từ chối trách nhiệm bảo hành của họ.

    Công việc kết hợp chỉ cần chứa một bản sao của giấy phép này và nhiều phần bất biến giống hệt nhau có thể được thay thế bằng một bản sao. Nếu có nhiều phần bất biến có cùng tên nhưng các nội dung khác nhau, hãy làm cho tiêu đề của từng phần như vậy bằng cách thêm vào cuối của nó, trong ngoặc đơn, tên của tác giả gốc hoặc nhà xuất bản của phần đó nếu được biết, hoặc nếu không số duy nhất. Thực hiện điều chỉnh tương tự cho các tiêu đề trong danh sách các phần bất biến trong thông báo giấy phép của công việc kết hợp.

    Trong sự kết hợp, bạn phải kết hợp bất kỳ phần nào có tên Lịch sử Lịch sử trong các tài liệu gốc khác nhau, hình thành một phần có tên là Lịch sử Lịch sử; Tương tự như vậy, kết hợp bất kỳ phần nào có tên là Acdancledgments, và bất kỳ phần nào có tên là Des Des Des. Bạn phải xóa tất cả các phần có tên là chứng thực.

  7. Bộ sưu tập tài liệu

    Bạn có thể tạo một bộ sưu tập bao gồm tài liệu và các tài liệu khác được phát hành theo giấy phép này và thay thế các bản sao riêng lẻ của giấy phép này trong các tài liệu khác nhau với một bản sao duy nhất được bao gồm trong bộ sưu tập, miễn là bạn tuân theo các quy tắc của giấy phép này cho Sao chép nguyên văn của từng tài liệu trong tất cả các khía cạnh khác.

    Bạn có thể trích xuất một tài liệu duy nhất từ ​​một bộ sưu tập như vậy và phân phối riêng lẻ theo giấy phép này, với điều kiện bạn chèn một bản sao giấy phép này vào tài liệu được trích xuất và làm theo giấy phép này trong tất cả các khía cạnh khác liên quan đến việc sao chép nguyên văn của tài liệu đó.

  8. Tập hợp với các tác phẩm độc lập

    Việc tổng hợp tài liệu hoặc các dẫn xuất của nó với các tài liệu hoặc công trình riêng biệt và độc lập khác, trong hoặc trên một khối lượng của một phương tiện lưu trữ hoặc phân phối, được gọi là tổng hợp của người dùng trong số những người dùng của phần tổng hợp vượt ra ngoài những gì cá nhân làm việc cho phép. Khi tài liệu được bao gồm trong một tổng hợp, giấy phép này không áp dụng cho các tác phẩm khác trong tổng hợp không phải là tác phẩm phái sinh của tài liệu.

    Nếu yêu cầu văn bản bìa của Phần 3 có thể áp dụng cho các bản sao của tài liệu này, thì nếu tài liệu nhỏ hơn một nửa của toàn bộ tổng hợp, các văn bản bìa của tài liệu có thể được đặt trên bìa để khung tài liệu trong tổng hợp hoặc Tương đương điện tử của bìa nếu tài liệu ở dạng điện tử. Nếu không, chúng phải xuất hiện trên bìa in mà khung toàn bộ.

  9. DỊCH

    Dịch được coi là một loại sửa đổi, vì vậy bạn có thể phân phối các bản dịch của tài liệu theo các điều khoản của Phần 4. Thay thế các phần bất biến bằng các bản dịch đòi hỏi sự cho phép đặc biệt từ chủ bản quyền của họ, nhưng bạn có thể bao gồm các bản dịch của một số hoặc tất cả các phần bất biến ngoài Các phiên bản gốc của các phần bất biến này. Bạn có thể bao gồm bản dịch giấy phép này và tất cả các thông báo giấy phép trong tài liệu và bất kỳ từ chối trách nhiệm bảo hành nào, miễn là bạn cũng bao gồm phiên bản tiếng Anh gốc của giấy phép này và các phiên bản gốc của các thông báo và từ chối trách nhiệm đó. Trong trường hợp bất đồng giữa bản dịch và phiên bản gốc của giấy phép này hoặc thông báo hoặc từ chối trách nhiệm, phiên bản gốc sẽ thắng thế.

    Nếu một phần trong tài liệu có tựa đề là Ass Acdyledgments

  10. Chấm dứt

    Bạn không được sao chép, sửa đổi, cấp cao hoặc phân phối tài liệu trừ khi được cung cấp rõ ràng theo giấy phép này. Bất kỳ nỗ lực nào khác để sao chép, sửa đổi, cấp cao hoặc phân phối nó là vô hiệu và sẽ tự động chấm dứt các quyền của bạn theo giấy phép này.

    Tuy nhiên, nếu bạn chấm dứt mọi vi phạm giấy phép này, thì giấy phép của bạn từ một chủ sở hữu bản quyền cụ thể sẽ được khôi phục (a) tạm thời, trừ khi và cho đến khi người giữ bản quyền rõ ràng và cuối cùng chấm dứt giấy phép của bạn và (b) vĩnh viễn, nếu chủ bản quyền thất bại Để thông báo cho bạn về vi phạm bằng một số phương tiện hợp lý trước 60 ngày sau khi chấm dứt.

    Hơn nữa, giấy phép của bạn từ một chủ sở hữu bản quyền cụ thể sẽ được khôi phục vĩnh viễn nếu người giữ bản quyền thông báo cho bạn về vi phạm bằng một số phương tiện hợp lý, đây là lần đầu tiên bạn nhận được thông báo vi phạm giấy phép này (đối với bất kỳ công việc nào) từ chủ sở hữu bản quyền đó, và bạn chữa vi phạm trước 30 ngày sau khi bạn nhận được thông báo.

    Việc chấm dứt các quyền của bạn trong phần này không chấm dứt giấy phép của các bên đã nhận được bản sao hoặc quyền từ bạn theo giấy phép này. Nếu quyền của bạn đã bị chấm dứt và không được phục hồi vĩnh viễn, hãy nhận một bản sao của một số hoặc tất cả các tài liệu giống nhau không cung cấp cho bạn bất kỳ quyền nào để sử dụng nó.

  11. Bản sửa đổi trong tương lai của giấy phép này

    Tổ chức phần mềm miễn phí có thể xuất bản các phiên bản mới, sửa đổi của giấy phép tài liệu miễn phí GNU. Các phiên bản mới như vậy sẽ tương tự về tinh thần với phiên bản hiện tại, nhưng có thể khác nhau về chi tiết để giải quyết các vấn đề hoặc mối quan tâm mới. Xem http://www.gnu.org/copyleft/.

    Mỗi phiên bản của giấy phép được cung cấp một số phiên bản phân biệt. Nếu tài liệu chỉ định rằng một phiên bản được đánh số cụ thể của giấy phép này, hoặc bất kỳ phiên bản nào sau này áp dụng cho nó, bạn có tùy chọn tuân theo các điều khoản và điều kiện trong một phiên bản được chỉ định đó hoặc của bất kỳ phiên bản nào sau này đã được xuất bản (không phải là Dự thảo) bởi Quỹ phần mềm miễn phí. Nếu tài liệu không chỉ định số phiên bản của giấy phép này, bạn có thể chọn bất kỳ phiên bản nào từng được xuất bản (không phải là bản nháp) bởi Quỹ phần mềm miễn phí. Nếu tài liệu chỉ định rằng proxy có thể quyết định phiên bản nào trong tương lai của giấy phép này, thì tuyên bố công khai của proxy, đó là tuyên bố công khai của một phiên bản cho phép bạn chọn phiên bản đó cho tài liệu đó.

  12. Relicensing

    Trang web cộng tác đa dạng lớn của trang web (hoặc trang web MMC) có nghĩa là bất kỳ máy chủ web trên toàn thế giới nào xuất bản các tác phẩm có bản quyền và cũng cung cấp các cơ sở nổi bật cho bất kỳ ai chỉnh sửa các tác phẩm đó. Một wiki công khai mà bất kỳ ai cũng có thể chỉnh sửa là một ví dụ về một máy chủ như vậy. Một sự hợp tác đa dạng lớn của người Viking (hay MMC,) có trong trang web có nghĩa là bất kỳ bộ tác phẩm có bản quyền nào được xuất bản trên trang web MMC.

    CC CC-BY-SA, có nghĩa là Giấy phép Creative Commons Share 3.0 được xuất bản bởi Creative Commons Corporation, một tập đoàn phi lợi nhuận với địa điểm kinh doanh chính ở San Francisco, California, cũng như các phiên bản copyleft trong tương lai của điều đó Giấy phép được xuất bản bởi cùng một tổ chức.

    Kết hợp với các phương tiện để xuất bản hoặc xuất bản lại một tài liệu, toàn bộ hoặc một phần, là một phần của một tài liệu khác.

    Một MMC có đủ điều kiện để di tích, nếu nó được cấp phép theo giấy phép này và nếu tất cả các tác phẩm được xuất bản lần đầu tiên theo giấy phép này ở đâu đó khác ngoài MMC này, và sau đó được kết hợp toàn bộ hoặc một phần vào MMC, (1) Các văn bản bao gồm các phần bất biến và (2) do đó được kết hợp trước ngày 1 tháng 11 năm 2008.

    Nhà điều hành của một trang web MMC có thể xuất bản lại một MMC có trong trang web theo CC-by-SA trên cùng một trang web bất cứ lúc nào trước ngày 1 tháng 8 năm 2009, với điều kiện MMC đủ điều kiện để chuyển tiếp.

Phụ lục: Cách sử dụng giấy phép này cho tài liệu của bạn

Để sử dụng giấy phép này trong một tài liệu bạn đã viết, bao gồm một bản sao của giấy phép trong tài liệu và đặt các thông báo bản quyền và giấy phép sau đây ngay sau trang tiêu đề:

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
0

Nếu bạn có các phần bất biến, văn bản che phủ phía trước và văn bản che phủ, hãy thay thế các văn bản bằng văn bản. Dòng với điều này:

wget -c ftp://sunsite.doc.ic.ac.uk/ls-lR.Z
1

Nếu bạn có các phần bất biến mà không có văn bản bìa, hoặc một số kết hợp khác của ba, hợp nhất hai lựa chọn thay thế đó cho phù hợp với tình huống.

Nếu tài liệu của bạn chứa các ví dụ không cần thiết về mã chương trình, chúng tôi khuyên bạn nên phát hành các ví dụ này song song theo sự lựa chọn của bạn về giấy phép phần mềm miễn phí, chẳng hạn như Giấy phép Công cộng GNU, để cho phép sử dụng phần mềm miễn phí của họ.


Chỉ số khái niệm

Nhảy đến: & nbsp;# & nbsp; . & nbsp; A & nbsp; B & nbsp; C & nbsp; D & NBSP; E & NBSP; F & nbsp; G & NBSP; H & nbsp; I & nbsp; K & nbsp; L & nbsp; M & nbsp; N & NBSP; O & nbsp; P & nbsp; Q & NBSP; R & NBSP; S & NBSP; T & nbsp; U & nbsp; V & nbsp; W & nbsp; X & nbsp;   .  
A   B   C   D   E   F   G   H   I   K   L   M   N   O   P   Q   R   S   T   U   V   W   X  
Mục nhập chỉ mục& nbsp; Tiết diện

#
#wget:& nbsp; Tiết diện

#
#wget:& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện

#
#wget:& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện

#
#wget:& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện

#
#wget:& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp; Tiết diện
#& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Độ dài nội dung, bỏ qua:
Mã hóa nội dung, chọn:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Tùy chọn tải xuống
Người đóng góp:& nbsp;Người đóng góp
Chuyển đổi các liên kết:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Độ dài nội dung, bỏ qua:

Tiếp tục truy xuất:
Tùy chọn tải xuống& nbsp;Người đóng góp:
Người đóng góp& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Người đóng góp
Chuyển đổi các liên kết:& nbsp;Tùy chọn truy xuất đệ quy
bánh quy:& nbsp;Tùy chọn truy xuất đệ quy
bánh quy:& nbsp;Tùy chọn truy xuất đệ quy
bánh quy:& nbsp;Tùy chọn truy xuất đệ quy
bánh quy:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Độ dài nội dung, bỏ qua:

Tiếp tục truy xuất:
Tùy chọn tải xuống& nbsp;Người đóng góp:
Người đóng góp& nbsp;Người đóng góp:
Người đóng góp& nbsp;Chuyển đổi các liên kết:
Tùy chọn truy xuất đệ quy& nbsp;Tùy chọn truy xuất đệ quy
bánh quy:& nbsp;cookie, tải:

cookie, tiết kiệm:
cookie, phiên:& nbsp;Cắt thư mục:
Tùy chọn thư mục& nbsp;D
Gỡ lỗi:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Tùy chọn tải xuống
Người đóng góp:& nbsp;Người đóng góp
Chuyển đổi các liên kết:& nbsp;Tùy chọn truy xuất đệ quy
bánh quy:& nbsp;cookie, tải:
cookie, tiết kiệm:& nbsp;cookie, phiên:
Cắt thư mục:& nbsp;Người đóng góp:
Người đóng góp& nbsp;Tùy chọn tải xuống
Người đóng góp:& nbsp;Tùy chọn tải xuống
Người đóng góp:& nbsp;Người đóng góp
Chuyển đổi các liên kết:& nbsp;Tùy chọn tải xuống

Người đóng góp:
Người đóng góp& nbsp;Tùy chọn tải xuống

Người đóng góp:
Người đóng góp& nbsp;Chuyển đổi các liên kết:
Tùy chọn truy xuất đệ quy& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Người đóng góp:
Người đóng góp& nbsp;Người đóng góp
Chuyển đổi các liên kết:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Tùy chọn HTTP

Mã hóa nội dung, chọn:
Độ dài nội dung, bỏ qua:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Tùy chọn truy xuất đệ quy
bánh quy:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Tùy chọn truy xuất đệ quy
bánh quy:& nbsp;Độ dài nội dung, bỏ qua:
bánh quy:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Tùy chọn tải xuống
Người đóng góp:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Người đóng góp:
Người đóng góp& nbsp;Người đóng góp:
Người đóng góp& nbsp;Chuyển đổi các liên kết:
Tùy chọn truy xuất đệ quy& nbsp;bánh quy:
cookie, tải:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Chuyển đổi các liên kết:
Tùy chọn truy xuất đệ quy& nbsp;Độ dài nội dung, bỏ qua:

Tiếp tục truy xuất:
Tùy chọn tải xuống& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Người đóng góp:

Người đóng góp
Chuyển đổi các liên kết:& nbsp;Tùy chọn truy xuất đệ quy
bánh quy:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Người đóng góp
Chuyển đổi các liên kết:& nbsp;cookie, phiên:
Cắt thư mục:& nbsp;Tùy chọn thư mục
D& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Tùy chọn tải xuống
Người đóng góp:& nbsp;Người đóng góp:

Người đóng góp
Chuyển đổi các liên kết:& nbsp;Tùy chọn thư mục
D& nbsp;Người đóng góp:
Người đóng góp& nbsp;Người đóng góp:
Người đóng góp& nbsp;Chuyển đổi các liên kết:

Tùy chọn truy xuất đệ quy
bánh quy:& nbsp;Tùy chọn truy xuất đệ quy
bánh quy:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;bánh quy:
cookie, tải:& nbsp;Độ dài nội dung, bỏ qua:

Tiếp tục truy xuất:
Tùy chọn tải xuống& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Tùy chọn tải xuống
Người đóng góp:& nbsp;Người đóng góp
Chuyển đổi các liên kết:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Người đóng góp:
Người đóng góp& nbsp;D

Gỡ lỗi:
Tùy chọn tệp ghi nhật ký và đầu vào& nbsp;Người đóng góp
Chuyển đổi các liên kết:& nbsp;Tùy chọn tải xuống
Người đóng góp:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Tùy chọn tải xuống
Người đóng góp:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Người đóng góp:
Người đóng góp& nbsp;Độ dài nội dung, bỏ qua:
Tiếp tục truy xuất:& nbsp;Tùy chọn tải xuống
Người đóng góp:& nbsp;Độ dài nội dung, bỏ qua:
Người đóng góp:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Tùy chọn HTTP
Mã hóa nội dung, chọn:& nbsp;Tùy chọn truy xuất đệ quy
Mật khẩu proxy:& nbsp;Tùy chọn HTTP
Người dùng proxy:& nbsp;Tùy chọn HTTP

Người dùng proxy:
Q.& nbsp;im lặng:
Tùy chọn tệp ghi nhật ký và đầu vào& nbsp;hạn ngạch:

Tùy chọn tải xuống
R& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;R
Chờ ngẫu nhiên:& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;R
Chờ ngẫu nhiên:& nbsp;R
Chờ ngẫu nhiên:& nbsp;Tùy chọn HTTP
Người dùng proxy:& nbsp;Q.
im lặng:& nbsp;Tùy chọn HTTP
Người dùng proxy:& nbsp;Q.
im lặng:& nbsp;Tùy chọn tệp ghi nhật ký và đầu vào
hạn ngạch:& nbsp;Tùy chọn tệp ghi nhật ký và đầu vào
hạn ngạch:& nbsp;Tùy chọn tải xuống
R& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;R
Chờ ngẫu nhiên:& nbsp;Tùy chọn truy xuất đệ quy
Mật khẩu proxy:& nbsp;hạn ngạch:
Mật khẩu proxy:& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;R
Chờ ngẫu nhiên:& nbsp;Tính ngẫu nhiên, chỉ định nguồn của:
Các tùy chọn HTTPS (SSL/TLS)& nbsp;Tính ngẫu nhiên, chỉ định nguồn của:

Các tùy chọn HTTPS (SSL/TLS)
Tỷ lệ, giới hạn:& nbsp;giờ đọc đã kết thúc:
đệ quy:& nbsp;Tùy chọn HTTP
Người dùng proxy:& nbsp;Q.
im lặng:& nbsp;Tính ngẫu nhiên, chỉ định nguồn của:
Các tùy chọn HTTPS (SSL/TLS)& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;Tùy chọn HTTP
Người dùng proxy:& nbsp;Tùy chọn HTTP
Người dùng proxy:& nbsp;Q.
im lặng:& nbsp;Tùy chọn tệp ghi nhật ký và đầu vào
hạn ngạch:& nbsp;im lặng:
Tùy chọn tệp ghi nhật ký và đầu vào& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;R
Chờ ngẫu nhiên:& nbsp;R
Chờ ngẫu nhiên:& nbsp;R
Chờ ngẫu nhiên:& nbsp;R
Chờ ngẫu nhiên:& nbsp;R
Chờ ngẫu nhiên:& nbsp;R
Chờ ngẫu nhiên:& nbsp;R
Chờ ngẫu nhiên:& nbsp;R
Chờ ngẫu nhiên:& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;R
Chờ ngẫu nhiên:& nbsp;R
Chờ ngẫu nhiên:& nbsp;Tùy chọn tệp ghi nhật ký và đầu vào
hạn ngạch:& nbsp;Tùy chọn tệp ghi nhật ký và đầu vào
hạn ngạch:& nbsp;Tùy chọn tải xuống
R& nbsp;Chờ ngẫu nhiên:
Tính ngẫu nhiên, chỉ định nguồn của:& nbsp;Các tùy chọn HTTPS (SSL/TLS)

Tỷ lệ, giới hạn:
giờ đọc đã kết thúc:& nbsp;đệ quy:
Tải xuống đệ quy& nbsp;Tải xuống đệ quy:
Chuyển hướng:& nbsp;chuyển hướng đầu ra:
Sử dụng nâng cao& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;Tải xuống đệ quy:
Chuyển hướng:& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;Tùy chọn HTTP
Người dùng proxy:& nbsp;Tùy chọn tệp ghi nhật ký và đầu vào

hạn ngạch:
Tùy chọn tải xuống& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;Tải xuống đệ quy:
Chuyển hướng:& nbsp;chuyển hướng đầu ra:
Sử dụng nâng cao& nbsp;chuyển hướng đầu ra:
Sử dụng nâng cao& nbsp;chuyển hướng đầu ra:
Sử dụng nâng cao& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;Tùy chọn HTTP

Người dùng proxy:
Q.& nbsp;im lặng:
Tùy chọn tệp ghi nhật ký và đầu vào& nbsp;im lặng:

Tùy chọn tệp ghi nhật ký và đầu vào
hạn ngạch:& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;R
Chờ ngẫu nhiên:& nbsp;Tính ngẫu nhiên, chỉ định nguồn của:
Các tùy chọn HTTPS (SSL/TLS)& nbsp;hạn ngạch:
Tùy chọn tải xuống& nbsp;R
Chờ ngẫu nhiên:& nbsp;Tính ngẫu nhiên, chỉ định nguồn của:
Các tùy chọn HTTPS (SSL/TLS)& nbsp;Tỷ lệ, giới hạn:
giờ đọc đã kết thúc:& nbsp;Các tùy chọn HTTPS (SSL/TLS)
Tỷ lệ, giới hạn:& nbsp;Tùy chọn tệp ghi nhật ký và đầu vào
hạn ngạch:& nbsp;Tùy chọn tệp ghi nhật ký và đầu vào
hạn ngạch:& nbsp;hạn ngạch:

Tùy chọn tải xuống
R& nbsp;im lặng:

Tùy chọn tệp ghi nhật ký và đầu vàohạn ngạch:   .  
A   B   C   D   E   F   G   H   I   K   L   M   N   O   P   Q   R   S   T   U   V   W   X  

Tùy chọn tải xuống