Linux:wget 命令学习

wget 下载大文件的时候,需要放在后台运行
更新于: 2022-06-16 23:33:02

背景

今天在自己的服务器上使用wget下载一个大文件时,不小心把ssh断开连接了,重新登上去后想查看这个文件的下载进度,现记录一些 wget 的知识点。

先预览干货

下面一堆废话,说的就是以下 N条命令

更细节的问题,可以直接看后面的参考链接

# 启动下载,并扔到后台,会生成 wget-log
wget URL &
# 查看进度
tail -f ./wget-log
# 查找 pid
ps aux | grep wget
# 重命令
$ wget -c https://gist.github.com/chales/11359952/archive/25f48802442b7986070036d214a2a37b8486282d.zip -O db-connection-test.zip

后台下载

网上很多资料提示用这个: wget -b URL

wget https://gmgc.embl.de/genome_bin_fasta.cgi?tax=8&q=low-quality &
.
|-- genome_bin_fasta.cgi?tax=8
`-- wget-log

查看进度

是动态变化的哦~

$ tail -f wget-log 
--2022-01-19 17:44:53--  https://gmgc.embl.de/genome_bin_fasta.cgi?tax=8
Resolving gmgc.embl.de (gmgc.embl.de)... 194.94.45.211
Connecting to gmgc.embl.de (gmgc.embl.de)|194.94.45.211|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/plain]
Saving to: 'genome_bin_fasta.cgi?tax=8'

  genome_bin_fasta.     [          <=>       ] 252.56M  3.04MB/s               

在进程中查找 pid

如果你想结束,可以用此命令

$ ps aux | grep wget
root     1921237  4.0  0.0  16508 11868 pts/0    S    17:44   0:11 wget https://gmgc.embl.de/genome_bin_fasta.cgi?tax=8
root     1927855  0.0  0.0   3128   796 pts/0    S+   17:49   0:00 grep --color=auto wget

离线一个网站

wget -m -k -K -E -bqc https://www.demo.com/

参考