5_wget

lyysharedblogs / 2023-08-01 / 原文

wget相关命令用法

  1. wget是一个GNU命令行实用程序,用于从FTP服务器的HTTP、HTTPS下载文件。该命令提供了许多选项,允许用户下载多个文件、恢复下载、限制宽带,镜像网站等。

    如果想将下载后的文件保存到特定的目录dest,使用-P选项:

      mkdir dest
    
      wget -P dest/ 链接
    

    如果想限制网速,使用--limit-rate选项:

      wget --limit-rate=100k -P dest/ 链接
    

    如果想要恢复中断的文件下载,使用-c选项:

      wget -c -P dest/ 链接
    

    如果想要一次下载多个文件,可以使用-i选项和一个包含多个url的文本文件。

    例如,从网上一次下载两个图片:

      vim images.txt
    

    vim编辑文本内容为两张图片的url:

    https://upload-images.jianshu.io/upload_images/5809200-a99419bb94924e6d.jpg?imageMogr2/auto-orient/strip|imageView2/2/w/1240
    https://upload-images.jianshu.io/upload_images/5809200-736bc3917fe92142.jpg?imageMogr2/auto-orient/strip|imageView2/2/w/1240

      wget -i images.txt
    

    如果你想在后台下载一些大型文件,比如.iso文件,请使用-b选项。

      nohup wget -b -c -P dest/ link.iso # 前缀nohup后,在关闭终端时,wget进程将继续在后台运行
    

    output will be written to 'wget-log'

    如果想查询下载状态,可使用tail -f wget-log检查下载状态

    如果你想创建一个可以查看的网站站点的离线副本(镜像网站):

      wget --mirror --convert-links --adjust-extension --page-reguisites --noparent http://example.arg
    

    --mirror 使下载递归化。
    --convert-links 转换链接,会将所有链接(包括css样式表)转换为相对路径,适合离线观看。
    --adjust-extension 将会为文件名添加合适的扩展名,例如html和css,具体取决于它们的文件内容。
    --page-reguisites还会下载css样式表和图像内容以正确显示离线页面。
    --no-parent 不要上升到父目录。

    也可以用缩略版命令

      wget -mkEpnp http://example.arg