<noframes id="lrbdz"><address id="lrbdz"><listing id="lrbdz"></listing></address>
<address id="lrbdz"><listing id="lrbdz"></listing></address>

    <em id="lrbdz"><form id="lrbdz"><nobr id="lrbdz"></nobr></form></em>

      <em id="lrbdz"><form id="lrbdz"></form></em>

      <address id="lrbdz"></address>
      <noframes id="lrbdz"><listing id="lrbdz"><listing id="lrbdz"></listing></listing>
      5
      新手入門 功能點介紹

      【智能模式】【流程圖模式】如何設置文件下載

      2021-12-21 19:16:18
      瀏覽 57906 次

      摘要:本教程介紹了如何設置文件下載功能 免費下載軟件

      后羿采集器支持在采集的過程中下載文件,文件類型包括:圖片、音頻、視頻、文檔、其他文件,啟用文件下載功能的位置如下圖所示:

      需要注意的是,此處的設置只是針對文件下載功能的開啟,所有的文件下載都需要在采集字段中設置對應的下載鏈接,無法獲取下載鏈接的文件不支持下載。

      在下載文件時,軟件支持對文件下載路徑進行修改,你可以按照下圖進行設置:

      在下載文件時,軟件支持按照一定的規則創建獨立的文件夾用來存放文件,規則包括按照文件類型、采集日期、任務名稱或者按照字段值給文件夾命名,如下圖所示:

      在下載文件時,軟件支持按照一定的規則重命名下載的文件,規則包括按照原文件名、文件md5值、任務名稱_編號、采集日期_編號、編號、自定義和字段值給下載文件命名,如下圖所示:

      當選擇自定義規則時,可以對不同的固定規則進行組合,從而創建出所需的命名規則,如下圖所示:

      當遇到同名文件時,用戶可以按照以下三種方式進行選擇:

      文件下載可以分為三種類型,第一種是直接點擊下載鏈接下載文件,第二種是通過點擊下載按鈕下載文件,第三種是通過數據處理生成下載鏈接。

      第一種類型:點擊下載鏈接下載文件

      1、圖片

      支持圖片的格式包括jpg、png、gif、jpeg、bmp、eps、psd等主流圖片格式。當我們需要下載圖片時,請勾選圖片選項,如下圖所示:

      下載圖片有以下三種情況:

      (1)下載列表頁的圖片

      (2)下載詳情頁的圖片

      接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這三種情況。

      (1)下載列表頁的圖片

      第一步:點擊添加字段,然后點擊列表中的圖片

      第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

      具體如下動圖所示:

      如果下載列表頁圖片時出現圖片顯示不完整,或者下載后的圖片非常小,或者圖片無法打開,那是因為采集時圖片未完全加載顯示出來,此時可以選擇設置一個更大的請求等待時間,或者在防屏蔽中勾選逐行滾動選項,如下圖所示:

      (2)下載詳情頁的圖片

      如果當前網頁可以通過點擊選中全部想要采集的內容,請按照以下步驟處理:

      第一步:點擊添加字段,然后點擊頁面內容,確保選中內容包含了所有的圖片

      第二步:右擊字段,設置取值屬性為“提取外部HTML”

      如果當前網頁無法通過點擊選中全部想要采集的內容,請按照以下步驟處理:

      第一步:選擇圖片最全的詳情頁作為深入采集的鏈接,然后點擊添加多個字段,分別對應需要采集的圖片

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      如果以上方法無法解決你的需求,請按照以下步驟處理:

      第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中包含所有圖片的內容

      第二步:右擊字段,設置取值屬性為“提取外部HTML”

      補充:在下載詳情頁圖片時,如果圖片需要滾動頁面才能顯示出來,此時需要在詳情頁加一個滾動操作。

      在智能模式中,請在詳情頁點擊右上角預執行腳本按鈕,然后在預執行腳本窗口中進行如下設置:

      在流程圖模式中,請直接拖動一個滾動組件放到點擊打開詳情頁的點擊組件之后,具體設置如下所示:

      2、音頻

      支持音頻圖片的格式包括mp3、amr、wav、m4a等主流音頻格式。當我們需要下載音頻時,請勾選音頻選項,如下圖所示。?

      下載音頻有以下兩種情況:

      (1)下載列表頁的音頻

      (2)下載詳情頁的音頻

      接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這兩種情況。

      (1)下載列表頁的音頻

      如果可以通過點擊獲取音頻下載鏈接,請按照以下步驟進行操作:

      第一步:點擊添加字段,然后點擊列表中的音頻下載鏈接

      第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

      如果以上方法無法解決你的需求,請按照以下步驟處理:

      第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中音頻下載鏈接

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      (2)下載詳情頁的音頻

      第一步:點擊添加字段,然后點擊詳情頁中的音頻下載鏈接

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      如果以上方法無法解決你的需求,請按照以下步驟處理:

      第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中音頻下載鏈接

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      3、視頻

      支持音頻圖片的格式包括mp4、avi、mov、3gp、flv等主流視頻格式。當我們需要下載視頻時,請勾選視頻選項,如下圖所示。

      下載視頻有以下兩種情況:

      (1)下載列表頁的視頻

      (2)下載詳情頁的視頻

      接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這兩種情況。

      (1)下載列表頁的視頻

      如果可以通過點擊獲取視頻下載鏈接,請按照以下步驟進行操作:

      第一步:點擊添加字段,然后點擊列表中的視頻下載鏈接

      第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

      如果以上方法無法解決你的需求,請按照以下步驟處理:

      第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中視頻下載鏈接

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      (2)下載詳情頁的視頻

      第一步:點擊添加字段,然后點擊詳情頁中的視頻下載鏈接

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      如果以上方法無法解決你的需求,請按照以下步驟處理:

      第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中視頻下載鏈接

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      4、文檔

      支持文檔的格式包括doc(x)、ppt(x)、xls(x)、pdf、snb、txt等主流文檔格式。當我們需要下載文檔時,請勾選文檔選項,如下圖所示。

      下載文檔有以下兩種情況:

      (1)下載列表頁的文檔

      (2)下載詳情頁的文檔

      接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這兩種情況。

      (1)下載列表頁的文檔

      如果可以通過點擊獲取文檔下載鏈接,請按照以下步驟進行操作:

      第一步:點擊添加字段,然后點擊列表中的文檔下載鏈接

      第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

      如果以上方法無法解決你的需求,請按照以下步驟處理:

      第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中文檔下載鏈接

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      (2)下載詳情頁的文檔

      第一步:點擊添加字段,然后點擊詳情頁中的文檔下載鏈接

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      如果以上方法無法解決你的需求,請按照以下步驟處理:

      第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中文檔下載鏈接

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      5、其他文件

      支持其他文件的格式包括apk、exe、rar、zip、gzip、dmg、torrent、epub等主流文件格式。當我們需要下載這些文件時,請勾選其他文件選項,如下圖所示。

      下載其他文件有以下兩種情況:

      (1)下載列表頁的文件

      (2)下載詳情頁的文件

      接下來我們以智能模式為例(流程圖模式的操作與此相同)分別介紹一下這兩種情況。

      (1)下載列表頁的文件

      如果可以通過點擊獲取文件下載鏈接,請按照以下步驟進行操作:

      第一步:點擊添加字段,然后點擊列表中的文件下載鏈接

      第二步:右擊設置該字段,設置取值屬性為“提取圖片等媒體地址”

      如果以上方法無法解決你的需求,請按照以下步驟處理:

      第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中文件下載鏈接

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      (2)下載詳情頁的文檔

      第一步:點擊添加字段,然后點擊詳情頁中的文件下載鏈接

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      如果以上方法無法解決你的需求,請按照以下步驟處理:

      第一步:點擊添加字段,然后右擊字段,選擇“編輯字段Xpath”,通過手動改寫Xpath來選中文件下載鏈接

      第二步:右擊字段,設置取值屬性為“提取圖片等媒體地址”

      第二種類型:點擊下載按鈕下載文件

      針對第二種類型,所有的文件類型設置方式相同,具體步驟如下:

      第一步:點擊添加字段,然后點擊下載按鈕

      第二步:右擊字段,設置取值屬性為“下載按鈕”

      在開啟下載的設置部分,勾選對應的文件選項即可,具體方法請參考上文第一種類型的下載設置。

      第三種類型:通過數據處理生成下載鏈接

      針對第三種類型,在進行下載鏈接的數據處理之后,需要再添加一個數據處理步驟,如下圖所示:

      在開啟下載的設置部分,勾選對應的文件選項即可,具體方法請參考上文第一種類型的下載設置。

       

      分享到:
      網頁下載成word 正則匹配郵箱 批量下載圖片 網頁內容關鍵字提取 python數據采集 批量下載視頻 python爬蟲 數據自動整理成excel 批量生成網址 php爬蟲
      關閉
      让少妇最快高潮的方法
      <noframes id="lrbdz"><address id="lrbdz"><listing id="lrbdz"></listing></address>
      <address id="lrbdz"><listing id="lrbdz"></listing></address>

        <em id="lrbdz"><form id="lrbdz"><nobr id="lrbdz"></nobr></form></em>

          <em id="lrbdz"><form id="lrbdz"></form></em>

          <address id="lrbdz"></address>
          <noframes id="lrbdz"><listing id="lrbdz"><listing id="lrbdz"></listing></listing>