<noframes id="lrbdz"><address id="lrbdz"><listing id="lrbdz"></listing></address>
<address id="lrbdz"><listing id="lrbdz"></listing></address>

  <em id="lrbdz"><form id="lrbdz"><nobr id="lrbdz"></nobr></form></em>

   <em id="lrbdz"><form id="lrbdz"></form></em>

   <address id="lrbdz"></address>
   <noframes id="lrbdz"><listing id="lrbdz"><listing id="lrbdz"></listing></listing>
   5
   新手入門 功能點介紹

   【智能模式】如何設置分頁

   2020-10-16 17:53:23
   瀏覽 52154 次

   摘要:本教程主要給大家介紹在智能模式中如何設置分頁。 免費下載軟件

   在智能模式中,后羿采集器會自動識別分頁,分頁類型通常包括以下幾種:

   (1)分頁按鈕

   (2)滾動加載

   (3)瀑布流分頁(滾動加載)+ 分頁按鈕

   (4)不啟用分頁

   但是偶爾也會發生識別結果錯誤的情況,原因通常包括以下幾種:

   (1)網頁加載速度過慢,軟件自動識別結束之后才出現分頁按鈕

   (2)頁面中存在多個分頁按鈕,軟件最終只會選擇其中的一個

   (3)在滾動加載和分頁按鈕同時存在的情況中,軟件自動滾動多次之后分頁按鈕仍未出現。

   (4)當前頁面中的分頁按鈕軟件暫時未兼容

   分頁設置”的設置菜單如下圖所示。

   針對不同的分頁類型,設置步驟如下:

   (1)分頁按鈕

   i:自動識別分頁:

   點擊“自動識別分頁”選項。

   軟件會自動識別網頁上的分頁按鈕,在識別成功后,頁面會自動滾到分頁按鈕的位置,并且用紅色的底色框進行框選。

   ii:點選分頁按鈕:

   如果軟件無法自動識別出分頁按鈕,則需要手動“點選分頁按鈕”。

   第一步:點擊“點選分頁按鈕”選項

   第二步:點擊頁面中的分頁按鈕

   iii:編輯分頁XPath:

   如果以上兩種情況都無法正確識別分頁,此時需要通過編寫XPath的方式來識別分頁。

   (2)瀑布流分頁(滾動加載):

   適合沒有分頁按鈕,通過滾動來加載內容的網頁。

   (3)瀑布流分頁(滾動加載)+ 分頁按鈕:

   適合一開始沒有分頁按鈕,需要通過滾動網頁多次后才能加載出分頁按鈕的網頁,或者已經顯示了下一頁按鈕,但是當前網頁內容未展示完畢,需要滾動網頁多次后才能顯示當前網頁的全部內容。

   這種分頁類型比較難識別,盡管軟件在自動識別時會嘗試自動滾動,但是這個滾動的次數和當前網頁所需的滾動次數可能不一致,所以這種類型的分頁通常需要加入一些人工操作。

   主要分為以下幾種情況:

   第一種:識別出滾動加載,但是未識別出分頁按鈕

   請手動滾動網頁,直到頁面中出現分頁按鈕,然后選擇分頁設置中的“自動識別分頁”。

   如果自動識別失敗,則選擇“點選分頁按鈕”,然后去頁面中點擊分頁按鈕。

   第二種:識別出分頁按鈕,但是未識別出滾動加載

   這種情況下只需在原有分頁設置基礎上,選擇“瀑布流分頁(滾動加載)”選項即可。

   備注:如果當前網頁不需要滾動加載,而軟件識別出滾動加載,此時不會影響采集結果,但是取消滾動加載選項可以提升采集的速度。

   (4)不啟用分頁

   如果不需要分頁,請選擇“不啟用分頁”。

   備注:是否啟用分頁和當前網頁是否存在分頁按鈕無關,只和你的采集需求有關,不啟用分頁可以縮小采集范圍,提升采集速度。

   分享到:
   批量下載視頻 數據自動整理成excel python爬蟲 批量生成網址 批量下載圖片 正則匹配郵箱 php爬蟲 python數據采集 網頁下載成word 網頁內容關鍵字提取
   關閉
   让少妇最快高潮的方法
   <noframes id="lrbdz"><address id="lrbdz"><listing id="lrbdz"></listing></address>
   <address id="lrbdz"><listing id="lrbdz"></listing></address>

    <em id="lrbdz"><form id="lrbdz"><nobr id="lrbdz"></nobr></form></em>

     <em id="lrbdz"><form id="lrbdz"></form></em>

     <address id="lrbdz"></address>
     <noframes id="lrbdz"><listing id="lrbdz"><listing id="lrbdz"></listing></listing>