<noframes id="lrbdz"><address id="lrbdz"><listing id="lrbdz"></listing></address>
<address id="lrbdz"><listing id="lrbdz"></listing></address>

    <em id="lrbdz"><form id="lrbdz"><nobr id="lrbdz"></nobr></form></em>

      <em id="lrbdz"><form id="lrbdz"></form></em>

      <address id="lrbdz"></address>
      <noframes id="lrbdz"><listing id="lrbdz"><listing id="lrbdz"></listing></listing>
      5
      新手入門 功能點介紹

      【流程圖模式】如何對采集字段進行配置

      2019-12-24 20:04:28
      瀏覽 9159 次

      摘要:本教程主要介紹了流程圖模式下提取數據組件的功能點及應用場景。 免費下載軟件

      在流程圖模式下,提取數據組件會將用戶需要的數據提取出來,用戶可以在這個組件內對采集字段進行設置。提取數據用于提取采集網頁中的數據,該組件既可以單獨使用也可以和循環組件或者判斷組件搭配使用。單獨使用時適合提取單頁上的數據,搭配使用時,適合提取所有頁面上的數據。

      具體設置介紹如下:

      1、修改字段名稱

      2、合并字段

      合并字段有兩種辦法,一種是點擊一條需要合并的字段,右擊選擇“合并字段”,然后在頁面中選擇需要合并的字段,這種方式適合兩個字段的合并。在合并字段中,用戶可以設置兩個字段內容之間的分隔符,如果不需要分隔符,在分隔符部分直接設置為空白就好。

      另外一種方法是按crtl或shift選中多個字段,然后右擊“合并字段”,這種方法適合多個字段的合并。

      3、在頁面中選擇

      如果要修改字段中提取的內容,或者在添加新字段時進行提取對象的設置,可以點擊“在頁面中選擇”或者字段上的瞄準器圖標,然后在網頁中點擊需要的數據。

      4、編輯字段Xpath

      Xpath一種路徑查詢語言,簡單的說就是利用一個路徑表達式找到我們需要的數據在網頁中的位置。有編程基礎的用戶可以使用此功能進行采集對象的定位。

      5、設置取值屬性

      不同的數據需要設置不同的取值屬性,在設置新字段的時候,字段的取值默認的是文本字段,一般情況下,在用戶選取新數據時,軟件會自動幫你判斷好字段屬性,不需要另外設置,但如果出現判斷失誤的情況下,我們可以自己設置字段的取值屬性。

      提取文本:適合普通的文本數據

      提取內部HTML:適合提取不包括內容自身的HTML

      提取外部HTML:適合提取包括內容自身的HTML

      提取鏈接地址:適合提取鏈接的數據

      提取圖片等媒體地址:適合提取圖片等媒體資源

      提取輸入框內容:適合提取輸入框的文字,多用于關鍵詞采集時使用

      下載按鈕:用于提取下載地址

      6、識別格式選擇

      在進行圖像識別時,通常軟件會自動檢測到識別格式,如果有些內容未識別到或者識別結果不正確,我們可以手動選擇識別格式。需要注意的是,圖像識別功能為企業版功能。

      7、數據處理

      如果需要對所提取的字段內容進行處理,比如只需要字段里的數字、郵箱、文本替換、清除首尾的空白字符等,可以點擊“數據處理”進行字段處理。

      8、設置特殊字段

      在數據采集過程中,如果需要采集一些特殊字段,如采集時的時間、當前網頁標題、當前網頁URL等,這些字段無法直接在網頁中提取,那么可以使用“改為特殊字段”功能進行字段設置,通常我們會新建字段,然后把字段改為特殊字段,我們也可以直接把其他字段改為特殊字段。

      9、刪除字段

      10、清空所有

      如果不需要軟件自動識別出來的字段,可以使用“清空所有”功能清空字段,重新設置需要的字段。

      11、添加字段

      如果要增加新字段,我們可以點擊“添加字段”按鈕新增字段,然后到頁面中點擊需要采集的數據。

      也可以直接在頁面中點擊要采集的內容,然后點擊提示中的提取數據選項。(下圖為在詳情頁中提取數據示例)

       

      分享到:
      網頁下載成word python數據采集 php爬蟲 批量生成網址 正則匹配郵箱 批量下載圖片 python爬蟲 批量下載視頻 網頁內容關鍵字提取 數據自動整理成excel
      關閉
      让少妇最快高潮的方法
      <noframes id="lrbdz"><address id="lrbdz"><listing id="lrbdz"></listing></address>
      <address id="lrbdz"><listing id="lrbdz"></listing></address>

        <em id="lrbdz"><form id="lrbdz"><nobr id="lrbdz"></nobr></form></em>

          <em id="lrbdz"><form id="lrbdz"></form></em>

          <address id="lrbdz"></address>
          <noframes id="lrbdz"><listing id="lrbdz"><listing id="lrbdz"></listing></listing>