系統之家 - 系統光盤下載網站!

  • 軟件介紹
  • 軟件教程
  • 人氣下載
  • 下載地址
  • 網友評論

  火車采集器是一款功能非常強大的數據采集器,它完美支持采集所有編碼格式的網頁,程序還可以自動識別網頁編碼,還支持目前所有主流和非主流的CMS,BBS等網站程序,通過系統的發布模塊能實現采集器和網站程序間的完美結合。

火車采集器

功能介紹

  1、通用性強

  無論新聞、論壇、視頻、黃頁、圖片、下載類網站,只要通過瀏覽器能看到的結構化的內容,通過指定匹配規則,都能采集到您所需要的內容。

  2、穩定、高效

  五年磨一劍,軟件不斷更新進步,采集速度快,性能穩定,占用資源少。

  3、擴展性強、適用范圍廣

  自定義web發布,自定義主流的數據庫的保存和發布,自定義本地php及。net外部編程接口處理數據,讓數據都能為你所用。

  4、支持所有網站編碼

  完美支持采集所有編碼格式的網頁,程序還可以自動識別網頁編碼。

  5、多種發布方式

  支持目前所有主流和非主流的CMS,BBS等網站程序,通過系統的發布模塊能實現采集器和網站程序間的完美結合。

  6、全自動

  無人值守工作,配置好程序后,程序將依據您的設置自動運行,完全無需人工干預。

  7、本地編輯

  本地可視化編輯已采集的數據。

  8、采集測試

  這是其它任何同類采集軟件所不能比的,程序支持直接查看采集結果并測試發布。

  9、管理方便

  使用站點+任務方式管理采集節點,任務支持批量操作,再多的數據管理也很輕松。

軟件特色

  1、規則自定義

  通過采集規則的定義,可以搜索所有網站采集幾乎任何類型的信息。

  2、多任務,多線程

  可以同時進行多個信息采集任務,每個任務可以使用多個線程。

  3、所見即所得

  任務采集過程所見即所得,過程中遍歷的鏈接信息、采集信息、錯誤信息等都會及時的反映在軟件界面中。

  4、數據保存

  數據邊采集邊自動保存到關系數據庫中,并且數據結構能夠自動適應,軟件可以根據采集規則自動創建數據庫,以及其中的表和字段,也可以通過導庫方式靈活的將數據保存到客戶已有的數據庫結構中。

  5、斷點續采

  信息采集任務可以在停止后從斷點開始繼續采集,從此你用不再擔心你的采集任務意外中斷了。

  6、網站登錄

  支持網站Cookie,支持網站可視化登錄,即使登錄時需要驗證碼的網站也能采集。

  7、計劃任務

  通過這個功能可以讓你的采集任務定時、定量或者一直循環執行。

  8、采集范圍限制

  可以根據采集的深度和網址的標識來限制采集的范圍。

  9、文件下載

  可以將采集到的二進制文件(諸如:圖片、音樂、軟件、文檔等等)下載到本地磁盤或者采集結果數據庫中。

  10、結果替換

  可以將采集的結果根據規則替換成你定義的內容。

  11、條件保存

  可以根據某個條件來決定那些信息保存,那些信息過濾。

  12、過濾重復內容

  軟件可根據用戶設置和實際情況對重復內容和重復網址自動刪除重復內容。

  13、特殊鏈接識別

  運用此功能可以將用JavaScript動態生成的鏈接或其他更古怪的連接識別出來。

  14、數據發布

  可以通過自定義接口,將已采集的結果數據發布到任意的內容管理系統和指定數據庫中,F在已支持的目標發布媒體包括:數據庫(access, sql server,my sql,oracle) ,靜態htm文件。

  15、預留編程接口

  定義多個編程接口,用戶可以在事件中利用PHP,C#語言進行編程,擴充采集功能。

菜單功能

  1、新建分組

  新建一個任務分組,選擇所屬分組,確定分組名稱和備注。

  2、新建任務

  確定所屬分組,新建一個任務,填寫任務名稱并保存。

  3、Web發布配置

  Web發布配置定義了如何登陸一個網站以及向該網站提交數據。

  主要涉及到登錄信息的獲取,網站編碼設定,欄目列表的獲取,以及使用數據測試發布效果。

  4、Web發布模塊

  可以定義網站登錄,獲取欄目列表,獲取網頁隨機值,內容發布參數,以及上傳文件,構造發布數據等高級功能。

  5、數據庫發布配置

  數據庫發布配置定義了數據庫鏈接信息的設置以及數據庫模塊的選擇。

  6、數據庫發布模塊

  用于編輯數據庫的發布模塊,方便我們將數據發布到配置好的數據庫中。

  火車采集器可選mysql、sqlserver、oracle、access四種數據庫類型,在文本輸入框中填寫sql語句

 。ㄐ栌袛祿䦷煜嚓P知識),并可使用標簽替換相應數據。也可在采集器模塊文件夾中加載某一模塊進行編輯。

  7、計劃任務

  設置列表中采集任務的啟動計劃,可每間隔、每天、每周、僅一次、或自定義Cron表達式,

 。–ron表達式的寫法可參考相關術語中的介紹)。保存設置后,任務即可按照設置執行。

  8、插件管理

  插件是可以用來擴展火車采集器功能的程序

  火車采集器V9支持PHP源碼、C#源碼、C#類庫三種類型的插件,

  可用于擴展http請求、內容處理和文件下載的功能,并可以分別進行測試。

  9、http二級代理

  網絡中的服務器,可以讓網絡用戶去取得所需要的網絡信息。

  代理的功能有可以突破自身ip的訪問限制訪問國外站點,訪問一些單位或團體內部資源,

  突破電信的ip封鎖和隱藏真實的ip等。

  火車采集器V9支持http代理、socket4和socket5代理。

  10、http模擬請求

  可以設置如何發起一個http請求,包括設置請求信息,返回頭信息。并具有自動提交的功能。

更新日志

  1、新增數據庫導入where條件篩選設置功能。

  2、日志打印相關問題修復。

  3、下載問題修復。

  4、發布模塊請求頭相關問題修復。

  5、列表頁標簽相關問題修復。

  6、發布最大超時時間增加。

  7、已生成的網址庫修改后則下次不顯示問題修復。

  8、未能分析主機名修復。

  9、其他已知問題修復。

人氣下載

更多+

最新軟件

專題推薦

火車采集器正在下載,用戶還下載了

關閉

火車采集器正在下載,用戶還下載了

關閉
幸运28评测论坛