關於 PHP, Linux, Open Source 及個人生活記載的網誌。
RSS icon
  • 在 Linux 建立 Web Spider

    Posted on November 15th, 2006 Sam Tang No comments

    Wep Spider 是一個自動瀏覽網頁的程式,它會將網頁內 HTML 及 Javascript 等內容過濾,並將有意義的內容收集及整理。而搜尋引擎就是 web spider 來收集網頁內容,及在網頁上讀取網頁上的連結,從而找到新網頁。

    要建立一個在 Linux 下的 web spider 收隻網路上的內容,可以用 php, perl, python, ruby 等語言來做,這篇文章 介紹如何建立一個 web spider,只要會一點 programming 及 Linux 操作也可跟著完成。

    Build a Web spider on Linux


    Leave a reply

    *
    To prove you're a person (not a spam script), type the security word shown in the picture. Click on the picture to hear an audio file of the word.
    Click to hear an audio file of the anti-spam word