日 落
沒提供 (RSS/ATOM) feed 只好每小時打一次網站了 ...
l• ܫ•) Davyキュルッ
就算是 RSS 也是定時打一次ㄚ
日 落
RSS 不是打網頁,是打指定的 XML
l• ܫ•) Davyキュルッ
但還是打了網站不是嗎XD
說穿了 html 也是一種 xml 變體
Ping拼湊湊
記得RSS 類似 Sitemap ,展示部分公開的入口⋯
沒有RSS,那要自己爬呀?
日 落
RSS 是網站擁有者自行建立的文章 (項目) 列表,主要包含標題、連結、時間,其他資料可不提供,所以整個檔案會比網頁還要小很多
RSS 2.0 Specification (Current)
日 落
另因 RSS 有提供時間,所以有一些爬蟲可以估計多久去拉一次資料,畢竟網路流量也是要錢的
l• ܫ•) Davyキュルッ
可以參考一下 etag 吧? 如果有提供的話
日 落
etag 沒有提供文章標題和連結吧?
l• ܫ•) Davyキュルッ
但有時間
日 落
yap
日 落
這樣講一講,其實大概只差在主動提供資料、或被動讓別人找資料
載入新的回覆