日 落
@zeroplex
說
Mon, Oct 9, 2023 12:57 PM
沒提供 (RSS/ATOM) feed 只好每小時打一次網站了 ...
l• ܫ•) Davyキュルッ
@david50407
Mon, Oct 9, 2023 1:59 PM
就算是 RSS 也是定時打一次ㄚ
日 落
@zeroplex
說
Mon, Oct 9, 2023 2:03 PM
RSS 不是打網頁,是打指定的 XML
l• ܫ•) Davyキュルッ
@david50407
Mon, Oct 9, 2023 2:11 PM
但還是打了網站不是嗎XD
說穿了 html 也是一種 xml 變體
Ping拼湊湊
@kkker0527
Mon, Oct 9, 2023 2:27 PM
記得RSS 類似 Sitemap ,展示部分公開的入口⋯
沒有RSS,那要自己爬呀?
日 落
@zeroplex
說
Tue, Oct 10, 2023 12:41 AM
RSS 是網站擁有者自行建立的文章 (項目) 列表,主要包含標題、連結、時間,其他資料可不提供,所以整個檔案會比網頁還要小很多
RSS 2.0 Specification (Current)
日 落
@zeroplex
說
Tue, Oct 10, 2023 12:42 AM
另因 RSS 有提供時間,所以有一些爬蟲可以估計多久去拉一次資料,畢竟網路流量也是要錢的
l• ܫ•) Davyキュルッ
@david50407
Tue, Oct 10, 2023 12:46 AM
可以參考一下 etag 吧? 如果有提供的話
日 落
@zeroplex
說
Tue, Oct 10, 2023 12:50 AM
etag 沒有提供文章標題和連結吧?
l• ܫ•) Davyキュルッ
@david50407
Tue, Oct 10, 2023 12:54 AM
但有時間
日 落
@zeroplex
說
Tue, Oct 10, 2023 12:54 AM
yap
日 落
@zeroplex
說
Tue, Oct 10, 2023 12:56 AM
這樣講一講,其實大概只差在主動提供資料、或被動讓別人找資料
載入新的回覆
說穿了 html 也是一種 xml 變體
沒有RSS,那要自己爬呀?
RSS 2.0 Specification (Current)