最近看到群里面大家對58同城、趕集網、百姓網等分類信息網的數據需求很大,大家應該是想在起初運營時候用這些信息來充實自己的網站吧,昨天湊空把分類信息的采集和發(fā)布規(guī)則寫出來了,現在分享給大家。
現在各種各樣的采集器非常多,無論是像咱們做分類信息網的站長還是做營銷推廣的從業(yè)者,都看中了58、趕集、百姓,因為這上面都大量的手機號碼,所以58、趕集、百姓等網站的防采集措施也逐漸升級,由最開始的手機號碼圖片化到現在的掃描二維碼才能看到手機號碼,目前,比較好采集的是百姓網,趕集網次之,最難采集的是58同城。
從今天開始陸續(xù)給大家介紹一些采集思路和方法,圖片形式手機號碼、掃碼看手機號等等全部解決。
-------------------------------------------------
今天給大家介紹58同城的數據
58同城類目非常多,大類目里面還有小類目,每個小類目里面還可以進行細分。下面以房產大類目為例給大家介紹數據的采集。
房產類細分表如下:


雖然房產類細分類目很多,但是詳情頁的數據表的表結構字段基本一致。
如:售價、戶型、位置、地址、聯(lián)系人、聯(lián)系方式、住宅類型、裝修程度、房屋類型、建筑建構、建造年代、房屋樓層、產權、朝向、詳細描述、相關圖片。


以房屋展開的表結構字段基本就這些,再回來看看我們框分類系統(tǒng)的mess表,完全能滿足要求,我們要做的就是采集出來這些信息,然后發(fā)布到mess表對應的字段中,這是發(fā)布接口的相關內容,這個我們下次講,今天只介紹采集部分。
此次采集用的軟件是火車頭采集器7.6pojieban,網上都有下載,有錢的可以購買最新版的火車采集器9.3,界面更清爽,功能更強大?;疖嚥杉?/font>-------站長必備
--------------
先寫到這,晚上有時間繼續(xù)更新……