最近看到群里面大家對58同城、趕集網(wǎng)、百姓網(wǎng)等分類信息網(wǎng)的數(shù)據(jù)需求很大,大家應(yīng)該是想在起初運營時候用這些信息來充實自己的網(wǎng)站吧,昨天湊空把分類信息的采集和發(fā)布規(guī)則寫出來了,現(xiàn)在分享給大家。
現(xiàn)在各種各樣的采集器非常多,無論是像咱們做分類信息網(wǎng)的站長還是做營銷推廣的從業(yè)者,都看中了58、趕集、百姓,因為這上面都大量的手機號碼,所以58、趕集、百姓等網(wǎng)站的防采集措施也逐漸升級,由最開始的手機號碼圖片化到現(xiàn)在的掃描二維碼才能看到手機號碼,目前,比較好采集的是百姓網(wǎng),趕集網(wǎng)次之,最難采集的是58同城。
從今天開始陸續(xù)給大家介紹一些采集思路和方法,圖片形式手機號碼、掃碼看手機號等等全部解決。
-------------------------------------------------
今天給大家介紹58同城的數(shù)據(jù)
58同城類目非常多,大類目里面還有小類目,每個小類目里面還可以進行細(xì)分。下面以房產(chǎn)大類目為例給大家介紹數(shù)據(jù)的采集。
房產(chǎn)類細(xì)分表如下:


雖然房產(chǎn)類細(xì)分類目很多,但是詳情頁的數(shù)據(jù)表的表結(jié)構(gòu)字段基本一致。
如:售價、戶型、位置、地址、聯(lián)系人、聯(lián)系方式、住宅類型、裝修程度、房屋類型、建筑建構(gòu)、建造年代、房屋樓層、產(chǎn)權(quán)、朝向、詳細(xì)描述、相關(guān)圖片。


以房屋展開的表結(jié)構(gòu)字段基本就這些,再回來看看我們框分類系統(tǒng)的mess表,完全能滿足要求,我們要做的就是采集出來這些信息,然后發(fā)布到mess表對應(yīng)的字段中,這是發(fā)布接口的相關(guān)內(nèi)容,這個我們下次講,今天只介紹采集部分。
此次采集用的軟件是火車頭采集器7.6pojieban,網(wǎng)上都有下載,有錢的可以購買最新版的火車采集器9.3,界面更清爽,功能更強大?;疖嚥杉?/font>-------站長必備
--------------
先寫到這,晚上有時間繼續(xù)更新……