一.前語(yǔ)
本文比較適用與中大型網(wǎng)站的SEO人員,小網(wǎng)站也能夠參閱。
意圖在于討論一種發(fā)掘網(wǎng)站的內(nèi)容潛力,把網(wǎng)站中用戶(hù)可能會(huì)關(guān)懷的內(nèi)容出現(xiàn)給用戶(hù),滿意其需求,獲取相應(yīng)的SEO流量。
許多大型網(wǎng)站都在用的一種方法,可是很少有人出來(lái)詳詳細(xì)細(xì)的解說(shuō)。
這樣的SEO流量是怎么取得的,下面舉一個(gè)通俗易懂的比方。
假定我在百度上查找“iOS 英雄無(wú)敵3”,意圖是找一個(gè)能在iOS下運(yùn)行的英雄無(wú)敵3這個(gè)游戲。
事實(shí)上這個(gè)游戲并不存在。因而壓根不存在一個(gè)頁(yè)面能夠讓我找到我想要的內(nèi)容(如果有也是標(biāo)題黨)
所以我進(jìn)入了tgbus的這個(gè)關(guān)于iOS 英雄無(wú)敵3的頁(yè)面。
我在這個(gè)頁(yè)面上找到了iOS上的英雄無(wú)敵2這個(gè)游戲以及其他相似英雄無(wú)敵3的iOS游戲,以及一些奇奇怪怪的新聞(ok,這個(gè)頁(yè)面做得并不是很簡(jiǎn)略閱覽)
Finall,我在tgbus上下載了英雄無(wú)敵2的iOS版別試試。
OK,我們?cè)贀Q個(gè)實(shí)際生活中比方:
一個(gè)姑娘去買(mǎi)衣服,所以看上一條粉紅色的連衣裙,可是沒(méi)她要的尺碼。
這時(shí)分營(yíng)業(yè)員會(huì)怎么做,沒(méi)錯(cuò),引薦一些相似色彩or樣式的連衣裙,而且有碼。
(TGBUS好像引薦出了一條牛仔褲。)
SO,我們應(yīng)該怎么去找出用戶(hù)想要的連衣裙和我們庫(kù)房中有的連衣裙,而且在最恰當(dāng)?shù)臅r(shí)分給用戶(hù)最好的成果,還能獲取到SEO流量,這并不是一件很簡(jiǎn)略的作業(yè)。
Wait,這不是就一個(gè)引薦引擎么?這么雜亂的玩意交給工程師做就行了。事實(shí)上大都時(shí)分,這僅僅SEO們一廂情愿的東西,工程師才不會(huì)來(lái)鳥(niǎo)你什么引薦引擎,我們先從一個(gè)可執(zhí)行的視點(diǎn),自給自足來(lái)把這個(gè)SEO方法施行下去。
二.內(nèi)容剖析,關(guān)鍵詞剖析,數(shù)據(jù)接口規(guī)劃
一個(gè)SEO知道自己網(wǎng)站有多少內(nèi)容很重要,常常遇到和人說(shuō):“你網(wǎng)站這個(gè)XX頁(yè)面有問(wèn)題” “啊?這是什么頁(yè)面啊,我從來(lái)沒(méi)見(jiàn)過(guò)。”
一般一個(gè)網(wǎng)站垂直去分,有主頁(yè),內(nèi)容頁(yè),列表頁(yè)。
內(nèi)容頁(yè)中,又可能分圖片頁(yè),談?wù)擁?yè),文章分頁(yè)等等
列表頁(yè)中,又可能分頻道頁(yè),產(chǎn)品列表頁(yè),索引頁(yè),專(zhuān)題頁(yè)等等。
一般一套頁(yè)面臨應(yīng)一套乃至多套php模板。
需求弄清楚這些模板是否在一個(gè)架構(gòu)內(nèi),是否公用數(shù)據(jù)庫(kù),頁(yè)面上使用了哪些字段,最好能夠找到對(duì)應(yīng)模板的開(kāi)發(fā)人,如果有條件申請(qǐng)到源代碼檢查權(quán)限,能夠自己看一下。一個(gè)內(nèi)容聚合的需求可完成度很大程度上取決于上面這些內(nèi)容,先弄清楚把配料都弄齊全了,再開(kāi)端做菜,不然巧婦難為無(wú)米之炊。
橫向去分可能是更多往business方向考慮,比方有我們有賣(mài)線路的,賣(mài)門(mén)票的,賣(mài)酒店的,攻略,用戶(hù)圖片,論壇帖子等等各個(gè)頻道,各個(gè)頻道可能是由不同的部分在擔(dān)任。哪些是網(wǎng)站暢銷(xiāo)的,需求熱推(至少你做個(gè)SEO的東西得有商業(yè)價(jià)值,在電商公司非常重要),包含各個(gè)頻道是否有人還在運(yùn)營(yíng),一個(gè)終年無(wú)人打理的頻道,明顯不是一個(gè)好的內(nèi)容源。一般來(lái)說(shuō),首要的產(chǎn)品線,和UGC的內(nèi)容一般是網(wǎng)站內(nèi)容供給主力。如果我們想發(fā)掘用戶(hù)需求,也能夠優(yōu)先考慮它們。
這個(gè)過(guò)程需求花許多時(shí)刻,雜亂一些網(wǎng)站乃至要1個(gè)月才干弄清楚網(wǎng)站到底有多少類(lèi)型的頁(yè)面。在弄清楚上面的問(wèn)題之后,
接下來(lái),就需求只需知道各類(lèi)內(nèi)容有多少數(shù)量。
比方多少個(gè)SKU,多少文章,多少帖子,多少tags,多少分類(lèi)等等
這是許多人在做相似作業(yè)時(shí)考慮不周全的,憑感覺(jué)去做。最后做出來(lái)一大堆重復(fù)內(nèi)容的頁(yè)面,重復(fù)頁(yè)面臨SEO有多壞的影響就不必再提了。
這個(gè)核算內(nèi)容數(shù)量的方法(從好到壞排序)。
1.讀數(shù)據(jù)庫(kù)
2.經(jīng)過(guò)一些”奇妙”的方法去數(shù)
3.用東西抓
4.靠經(jīng)歷猜(根本不靠譜)
讀數(shù)據(jù)庫(kù)是最簡(jiǎn)略,也是最準(zhǔn)確的方法了,一個(gè)select完事
如果沒(méi)有數(shù)據(jù)庫(kù)權(quán)限,就要去想方法知道。比方文章有多少條,那能夠核算分頁(yè)數(shù)量*每頁(yè)文章數(shù)量來(lái)核算
如果是自增id,那來(lái)湊自增id來(lái)數(shù);
如果是固定格局?jǐn)?shù)據(jù),比方來(lái)北京的圖片,北京的氣候,區(qū)域數(shù)量*類(lèi)型來(lái)核算,等等;
經(jīng)過(guò)東西抓是許多查找引擎優(yōu)化的愿望,無(wú)數(shù)人問(wèn)過(guò)這樣的問(wèn)題,有沒(méi)有什么東西能夠核算出我網(wǎng)站有多少網(wǎng)頁(yè)啊。
抱歉,還真沒(méi)有,因?yàn)榉N種網(wǎng)站原因,沒(méi)有任何一個(gè)東西能夠核算出一個(gè)中大型網(wǎng)站到底有多少網(wǎng)頁(yè)(誰(shuí)有那這個(gè)東西比google,百度爬蟲(chóng)還NB),太多的爬蟲(chóng)圈套,阻止深化抓取的東西了。當(dāng)然,這樣的抓取東西并不是一無(wú)可取,關(guān)于小型網(wǎng)站,或許特定頻道,乃至特定區(qū)塊的抓取,仍是有一定作用的。比方Httrack,Xeun,當(dāng)然還有我比較喜歡用的火車(chē)頭。python,shell等腳本語(yǔ)言一直是全能的。
上面根本就是內(nèi)容剖析的大致?tīng)顩r了,弄清楚內(nèi)容的品種,數(shù)量和運(yùn)營(yíng)狀況,對(duì)SEO是有許多優(yōu)點(diǎn)的。
三.關(guān)鍵詞發(fā)掘,清洗與過(guò)濾
關(guān)鍵詞的發(fā)掘說(shuō)難不難,說(shuō)簡(jiǎn)略也不簡(jiǎn)略。
根本每個(gè)人都會(huì)問(wèn),怎么發(fā)掘關(guān)鍵詞制造詞庫(kù)。先說(shuō)說(shuō)一些常用的方法。
1.baidu/google API
2.收集愛(ài)站,chinaz,伯樂(lè)等數(shù)據(jù)
3.收集百度下拉框(其他查找引擎同理)
4.收集百度相關(guān)查找(其他查找引擎同理)
5.站內(nèi)查找和天然流量關(guān)鍵詞
6.現(xiàn)成字典/詞庫(kù)
講點(diǎn)詳細(xì)完成的一些注意點(diǎn),都是在實(shí)踐過(guò)程中總結(jié)出來(lái)的東西。方法說(shuō)了,根本10個(gè)人里邊有1個(gè)人去實(shí)踐一些就不錯(cuò)了
1.百度和google的api是要申請(qǐng)的,想方法搞一個(gè),如果沒(méi)有,只能用百度網(wǎng)頁(yè)級(jí)別的收集,百度競(jìng)價(jià)后臺(tái)常常改,所以不是很穩(wěn)定,這邊友誼引薦一個(gè)東西http://www.lingdonge.com/(暫時(shí)存案中可能打不開(kāi)),作者很nb,搞俠客站群軟件的。百度API的python的SOAP通訊有BUG,連不上(可能我水平太低了T_T),PHP會(huì)SOAP通訊的話能夠自己寫(xiě)腳正本跑,Google的沒(méi)玩過(guò),應(yīng)該差不多;
2.API是有準(zhǔn)確查找量的數(shù)據(jù),所以是詞庫(kù)榜首數(shù)據(jù)來(lái)歷;
3.百度下拉框反收集做的比較少,收集地址為http://suggestion.baidu.com/su?wd=xxxxxxxxx+一堆參數(shù)的,詳細(xì)調(diào)整一下,一個(gè)小腳本能夠搞定,可是數(shù)據(jù)深度有限,一般收集2輪后就不必再采了,根本采不出新數(shù)據(jù)了;
4.相關(guān)查找能夠用火車(chē)頭或許飛達(dá)魯金花之類(lèi)的,因?yàn)槭鞘占疭ERP,反收集這塊要想方法繞過(guò);
5.站內(nèi)查找和天然流量關(guān)鍵詞去GA搞一下就行,批量導(dǎo)出不說(shuō)了。很簡(jiǎn)略,不是用的GA可能會(huì)悲劇一些;
6.拼音輸入法詞庫(kù);
7.一些特別的查找引擎,淘寶,youku之類(lèi),他們也積攢了很多的數(shù)據(jù)信息。
四.分詞/檢索/排序/批改
五.頻道的運(yùn)營(yíng),保護(hù),拓寬
六.數(shù)據(jù)監(jiān)控
|