這一篇主要介紹搜索引擎的工作原理和常用的高級(jí)搜索指令,對(duì)于我們深入了解seo和靈活使用搜索引擎。
雖然很多人喜歡的內(nèi)容是——
“你就告訴我,怎么三下五除二,能把網(wǎng)站優(yōu)化到第一頁(yè)就行了,不要給我扯這些花里胡哨的”。
但我覺(jué)得這一章其實(shí)是很有必要的。在深入了解搜索引擎的工作原理之后,我們才能從宏觀層面有個(gè)大概的操作思路,授之于魚不如授之以漁。
不啰嗦了,我開始啦~
2.1搜索引擎與目錄
對(duì)于現(xiàn)在的人來(lái)說(shuō),已經(jīng)很少用到目錄網(wǎng)站,典型的類似hao123,http://265.com等,網(wǎng)站上面有許許多多的人工搜集并整理的網(wǎng)站。在早期,許多seo資料把目錄也稱為搜索引擎的一種,其實(shí)這是不準(zhǔn)確的。
搜索引擎是由蜘蛛程序沿著鏈接爬行,抓取網(wǎng)上的大量頁(yè)面,存進(jìn)數(shù)據(jù)庫(kù),經(jīng)過(guò)預(yù)處理,用戶在搜索框內(nèi)輸入查詢?cè)~后,搜索引擎排序程序從數(shù)據(jù)庫(kù)中挑選出符合查詢?cè)~的頁(yè)面。蜘蛛的爬行,頁(yè)面的收錄以及排序都是自動(dòng)處理的——這就是搜索引擎和目錄網(wǎng)站最大的區(qū)別。
2.2搜索引擎工作原理簡(jiǎn)介
搜索引擎的工作過(guò)程可分為三個(gè)階段
爬行和抓?。核阉饕嬷┲胪ㄟ^(guò)跟蹤鏈接發(fā)現(xiàn)和訪問(wèn)網(wǎng)頁(yè),讀取頁(yè)面html代碼,存入數(shù)據(jù)庫(kù)。
預(yù)處理:索引程序?qū)ψト?lái)的頁(yè)面數(shù)據(jù)進(jìn)行文字提取、中文分詞、索引、倒排索引等處理
排名:用戶輸入查詢?cè)~后,排名程序調(diào)用索引庫(kù)數(shù)據(jù),計(jì)算相關(guān)性,然后按一定格式生成搜索結(jié)果頁(yè)面。
從搜索引擎的原理上來(lái)分析,我們想做的事情就是,第一,吸引蜘蛛,盡可能地讓蜘蛛爬行我們的頁(yè)面,第二:要注意網(wǎng)站或網(wǎng)頁(yè)的結(jié)構(gòu)優(yōu)化,有利于蜘蛛爬行,才會(huì)盡可能讓我們網(wǎng)站更多的頁(yè)面被收錄。
想要吸引蜘蛛來(lái)爬取,要做好以下幾點(diǎn):
網(wǎng)站和頁(yè)面權(quán)重的提升
頁(yè)面經(jīng)常更新
每個(gè)頁(yè)面都有導(dǎo)入鏈接
與首頁(yè)的點(diǎn)擊距離不能太遠(yuǎn)
url短,層次淺
2.3用戶怎樣瀏覽和點(diǎn)擊搜索結(jié)果
當(dāng)用戶在搜索框輸入一個(gè)關(guān)鍵詞,搜索引擎給出了搜索結(jié)果,那么用戶會(huì)點(diǎn)擊哪一個(gè)呢?
從大量的研究可以得出以下的結(jié)果:
排名第一的結(jié)果獲得了大概40%的點(diǎn)擊率
排名第二的結(jié)果獲得了大概11%的點(diǎn)擊率
排名第三的結(jié)果獲得了大概8%的點(diǎn)擊率
排名靠后的結(jié)果點(diǎn)擊率逐漸下降,第二頁(yè)的結(jié)果則斷崖式下降。
雖然不同的行業(yè),不同的關(guān)鍵詞會(huì)使得這個(gè)結(jié)論有一定的差異,但是我們依然能得出一些對(duì)我們有用的結(jié)論:
第一和第二名流量差異巨大,第二頁(yè)和第一頁(yè)的流量差距也很大;
有時(shí)候我們可以找到網(wǎng)站有哪些關(guān)鍵詞排名在第二位,想辦法提高到第一位,,能使流量提升好幾倍。第二頁(yè)優(yōu)化到第一頁(yè)也是同理。
2.4常用的高級(jí)搜索指令
雙引號(hào):完全匹配搜索
釋義:搜索結(jié)果返回的頁(yè)面包含雙引號(hào)中出現(xiàn)的所有詞,連順序也必須完全匹配。
如:“飛機(jī)微博圖片”
指令支持:谷歌和百度都支持
減號(hào)
釋義:搜索不包含減號(hào)后面詞的頁(yè)面。使用時(shí),減號(hào)前面必須是空格,減號(hào)后面沒(méi)有空格,緊跟著需要排除的詞。
如:新加 -坡
指令支持:谷歌和百度都支持
星號(hào)
釋義:常用的通配符。
如:郭*綱,其中*代表任何文字。
指令支持:谷歌支持,百度不支持
inurl:
釋義:用于詞搜索查詢?cè)~出現(xiàn)在url中的頁(yè)面。由于關(guān)鍵詞出現(xiàn)在url中對(duì)排名有一定影響,因此使用inurl:搜索可以更準(zhǔn)確地找到競(jìng)爭(zhēng)對(duì)手
如:inurl:搜索引擎優(yōu)化
指令支持:谷歌支持,百度不支持
inanchor:
釋義:指令返回的結(jié)果是導(dǎo)入鏈接錨文字中包含搜索詞的頁(yè)面。
如:inanchor:點(diǎn)擊這里
返回的結(jié)果頁(yè)面本身不一定包含“點(diǎn)擊這里”四個(gè)字,而是指向這些頁(yè)面的錨文字中出現(xiàn)了“點(diǎn)擊這里”這四個(gè)字。
鏈接錨文字是關(guān)鍵詞排名因素之一,有經(jīng)驗(yàn)的seo會(huì)盡量使外部鏈接錨文字中出現(xiàn)一定次數(shù)的目標(biāo)關(guān)鍵詞。使用inanchor:指令可以找到某個(gè)關(guān)鍵詞的競(jìng)爭(zhēng)對(duì)手,而這些對(duì)手往往都是做過(guò)seo的。
指令支持:谷歌支持,百度不支持
intitle:
釋義:指令返回的是頁(yè)面title中包含關(guān)鍵詞的頁(yè)面
如:intitle:搜索引擎優(yōu)化
title是頁(yè)面優(yōu)化的重要因素,使用intitle指令找到的文件都是更準(zhǔn)確的競(jìng)爭(zhēng)頁(yè)面。如果關(guān)鍵詞只出現(xiàn)在頁(yè)面卻沒(méi)有在title中,說(shuō)明也不是有力的競(jìng)爭(zhēng)對(duì)手。
指令支持:谷歌和百度都支持
filetype:
釋義:用于搜索特定的文件格式
如:filetype:pdf SEO
返回的就是包含SEO這個(gè)關(guān)鍵詞的所有PDF文件
用于搜索特定的資源,如pdf電子書,word文件等非常有效
指令支持:谷歌和百度都支持
site:
釋義:用于搜索某個(gè)域名下的所有文件
如:site:http://seozac.com
返回的就是seozac這個(gè)域名下的所有頁(yè)面,這個(gè)指令是查詢網(wǎng)站收錄頁(yè)面最有效的方法。不過(guò)這個(gè)指令不是很準(zhǔn)確,只能作為參考。
指令支持:谷歌和百度都支持
link:
釋義:用于搜索某個(gè)url的反向鏈接,既包含內(nèi)部鏈接,也包含外部鏈接
如:link:http://seozac.com
指令支持:谷歌支持,百度不支持
高級(jí)搜索指令也是可以搭配起來(lái)使用的
如inurl:http://edu.cnintitle:交換鏈接
返回的則是來(lái)自http://edu.cn域名,標(biāo)題中包含“交換鏈接”這四個(gè)字的頁(yè)面,大部分應(yīng)該是愿意交換鏈接的學(xué)校網(wǎng)站。
(來(lái)源:希聲碎碎念)
以上內(nèi)容屬作者個(gè)人觀點(diǎn),不代表雨果跨境立場(chǎng)!本文經(jīng)原作者授權(quán)轉(zhuǎn)載,轉(zhuǎn)載需經(jīng)原作者授權(quán)同意。?