怎么讓搜索引擎精準(zhǔn)的抓取
今天就和大家說說,我們?cè)趺醋?,讓搜索引擎精?zhǔn)的抓取我們站點(diǎn)!
一、head標(biāo)簽中的部分
1.URL設(shè)計(jì)
URL盡量含有通用已成趨勢(shì)的移動(dòng)命名,例如“m./wap./3g./mobi./mobile./mob/wml/”,可以在子域名等方面體現(xiàn)
2.頁面頂部的doctype標(biāo)簽
作為協(xié)議的重要部分,doctype中是否移動(dòng)化也很重要,檢查是否存在與移動(dòng)相關(guān)的聲明,如這些關(guān)鍵詞,openmobilealliance, xhtml-mobile, xhtml-basic,wapforum,dtd compact html
例:“”
3.meta標(biāo)簽中的viewport屬性和x-ua-compatible 屬性
viewport,移動(dòng)前端開發(fā)中最重要的標(biāo)簽,響應(yīng)式設(shè)計(jì)的根基,如果你的頁面是遵守響應(yīng)式設(shè)計(jì)的,那么說明這些頁面對(duì)移動(dòng)設(shè)備有友好的輸出。
典型的的viewport代碼是這樣的,,判斷移動(dòng)與否的關(guān)鍵屬性值為width,如果width=device-width這是典型的移動(dòng)友好的設(shè)計(jì),增加判定為移動(dòng)頁面的砝碼,如果width有具體值,且值大于典型的移動(dòng)屏幕(應(yīng)該小于600),那么該頁面被判定為PC頁面的幾率大大增加。
但,META中還有一個(gè)很獨(dú)特的屬性作為SEO人員應(yīng)該很少接觸到,那就是x-ua-compatible 屬性,該屬性是PC意味非常強(qiáng)烈的功能性代碼。示例代碼如此,,從百度工程師處得知,該代碼會(huì)有較強(qiáng)暗示當(dāng)前頁面為PC頁面的功能,需選擇性使用。
4.title中的移動(dòng)暗示
制作移動(dòng)頁面時(shí),在title標(biāo)簽中寫明:“移動(dòng)版”、“手機(jī)版”、“WAP版”、“觸屏版”不僅是照顧用戶體驗(yàn)的方案,也利于頁面的移動(dòng)識(shí)別,反之PC頁面要謹(jǐn)慎使用這些文案。
5.鏈接link標(biāo)簽的media和href屬性中需要注意的細(xì)節(jié)(多為樣式文件)
media屬性值為screen時(shí),表示屏幕中的顯示樣式,link的href所填寫的URL(基本為樣式文件的URL)就比較重要了,一定程度加大不同設(shè)備的偏重。此時(shí)URL中盡量出現(xiàn)/wap,/mobile/這樣的命名,同URL設(shè)計(jì)一樣,用于提高頁面識(shí)別為移動(dòng)的效率和概率。如URL中含有pc字樣則加大識(shí)別為PC頁面的幾率。
6.一些通用的PC類識(shí)別HTML代碼
embed:經(jīng)常用于嵌入多媒體
object:用于嵌入對(duì)象
marquee:老舊的滾動(dòng)特效實(shí)現(xiàn)代碼
iframe:想必網(wǎng)站優(yōu)化人員很熟悉了,典型的PC常用標(biāo)簽
這些典型的用于PC或者老舊的、HTML5已經(jīng)有更高效替代方案的舊標(biāo)簽,意味著使用它們將增加頁面的PC屬性,需要有目的地取舍。
7.一些javascript中典型的PC特征
加載swfobject、含有activexobject語句:移動(dòng)頁面根本不會(huì)使用如此重的多媒體引用方案(可以問你的前端工程師)
含有netscape(網(wǎng)景)、msie(IE)、firefox(火狐)、browser.msie(IE)這些典型的非移動(dòng)端瀏覽器兼容代碼的
設(shè)置了timer的 ,以及JS代碼含有settimeout的(此處不知道為什么設(shè)置timer還有識(shí)別的問題),均大幅增加識(shí)別為PC頁面的可能性
以上這些中出現(xiàn)的內(nèi)容
二、正文body中需要注意的部分
鏈接和文本遵照的原則基本與head中一樣——多出現(xiàn)移動(dòng)相關(guān)的字眼;頁面設(shè)置的寬度不要超過常規(guī)移動(dòng)設(shè)備的大小;那些常識(shí)中(除非招錯(cuò)前端工程師)絕對(duì)只用于PC的一些兼容性代碼。
此外div塊的個(gè)數(shù)也值得注意,沒有哪家移動(dòng)頁面會(huì)過量使用div塊;還有典型的只用于適配PC機(jī)器的HTML代碼,例如:accesskey(如果移動(dòng)頁面用,要不前端招錯(cuò)人了,要不產(chǎn)品招錯(cuò)人了,應(yīng)該引起警覺)
head和正文兩大部分,基本涵蓋了一張頁面最主要的部分。
網(wǎng)站優(yōu)化人員一定要把握這些使用細(xì)節(jié),協(xié)助前端工程師從正反方向?qū)⒐镜腜C和手機(jī)頁面涇渭分明地呈現(xiàn)給搜索引擎。試想如果你每日被抓取頁面達(dá)到90%的識(shí)別率,而一般水平是70%,這種優(yōu)化增量是非常顯著的。
最后,分享一個(gè)機(jī)器學(xué)習(xí)的思想給網(wǎng)站優(yōu)化的新人,此文中心思想截取如下:“你從市場(chǎng)上的芒果里隨機(jī)的抽取一定的樣品(訓(xùn)練數(shù)據(jù)), 制作一張表格, 上面記著每個(gè)芒果的物理屬性, 比如顏色, 大小, 形狀, 產(chǎn)地, 賣家, 等等。(這些稱之為特征)。 還記錄下這個(gè)芒果甜不甜, 是否多汁,是否成熟(輸出變量)。你將這些數(shù)據(jù)提供給一個(gè)機(jī)器學(xué)習(xí)算法(分類算法/回歸算法),然后它就會(huì)學(xué)習(xí)出一個(gè)關(guān)于芒果的物理屬性和它的質(zhì)量之間關(guān)系的模型。 下次你再去市集, 只要測(cè)測(cè)那些芒果的特性(測(cè)試數(shù)據(jù)),然后將它輸入一個(gè)機(jī)器學(xué)習(xí)算法。算法將根據(jù)之前計(jì)算出的模型來預(yù)測(cè)芒果是甜的,熟的, 并且/還是多汁的。
?
一、head標(biāo)簽中的部分
1.URL設(shè)計(jì)
URL盡量含有通用已成趨勢(shì)的移動(dòng)命名,例如“m./wap./3g./mobi./mobile./mob/wml/”,可以在子域名等方面體現(xiàn)
2.頁面頂部的doctype標(biāo)簽
作為協(xié)議的重要部分,doctype中是否移動(dòng)化也很重要,檢查是否存在與移動(dòng)相關(guān)的聲明,如這些關(guān)鍵詞,openmobilealliance, xhtml-mobile, xhtml-basic,wapforum,dtd compact html
例:“”
3.meta標(biāo)簽中的viewport屬性和x-ua-compatible 屬性
viewport,移動(dòng)前端開發(fā)中最重要的標(biāo)簽,響應(yīng)式設(shè)計(jì)的根基,如果你的頁面是遵守響應(yīng)式設(shè)計(jì)的,那么說明這些頁面對(duì)移動(dòng)設(shè)備有友好的輸出。
典型的的viewport代碼是這樣的,,判斷移動(dòng)與否的關(guān)鍵屬性值為width,如果width=device-width這是典型的移動(dòng)友好的設(shè)計(jì),增加判定為移動(dòng)頁面的砝碼,如果width有具體值,且值大于典型的移動(dòng)屏幕(應(yīng)該小于600),那么該頁面被判定為PC頁面的幾率大大增加。
但,META中還有一個(gè)很獨(dú)特的屬性作為SEO人員應(yīng)該很少接觸到,那就是x-ua-compatible 屬性,該屬性是PC意味非常強(qiáng)烈的功能性代碼。示例代碼如此,,從百度工程師處得知,該代碼會(huì)有較強(qiáng)暗示當(dāng)前頁面為PC頁面的功能,需選擇性使用。
4.title中的移動(dòng)暗示
制作移動(dòng)頁面時(shí),在title標(biāo)簽中寫明:“移動(dòng)版”、“手機(jī)版”、“WAP版”、“觸屏版”不僅是照顧用戶體驗(yàn)的方案,也利于頁面的移動(dòng)識(shí)別,反之PC頁面要謹(jǐn)慎使用這些文案。
5.鏈接link標(biāo)簽的media和href屬性中需要注意的細(xì)節(jié)(多為樣式文件)
media屬性值為screen時(shí),表示屏幕中的顯示樣式,link的href所填寫的URL(基本為樣式文件的URL)就比較重要了,一定程度加大不同設(shè)備的偏重。此時(shí)URL中盡量出現(xiàn)/wap,/mobile/這樣的命名,同URL設(shè)計(jì)一樣,用于提高頁面識(shí)別為移動(dòng)的效率和概率。如URL中含有pc字樣則加大識(shí)別為PC頁面的幾率。
6.一些通用的PC類識(shí)別HTML代碼
embed:經(jīng)常用于嵌入多媒體
object:用于嵌入對(duì)象
marquee:老舊的滾動(dòng)特效實(shí)現(xiàn)代碼
iframe:想必網(wǎng)站優(yōu)化人員很熟悉了,典型的PC常用標(biāo)簽
這些典型的用于PC或者老舊的、HTML5已經(jīng)有更高效替代方案的舊標(biāo)簽,意味著使用它們將增加頁面的PC屬性,需要有目的地取舍。
7.一些javascript中典型的PC特征
加載swfobject、含有activexobject語句:移動(dòng)頁面根本不會(huì)使用如此重的多媒體引用方案(可以問你的前端工程師)
含有netscape(網(wǎng)景)、msie(IE)、firefox(火狐)、browser.msie(IE)這些典型的非移動(dòng)端瀏覽器兼容代碼的
設(shè)置了timer的 ,以及JS代碼含有settimeout的(此處不知道為什么設(shè)置timer還有識(shí)別的問題),均大幅增加識(shí)別為PC頁面的可能性
以上這些中出現(xiàn)的內(nèi)容
二、正文body中需要注意的部分
鏈接和文本遵照的原則基本與head中一樣——多出現(xiàn)移動(dòng)相關(guān)的字眼;頁面設(shè)置的寬度不要超過常規(guī)移動(dòng)設(shè)備的大小;那些常識(shí)中(除非招錯(cuò)前端工程師)絕對(duì)只用于PC的一些兼容性代碼。
此外div塊的個(gè)數(shù)也值得注意,沒有哪家移動(dòng)頁面會(huì)過量使用div塊;還有典型的只用于適配PC機(jī)器的HTML代碼,例如:accesskey(如果移動(dòng)頁面用,要不前端招錯(cuò)人了,要不產(chǎn)品招錯(cuò)人了,應(yīng)該引起警覺)
head和正文兩大部分,基本涵蓋了一張頁面最主要的部分。
網(wǎng)站優(yōu)化人員一定要把握這些使用細(xì)節(jié),協(xié)助前端工程師從正反方向?qū)⒐镜腜C和手機(jī)頁面涇渭分明地呈現(xiàn)給搜索引擎。試想如果你每日被抓取頁面達(dá)到90%的識(shí)別率,而一般水平是70%,這種優(yōu)化增量是非常顯著的。
最后,分享一個(gè)機(jī)器學(xué)習(xí)的思想給網(wǎng)站優(yōu)化的新人,此文中心思想截取如下:“你從市場(chǎng)上的芒果里隨機(jī)的抽取一定的樣品(訓(xùn)練數(shù)據(jù)), 制作一張表格, 上面記著每個(gè)芒果的物理屬性, 比如顏色, 大小, 形狀, 產(chǎn)地, 賣家, 等等。(這些稱之為特征)。 還記錄下這個(gè)芒果甜不甜, 是否多汁,是否成熟(輸出變量)。你將這些數(shù)據(jù)提供給一個(gè)機(jī)器學(xué)習(xí)算法(分類算法/回歸算法),然后它就會(huì)學(xué)習(xí)出一個(gè)關(guān)于芒果的物理屬性和它的質(zhì)量之間關(guān)系的模型。 下次你再去市集, 只要測(cè)測(cè)那些芒果的特性(測(cè)試數(shù)據(jù)),然后將它輸入一個(gè)機(jī)器學(xué)習(xí)算法。算法將根據(jù)之前計(jì)算出的模型來預(yù)測(cè)芒果是甜的,熟的, 并且/還是多汁的。
?
1 個(gè)評(píng)論
讓搜索引擎搜索結(jié)果更精準(zhǔn)的方法:
1、完整搜索”關(guān)鍵詞“表示查詢?cè)~不能被拆分,在搜索結(jié)果中必須完整出現(xiàn)。
2、不含某個(gè)詞,表示所有搜索結(jié)果不包含減號(hào)后面的詞,含有它的網(wǎng)頁將被過濾掉。
3、標(biāo)題中搜索intitle,表示搜索結(jié)果的標(biāo)題都必須含有intitle:后的查詢?cè)~,幫助排除無關(guān)網(wǎng)頁。
4、指定網(wǎng)站site:表示搜索結(jié)果一定來自你輸入的網(wǎng)站。
5、并行搜索|,表示搜索結(jié)果中包含詞語A和B中的任意一個(gè),不必同時(shí)包含這兩個(gè)詞。
6、ERL中搜索inurl,表示搜索結(jié)果中,查詢?cè)~需要出現(xiàn)在網(wǎng)頁的URL里。
7、搜索政府網(wǎng)頁inurl:gov,表示搜索出來的網(wǎng)頁都是URL中帶有g(shù)ov的政府網(wǎng)站。
8、指定格式filetype,表示搜索特定的文件格式
想了解更多獨(dú)立站信息可以加劉小喵QQ 982709520 現(xiàn)在加好友還可以免費(fèi)獲得十五天試用哦
1、完整搜索”關(guān)鍵詞“表示查詢?cè)~不能被拆分,在搜索結(jié)果中必須完整出現(xiàn)。
2、不含某個(gè)詞,表示所有搜索結(jié)果不包含減號(hào)后面的詞,含有它的網(wǎng)頁將被過濾掉。
3、標(biāo)題中搜索intitle,表示搜索結(jié)果的標(biāo)題都必須含有intitle:后的查詢?cè)~,幫助排除無關(guān)網(wǎng)頁。
4、指定網(wǎng)站site:表示搜索結(jié)果一定來自你輸入的網(wǎng)站。
5、并行搜索|,表示搜索結(jié)果中包含詞語A和B中的任意一個(gè),不必同時(shí)包含這兩個(gè)詞。
6、ERL中搜索inurl,表示搜索結(jié)果中,查詢?cè)~需要出現(xiàn)在網(wǎng)頁的URL里。
7、搜索政府網(wǎng)頁inurl:gov,表示搜索出來的網(wǎng)頁都是URL中帶有g(shù)ov的政府網(wǎng)站。
8、指定格式filetype,表示搜索特定的文件格式
想了解更多獨(dú)立站信息可以加劉小喵QQ 982709520 現(xiàn)在加好友還可以免費(fèi)獲得十五天試用哦
精選服務(wù)
¥