
搜索引擎對(duì)頁面的分詞取決于詞庫的規(guī)模、準(zhǔn)確性和分詞算法的好壞,而不是取決于頁面本身如何,所以網(wǎng)站優(yōu)化人員對(duì)分詞所能做的很少。裕華區(qū)正規(guī)石家莊建設(shè)網(wǎng)站唯一能做的是在頁面上用某種形式提示搜索引擎,某幾個(gè)字應(yīng)該被當(dāng)做一個(gè)詞處理,尤其是可能產(chǎn)生歧義的時(shí)候,比如在頁面標(biāo)題、hl標(biāo)簽及黑體中出現(xiàn)關(guān)鍵詞。石家莊建設(shè)網(wǎng)站多少錢如果頁面是關(guān)于“和服”的內(nèi)容,那么可以把“和服”這兩個(gè)字特意標(biāo)為黑體。如果頁面是關(guān)于“化妝利服裝”,可以把“服裝”兩個(gè)字標(biāo)為黑體。

正規(guī)石家莊建設(shè)網(wǎng)站詞頻及密度。一般認(rèn)為在沒有關(guān)鍵詞堆積的情況下,搜索詞在頁面中出現(xiàn)的次數(shù)多,密度越高,說明頁面與搜索詞越相關(guān)。當(dāng)然這只是一個(gè)大致規(guī)律,實(shí)際情況未必如此,所以相關(guān)性計(jì)算還有其他因素。石家莊建設(shè)網(wǎng)站多少錢出現(xiàn)頻率及密度只是因素的一部分,而且重要程度越來越低。關(guān)鍵詞位置及形式。就像在索引部分中提到的,頁面關(guān)鍵詞出現(xiàn)的格武和位置都被記錄在索引庫中。關(guān)鍵詞出現(xiàn)在比較重要的位置,如標(biāo)題標(biāo)簽、黑體、Hl等,說明頁面與關(guān)鍵詞越相關(guān)。這一部分就是頁面網(wǎng)站優(yōu)化所要解決的。

裕華區(qū)正規(guī)石家莊建設(shè)網(wǎng)站蜘蛛每次爬行都會(huì)把頁面數(shù)據(jù)存儲(chǔ)起來。如果第二次爬行發(fā)現(xiàn)頁面與第一次收錄的完全一樣,說明頁面沒有更新,蜘蛛也就沒有必要經(jīng)常抓取。如 果頁面內(nèi)容經(jīng)常更新,蜘蛛就會(huì)更加頻繁地訪問這種頁面,頁面上出現(xiàn)的新鏈接,石家莊建設(shè)網(wǎng)站多少錢也自然會(huì)被蜘蛛更快地跟蹤,抓取新頁面。導(dǎo)入鏈接。無論是外部鏈接還是同一個(gè)網(wǎng)站的內(nèi)部鏈接,要被蜘蛛抓取,就必須 有導(dǎo)入鏈接進(jìn)入頁面,否則蜘蛛根本沒有機(jī)會(huì)知道頁面的存在。高質(zhì)量的導(dǎo)入鏈 接也經(jīng)常使頁面上的導(dǎo)出鏈接被爬行深度增加。

蜘蛛的爬行、頁面的收錄及排序都是自動(dòng)處理。網(wǎng)站目錄則是一套人工編輯的分類目錄,裕華區(qū)正規(guī)石家莊建設(shè)網(wǎng)站由編輯人員人工創(chuàng)建多個(gè)層次的分類,站長可以在不同分類里提交網(wǎng)站,目錄編輯在后臺(tái)審核所提交的網(wǎng)站,將網(wǎng)站放置于相應(yīng)的分類頁面。有的時(shí)候編輯也主動(dòng)收錄網(wǎng)站。石家莊建設(shè)網(wǎng)站多少錢典型的網(wǎng)站目錄包括雅虎目錄、開放目錄、好123等。目錄并不是本書中所討論的SEO所關(guān)注的真正的搜索引擎。雖然網(wǎng)站目錄也常有一個(gè)搜索框,但目錄的數(shù)據(jù)來源是人工編輯得到的。

裕華區(qū)正規(guī)石家莊建設(shè)網(wǎng)站同一篇文章經(jīng)常會(huì)重復(fù)出現(xiàn)在不同網(wǎng)站及同一個(gè)網(wǎng)站的不同網(wǎng)址上,搜索引擎并不喜歡這種重復(fù)性的內(nèi)容。用戶搜索時(shí),如果在前兩頁看到的都是來自不同網(wǎng)站的同一篇文章,用戶體驗(yàn)就太差了,雖然都是內(nèi)容相關(guān)的。石家莊建設(shè)網(wǎng)站多少錢搜索引擎希望只返回相同文章中的一篇,所以在進(jìn)行索引前還需要識(shí)別和刪隙重復(fù)內(nèi)容,這個(gè)過程就稱為“去重”。去重的基本方法是對(duì)頁面特征關(guān)鍵詞計(jì)算指紋,也就是說從頁面主體內(nèi)容中選取Z有代表性的一部分關(guān)鍵詞(經(jīng)常是出現(xiàn)頻率Z高的關(guān)鍵詞),然后計(jì)算這些關(guān)鍵詞的數(shù)字指紋。