、簡單算法: 例如一個由4個頁面組成的小團體:A,B, C 和 D。如果所有頁面都鏈向A,那么A的PR(PageRank)值將是B,C 及 D的和。 PR(A) = PR(B) + PR(C) + PR(D) 繼續(xù)假設B也有鏈接到C,并且D也有鏈接到包括A的3個頁面。一個頁面不能投票2次。所以B給每個頁面半票。以同樣的邏輯,D投出的票只有三分之一算到了A的 PageRank 上。 風采依揚覺得,根據(jù)鏈處總數(shù)平分一個頁面的PR值。 最后,所有這些被換算為一個百分比再乘上一個系數(shù)q。由于下面的算法,沒有頁面的PageRank會是0。所以,Google通過數(shù)學系統(tǒng)給了每個頁面一個最小值1 − q。 所以一個頁面的 PageRank 是由其他頁面的PageRank計算得到。Google 不斷的重復計算每個頁面的 PageRank。如果您給每個頁面一個隨機 PageRank 值(非0),那么經(jīng)過不斷的重復計算,這些頁面的 PR 值會趨向于正常和穩(wěn)定。這就是搜索引擎使用它的原因。 二、完整的算法: 這個方程式引入了隨機瀏覽的概念,即有人上網(wǎng)無聊隨機打開一些頁面,點一些鏈接。一個頁面的PageRank值也影響了它被隨機瀏覽的概率。為了便于理解,這里假設上網(wǎng)者不斷點網(wǎng)頁上的鏈接,最終到了一個沒有任何鏈出頁面的網(wǎng)頁,這時候上網(wǎng)者會隨機到另外的網(wǎng)頁開始瀏覽。 為了對那些有鏈出的頁面公平,q = 0.15(q的意義見上文)的算法被用到了所有頁面上, 估算頁面可能被上網(wǎng)者放入書簽的概率。 所以,這個等式如下: p1,p2,…,pN是被研究的頁面,M(pi)是鏈入pi頁面的數(shù)量,L(pj)是pj鏈出頁面的數(shù)量,而N是所有頁面的數(shù)量 PageRank值是一個特殊矩陣中的特征向量。這個特征向量為 R是等式的答案 如果pj不鏈向pi, 而且對每個j都成立時, 這項技術主要的弊端是,舊的頁面等級會比新頁面高,因為新頁面,即使是非常好的頁面,也不會有很多鏈接,除非他是一個站點的子站點。 這就是 PageRank 需要多項算法結合的原因。之前石頭也說了wikipedia.com在google的一些關鍵詞內表現(xiàn)很好整體的訪問量超過一些門戶網(wǎng)站,另一方面也是數(shù)萬網(wǎng)民的共同努力。 Google對維基百科情有獨鐘之一,風采依揚想應該是:PageRank 似乎傾向于維基百科頁面,在條目名稱的搜索結果中總在大多數(shù)或者其他所有頁面之前。原因主要是維基百科內相互的鏈接很多,并且有很多站點鏈入。 Google 經(jīng)常處罰惡意提高 PageRank 的行為。Google 究竟怎樣區(qū)分正常的鏈接交換和不正常的鏈接堆積仍然是商業(yè)機密。 相信看完以上內容后對PageRank了解更深入。 我們可以知道搜索引擎用來評估網(wǎng)頁質量的一種方法,就是PageRank,它經(jīng)常被用來當作對Google搜索引擎網(wǎng)頁要素評分之一。 你可以找到任何網(wǎng)頁的PageRank分數(shù),通過使用你的瀏覽器去瀏覽網(wǎng)頁,并下載GOOGLE工具欄。將你的鼠標放在綠色的PageRank欄上,馬上就會顯示出一個從0到10之間的數(shù)字,這就是PageRank值,是google對該頁面的重要性的分配。工具欄按照PageRank比例范圍顯示出網(wǎng)頁的PageRank,但是在現(xiàn)在的PageRank算法中就是不單單是0到10的數(shù)據(jù)了,在google的服務器中,PageRank的分配數(shù)有可能是0精確到100,甚至是到1000的數(shù)值。 PageRank是平均每三個月更新一次的,它不是按照一般的線性刻度計算,而是按照一種指數(shù)刻度。這是一種非常繁雜的數(shù)學術語(之前文章也有提到),意思是PageRank4不是比PageRank3好一級—而是會好6到7倍。因此一個PageRank5的網(wǎng)頁和PageRank8的網(wǎng)頁之間的差距會比你可能認為的要大很多。 PageRank值在這幾天要更新了,我們談談現(xiàn)在PR的算法吧!當一個網(wǎng)頁鏈接到你的網(wǎng)頁時,搜索引擎是怎樣轉移這個網(wǎng)頁的權威性到你的網(wǎng)站的(也就是PageRank的轉移)。因此你希望從有最高PageRank得分的網(wǎng)頁上獲得鏈接,去不斷的尋找高PR的站點,是不是呢? 這種方式在以前還管用,但是現(xiàn)在實際情況比這復雜了很多,一個權威性的轉移與網(wǎng)頁上存在的鏈接數(shù)量有關—鏈接越少,每個鏈接所轉移的權威性就越高,因些,通常PageRank5網(wǎng)頁上唯一的鏈接要比PageRank7上一百個鏈接中的一個要有價值。當然這也是有前提的,就是站于站之間的鏈接內容相似度要高一些。 之前所講的大家都知道PR值的重要性,但是真的一提的是,不要落入PageRank的誘惑陷阱中。對于你的網(wǎng)頁來說,最重要的是被鏈接到那些能為你的站點帶來流量的站點,而不是見到PageRank就鏈。要將PageRank作為工具來驗證你自己對一個潛在鏈接來源質量判斷,而不要在做你的鏈接來源列表時盲目跟從PageRank。 祝SEOer好運! |