TrustRank 算法
TrustRank是近年來比較受關注的一種基于鏈接的排名算法。 TrustRank可以翻譯為“信任指數”。
TrustRank算法最初來自于2004年斯坦福大學和雅虎的聯合研究,用于檢測垃圾網站,并于2006年獲得專利。TrustRank算法的發明者還專門發表了一份PDF文檔解釋TrustRank算法的應用。感興趣的讀者可以在以下網址下載PDF文件:http://www.vldb.org/conf/2004/Rs15P3.PDF
TrustRank算法并不是Google提出的,但是由于Google的市場占有率最大,TrustRank也是Google排名中很重要的一個因素,所以有人誤認為TrustRank是Google提出的。更讓人迷惑的是,谷歌曾經申請過TrustRank作為商標,但TrustRank商標中的TrustRank指的是谷歌檢測含有惡意代碼的網站的方法,而不是排名算法中的信任指數。
TrustRank 算法基于一個基本假設:好網站(北京網站制作)很少鏈接到壞網站。反之則不然,也就是說,壞網站很少鏈接到好網站的說法是不正確的。相反,很多垃圾網站會鏈接到權威度高、信任度高的網站,企圖提高自己的信任度。
基于這樣的假設,如果我們能夠選擇能夠100%信任的網站,那么這些網站的TrustRank將是最高的,而這些TrustRank最高的網站所鏈接的網站仍然會非常高,即使索引是略低。同樣,二級可信網站鏈接的三級網站的信任度繼續下降。由于種種原因,好的網站難免會鏈接到一些垃圾網站,但點擊距離越接近一級網站,傳遞的信任指數越高,點擊距離越遠,信任度越高。指數會更高。會依次下降。這樣,通過TrustRank算法,可以為所有網站計算出相應的信任指數。離一級網站越遠,成為垃圾網站的可能性就越大。
計算TrustRank值,首先需要選擇一批種子網站,然后人工檢查網站設置一個初始TrustRank值。選擇種子網站有兩種方法。一種是選擇外向鏈接最多的網站,因為TrustRank 算法計算外向鏈接衰減的指數。導出鏈接多的網站,某種意義上可以理解為具有比較高的“反向PR值”。
另一種選擇種子網站的方法是選擇PR值高的網站,因為PR值越高,出現在搜索結果頁面的概率就越大。這些網站是TrustRank算法最關注、需要調整排名的網站。那些PR值很低的頁面在沒有TrustRank算法的情況下排名也很低,TrustRank的計算意義不大。
據測算,通過選取約200個網站(高端建站)作為種子,可以更準確地計算出所有網站的TrustRank值。
TrustRank隨鏈接關系遞減的公式有兩種計算方式。一種是隨著鏈接數衰減,也就是說,如果第一層頁面的TrustRank指數為100,第二層頁面衰減到90,第三層衰減到80。第二種計算方法是賦值TrustRank值是根據出鏈數來計算的,即如果一個頁面的TrustRank值為100,頁面上有5個出鏈,每個鏈接將傳遞TrustRank值的20%。衰減和分配這兩種計算方法通常結合使用,總體效果是TrustRank值隨著鏈路級別的增加而逐漸降低。一旦推導出網站的頁面和TrustRank 值,排名就會受到兩種方式的影響。一種是根據TrustRank值對傳統排名算法選擇的多個頁面進行比較,重新調整排名。另一個是設置一個最小的TrustRank 值閾值。只有超過此閾值的頁面才被認為具有足夠的質量進入排名。低于閾值的頁面將被視為垃圾頁面并從搜索結果中過濾掉。
雖然TrustRank算法最初是作為一種檢測垃圾郵件的方法,但在目前的搜索引擎排名算法中,TrustRank的概念被更廣泛地使用,往往會影響大多數網站的整體排名。 TrustRank 算法最初是針對頁面級別的。現在在搜索引擎算法中,TrustRank值通常是在域名層面上表示的。整個域名的信任指數越高,綜合排名能力越強。
我們專注高端建站,小程序開發、軟件系統定制開發、BUG修復、物聯網開發、各類API接口對接開發等。十余年開發經驗,每一個項目承諾做到滿意為止,多一次對比,一定讓您多一份收獲!