一级女人毛片人一女人-一级女性大黄生活片免费-一级女性全黄久久生活片-一级女性全黄生活片免费-国产美女在线一区二区三区-国产美女在线观看

始創(chuàng)于2000年 股票代碼:831685
咨詢熱線:0371-60135900 注冊有禮 登錄
  • 掛牌上市企業(yè)
  • 60秒人工響應(yīng)
  • 99.99%連通率
  • 7*24h人工
  • 故障100倍補(bǔ)償
全部產(chǎn)品
您的位置: 網(wǎng)站首頁 > 幫助中心>文章內(nèi)容

HITS算法

發(fā)布時間:  2012/9/3 12:05:27
  HITS算法是Web結(jié)構(gòu)挖掘中最具有權(quán)威性和使用最廣泛的算法。

       其基本思想是利用頁面之間的引用鏈來挖掘隱含在其中的有用信息(如權(quán)威性),具有計(jì)算簡單且效率高的特點(diǎn)。HITS算法通過兩個評價權(quán)值——內(nèi)容權(quán)威度(Authority)和鏈接權(quán)威度(Hub)來對網(wǎng)頁質(zhì)量進(jìn)行評估。

       內(nèi)容權(quán)威度與網(wǎng)頁自身直接提供內(nèi)容信息的質(zhì)量相關(guān),被越多網(wǎng)頁所引用的網(wǎng)頁,其內(nèi)容權(quán)威度越高;鏈接權(quán)威度與網(wǎng)頁提供的超鏈接頁面的質(zhì)量相關(guān),引用越多高質(zhì)量頁面的網(wǎng)頁,其鏈接權(quán)威度越高。

       HITS算法認(rèn)為對每一個網(wǎng)頁應(yīng)該將其內(nèi)容權(quán)威度和鏈接權(quán)威度分開來考慮,在對網(wǎng)頁內(nèi)容權(quán)威度做出評價的基礎(chǔ)上再對頁面的鏈接權(quán)威度進(jìn)行評價,然后給出該頁面的綜合評價。然而HITS算法也有其明顯的不足。

       首先,它完全將網(wǎng)頁的內(nèi)容或文本排除在外,僅考慮網(wǎng)頁之間的鏈接結(jié)構(gòu)來分析頁面的權(quán)威性,這與現(xiàn)實(shí)網(wǎng)絡(luò)中的權(quán)威頁面相比,其不科學(xué)性顯而易見。因?yàn)闄?quán)威頁面必須針對某一主題或關(guān)鍵詞而言。某一頁面對一確定主題的具有較大權(quán)威性的頁面并不意味在其他與其無關(guān)的主題方面同樣具有權(quán)威性。

       其次一個頁面對另一頁面的引用有多種情況,其中包含了一頁面對另一頁面的認(rèn)可,但除此之外也有其他目的鏈接,如為了導(dǎo)航或?yàn)榱烁顿M(fèi)廣告。而HITS算法在實(shí)現(xiàn)過程中均沒有考慮以上情況.導(dǎo)致了結(jié)果與目標(biāo)的差距。就HITS算法的思想與實(shí)現(xiàn)過程做了細(xì)致的研究與概括。

       針對前面第一種不足,就有相關(guān)的學(xué)者提出了一種利用超鏈文字及其周圍文字與關(guān)鍵字相匹配而計(jì)算超鏈權(quán)值的方法,并引入系數(shù)對周圍文字和超鏈文字進(jìn)行權(quán)值的相對控制,很好地將頁面文本信息引入到HITS算法,提高了算法的可靠性,并在現(xiàn)實(shí)中取得了很好的效果。

       對HITS算法的第二個不足,即非正常目的的引用.在HITS算法看來,也誤認(rèn)為是正常引用,導(dǎo)致實(shí)際結(jié)果與目標(biāo)的出入。后來,經(jīng)過不斷的改進(jìn)。HITS算法又引入了時間參數(shù),即利用對一鏈接引用的時問長短來評價是否為正常引用。因?yàn)榉钦f溄悠湟脮r問肯定不會很長(如交換鏈接、廣告鏈接),相反,如果一頁面對另一頁面的鏈接時間較長,則必然反映此頁面就是用戶的尋找頁面。即目標(biāo)頁面或至少是正常引用。

       如果設(shè)定時間閥值,則可以將非正常引用的鏈接在HITS算法的實(shí)現(xiàn)過程中篩選出來。如設(shè)定訪問時間少于1分鐘者為非正常引用。另外可構(gòu)造時間訪問函數(shù),控制權(quán)威頁面的相對大小。如隨訪問時間的增大而其權(quán)威性也逐漸非線性增大.這樣可為HITS算法的權(quán)威頁面提供更合理、更科學(xué)的解釋。鏈接穩(wěn)定性,在外部鏈接的建設(shè)中,占據(jù)非常重要的地位。鏈接越穩(wěn)定,對排名的幫助就越大。


本文出自:億恩科技【www.laynepeng.cn】

服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經(jīng)營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經(jīng)營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經(jīng)營性ICP/ISP證:贛B2-20080012
  • 服務(wù)器/云主機(jī) 24小時售后服務(wù)電話:0371-60135900
  • 虛擬主機(jī)/智能建站 24小時售后服務(wù)電話:0371-60135900
  • 專注服務(wù)器托管17年
    掃掃關(guān)注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權(quán)所有  地址:鄭州市高新區(qū)翠竹街1號總部企業(yè)基地億恩大廈  法律顧問:河南亞太人律師事務(wù)所郝建鋒、杜慧月律師   京公網(wǎng)安備41019702002023號
      1
     
     
     
     

    0371-60135900
    7*24小時客服服務(wù)熱線