Pagerank
Page Rank Nedir?
Pagerank metodu Google tarafından, sitelerin birbirleriyle
orantılı olarak önemlerini yani kısaca popüleritelerini tespit
etmek için bulundu. Bu metod oluşturulurken siteler arasındaki
linkler baz alınarak internetteki topoloji örneklendi.
Page Rank’in ana fikri şöyledir: Eğer bir A sitesi B
sitesinin linkini yayınlamışsa bunun nedeni B sayfasının A
sayfası ziyaretçileri tarafından dolaşılabilecek olarak
düşünülmüş olmasıdır. Bu yapıya göre A sayfası B sayfasının
pagerankini yükseltmiş olacaktır.
Ancak Pagerank kavramı sadece bunlarla sınırlı değildir.
Aşağıda belirttiğim iki fikir de önemli başrol oynar.
- A sayfası ne kadar yüksek pageranke sahipse B sayfasının
pagerank değeri de buna orantılı olarak artacaktır. - A sayfasında ne kadar az dışarı link varsa, B sayfasının
pagerank değeri o kadar yüksek olacaktır. Bu mantığa göre A
sayfası sadece B sayfasını link verilecek değerde görmüşse,
B sayfasının pageranki çok daha fazla artacaktır.
Mantığı açıkladıktan sonra, bu sistemi gelin formülize
edelim. Başlamadan önce açıklayalım, bu formülü Google’ın iki
kurucusundan aldık. Formül şu ana kadar değişilik geçirmiştir
ancak temel mantığı halen aynıdır.
A 1, A 2 , …, An B sayfasına link veren sayfalar olsun. PR(Ak)’yı
da A k sayfasının pageranki olarak kabul edelim. N(Ak) ise Ak
sayfasının dış sayfalara verdiği link sayısı olsun. d ise 0 ile
1 arasında değişen ve genellikle 0.85 olan bir katsayı olsun.
Bu durumda PageRank’in matematiksel değeri şöyle olacaktır:
PR(B) = (1-d) + d x ( PR(A1) / N(A1) +
… + PR(An) / N(An) )
Belki bu formülün hem basit hem de karmaşık olduğunu
düşünebilirsiniz. Basit çünkü sadece birkaç koşula bağlı,
karmaşık çünkü hesaplamak için daha önceden başka bir sitenin
pagerankini hesaplamanız gerekir.
Aslında bu çok basittir, tüm pagerankleri belli bir değere
sabitlerseniz olur biter. Eğer her sayfaya aynı değeri
verirseniz; bu değeri kaç alırsanız alın sonuç değişmeyecektir.
Formülü tekrarlamaya başladığınızda sonuç bir önceki
hesaplamaya bağlı olarak tekrar hesaplanacaktır. İşlem
ilerledikçe pagerank değerleri yerine oturmaya başlayacak, ve
bir hesaplamadan diğerine kadar hiçbir değişiklik olmayacaktır.
Rastgele Yürüme Modeli
PageRank değerinin hesaplanmasında formül dışında bir başka
model daha vardır. Bu model de internetde dolaşan birinin simüle
edilmesiyle, rastgele linkler arasında dolaşılmasıdır.
Bir düşünün, birisi bir sayfada dolaşırken bir link dikkatini
çeker ve ona tıklayarak o sayfada dolaşmaya başlar. Böylece
giderek birçok sayfa dolaşılır .
Page Rank değeri bir ziyaretçinin sayfada harcadığı
süreye de bağlı olabilir.
Eğer gidilen bir sayfada geriye dönüş için de link
bulunuyorsa olasılık daha da artacaktır. Bu da formülün ikinci
terimine denk gelmektedir.
İlk terim ise sayfadan çıkılmadan içeri de ne kadar
dolaşılabileceği olasılığını modeller. Formülde ifade ettiğmiz d
sembolü aslında budur.
Trackback this post | Subscribe to the comments via RSS Feed