Einfluss ausgehender Links auf den PageRank

Grundlagen des PageRank-Verfahrens

Nach Lawrence Page und Sergey Brin (Titel der Veröffentlichung von 1998: The anatomy of a large-scale hypertextual web search engine) schaden ausgehende Links dem PageRank (PR) einer Website. Webkataloge oder Linklisten, die oft mehr ausgehende als eingehende Links haben, dürften kaum einen nennenswerten PR erreichen. Das kann z.B. mit dem Tool PageRank.xls (83 kB) nachvollzogen werden, wobei allerdings die Webgröße beschränkt ist und daher die Übertragbarkeit auf ein großes Netz nicht unproblematisch ist. Screenshot (zum Vergrößern anklicken):

PageRank-Berechnung

Andererseits können nach J. Kleinberg (Authoritative sources in a hyperlinked environment, IBM Research Report RJ 10076, May 1997) ausgehende Links auf "gute" Webseiten einen positiven Einfluss auf den sogenannten "Hub" haben, der sich in etwa mit "Hinweisqualität" übersetzen lässt. Nach der ursprünglichen Idee von Kleinberg sollte der Hub erst bei einer konkreten Suchanfrage berechnet und nicht allgemeingültig (im Sinne vom PageRank) für eine Webseite sein. Denkbar ist nun, dass der Google PageRank nicht mehr klassisch berechnet wird, sondern ggf. auch den Hub der ausgehenden Links berücksichtigt. Ob ausgehende Links nun eher schädlich oder sogar nützlich sind, soll in einem Experiment untersucht werden (siehe übernächster Abschnitt).

Denkbar ist weiterhin, dass bei der Berechnung des PageRankTM für die Toolbar-Anzeige ein vereinfachter Algorithmus verwendet wird, da das im folgenden vorgestellte PageRank-Orakel bessere Ergebnisse liefert, als eigentlich zu erwarten wäre.

PageRank-Orakel

In SEO-Kreisen besteht Einigkeit darüber, dass der PageRank (PR) logarithmisch skaliert ist. Unstrittig ist auch, dass ein einzelner Link von einer Seite mit hohem PR wesentlich wertvoller ist, als viele Links von PR0- oder PR1-Seiten. Weiterhin kann häufig beobachtet werden, dass Unterseiten einen um 1 geringeren PR als die direkt darüber liegenden Seiten haben. Eine möglichst einfache Formel, die zu einem solchen Ergebnis führt, ist:

Ranking-Gleichung

In dieser Gleichung ist A ein Skalierfaktor und B die Basis. Die Anzahl der Links von PR0 bis PR10 wird durch n0 bis n10 ausgedrückt.

Etwas problematisch ist die Bestimmung der Link-Anzahlen. Z.B. liefern einige Tools den PR der Startseite und nicht den PR der Seite, auf der sich der Link befindet. Auch greifen die Tools üblicherweise auf Suchmaschinen zurück, um die Links zu finden. Da aber wohl keine Suchmaschine alle Links liefert, besteht hier eine erhebliche Fehlerquelle. Zur Ermittlung der konstanten A und B in obiger Gleichung wurde LinkVendor mit der Einstellung "msn" verwendet. Abgefragt wurden am 10.10. bzw. 12.10.2005 die Links der unter Nr. 9, 13, 17, 36, 42 - 54, 57 und 58 im Linkverzeichnis aufgeführten Webseiten. Das Ergebnis und der zugehörige PR (vor dem Oktober-Update) sowie der PR vom 22.10.2005 (nach dem Oktober-Update) sind auch angegeben. Auf der Basis der PR-Werte vom 22.10 wurden die Konstanten bestimmt: A=0,44 und B=6. Obwohl die Gleichung eher trivial ist, wird der PR von 15 der 19 Seiten richtig berechnet.

Allerdings finden sich auch etliche Seiten, bei denen die Ergebnisse weniger gut sind. Dies ist zum Einen darauf zurückzuführen, dass in der Gleichung nicht berücksichtigt wird, wieviele ausgehende Links die Link-gebende Seite hat. Zum Anderen schlägt hier möglicherweise ein Filter zu, der Linknetzwerke aufdeckt und abwertet. Um solche Fälle mit obiger Gleichung zu erfassen, kann der Skalierfaktor A geändert werden. Zum Spielen gibt's die Formel hier in JavaScript:

PR0 PR1 PR2 PR3 PR4 PR5 PR6 PR7 PR8 PR9 PR10

Wie 'optimiert' ist die Site? hä?, A=0,44 Hobby-SEO, A=0,22 in Linknetztwerken, A=0,11

PageRank= gerundet=

Experiment zum PageRank

Wieder zurück zum Thema. Mit Hilfe dieser Webseite soll der Einfluss ausgehender Links auf den PageRank über einen längeren Zeitraum untersucht werden.

Da es praktisch unmöglich ist, zwei identische Webseiten zu gestalten, die von außerhalb identisch verlinkt sind und sich nur in der Art der ausgehenden Links unterscheiden (z.B. mit bzw. ohne rel="nofollow"), soll hier ein anderer Weg beschritten werden: Auf diese Webseite werden maximal 95 ausgehende Links gesetzt. Nach einem PageRank-Update wird das Link-Tag entfernt und die URL im Klartext ausgegeben. Beispiel:

Verlinkte Seite:
Physiker brauchen die optische Bank mit Zubehör.
URL im Klartext:
Physiker brauchen die [http://www.henschke-geraetebau.de/optische-bank.html] optische Bank mit Zubehör.

Nach einem weiteren PageRank-Update werden die Links wieder aktiviert. Durch dies Hin und Her zwischen Links und reinem Text sollte sich nach z.B. 4 bis 8 Umschaltvorgängen ein statistisch signifikanter Link-Einfluss feststellen lassen, auch wenn eine - hoffentlich nicht zu große - Veränderung in den Links von außen auftritt.

29. April 2006: Mittlerweile haben zwei PageRank-Updates relativ schnell hintereinander stattgefunden und diese Seite hat auf allen von Database-Search abgefragten Datencentern einen PR4. Im Google-Directory wird DR3 (16 Pixel) angezeigt. Die Unterseite ../pagerank-bild.html hat PR3 und die Excel-Tabelle ../PageRank.xls liegt auch bei PR3. Laut 'Backlink Spider' (update 2012: ursprüngliche Seite existiert nicht mehr) verweisen 8 PR4, 13 PR3, 10 PR2, 7 PR1 und 21 PR0 Links auf diese Seite. Bei diesem Zwischenstand wurden heute die Links deaktiviert und es geht in die nächste Runde.

14. November 2006: Zwischenzeitlich haben wiederum zwei PageRank-Updates stattgefunden und diese Seite hat bei der Abfrage mit o. a. Tool weiterhin einen PR4 auf allen Datencentern. Unverändert sind auch der Google-Directory-Rank (DR3) und die PR's der Unterseiten (beide PR3). Der 'Backlink Spider' funktioniert zur Zeit leider nur mit Yahoo und liefert für diese Seite: 1 PR5, 10 PR4, 10 PR3, 6 PR2, 3 PR1 und 31 PR0 Links. Jetzt werden die Links wieder aktiviert und bleiben es auch, bis wiederum zwei Updates vorbei sind, da Google in letzter Zeit PR-Änderungen offenbar nur langsam umsetzt.

4. Januar 2013: Von den ursprünglich rund 100 Links auf dieser Seite funktionieren etliche nicht mehr. Da Google außerdem den Algorithmus offenbar erweitert/geändert hat, ist das Experiment in der geplanten Form nicht weiter durchführbar und wird beendet. Alle 'toten' Links im Linkverzeichnis und Links bei denen der Backlink entfernt wurde werden gelöscht und nicht wieder neu besetzt.

Aufruf zum Mitmachen! (04.01.2013: Das Experiment ist beendet.)

Bis das Linkverzeichnis gefüllt ist, sind Mitspieler gesucht, die mir bitte einen Link in der Form

  <li>Begleittext <a href="http://www.domain.tld/seite.html">Linktext</a> Begleittext</li>

an Text-Ersatz senden. Dabei bitte folgende Spielregeln beachten:

Kommentiertes Linkverzeichnis

Grüne Texte sind nur Platzhalter, die mit der Zeit durch Mitspieler-Links ersetzt werden (04.01.2013: Ende, aus, vorbei).

  1. Manches hat ein Ende,
  2. doch das Internet hat viele.
  3. In Form einer Fehlermeldung,
  4. eines Gästebuches,
  5. eines Restaurants oder
  6. auch eines Gebets.
  7. Richtig kreativ und
  8. galaktisch bis hin zum
  9. Abschalten des Internet (mit Alt-F4 beenden)
  10. oder gar der Erde (mit Alt-F4 beenden).
  11. Hauptsache das Sichern wurde nicht vergessen.