Jeder Webmaster, der seine Arbeit ernst nimmt, möchte wissen, ob seine Seiten besucht werden, wie viele Besucher kommen, wie lange sie bleiben, wie viele Seiten sie betrachten, was sie lesen und was nicht, mit welchen Browsern sie sich die Seiten anzeigen lassen, wie groß ihre Displays sind und von woher sie gekommen sind. Interessant ist ferner, durch welche Suchbegriffe sie auf der eigenen Website gelandet sind, ob es Links auf anderen Websites gibt, durch die Besucher kommen und ob Fehler festgestellt werden.
Dabei geht es nicht um das Ausspionieren von Besuchern, sondern um die Überprüfung der eigenen Technik und des Inhalts. Was bringt es, wenn die eigenen Websites auf vielen Medien schlecht aussehen oder von gängigen Browsern nicht richtig angezeigt werden? Die Frage nach dem Grad des Interesses an Beiträgen ist ebenfalls legitim und berechtigt, denn es macht wenig Sinn Stoff zu publizieren, den keiner lesen mag.
Analysetools
Es gibt verschiedene Möglichkeiten, um Auskünfte zu erhalten. Google hat ein Analysetool, die Hoster führen entsprechende Statistiken und Piwik ist bekannt als gutes Dokumentationsinstrument.
Vor vielen Jahren, als Websites aus HTML-Seiten und eingebetteten Bildern bestanden, waren die Ergebnisse der Analyseprogramme übersichtlich und leicht zu verstehen. Doch mit dem Aufkommen von Websites, die über PHP-Seiten und Datenbanken funktionierten, wurden die Aufrufe von technischen Seiten, die lediglich zur Darstellung welche Inhalte dienten, genauso protokolliert wie die tatsächlichen Inhalte. So konnte es sein, dass eine ‚template.html‘ oder eine ’style.css‘ neben anderen irrelevanten Angaben durch häufige Zugriffe weit oben in der Liste standen, doch haben diese Einträge keinerlei Wert hinsichtlich der Fragen der Webmaster.
Piwik
Unter den Websitemachern ist das kostenlose Programm Piwik beliebt. Für jede Website und bei Bedarf sogar für separate Unterbereiche einer Website, wird ein Code erzeugt, der in die Webseiten eingebettet wird. Beim Aufruf der Seiten im Internet meldet der Code diverse Infos an die Piwik-Installation, die sie brav in eine Datenbank einträgt.
Piwik protokolliert den Aufruf von Seiten mit Inhalten und filtert technische Seiten wie die ‚template.html‘ und andere Hilfsdateien aus. Was will man mehr?
Leider gibt es seitens der Webmaster keine Möglichkeit, die Zuverlässigkeit und Qualität der Protokollsysteme zu kontrollieren. Beispielsweise ist nicht erkennbar, ob Menschen, die mit einem Tarnkappenmodus surfen, erfasst werden. Niemand weiß, wie genau die Zählwerke sind.
Probleme
In die Websites medienarchiv.com und photoinfos.com wurden Coppermine-Bilddatenbanken integriert. Die Seiten der Datenbanken wurden mit eigens generierten Piwik-Zählcodes versehen, um ihre Aufrufe zu protokollieren. Versuchsweise wurde für eine Bilddatenbank ein zweiter Code generiert. Beide Zählcodes wurden auf jeder Seite an zwei unterschiedlichen Stellen eingefügt. Theoretisch müssten zwei Zählwerke genau die gleichen Aktionen dokumentieren. Dem war nicht so.
Für die Datenbank unter medienarchiv.com (http://www.medienarchiv.com/a-archiv/) wurden für denselben Zeitraum 13 Bsucher mit 56 Seitenaufrufen und 2 Besucher mit 2 Seitenaufrufen protokolliert. Interessanterweise zählten die beiden Piwik-Codes jeweils Besuche, die durch den anderen Code nicht erfasst wurden. Es war nicht so, dass der eine Code alle Besucher zählte und der andere Code nur ein Teil davon. Tatsächlich waren die Besuche, die der eine Code protokollierte nicht in der Erfassung durch den anderen Code enthalten.
Diese unterschiedlichen Ergebnisse machen deutlich, dass die Ergebnisse der Analysetools heikel sind. Die Tücke liegt im Detail, nämlich zunächst bei der Frage, wo genau ein Zählcode einzufügen ist. Im Falle von Coppermine wäre das eigentlich im HTML-Code der template.html vor dem Eintrag </body>. Doch werden damit nicht alle Besucher erfasst.
Für die Bildatenbank innerhalb der Website photoinfos.com (http://www.photoinfos.com/telescopes/) wurden gar keine Zugriffe protokolliert, was an dem Tag total an der Realität vorbeiging, denn der Hinweis auf genau das betreffende Bildarchiv hatte am selben Tag bei Facebook einige ‚Likes‘ bekommen. Warum hätte jemand die vergeben sollen, wenn angeblich niemand auf der Seite war?
Mit dieser Problematik ist vor allem bei der Verwendung von php- und datenbankgestützten Websites zu rechnen. Das ist insofern misslich, als die Zugriffszahlen in Verhandlungen über Werbeeinblendungen und daraus resultierender Erträge eine wichtige Rolle spielen. Wer beispielsweise ein großes Pflanzenarchiv aufwändig im Internet präsentiert und mit einem großen Gartenbauhändler über das Einblenden eines bezahlen Werbebanners verhandelt, braucht zuverlässige und belastbare Angaben über die Häufigkeit von Besuchen.