Piwik, freies Webstatistik System als Alternative zu Google Analytics
Wer eine Website betreibt hat stets auch ein natürlich Interesse daran, wie diese genutzt wird. Wieviele Besucher kommen auf meine Website? Woher kommen meine Besucher? Welche Inhalte werden angeschaut? Das sind nur die grundlegendsten von vielen Fragen, die sich in Bezug auf die eigene Webpräsenz stellen. Die Antworten auf diese Fragen werden benötigt um Anhaltspunkte zu bekommen um sein Angebot verbessern und auf die Zielgruppe hin optimieren zu können.
Eine kurze Geschichte über Google Analytics
Weit verbreitet ist der Einsatz von Google Analytics. Das Produkt des Suchmaschinenriesen ist eine Weiterentwicklung des Systems der Firma Urchin, die 2005 von Google aufgekauft wurde. Selbst setze ich GA seit 2006 ein und bin damit immer sehr zufrieden gewesen. Da ich diverse Services von Google nutze und viele eigene und Kundenwebsites betreue, ist es für mich auch eine Sache der Bequemlichkeit in meinem Google Account alles beisammen zu haben und nicht groß springen zu müssen. Jedoch hat die Verwendung von Google Analytics auch seine Schattenseiten. Einige davon sind vielen Nutzern gar nicht bekannt.

Was viele nicht wissen
Die Nutzung von Google Analytics ist kostenlos – meistens jedenfalls. Haben die mit GA getrackten Websites eines Accounts zusammen mehr als 5 Millionen Seitenabrufe im Monat, wird GA kostenpflichtig, außer man gibt bereits mit Googles Werbeprogramm AdWords soviel Geld aus, wie es Google für ausreichend hält – was auch immer das heißen mag. Das alles liest sich in den Nutzungsbedingungen so:
2.1 Vorbehaltlich einer Änderung der Bedingungen nach Klausel 15 wird der Service unentgeltlich erbracht, vorausgesetzt dass (a) über Ihr Account monatlich nicht mehr als fünf Millionen (5.000.000) Page Views verarbeitet werden oder (b) Sie eine aktive Adwords-Kampagne bei Google laufen haben, die nach Googles freiem Ermessen hinreichend bedeutend ist.
Weiterhin behält man sich vor für neue Features oder auch einfach nur so zum Spaß später mal zur Kasse zu bitten:
2.2 Google ist berechtigt, die Entgelte und Zahlungsbedingungen für den Service von Zeit zu Zeit zu ändern, einschließlich aber nicht beschränkt auf die Einführung zusätzlicher Entgelte für geografische Daten, für die Einführung von Kosten-Daten aus Suchmaschinen oder anderer Entgelte, die Dritte von Google oder seinen verbundenen Unternehmen für die Aufnahme von Daten in den Service beanspruchen.
Was ebenfalls gerne vergessen wird, ist die in den Nutzungsbedingungen angegebene Datenschutzpolicy (Absatz 8.1) in der eigenen Website unterzubringen, um dem gesetzlichen Anspruch genüge zu tun, über die Erfassung datenschutzrelevanter Daten und deren Übermittung an und Speicherung durch Dritte (also Google) zu informieren.
Piwik – Ausweg aus dem Dilemma
Möchte man nun also Websites mit mehr als 5 Mio. PI pro Monat auswerten, oder lässt sich die Übermittlung der Nutzungsdaten der Websites nicht mit den Datenschutzpolicys der Betreiber in Einklang bringen, oder hat man schlichtweg kein gutes Gefühl dabei Google Daten zur Verfügung zu stellen ohne genau wissen zu können, was dort alles damit gemacht wird, dann kann Piwik (ehem. phpMyVisits) eine Alternative sein. (Es gibt noch eine Reihe Analsysetools mehr, von denen auf Trends-In einige angesprochen werden.)
Piwik ist ein noch relativ junges Projekt aus Frankreich. Es handelt sich dabei um eine in PHP geschriebene Software zur Installation auf dem eigenen Webserver. Seine Daten speichert es in einer MySQL Datenbank. Hier liegt auch schonmal der erste entscheidende Vorteil: Man ist nicht mehr abhängig von einem Dienstleister und alle erfassten Daten bleiben im eigenen Haus und wandern nicht quer durchs Netz zu einem Dritten. Dennis hat sich die Mühe gemacht eine bebilderte Installationsanleitung für Piwik ins Netz zu stellen.
Im Praxiseinsatz sind Google Analytics und Piwik sehr ähnlich. In beiden muss man lediglich einen kleinen Schnipsel Javascript Code an das Ende der zu trackenden Seiten einfügen. In der Regel wird ja eh mit einem Content Management System (Wordpress, Typo3, Drupal, Joomla, …) gearbeitet, wo man den Code an nur einer Stelle des Themes einfügen muss, um die gesamte Seite zu tracken.
Was im Vergleich auffällt
Die Benutzeroberfläche ist sehr variabel gehalten. Diagramme können auf Klick ihre Darstellung ändern (Tortendiagramm, Balkendiagramm, Tag-Cloud, …), Daten können in verschiedenen Formaten exportiert und Diagramme auch auf eigenen Websites integriert werden. Die einzelnen Auswertungen sind als Plugins ausgeführt. Da die Schnittstellen offenliegen, kann man sich auch eigene Auswertugen programmieren. Zudem kann man sich das Layout der Oberfläche per Drag & Drop selbst zusammenstellen. Die persönliche Einstellung wird dann beider Anzeige aller Konten auf der eigenen Benutzer Zugriff hat, übernommen.

Piwik ist grundsätzlich Multi-Site fähig und es lassen sich auch beliebig Benutzer anlegen. Diese kann man Sites zuweisen, für die man dann Zugriff auf die Auswertungen hat. Für GA dagegen braucht jeder, der auf die Stats zugreifen möchte, einen eigenen Google Account. Manch einem Kunden ist es schon schwer zu erklären, wie er sich für einen solchen registriert und dann anmeldet.
Die Auswertung in Piwik ist live. Je nach Kapazitäten des Servers und der Anzahl der registrierten Hits kann man in der Konfigirationsdatei aber noch ein paar Einstellungen tätigen, damit sich Diagramme schneller aufbauen. Schaut sich keiner welche an, sammelt Piwik erstmal ressourenschonend. Erst wenn sich jemand einloggt oder der Archiv-Cron-Job von Piwik läuft, werden dann die “auf Halde” liegenden Daten in die Datenbank übernommen.
Greife ich mich mal exemplarisch für zwei Websites, auf denen ich sowohl Piwik als auch GA einsetze, die Auswertungen der Woche vom 9. bis 15. Februar 2009 heraus, ergibt sich grob folgendes Bild:
Website A:
- Besucher
- Piwik: 48708
- Google Analytics: 48957
- Page Impressions
- Piwik: 205958
- Google Analytics: 206644
Website B:
- Besucher
- Piwik: 1828
- Google Analytics: 1460
- Page Impressions
- Piwik: 2844
- Google Analytics: 2226
Während also eine Website praktisch identische Ergebnisse für die Kennzahlen Besuche und Seitenabrufe liefert, ergibt sich für die andere Website das Bild, dass GA 20% weniger verzeichnet als Piwik. Eine Erklärung für diese Differenz liegt aktuell nicht vor.
Piwik Einsatz mit SSL
Wer Piwik selbst einsetzen möchte, um auch Zugriffe auf SSL geschützte (HTTPS) Seiten zu protokollieren, kann dies ebenso wie bei Google Analytics tun. Der JavaScript Tracking Code erkennt automatisch, wenn die Seite über HTTPS ausgeliefert wird und lädt das Tracking entsprechend auch per HTTPS vom Piwik-Server. Das bedeutet wiederum, dass dieser auch via HTTPS erreichbar sein muss und zudem ein allgemein ohne Rückfrage durch die Browser anerkanntes Zertifikat benutzen sollte. Grundsätzlich empfiehlt es sich eh sensitive Kundendaten ausschließlich via SSL ins Netz zu bringen, gerade wenn dem Einsatz von Piwik Datenschutzbedenken in Richtung Google zugrunde liegen.
Wer auf der Suche nach einem passenden Zertifikatshändler ist, sollte mal einen Blick auf PSW werfen, mit denen ich persönlich sehr gute Erfahrungen gemacht habe.
Mit folgendem Eintrag in einer .htaccess Datei lasse ich mein Piwik so laufen, dass das Webinterface ausschließlich abegesichert aufgerufen werden kann (ggf. wird automatisch umgeleitet), während das Tracking-Script auch weiterhin unverschlüsselt gezogen werden kann:
<ifmodule mod_rewrite.c>
RewriteEngine On
RewriteCond %{HTTPS} !=on
RewriteRule ^$ https://%{SERVER_NAME}/index.php$1 [L,R]
RewriteCond %{HTTPS} !=on
RewriteRule ^index.php$ https://%{SERVER_NAME}/index.php$1 [L,R]
</ifmodule>
Front-End Optimierung
Zusätzlich liefere ich alle Daten komprimiert aus, sowohl im Webinterface, als auch für das reine Tracking. Der Schnipsel ist natürlich nicht nur für Piwik, sondern generell dann nützlich, wenn der Webserver keinen Engpass in Sachen Rechenkraft aufweist. In der Version 0.2.30 von Piwik werden so lediglich 2265 Bytes für die piwik.js übertragen, anstatt 7720.
<ifmodule mod_deflate.c> AddOutputFilterByType DEFLATE text/html text/plain text/xml application/xml application/xhtml+xml text/javascript text/css application/x-javascript application/javascript BrowserMatch ^Mozilla/4 gzip-only-text/html BrowserMatch ^Mozilla/4.0[678] no-gzip BrowserMatch bMSIE !no-gzip !gzip-only-text/html SetEnvIf User-Agent ".*MSIE.*" nokeepalive ssl-unclean-shutdown downgrade-1.0 force-response-1.0 </ifmodule>
Überblick
Wer mehrere Websites mit Piwik beobachtet, für den mag auch das die freie Adobe Air Anwendung Piwik Connector von Tino Goetz interessant sein. Mit ihr kann man alle Sites, auch über mehrere Piwik Accounts hinweg, übersichtlich im Auge behalten. Dargestellt werden zwar nur Besuche und Seitenabrufe, aber für einen Überblick ist das in der Regel völlig ausreichend.

Ausblick
Zu diesem Zeitpunkt ist Version 0.2.30 aktuell. Das Piwik Team arbeitet fleißig auf einer Version 1.0 hin. Was darin enthalten sein soll und auch nicht darin enthalten sein soll, kann man der Roadmap entnehmen. Interessant ist auch, dass man bereits im letzten Jahr einen hauptamtlichen Programmierer eingestellt hat, es handelt sich also um kein reines Hobbyprojekt, sondern das Werk einiger ambitionierter Entwickler.
Ich werde Piwik jedenfalls treu bleiben. In Kürze geht die ersten Piwik-only getrackte Websites von mir ans Netz und für die nahe Zukunft werde ich nach und nach Websites aus Google Analytics abziehen.
Weitere interessante Artikel:
Wenn dir der Eintrag gefallen hat, tu mir doch den Gefallen und schreibe einen Kommentar und / oder abonniere den Newsfeed und erhalte zukünftig Artikel direkt über deinen Newsreader.
Kommentare / Trackbacks / Pingbacks
Mir hat Piwik auf den ersten Blick sehr gefallen. Sah fast so wie Google Analytics aus, ließ sich leicht bedienen und schien fast alle Aufzeichnungsmöglichkeiten zu haben, die man sich so wünscht. Aber jetzt nach ca. 4 Wochen “Testphase” hab ich das Zeug wieder runtergehauen. Es wurden meiner Meinung nach garnicht alle Besucher geloggt, die Refferer hat es nicht richtig gespeichert, und die ein oder andere Funktion hat dann doch gefehlt, die ich an Google Analytics zu schätzen gewusst habe. So zum Beispiel die genaue Aufschlüsselung der Browsertypen, die die Webseite besucht haben usw…
Solche kleinen Sachen haben sich dann summiert und führten zum Entschluss, Piwik wieder zu entfernen.
Mittlerweile habe ich mit Piwik eine siebenstellige Zahl von Einträgen verarbeitet und keine solchen Probleme gehabt. Die Browser-Aufschlüsselung findet sind unter Besucher -> Einstellungen, bzw. im Widget Besuchersettings -> User Browser
Ein sehr hilfreicher Artikel, danke.
Ich bin schon länger am überlegen, ob ich mich von Google Analytics trenne.
Der Artikel hat mir die letztliche Überzeugung geliefert. Zumal ja seit Entstehung des Artikels Piwik sich noch weiter entwickelt hat.
Sehr schöner Artikel. Besonders der Einblick in die Google Analytics Nutzerbedingungen hat mir gefallen. Ich muss zugeben das ich diese noch nie gelesen habe. :P

[...] Analytics, unheimlich befruchtet hat, ist er nun auch noch meinem Wunsch nachgekommen und hat einen ausführlichen Beitrag dazu auf seinem Blog veröffentlicht. Sehr lesenswert [...]