Piwik, freies Webstatistik System als Alternative zu Google Analytics

Wer eine Website betreibt hat stets auch ein natürlich Interesse daran, wie diese genutzt wird. Wieviele Besucher kommen auf meine Website? Woher kommen meine Besucher? Welche Inhalte werden angeschaut? Das sind nur die grundlegendsten von vielen Fragen, die sich in Bezug auf die eigene Webpräsenz stellen. Die Antworten auf diese Fragen werden benötigt um Anhaltspunkte zu bekommen um sein Angebot verbessern und auf die Zielgruppe hin optimieren zu können.

Eine kurze Geschichte über Google Analytics

Weit verbreitet ist der Einsatz von Google Analytics. Das Produkt des Suchmaschinenriesen ist eine Weiterentwicklung des Systems der Firma Urchin, die 2005 von Google aufgekauft wurde. Selbst setze ich GA seit 2006 ein und bin damit immer sehr zufrieden gewesen. Da ich diverse Services von Google nutze und viele eigene und Kundenwebsites betreue, ist es für mich auch eine Sache der Bequemlichkeit in meinem Google Account alles beisammen zu haben und nicht groß springen zu müssen. Jedoch hat die Verwendung von Google Analytics auch seine Schattenseiten. Einige davon sind vielen Nutzern gar nicht bekannt.

Google Analytics Screenshot

Was viele nicht wissen

Die Nutzung von Google Analytics ist kostenlos – meistens jedenfalls. Haben die mit GA getrackten Websites eines Accounts zusammen mehr als 5 Millionen Seitenabrufe im Monat, wird GA kostenpflichtig, außer man gibt bereits mit Googles Werbeprogramm AdWords soviel Geld aus, wie es Google für ausreichend hält – was auch immer das heißen mag. Das alles liest sich in den Nutzungsbedingungen so:

2.1 Vorbehaltlich einer Änderung der Bedingungen nach Klausel 15 wird der Service unentgeltlich erbracht, vorausgesetzt dass (a) über Ihr Account monatlich nicht mehr als fünf Millionen (5.000.000) Page Views verarbeitet werden oder (b) Sie eine aktive Adwords-Kampagne bei Google laufen haben, die nach Googles freiem Ermessen hinreichend bedeutend ist.

Weiterhin behält man sich vor für neue Features oder auch einfach nur so zum Spaß später mal zur Kasse zu bitten:

2.2 Google ist berechtigt, die Entgelte und Zahlungsbedingungen für den Service von Zeit zu Zeit zu ändern, einschließlich aber nicht beschränkt auf die Einführung zusätzlicher Entgelte für geografische Daten, für die Einführung von Kosten-Daten aus Suchmaschinen oder anderer Entgelte, die Dritte von Google oder seinen verbundenen Unternehmen für die Aufnahme von Daten in den Service beanspruchen.

Was ebenfalls gerne vergessen wird, ist die in den Nutzungsbedingungen angegebene Datenschutzpolicy (Absatz 8.1) in der eigenen Website unterzubringen, um dem gesetzlichen Anspruch genüge zu tun, über die Erfassung datenschutzrelevanter Daten und deren Übermittung an und Speicherung durch Dritte (also Google) zu informieren.

Piwik – Ausweg aus dem Dilemma

Möchte man nun also Websites mit mehr als 5 Mio. PI pro Monat auswerten, oder lässt sich die Übermittlung der Nutzungsdaten der Websites nicht mit den Datenschutzpolicys der Betreiber in Einklang bringen, oder hat man schlichtweg kein gutes Gefühl dabei Google Daten zur Verfügung zu stellen ohne genau wissen zu können, was dort alles damit gemacht wird, dann kann Piwik (ehem. phpMyVisits) eine Alternative sein. (Es gibt noch eine Reihe Analsysetools mehr, von denen auf Trends-In einige angesprochen werden.)

Piwik ist ein noch relativ junges Projekt aus Frankreich. Es handelt sich dabei um eine in PHP geschriebene Software zur Installation auf dem eigenen Webserver. Seine Daten speichert es in einer MySQL Datenbank. Hier liegt auch schonmal der erste entscheidende Vorteil: Man ist nicht mehr abhängig von einem Dienstleister und alle erfassten Daten bleiben im eigenen Haus und wandern nicht quer durchs Netz zu einem Dritten. Dennis hat sich die Mühe gemacht eine bebilderte Installationsanleitung für Piwik ins Netz zu stellen.

Im Praxiseinsatz sind Google Analytics und Piwik sehr ähnlich. In beiden muss man lediglich einen kleinen Schnipsel Javascript Code an das Ende der zu trackenden Seiten einfügen. In der Regel wird ja eh mit einem Content Management System (WordPress, Typo3, Drupal, Joomla, …) gearbeitet, wo man den Code an nur einer Stelle des Themes einfügen muss, um die gesamte Seite zu tracken.

Was im Vergleich auffällt

Die Benutzeroberfläche ist sehr variabel gehalten. Diagramme können auf Klick ihre Darstellung ändern (Tortendiagramm, Balkendiagramm, Tag-Cloud, …), Daten können in verschiedenen Formaten exportiert und Diagramme auch auf eigenen Websites integriert werden. Die einzelnen Auswertungen sind als Plugins ausgeführt. Da die Schnittstellen offenliegen, kann man sich auch eigene Auswertugen programmieren. Zudem kann man sich das Layout der Oberfläche per Drag & Drop selbst zusammenstellen. Die persönliche Einstellung wird dann beider Anzeige aller Konten auf der eigenen Benutzer Zugriff hat, übernommen.

Piwik Screenshot

Piwik ist grundsätzlich Multi-Site fähig und es lassen sich auch beliebig Benutzer anlegen. Diese kann man Sites zuweisen, für die man dann Zugriff auf die Auswertungen hat. Für GA dagegen braucht jeder, der auf die Stats zugreifen möchte, einen eigenen Google Account. Manch einem Kunden ist es schon schwer zu erklären, wie er sich für einen solchen registriert und dann anmeldet.

Die Auswertung in Piwik ist live. Je nach Kapazitäten des Servers und der Anzahl der registrierten Hits kann man in der Konfigirationsdatei aber noch ein paar Einstellungen tätigen, damit sich Diagramme schneller aufbauen. Schaut sich keiner welche an, sammelt Piwik erstmal ressourenschonend. Erst wenn sich jemand einloggt oder der Archiv-Cron-Job von Piwik läuft, werden dann die “auf Halde” liegenden Daten in die Datenbank übernommen.

Greife ich mich mal exemplarisch für zwei Websites, auf denen ich sowohl Piwik als auch GA einsetze, die Auswertungen der Woche vom 9. bis 15. Februar 2009 heraus, ergibt sich grob folgendes Bild:

Website A:

Website B:

Während also eine Website praktisch identische Ergebnisse für die Kennzahlen Besuche und Seitenabrufe liefert, ergibt sich für die andere Website das Bild, dass GA 20% weniger verzeichnet als Piwik. Eine Erklärung für diese Differenz liegt aktuell nicht vor.

Piwik Einsatz mit SSL

Wer Piwik selbst einsetzen möchte, um auch Zugriffe auf SSL geschützte (HTTPS) Seiten zu protokollieren, kann dies ebenso wie bei Google Analytics tun. Der JavaScript Tracking Code erkennt automatisch, wenn die Seite über HTTPS ausgeliefert wird und lädt das Tracking entsprechend auch per HTTPS vom Piwik-Server. Das bedeutet wiederum, dass dieser auch via HTTPS erreichbar sein muss und zudem ein allgemein ohne Rückfrage durch die Browser anerkanntes Zertifikat benutzen sollte. Grundsätzlich empfiehlt es sich eh sensitive Kundendaten ausschließlich via SSL ins Netz zu bringen, gerade wenn dem Einsatz von Piwik Datenschutzbedenken in Richtung Google zugrunde liegen.

Wer auf der Suche nach einem passenden Zertifikatshändler ist, sollte mal einen Blick auf PSW werfen, mit denen ich persönlich sehr gute Erfahrungen gemacht habe.

Mit folgendem Eintrag in einer .htaccess Datei lasse ich mein Piwik so laufen, dass das Webinterface ausschließlich abegesichert aufgerufen werden kann (ggf. wird automatisch umgeleitet), während das Tracking-Script auch weiterhin unverschlüsselt gezogen werden kann:


<ifmodule mod_rewrite.c>
RewriteEngine On

RewriteCond %{HTTPS} !=on
RewriteRule ^$ https://%{SERVER_NAME}/index.php$1 [L,R]

RewriteCond %{HTTPS} !=on
RewriteRule ^index.php$ https://%{SERVER_NAME}/index.php$1 [L,R]
</ifmodule>

Front-End Optimierung

Zusätzlich liefere ich alle Daten komprimiert aus, sowohl im Webinterface, als auch für das reine Tracking. Der Schnipsel ist natürlich nicht nur für Piwik, sondern generell dann nützlich, wenn der Webserver keinen Engpass in Sachen Rechenkraft aufweist. In der Version 0.2.30 von Piwik werden so lediglich 2265 Bytes für die piwik.js übertragen, anstatt 7720.


<ifmodule mod_deflate.c>
AddOutputFilterByType DEFLATE text/html text/plain text/xml application/xml application/xhtml+xml text/javascript text/css application/x-javascript application/javascript
BrowserMatch ^Mozilla/4 gzip-only-text/html
BrowserMatch ^Mozilla/4.0[678] no-gzip
BrowserMatch bMSIE !no-gzip !gzip-only-text/html
SetEnvIf User-Agent ".*MSIE.*" nokeepalive ssl-unclean-shutdown downgrade-1.0 force-response-1.0
</ifmodule>

Überblick

Wer mehrere Websites mit Piwik beobachtet, für den mag auch das die freie Adobe Air Anwendung Piwik Connector von Tino Goetz interessant sein. Mit ihr kann man alle Sites, auch über mehrere Piwik Accounts hinweg, übersichtlich im Auge behalten. Dargestellt werden zwar nur Besuche und Seitenabrufe, aber für einen Überblick ist das in der Regel völlig ausreichend.

Piwik Connector Screenshot

Ausblick

Zu diesem Zeitpunkt ist Version 0.2.30 aktuell. Das Piwik Team arbeitet fleißig auf einer Version 1.0 hin. Was darin enthalten sein soll und auch nicht darin enthalten sein soll, kann man der Roadmap entnehmen. Interessant ist auch, dass man bereits im letzten Jahr einen hauptamtlichen Programmierer eingestellt hat, es handelt sich also um kein reines Hobbyprojekt, sondern das Werk einiger ambitionierter Entwickler.

Ich werde Piwik jedenfalls treu bleiben. In Kürze geht die ersten Piwik-only getrackte Websites von mir ans Netz und für die nahe Zukunft werde ich nach und nach Websites aus Google Analytics abziehen.

Weitere interessante Artikel:

 
Tags: , , ,


Wenn dir der Eintrag gefallen hat, tu mir doch den Gefallen und schreibe einen Kommentar und / oder abonniere den Newsfeed und erhalte zukünftig Artikel direkt über deinen Newsreader.

Kommentare / Trackbacks / Pingbacks

[...] Analytics, unheimlich befruchtet hat, ist er nun auch noch meinem Wunsch nachgekommen und hat einen ausführlichen Beitrag dazu auf seinem Blog veröffentlicht. Sehr lesenswert [...]

Mir hat Piwik auf den ersten Blick sehr gefallen. Sah fast so wie Google Analytics aus, ließ sich leicht bedienen und schien fast alle Aufzeichnungsmöglichkeiten zu haben, die man sich so wünscht. Aber jetzt nach ca. 4 Wochen “Testphase” hab ich das Zeug wieder runtergehauen. Es wurden meiner Meinung nach garnicht alle Besucher geloggt, die Refferer hat es nicht richtig gespeichert, und die ein oder andere Funktion hat dann doch gefehlt, die ich an Google Analytics zu schätzen gewusst habe. So zum Beispiel die genaue Aufschlüsselung der Browsertypen, die die Webseite besucht haben usw…

Solche kleinen Sachen haben sich dann summiert und führten zum Entschluss, Piwik wieder zu entfernen.

Mittlerweile habe ich mit Piwik eine siebenstellige Zahl von Einträgen verarbeitet und keine solchen Probleme gehabt. Die Browser-Aufschlüsselung findet sind unter Besucher -> Einstellungen, bzw. im Widget Besuchersettings -> User Browser

Ein sehr hilfreicher Artikel, danke.
Ich bin schon länger am überlegen, ob ich mich von Google Analytics trenne.
Der Artikel hat mir die letztliche Überzeugung geliefert. Zumal ja seit Entstehung des Artikels Piwik sich noch weiter entwickelt hat.

Sehr schöner Artikel. Besonders der Einblick in die Google Analytics Nutzerbedingungen hat mir gefallen. Ich muss zugeben das ich diese noch nie gelesen habe. :P

Hallo Alexander,

ich habe mir am Wochenende Piwik installiert und bin schon ziemlich gut zufrieden damit. Aber eine Sache krieg ich net raus, vielleicht kannst du mir helfen? Zwar sehe ich, wie viele Besucher gestern auf meiner Website waren, aber wo steht, wie viele es insgesamt waren? Find’s einfach nicht :(

Danke schon einmal!
Birgit

Hallo Birgit,

was meinst denn du denn genau mit “gesamt”?

Grüße,
Alex

Huhuu Alexander,

also… ich kann oben ja einstellen, ob ich die Werte für einen Tag, eine Woche oder auch ein Jahr anzeigen lassen möchte. Was aber, wenn das Tool über Jahre läuft, dann möchte ich irgendwo die absolute Gesamtsumme der Besucher sehn. Etwa, um den 100.000. Besucher zu feiern. Also die Summe aller jemals dagewesenen Besucher.

Hallo Birgit,

also genau genommen siehst du dann eine Auswertung nach Tag, Woche, Monat, Jahr. Hast du Daten aus mehreren Jahren, siehst du diese auch. Diese werden zwar nicht insgesamt aufsummiert, aber das es Piwik noch nicht sooo lange gibt, kann man das noch eben zusammenzählen. Die Daten der vergangenen Jahre ändern sich ja nicht mehr ;)

Die statistische Auswertung dient ja in erster Linie der Erfolgskontrolle, auch von SEO und Marketingmaßnahmen und da dürften solche Werte “über alles” eher keine Rolle spielen.

Hmm, die von Piwik kennen mich noch nicht, sonst hätten sie es längst eingebaut. Ich bin doch auf jeden Besucher so stolz… und je mehr, desto stolzer ;)

Dank dir für deine Antwort, zumindest weiß ich jetzt, dass ich net blind bin. Und Piwik ist trotz allem klasse, auch wenn ich es erst seit wenigen Tagen laufen habe.

Es hat aber auch so seine Tücken, wenn man viel darüber laufen lässt. Für die meisten Blogs und Homepages dürfte es kein Problem darstellen, aber wenn du anfängst damit Sites zu tracken, wo richtig was los ist, dann hast du schnell die Situation, dass du ordentlich Hardware hinterherwerfen musst. Das dürfte bei Google nicht anders sein, die haben aber genug davon ;-)

Klasse Anleitung, vielen Dank. War schon lange auf der Suche nach einer Alternative für Analytics und heute ist die Umstellung endlich erfolgt. Vor allem ist es wesentlich schneller als das Google-System :-)

Je nachdem wie man Piwik konfiguriert sind die Statistiken live oder zumindest zeitnah. Mit hochvolumigen Seiten in der Auswertung muss man dann schon mit den Einstellungen jonglieren und braucht recht ordentlich Platz und Performance auf dem Server.

Das wird aber tendenziell erst ein Thema wenn man in siebenstellige Bereiche kommt.

Mit schneller meinte ich eigentlich nicht die Auswertung, sondern den Aufruf des Codes. Der eigene Server antwortet schneller als der Google-Analytics ;-)

Die Auswertung machte heute schon Problem… -> Timeout… Habe nun mal die Archivierung abgestellt und den Cron eingerichtet, mal sehen wie es nun läuft. Piwik läuft alleine auf dem Server, hoffe nur der packt das auch. 7-stellig… Das habe ich jeden Tag, wenn ich alle Domänen zusammenrechne.

Ich habe das enable_browser_archiving_triggering auf true gelassen, weil es sich ausgeschaltet nicht mit time_before_today_archive_considered_outdated vertragen hat, das ich auf 900 Sekunden eingestellt habe. Parallel läuft auch der Cron bei mir alle 15 Minuten.

Gehe ich nun ins Piwik muss der Archiving-Prozess maximal die Daten der letzten 14:59 Minuten neu auswerten.

Ok, das ist mal ein neuer Anhaltspunkt, ist ja noch alles Neuland für mich.

time_before_today_archive_considered_outdated habe ich derzeit erst mal auf 300, also 5 Minuten und den enable_browser_archiving_triggering auf 0 . Bei mir verträgt sich das wohl, zumindest bekomme ich keine Fehler. Wie hast Du denn gemerkt, dass es sich nicht vertragen hat?

Der Cron steht auf 24 Stunden, aber ich starte den vorerst eh immer per Hand zwischendurch, damit ich sehe was der tut, oder gegebenenfalls auch nicht.

P.S: Das verstümmelte Post vorhin lag an dem Anführungszeichen die ich zuvor um ..schneller.. herum hatte. Die mag das System hier wohl nicht ;-)

Ich habs so gemerkt, dass auch nach durchgelaufenen Crons die Daten im Frontend noch dieselben waren.

Kein Problem wegen dem Post. Mollom ist da wohl etwas komisch. Muss mal das Plugin updaten.. :)

So, nun bin ich es nochmal. Hatte nämlich bemerkt, dass ich das gleiche Problem hatte. Der aktuelle Tag wurde nicht aktualisiert – wie bei Dir. Hab dann die ganzen neuen Revisionen versucht, aber auch da ging es nicht, allerdings waren die alle schon wesentlich schneller. Jetzt, seit heute Morgen, habe ich die Piwik 0.6-rc2 installiert. Ist gut doppelt so schnell wie die 0.5.5 und das Update per Cron geht nun auch :-)

Danke für das Update. Dann kann ich mich ja schonmal auf die nächste Version von Piwik freuen. Bei dem Stand RC2 dürfte es ja nicht mehr lang dauern :)

Super Artikel. Ich habe mich nun auch von Google Analytics getrennt.. Danke für den ausführlichen Artikel.
Grüße!

Hallo Alexander!
Ich habe auch vor mich von Analytics zu trennen, da ich nicht mehr will, das G. alles von mir weiß!
Kannst du nach deinen Tests mittlerweile sagen, ob du seitdem irgendetwas an Analytics vermisst?Gruß,Band-IT

Moin!

Es fehlt noch Schnickschnack, wie beispielsweise das Überlagern zweier Zeiträume, um etwa mal das die letzten 12 Monate mit den 12 Monaten davor vergleichen zu können. In Sachen Usability hat Google Analytics da schon die Nase vorn. Ich kann in Piwik zwar bei einzelnen Auswertungen anklicken, dass ich das Ding als Tortendiagramm sehen möchte, aber das sind noch Einstellungen, die nicht gespeichert werden. GA ist auch irgendwie übersichtlicher.

E-Commerce, Trichterauswertung, .. das gibt es so in Piwik auch nicht. Wenn man selbst GA gar nicht soweit benutzt, wird man diese Funktionen auch nicht vermissen.

Also mir fehlt im Piwik eigentlich nur die Option, dass man Keywörter pro Seite sehen kann und nicht nur pro Domain, alles andere aus Analytics hatte ich eh nicht benutzt.Aber mal was anderes. Oben in der .htaccess Zeile 8 fehlt ein vor dem Punkt – bei index.php. Der Punkt sollte maskiert werden.Die Komprimierung der .js Ausgabe bringt auch nicht so arg viel, besser wäre es da mod_expires (zusätzlich) zu aktivieren. Die Hauptlast verursacht nämlich auch nicht die piwik.js, sondern die piwik.php.

Guter Artikel danke sehr für die Arbeit. Für die jenigen die sich kurz ein Bild von Piwik machen wollen gibt es hier ein Video von ralph segert.

bei mir hat Piwik leider nicht funktioniert. Installation alles ok aber dann war Schluß. Keine Anmeldung möglich.

@Andreas: Heute ist Code eingecheckt worden, sodass im Dashboard die Einstellungen gespeichert werden (also welches Diagramm du ausgewählt hast). Überlagern von Zeiträumen ist in Planung, es existiert bereits ein Ticket in trac.@Uwe: Schicke bitte einen Bug-Report an die Entwickler. Z.B. unter http://forum.piwik.org


Schreibe einen Kommentar

(erforderlich)

(erforderlich)