Mancher fragt sich vielleicht: Wie kann die LUG Stormarn sagen, dass sie keine personenbezogenen Daten bei der Nutzung erheben, dann aber doch regelmäßig eine anonyme Statistik der Videokonferenznutzung veröffentlichen?
Daher möchten wir im Folgenden das Verfahren der Erhebung und Speicherung unserer Nutzungsstatistik darlegen.
Grundlage der Nutzungsstatistik sind die anfallenden Webserver-Logfiles unseres Apache Webservers. Dort werden die einzelnen Zugriffe auf die Seiten des LUG Stormarn Webservers u.a. unter Angabe der IP Adresse gespeichert. Diese Logfiles heben wir max. 14 Tage auf, um im Fehler- oder Sicherheitsstörfall auch nachträglich über einen kurzen zurückliegenden Zeitraum mögliche Ursachen, Zusammenhänge und Lösungen ermitteln zu können (siehe dazu auch unsere Datenschutzerklärung unter "Erhebung von Zugriffsdaten und Logfiles").
Um die Statistik auch über diesen Zeitraum hinweg fortschreiben zu können, wird täglich automatisiert (um 23:55 Uhr per Cron-Job) ermittelt, wie viele unterschiedliche IP-Adressen an diesem Tag jeweils auf eine Konferenz-URL mit dem gleichen Raumnamen laut Webserver Log zugegriffen haben. Hierbei kommt folgendes Bash-Script 'meet-usage' zum Einsatz. Die Ausgabe dieses Scripts beinhaltet lediglich die Anzahl der unterschiedlichen IPs (nicht die IPs selber) sowie einen SHA-1-Hash des Raumnamens. Den Raumnamen hashen wir, da darin personenbezogene Informationen (z.B. 'PetersKonferenz') enthalten sein können. Eine Rückübersetzung des Hashwertes zum Raumnamen ist nicht möglich (siehe dazu u.a. auch Wikipedia:Hashfunktion und Wikipedia:Secure_Hash_Algorithm).
Alle Konferenzen werden jeweils mit der Anzahl der teilgenommenen IPs sowie dem Hashwert des Raumes in ein separates Tages-Logfile für den jeweiligen Tag geschrieben. Ein solches Tages-Logfiles sieht bspw. folgendermaßen aus:
5 d8dd82b4a3161d0eac8543b4867c2758533643b5
1 34d24bf10f9cb0ecddc3409113e253b693559a72
6 0d4114315d3292daa6b4efae2cf28aa287d4863c
1 1e3ff4a4ad28421aef00418a37e27ada6ea1b1d1
56 374935dec0d3632a284e67bb45036fd1a0591724
1 c2f48ebf810fbdd9a05b5806209da527b83a5138
2 0d15d73728ebcafb6959ea0b68826daad44e0e4a
1 9b02d9974c14e223c9ffbed7360beacbf0dcb95f
6 608b04b482b1f4d6c8c1b81f975cf789ed4fc2f9
Konferenzen mit nur einer zugegriffenen IP werden bei den weiteren Auswertungen herausgefiltert und nicht gezählt, da es sich bei diesen um keine Konferenzen, sondern eher nur um Tests einzelner Teilnehmer handelt.
Zur Ermittlung der Statisktik werden nun über einen definierten Zeitraum in allen dazugehörigen Statistik-Tages-Logs jeweils alle Anzahl IPs für die Teilnehmerzahl summiert sowie alle Zeilen mit den Konferenz-Hashes für die Anzahl Konferenzen gezählt. Gleiche Hashes an unterschiedlichen Tagen (d.h. bspw. regelmäßige Konferenzen mit immer gleichem Raumnamen, bspw. 'UnserMittwochsTreffen' oder das 'LUGTreffen' einmal im Monat) werden dabei an jedem gefundenen Tag als neue Konferenz gezählt. Dagegen werden unterschiedliche Konferenzen am gleichen Tag mit dem selben Raumnamen (z.B. ein morgendliches und ein nachmittagliches dienstliches Status-Meeting) nur als eine Konferenz gewertet. Leichte Ungenauigkeiten sind unvermeidbar, auch wenn z.B. mehrere Teilnehmer aus dem gleichen Netzwerk mit der selben IP Adresse (Stichwort: Network Address Translation am DSL-Router) teilnehmen und nur als ein Teilnehmer erkannt und gewertet werden.
Auf diese Weise können wir als Betreiber aber den Erfolg der Nutzung unseres Videokonferenzsystems für uns hinreichend messen ohne hierfür personenbezogene Daten speichern zu müssen.
Fragen, Anregungen oder konkrete Verbesserungsvorschläge hierzu sendet uns gerne über unsere Kontakt Adressen.