Little Big Data – Visualisierung und Analyse von Zusammenhängen mit Smartphone und Browser

Das Thema Big Data sollte auch in Schulen betrachtet werden. Der Beitrag zeigt, wie dies mit einfachen Mitteln im Mathematik­unterricht gelingen kann. Er beschreibt einen handlungsorientierten Zugang zur Behandlung dieses Themengebietes, der nur wenig Vorbereitungsaufwand erfordert.

Jeder Computernutzer mit Internetzugang hat Zugriff auf eine gigantische Datensammlung im Web. Daneben existieren Sammlungen nicht öffentlicher Daten ähnlichen Ausmaßes. Diese entstehen u. a. dadurch, dass Telekommunikations- und Internetunternehmen Datennutzung protokollieren und auswerten, um das Kaufverhalten ihrer Kunden besser zu verstehen. Weitere Daten, insbesondere von elektronischen Sensoren, fallen durch den Ausbau des sogenannten Internets der Dinge („Internet of things“) an. Derartige Massendaten und alles, was mit ihrer Analyse zu tun hat, bezeichnet man als Big Data.

Im Bereich dieser Technologie entstehend neue Arbeitsplätze und sie beeinflusst zunehmend unser Leben. So wird sie z. B. bereits von der Polizei für die Kriminalitätsprävention genutzt: Wenn in bestimmten Gegenden zu bestimmten Zeiten eine hohe Wahrscheinlichkeit für Straftaten bestehen, werden vermehrt Polizisten dort auf Streife geschickt. Aufgrund der zunehmenden Bedeutung für unseren Alltag sollte das Thema daher auch in der Schule behandelt werden.

Zugang auf Suchanfragen von allen für alle – Google Trends

Einen möglichen unterrichtlichen Zugang stellt der Onlinedienst Google Trends® des Unternehmens Google® dar, der jedem Internetnutzer zumindest einen kumulativen Blick auf die gesammelten Suchanfragen ermöglicht – und das ohne Regis­trierung. Allerdings werden von Google Trends® keine absoluten, sondern nur relative Zahlen angegeben. Dabei erhält die maximale Zahl von Suchanfragen der letzten zehn Jahre den Wert 100. Beispielhaft sind hier Graphen gezeigt, aus denen hervorgeht, wie häufig zu einem bestimmten Zeitpunkt nach den Begriffen „Erkältung“ und „Hitze“ gesucht wurde. Die Zeitkurven verhalten sich gegenläufig (sie sind negativ korreliert). Das entspricht der Erfahrung, dass Erkältungen eher im Winter als im Sommer auftreten. Durch die Auswertung krankheitsspezifischer Suchbegriffe wird z. B. auch die räumliche Ausbreitung von Grippeerregern untersucht.

Eine mögliche Aufgabe für Schülerinnen und Schüler kann nun darin bestehen, Werte aus den Google-Trends®-Diagrammen abzulesen und sie mit einer Tabellenkalkulations-App, wie z. B. WPS Office® oder PlanMaker darzustellen. So kann man sich die Daten für zwei Suchbegriffe nicht nur als Zeitverlauf, sondern auch als Streudiagramm („Scatterplot“) anzeigen lassen. Ein derartiges Diagramm besteht aus Punkten, deren x- und y-Koordinaten hier für die (relativen) Häufigkeiten der beiden Suchbegriffe stehen.

 

Ergebnisse von Google Trends zu einer Suchanfrage
© Daniel Gembris | Ergebnisse von Google Trends zu einer Suchanfrage

Google-Werkzeug für die Analyse von Zusammenhängen

Diagramme lassen sich auch direkt von einem weiteren Google®-Onlinedienst erhalten: www.google.com/trends/correlate. Bei Eingabe der Internetadresse bitte auf das „.com“ achten.

Die Abbildung zeigt das Beispielergebnis einer dort abrufbaren Analyse. Man erkennt, dass die Benutzer, die nach dem Begriff „Hitze“ suchen, in ihren Anfragen häufig auch die Begriffe „Klimaanlage“ und „Klimageräte“ verwenden, was durch einen hohen Korrelationskoeffizienten von über 0,9 und einen ähnlichen Zeitverlauf der Suchanfragenhäufigkeit zum Ausdruck kommt.

 

Analyse-Ergebnisse
© Daniel Gembris | Analyse-Ergebnisse

 

Man sollte die Schülerinnen und Schüler darauf hinweisen, dass solche erkennbaren Zusammenhänge nicht immer auf eine Ursache-Wirkungs-Beziehung hinweisen. Ein bekanntes Beispiel: Wenn es mehr Störche gibt, werden mehr Babys geboren; die Störche sind dafür natürlich nicht verantwortlich. Zusammenhänge können sehr wohl auch auf Zufall beruhen.

Mögliche Lernziele sind, dass die Schülerinnen und Schüler Quellen für statistische Daten kennen, Zeitverläufe und Diagramme mit einer Tabellenkalkulation erstellen können und wissen, wie diese zu interpretieren sind. Lernziele für höhere Jahrgänge wären die Berechnung von Ausgleichsgeraden und die von Korrelationskoeffizienten.

Die Auswertung von Suchanfragen bietet nur einen schmalen Ausschnitt aus dem Themenkomplex Big Data. Neben dem mathematisch-technischen sollten aber unbedingt auch soziale Aspekte thematisiert werden, z. B. durch eine Selbst­reflexion der Schülerinnen und Schüler, welche Spuren sie im Netz hinterlassen.

Prof. Dr. Daniel Gembris

Weitere Informationen
Statistisches Bundesamt: www.destatis.de
Gemeinsames Portal des Bundes und der Länder: www.statistikportal.de/Statistik-Portal
Leitlinien für den Big-Data-Einsatz: www.bit.ly/2AXP8tk
Leitfaden Big Data im Praxiseinsatz: www.bit.ly/2xgaXlu

Tipp:
Beispielsweise könnten im Unterricht Zeitreihendaten zur Verbreitung von Smart­phones in der Welt und in Deutschland verglichen werden: Entwicklung der Zahl der Smart­phone-Nutzer (mit Prognose)