Datenexploration - Datendetektive bei der Arbeit: Unterschied zwischen den Versionen

Aus Unterrichtsmaterial
Wechseln zu:Navigation, Suche
K
(12 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
{{Infobox|image=Datei:ProDaBi Logo.png|thema=ProDaBi|Material=Datei:Datenexploration - Datendetektive bei der Arbeit.zip|Autor=Podworny|subpages=True|Material1=|Material2=|Material_Name=Unterrichtsreihe.zip}}
+
{{Infobox|image=Datei:ProDaBi Logo.png|thema=ProDaBi|Autor=Podworny|subpages=True|Material1=|Material2=|Material1_Name=|Material2_Name=}}
In dieser Unterrichtseinheit geht es um Data Science Inhalte für die 9./10. Klasse. Anhand eines fiktiven Rahmenbeispiels einer Online-Plattform, die Werbung für Jugendliche passgenau schalten möchte, sollen die Schülerinnen und Schüler motiviert werden, als Datendetektive in einem Datensatz nach Spuren und Mustern zu suchen, um so die Online-Plattform zu beraten.
+
In dieser Unterrichtseinheit geht es um Data Science Inhalte für die 8.-10. Klasse. Anhand eines fiktiven Rahmenbeispiels einer Online-Plattform, die Werbung für Jugendliche passgenau schalten möchte, werden Schülerinnen und Schüler motiviert, als Datendetektive in einem Datensatz nach Spuren und Mustern zu suchen, um so die Online-Plattform zu beraten.
  
Es stehen Arbeitsblätter, PowerPoint-Präsentationen, Anleitungen, der Datensatz (JIM-Datensatz), Variablenlisten und dieser Überblick über die einzelnen Stunden zur Verfügung. Für die Datenanalyse wird die Software CODAP (codap.concord.org) genutzt, die im Internet frei zugänglich ist.
+
Es stehen Arbeitsblätter, PowerPoint-Präsentationen, Anleitungen, der JIM-Datensatz, Variablenlisten und dieser Überblick über die einzelnen Stunden zur Verfügung. Für die Datenanalyse wird die Software CODAP (codap.concord.org) genutzt, die im Internet frei und kostenlos zugänglich ist.
  
Gearbeitet wird mit Daten von fast 500 Schülerinnen und Schülern, die zu vielen Merkmalen im Freizeit- und Medienbereich Angaben gemacht haben (JIM für Jugend-Information-Medien). Der Datensatz liegt für diese Unterrichtsreihe in zwei Versionen vor. Zum einen steht eine reduzierte Version zur Verfügung mit 50 Variablen. Zum anderen kann die Vollversion mit über 160 Variablen im Unterricht eingesetzt werden. Es wird empfohlen, aufgrund der besseren Übersichtlichkeit den Datensatz mit der reduzierten Variablenliste zu verwenden. Hier sind multivariate und interessante Entdeckungen möglich! Die Lehrkraft hat jedoch die Möglichkeit je nach Leistungsfähigkeit der Klasse/des Kurses zu differenzieren oder für besonders leistungsfähige Schülerinnen und Schüler ein binnendifferenziertes Angebot zu unterbreiten (siehe unten).
+
Gearbeitet wird mit Daten von über 1000 Schülerinnen und Schülern, die zu vielen Merkmalen im Freizeit- und Medienbereich Angaben gemacht haben (JIM-PB für Jugend-Information-Medien Paderborn). Der Datensatz liegt für diese Unterrichtsreihe in zwei Versionen vor. Zum einen steht eine reduzierte Version mit 50 Variablen zur Verfügung. Zum anderen kann die Vollversion mit über 160 Variablen im Unterricht eingesetzt werden. Es wird empfohlen, aufgrund der besseren Übersichtlichkeit den Datensatz mit der reduzierten Variablenliste zu verwenden. Hier sind multivariate und interessante Entdeckungen möglich! Die Lehrkraft hat jedoch die Möglichkeit je nach Leistungsfähigkeit der Klasse/des Kurses zu differenzieren, oder für besonders leistungsfähige Schülerinnen und Schüler ein binnendifferenziertes Angebot zu unterbreiten (siehe unten).
  
 
Der [[:Datei:Variablenliste JIM 2021 reduziert 50.docx|'''Link''']] zum Datensatz, mit dem im Projekt gearbeitet wird (50 Variablen):
 
Der [[:Datei:Variablenliste JIM 2021 reduziert 50.docx|'''Link''']] zum Datensatz, mit dem im Projekt gearbeitet wird (50 Variablen):
  
Die Unterrichtsreihe umfasst 8 Unterrichtsstunden. Das Herzstück der Unterrichtsreihe ist eine eigenständige Data Science Projektarbeit der Schülerinnen und Schüler in den Stunden 5 und 6 mit Präsentationen in Stunde 7. Die Projektarbeit findet in Kleingruppen statt, in denen sich die Schülerinnen und Schüler eigenständig als Data Science Experten mit dem Datensatz arbeiten. Dafür ordnen sie sich vier inhaltlichen Gruppen der JIM-Daten zu analog zu den Kundenwünschen der Online-Plattform (diese Zuordnung geschieht in Stunde 4):
 
  
·        Kunde 1 möchte TikTok bewerben,
+
Die Unterrichtsreihe umfasst 8 Unterrichtsstunden. Das Herzstück der Unterrichtsreihe ist eine eigenständige Data Science Projektarbeit der Schülerinnen und Schüler in den Stunden 5 und 6 mit Präsentationen in Stunde 7. Die Projektarbeit findet in Kleingruppen statt, in denen sich die Schülerinnen und Schüler eigenständig als Data-Science-Experten mit dem Datensatz beschäftigen. Dafür ordnen sie sich vier inhaltlichen Gruppen der JIM-Daten, analog zu den Kundenwünschen der Online-Plattform, zu (diese Zuordnung geschieht in Stunde 4):
  
·        Kunde 2 möchte LetsPlay_YouTube Videos bewerben,
+
*Kunde 1 möchte TikTok bewerben,
 +
*Kunde 2 möchte LetsPlay_YouTube Videos bewerben,
 +
*Kunde 3 möchte Online-Zeitungen bewerben,
 +
*Kunde 4 möchte feste Spielekonsolen bewerben.
  
·        Kunde 3 möchte Online Zeitungen bewerben,
 
  
·        Kunde 4 möchte feste Spielekonsolen bewerben.
+
In der letzten Stunde findet eine Reflektion über das Vorgehen für die Datenexploration statt und persönliche und gesellschaftliche Aspekte können diskutiert werden. Außerdem kann hier als Exkurs das Thema Datenbereinigung angesprochen und in CODAP bearbeitet werden, die in der Arbeit eines echten Data-Scientists viel Zeit beansprucht.
 
 
Präsentationen aller Gruppen beschließen die Gruppenarbeit. In der letzten Stunde findet eine Reflektion über das Vorgehen für die Datenexploration statt und persönliche und gesellschaftliche Aspekte können diskutiert werden.
 
  
 
===Überblick über die Unterrichtsreihe===
 
===Überblick über die Unterrichtsreihe===
Zeile 28: Zeile 27:
 
|1
 
|1
 
|'''Einführung'''
 
|'''Einführung'''
 +
In dieser Stunde wird in das Projekt „Datendetektive bei der Arbeit” eingeführt. Dazu wird der komplette Rahmen der Unterrichtsreihe aufgezeigt. In zwei Arbeitsphasen werden die SuS an die vorliegenden Umfragedaten und an die Datenanalyse in CODAP herangeführt.
  
In dieser Stunde wird in das Projekt “Datendetektive bei der Arbeit”  eingeführt. Dazu wird der komplette Rahmen der Unterrichtsreihe aufgezeigt.  In zwei Arbeitsphasen werden die SuS an die vorliegenden Umfragedaten und an  die Datenanalyse in CODAP herangeführt.
+
Das Dokument Stunde_1_Überblick bietet Gestaltungshinweise für diese Stunde.
  
Das Dokument Stunde_1_Überblick bietet Gestaltungshinweise für diese  Stunde.
+
Mit Arbeitsblatt 1 erkunden SuS den Datensatz selbständig.
 
|[[Datenexploration - Datendetektive bei der Arbeit/Stunde 1|Stunde_1_Überblick]]
 
|[[Datenexploration - Datendetektive bei der Arbeit/Stunde 1|Stunde_1_Überblick]]
  
[[Medium:Datenexploration Arbeitsblatt 1 Datensatz.docx|Arbeitsblatt1_Datensatz]][[Medium:Variablenliste JIM 2021 reduziert 50.docx|Variablenliste_JIM_2021_reduziert]]
+
[[Medium:Datenexploration Arbeitsblatt 1 Datensatz.docx|Arbeitsblatt1_Datensatz]]
 +
 
 +
[[Medium:Variablenliste JIM 2021 reduziert 50.docx|Variablenliste_JIM_2021_reduziert]]
 +
 
 +
Kurzeinführung in CODAP:
 +
 
 +
<nowiki>https://youtu.be/2z5H4anfhWM</nowiki> (ca. 5 min)
  
 
|-
 
|-
 
|2-3
 
|2-3
|In diesen beiden Stunden geht es darum, dass die Schülerinnen und Schüler zu Data Science Experten werden, um anschließend selbständig arbeiten zu können.  
+
|In diesen beiden Stunden geht es darum, dass die Schülerinnen und Schüler zu Data-Science- Experten werden, um anschließend selbständig arbeiten zu können.
 +
Zunächst kann, sofern noch nicht geschehen, Arbeitsblatt 1 besprochen werden.
 +
 
 +
Die Präsentation zu Sitzung 2+3 kann als Lehrerhintergrundinformation oder zur Präsentation im Unterricht begleitend zu den Arbeitsblättern 3-6a genutzt werden.
 +
 
 +
 
 +
'''Einführung in nötige Grundbegriffe und Erwartungshaltung aufbauen'''
  
'''Einführung in statistische Grundbegriffe und Erwartungshaltung  aufbauen'''
+
Die SuS erhalten Informationen über grundlegende statistische Fachbegriffe (Infoblatt_Glossar). Die kennengelernten statistischen Grundbegriffe übertragen die SuS anhand von Arbeitsblatt 2 auf den vorliegenden Datensatz.
  
Die SuS erhalten Informationen  über grundlegende statistische Fachbegriffe (Infoblatt_Glossar). Die  kennengelernten statistischen Grundbegriffe übertragen die SuS anhand von  Arbeitsblatt2_Begriffe auf den vorliegenden Datensatz.
 
  
 
'''CODAP und Analysemethoden'''
 
'''CODAP und Analysemethoden'''
  
Es wird in die Bedienung von CODAP eingeführt und Auswertungsmöglichkeiten bezüglich verschiedener Prozente werden nacheinander erarbeitet. Je nach  Kurs/Klasse können sich die SuS die Auswertungsmöglichkeiten anhand der  Anleitungen selbst erarbeiten und bei den Arbeitsblättern anwenden. Alternativ kann die Lehrkraft mithilfe der PowerPoint in die Analysemethoden einführen und die SuS bearbeiten dann die Arbeitsblätter. Dies ist die  notwendige Voraussetzung für die eigenständige Schülerexploration in den  folgenden Stunden.
+
Es werden Auswertungsmöglichkeiten bezüglich verschiedener Prozente und damit verbundener Aussagen erarbeitet.  
 +
 
 +
Zunächst sollten interessierende Merkmale umcodiert werden, so dass die Ausprägungen von sieben (täglich, mehrmals pro Woche, … nie) auf zwei (z. B. häufig, selten) reduziert werden. Mehrere Unterrichtserprobungen haben gezeigt, dass dies ein sinnvolles Vorgehen ist und gleichzeitig das Modellieren thematisiert wird. Dies wird in Anleitung_CODAP_umcodieren (diese Anleitung ist im YouTube-Video umgesetzt) erklärt.  
 +
 
 +
Eine Differenzierungsmöglichkeit besteht hier erneut darin, motivierte SuS Auswertungen mit den binären Merkmalen und zusätzlich mit den Merkmalen mit sieben Ausprägungen machen zu lassen (die Arbeitsblätter 3-5 lassen sich auf beide Arten bearbeiten).
  
Die Anleitungen für die Selbstlernphase der SuS beinhalten das  Auswerten von eindimensionalen Verteilungen (Anleitung_CODAP_1dim) und zweidimensionalen Verteilungen (Anleitung_CODAP_2dim_A und _B).
+
Je nach Kurs/Klasse können sich die SuS die Auswertungsmöglichkeiten anhand der Anleitungen selbst erarbeiten und bei den Arbeitsblättern anwenden. Alternativ kann die Lehrkraft mithilfe der PowerPoint in die Analysemethoden einführen und die SuS bearbeiten dann die Arbeitsblätter. Dies ist die notwendige Voraussetzung für die eigenständige Schülerexploration in den folgenden Stunden. ''Erfahrungsgemäß benötigen SuS Unterstützen beim Bearbeiten und Interpretieren der prozentualen Auswertungen mit Zeilen-, Spalten- oder Zellenprozenten. Einen Einstieg auch zur Diskussion kann Arbeitsblatt 6a bieten.''
  
Wir schlagen vor, mit der Anleitung (Anleitung_CODAP_2dim_red) in die Exploration von zweidimensionalen Verteilungen zu starten. Hier wird zunächst  von einer Variablen nur eine Ausprägung betrachtet und somit die Komplexität  der Auswertung von einer 7x7 Matrix auf eine 7x1 Matrix reduziert.
+
Wir schlagen vor, mit der Anleitung (Anleitung_CODAP_umcodieren) in die Exploration zu starten und dann die Anleitung_CODAP_2dimProzente weiter zu nutzen.
  
  
 
'''Technik'''
 
'''Technik'''
  
Hier sollte den SuS auch gezeigt werden, wie sie Graphiken aus CODAP in eine Word-Datei oder eine PowerPoint Präsentation kopieren können. Ggf. ist auch das Weitergeben des CODAP-Dokuments per Link eine gute Möglichkeit, um Schülerbearbeitungen zu dokumentieren, bzw. zu kontrollieren.
+
Hier sollte den SuS auch gezeigt werden, wie sie Graphiken aus CODAP in eine Word-Datei oder eine PowerPoint Präsentation kopieren können. Ggf. ist auch das Weitergeben des CODAP-Dokuments per Link eine gute Möglichkeit, um Schülerbearbeitungen zu dokumentieren, bzw. zu kontrollieren.
 
|
 
|
Infoblatt_Glossar
+
[[Medium:Datenexploration Infoblatt Glossar.docx|Infoblatt_Glossar]]
 
 
Arbeitsblatt2_Begriffe
 
 
 
  
 +
[[Medium:Datenexploration Arbeitsblatt 2 Begriffe.docx|Arbeitsblatt2_Begriffe]]
  
PowerPoint-Präsentation (optional)
+
[[Medium:Datenexploration Folien Sitzung 2+3.pptx|PowerPoint-Präsentation (optional)]]
  
[[:Datei:Datenexploration Anleitung CODAP 1dim.docx|Anleitung_CODAP_1dim]]
+
[[Medium:Datenexploration Anleitung CODAP 1dim.docx|Anleitung_CODAP_1dim]]
  
Anleitung_CODAP_2dim_red
+
[[Medium:Anleitung CODAP umcodieren.docx|Anleitung_CODAP_umcodieren]]
  
Anleitung_CODAP_2dim_A
+
(<nowiki>https://youtu.be/qcK_ZZsWfbQ</nowiki>)
  
Anleitung_CODAP_2dim_B
+
[[Medium:Datenexploration Anleitung CODAP 2dim ausblenden.docx|Anleitung_CODAP_2dim_ausblenden]]
  
Arbeitsblätter 3 – 5
 
  
 +
[[Medium:Datenexploration Arbeitsblatt 3.docx|Arbeitsblatt 3]]
  
 +
[[Medium:Datenexploration Arbeitsblatt 4 Verteilungen II.docx|Arbeitsblatt 4]]
  
 +
[[Medium:Datenexploration Arbeitsblatt 5.docx|Arbeitsblatt 5]]
  
  
  
 +
[[Medium:Datenexploration Arbeitsblatt 6 Prozenteprüfen.docx|<br />Arbeistblatt 6]]
  
  
Zeile 90: Zeile 106:
  
 
<nowiki>https://youtu.be/otLuX8hhtq8</nowiki>
 
<nowiki>https://youtu.be/otLuX8hhtq8</nowiki>
 +
 +
 +
 +
 
|-
 
|-
 
|4
 
|4
|'''Erwartungshaltung aufbauen und passende Fragen stellen'''
+
|'''Erwartungshaltung aufbauen und passende Fragen stellen'''
 +
In dieser Stunde werden die Schülerinnen und Schüler in Kleingruppen für die komplette restliche Unterrichtseinheit eingeteilt und vier verschiedenen inhaltlichen Bereichen der Daten/Kunden der Online-Plattform zugeordnet (Arbeitsblatt_6_Gruppenbildung). Jede Gruppe sollte vier SuS umfassen, damit die spätere Think-pair-share Phase gut funktioniert.
  
In dieser Stunde werden die Schülerinnen und Schüler in Kleingruppen  für die komplette restliche Unterrichtseinheit eingeteilt und vier  verschiedenen inhaltlichen Bereichen der Daten/Kunden der Online-Plattform  zugeordnet (Arbeitsblatt3_Gruppenbildung). Anhand von AB3 findet eine theoretische Auseinandersetzung mit den Daten, resp. der Variablenliste, statt, um eine Erwartungshaltung für die kommenden Stunden aufzubauen. Diese Erwartungshaltung ist zentral für die eigene Datenanalyse und soll auf Plakaten festgehalten werden. Die hierzu erstellten Plakate sollten im Verlauf der weiteren Unterrichtseinheit sichtbar für alle SuS im Klassenraum hängen.
+
Anhand von AB 6 findet eine theoretische Auseinandersetzung mit den Daten, resp. der Variablenliste, statt, um eine Erwartungshaltung für die kommenden Stunden aufzubauen. Diese Erwartungshaltung ist zentral für die eigene Datenanalyse und soll auf Plakaten festgehalten werden. Die hierzu erstellten Plakate sollten im Verlauf der weiteren Unterrichtseinheit sichtbar für alle SuS im Klassenraum hängen.
  
 
+
Die Erfahrung hat gezeigt, dass das Stellen von geeigneten (statistischen) Fragestellungen für SuS eine Hürde darstellt, deshalb liegt ein weiterer Fokus dieser Stunde darauf, die SuS anhand von AB 6b in Kleingruppen geeignete Fragen erarbeiten zu lassen. Hierfür wird die Methode Think-Pair-Share genutzt.
Die Erfahrung hat gezeigt, dass das Stellen von geeigneten (statistischen) Fragestellungen für SuS eine Hürde darstellt, deshalb liegt ein weiterer Fokus dieser Stunde darauf, die SuS in Kleingruppen geeignete Fragen erarbeiten zu lassen. Hierfür wird die Methode Think-Pair-Share genutzt.
+
|[[Medium:Datenexploration Arbeitsblatt 7 Gruppenbildung.docx|Arbeitsblatt7 Gruppenbildung]]
|Arbeitsblatt6_Gruppenbildung
 
  
 
Plakate
 
Plakate
  
  
PowerPoint als Hintergrundinformation für L
+
[[Medium:Datenexploration Hintergrundinformationen.pptx|PowerPoint als Hintergrundinformation für Lehrende]]
  
  
Zeile 109: Zeile 129:
  
  
 +
[[Medium:Datenexploration Arbeitsblatt 8 Fragestellung.docx|<br />Arbeitsblatt_8_Fragestellung]]
  
 
+
<br />
 
 
Arbeitsblatt6a_Fragen
 
 
|-
 
|-
 
|5-6
 
|5-6
 
|'''Projektarbeit in Kleingruppen'''
 
|'''Projektarbeit in Kleingruppen'''
 +
In diesen beiden Stunden wird das Vorgehen der Datenexploration von den Kleingruppen zunächst geplant (Arbeitsblatt 9). Anschließend findet die Datenexploration in den Kleingruppen statt (Arbeitsblatt 10) und die Präsentation der Ergebnisse wird vorbereitet. Zu Beginn der sechsten Stunde können evtl. Kriterien für gute statistische Präsentationen besprochen werden, um die Erstellung der Präsentationen vorzubereiten (leere Power-Point-Vorlage). Die Lehrkraft steht in den Stunden 5-6 vor allem unterstützend für Fragen und Anregungen zur Verfügung, die SuS arbeiten möglichst selbständig mit CODAP und PowerPoint.
 +
|[[:Datei:Datenexploration Arbeitsblatt 9 Planung.docx|Arbeitsblatt_9_Planung]]
 +
[[Medium:Datenexploration Arbeitsblatt 10 Datenanalyse.docx|Arbeitsblatt_10_Datenanalyse]]
  
In diesen beiden Stunden wird das Vorgehen der Datenexploration von  den Kleingruppen zunächst geplant (Arbeitsblatt 7). Anschließend findet die  Datenexploration in den Kleingruppen statt (Arbeitsblatt 8) und die  Präsentation der Ergebnisse wird vorbereitet. Zu Beginn der sechsten Stunde  können evtl. Kriterien für gute statistische Präsentationen besprochen  werden, um die Erstellung der Präsentationen vorzubereiten (Leere  Power-Point-Vorlage). Die Lehrkraft steht in den Stunden 5-6 vor allem  unterstützend für Fragen und Anregungen zur Verfügung, die SuS arbeiten  möglichst selbständig mit CODAP und PowerPoint.
+
[[Medium:Datenexploration Anleitung Hinweise Präsentation.docx|Anleitung_Hinweise_Präsentation]]
|Arbeitsblätter 7-8
 
 
 
Anleitung_HinweisePräsentation
 
  
Leere PowerPoint-Vorlage für Schülerpräsentationen
+
[[Medium:Datenexploration Vorlage Präsentation.pptx|Leere PowerPoint-Vorlage für Schülerpräsentationen]]
 
|-
 
|-
 
|7
 
|7
|'''Präsentationen der Kleingruppen'''
+
|'''Präsentationen der Kleingruppen'''
 
+
In dieser Stunde finden die Präsentationen der Schülerergebnisse statt. Dabei kann immer eine Gruppe einen speziellen Feedback-Auftrag bekommen, damit eine inhaltliche Diskussion angeregt wird (Arbeitsblatt 11). Anhand von Arbeitsblatt 12, das sich gut als Hausaufgabe und Ergebnissicherung eignet, können die SuS überprüfen, ob sie eine Datenanalyse durchführen können.
In dieser Stunde finden die Präsentationen der Schülerergebnisse statt. Dabei kann immer eine Gruppe einen speziellen Feedback Auftrag bekommen, damit eine inhaltliche Diskussion angeregt wird (Arbeitsblatt 9). Anhand von Arbeitsblatt 10, das sich gut als Hausaufgabe und Ergebnissicherung eignet, können die SuS überprüfen, ob sie eine Datenanalyse durchführen können.
 
 
|PowerPoint-Präsentationen der SuS
 
|PowerPoint-Präsentationen der SuS
 +
[[Medium:Datenexploration Arbeitsblatt 11 Feedback.docx|Arbeitsblatt_11_Feedback]]
  
Arbeitsblatt 9-10
+
[[Medium:Datenexploration Arbeitsblatt 12 Hausaufgabe.docx|Arbeitsblatt_12_Hausaufgabe]]
 
|-
 
|-
 
|8
 
|8
 
|'''Reflektieren'''
 
|'''Reflektieren'''
 +
In dieser Stunde findet eine gemeinsame Reflexion des gesamten Projekts statt. Die einzelnen Schritte der durchgeführten Datenanalyse werden den Stationen des PPDAC-Kreislaufs zugeordnet (Powerpoint Präsentation Stunde 8). 
  
In dieser Stunde findet eine gemeinsame Reflexion des gesamten  Projekts statt. Die einzelnen Schritte der durchgeführten Datenanalyse werden  den Stationen des PPDAC-Kreislaufs zugeordnet (Powerpoint_Präsentation).
+
Weiter können unter anderem persönliche und gesellschaftliche Auswirkungen einer Datenexploration angesprochen werden und versucht werden, „über den Tellerrand” zu schauen.
 
+
|[[Medium:Datenexploration Folien Stunde 8.pptx|Powerpoint Präsentation Stunde 8]]
 
+
|-
Weiter können unter anderem persönliche und gesellschaftliche Auswirkungen einer Datenexploration angesprochen werden und versucht werden, „über den Tellerrand” zu schauen.
+
|Abschluss
|Powerpoint_Präsentation
+
|'''Zu Forschungszwecken''' bitten wir darum, dass die SuS am Ende der Unterrichtsreihe eine anonyme Umfrage ausfüllen und Feedback geben, wie Ihnen die Unterrichtsreihe gefallen hat.
 +
|[https://umfrage-ddi.cs.uni-paderborn.de/limesurvey/index.php/545222?lang=de Link zu der Umfrage]
 +
|-
 +
|Exkurs
 +
|'''Datenbereinigung als Detektivarbeit'''
 +
Der Bereich Datenbereinigung kann als Exkurs in einer eigenen Stunde thematisiert werden. Hierzu gibt es die nebenstehende CODAP-Umgebung, in der sich der unbereinigte JIM-Datensatz befindet. Dort findet sich ebenfalls ein Textfeld mit Erklärungen und ersten Schritten, wie mit Hilfe von CODAP eine Datenbereinigung vorgenommen werden kann.
 +
|<nowiki>https://tinyurl.com/jim-pb50-unbereinigt</nowiki>
 
|}
 
|}
  
Zeile 145: Zeile 171:
  
 
====Möglichkeit zur Differenzierung====
 
====Möglichkeit zur Differenzierung====
Die Unterrichtsreihe ist so angelegt, dass mit einem „kleinen“ Datensatz gearbeitet werden kann. Dieser enthält 50 Variable und bietet reichhaltig Möglichkeiten für Explorationen.
+
Die Unterrichtsreihe ist so angelegt, dass mit einem „kleinen“ Datensatz gearbeitet wird. Dieser enthält 50 Variable und bietet reichhaltig Möglichkeiten für Explorationen.
  
 
Für besonders motivierte Schülerinnen und Schüler kann stattdessen auch mit dem großen Datensatz gearbeitet werden, der alle 160 Variablen erhält, die in der Umfrage erhoben wurden. Dies erfordert jedoch ein hohes Engagement und gutes Arbeiten mit der Variablenliste seitens der Schülerinnen und Schüler!
 
Für besonders motivierte Schülerinnen und Schüler kann stattdessen auch mit dem großen Datensatz gearbeitet werden, der alle 160 Variablen erhält, die in der Umfrage erhoben wurden. Dies erfordert jedoch ein hohes Engagement und gutes Arbeiten mit der Variablenliste seitens der Schülerinnen und Schüler!
 +
 +
Eine weitere Möglichkeit zur Differenzierung besteht darin, besonders motivierte Schülerinnen und Schüler mit den „normalen“ Merkmalen mit allen sieben Ausprägungen arbeiten zu lassen. Der Standardfall sollte das Arbeiten mit binären Merkmalen sein, also Merkmalen, die zuvor von den SuS umcodiert wurden, wie in Anleitung_CODAP_umcodieren in Stunde 2+3 beschrieben.
  
 
====Zum Umgang mit den Aufgaben====
 
====Zum Umgang mit den Aufgaben====
Zeile 155: Zeile 183:
 
CODAP ist in weiten Teilen auf Deutsch verfügbar. Sollte die Sprache nicht auf Deutsch eingestellt sein, so kann rechts oben die Sprache umgestellt werden.
 
CODAP ist in weiten Teilen auf Deutsch verfügbar. Sollte die Sprache nicht auf Deutsch eingestellt sein, so kann rechts oben die Sprache umgestellt werden.
  
[[:Datei:Variablenliste JIM 2021.docx|'''Link''']] zum Datensatz mit allen 161 Variablen
+
Link zum Datensatz mit allen 161 Variablen:
<br />
+
 
 +
<nowiki>https://tinyurl.com/jim-pb160</nowiki>
 +
 
 +
===Teilnahme an der Umfrage===
 +
Wer mit seiner Klasse an der Umfrage teilnehmen möchte, kann dies gerne machen. Die Daten werden vollständig anonym erfasst (eventuell mit der Schulleitung abklären). Die Daten fließen dann jährlich in eine Neuauflage des Datensatzes ein, der per CODAP-Link zugänglich bleibt.
 +
 
 +
Über diesen Link können SuS an der Umfrage teilnehmen (Achtung: 161 Fragen!, genügend Zeit einplanen):
 +
 
 +
[http://go.upb.de/JIM-Umfrage Link]
  
 
===Unterseiten===
 
===Unterseiten===
Zeile 163: Zeile 199:
 
[[Kategorie:ProDaBi]]
 
[[Kategorie:ProDaBi]]
 
[[Kategorie:Praxiserprobt]]
 
[[Kategorie:Praxiserprobt]]
[[Kategorie:Gymnasium]]
+
[[Kategorie:Sekundarstufe I]]
 +
[[Kategorie:Sekundarstufe II]]
 +
[[Kategorie:Module]]

Version vom 25. November 2021, 16:24 Uhr

Übersicht
ProDaBi Logo.png
Themenfeld ProDaBi
Autor Podworny
Editiert am 25.11.2021
Unterseiten


In dieser Unterrichtseinheit geht es um Data Science Inhalte für die 8.-10. Klasse. Anhand eines fiktiven Rahmenbeispiels einer Online-Plattform, die Werbung für Jugendliche passgenau schalten möchte, werden Schülerinnen und Schüler motiviert, als Datendetektive in einem Datensatz nach Spuren und Mustern zu suchen, um so die Online-Plattform zu beraten.

Es stehen Arbeitsblätter, PowerPoint-Präsentationen, Anleitungen, der JIM-Datensatz, Variablenlisten und dieser Überblick über die einzelnen Stunden zur Verfügung. Für die Datenanalyse wird die Software CODAP (codap.concord.org) genutzt, die im Internet frei und kostenlos zugänglich ist.

Gearbeitet wird mit Daten von über 1000 Schülerinnen und Schülern, die zu vielen Merkmalen im Freizeit- und Medienbereich Angaben gemacht haben (JIM-PB für Jugend-Information-Medien Paderborn). Der Datensatz liegt für diese Unterrichtsreihe in zwei Versionen vor. Zum einen steht eine reduzierte Version mit 50 Variablen zur Verfügung. Zum anderen kann die Vollversion mit über 160 Variablen im Unterricht eingesetzt werden. Es wird empfohlen, aufgrund der besseren Übersichtlichkeit den Datensatz mit der reduzierten Variablenliste zu verwenden. Hier sind multivariate und interessante Entdeckungen möglich! Die Lehrkraft hat jedoch die Möglichkeit je nach Leistungsfähigkeit der Klasse/des Kurses zu differenzieren, oder für besonders leistungsfähige Schülerinnen und Schüler ein binnendifferenziertes Angebot zu unterbreiten (siehe unten).

Der Link zum Datensatz, mit dem im Projekt gearbeitet wird (50 Variablen):


Die Unterrichtsreihe umfasst 8 Unterrichtsstunden. Das Herzstück der Unterrichtsreihe ist eine eigenständige Data Science Projektarbeit der Schülerinnen und Schüler in den Stunden 5 und 6 mit Präsentationen in Stunde 7. Die Projektarbeit findet in Kleingruppen statt, in denen sich die Schülerinnen und Schüler eigenständig als Data-Science-Experten mit dem Datensatz beschäftigen. Dafür ordnen sie sich vier inhaltlichen Gruppen der JIM-Daten, analog zu den Kundenwünschen der Online-Plattform, zu (diese Zuordnung geschieht in Stunde 4):

  • Kunde 1 möchte TikTok bewerben,
  • Kunde 2 möchte LetsPlay_YouTube Videos bewerben,
  • Kunde 3 möchte Online-Zeitungen bewerben,
  • Kunde 4 möchte feste Spielekonsolen bewerben.


In der letzten Stunde findet eine Reflektion über das Vorgehen für die Datenexploration statt und persönliche und gesellschaftliche Aspekte können diskutiert werden. Außerdem kann hier als Exkurs das Thema Datenbereinigung angesprochen und in CODAP bearbeitet werden, die in der Arbeit eines echten Data-Scientists viel Zeit beansprucht.

Überblick über die Unterrichtsreihe

Stunde Thema Material
1 Einführung

In dieser Stunde wird in das Projekt „Datendetektive bei der Arbeit” eingeführt. Dazu wird der komplette Rahmen der Unterrichtsreihe aufgezeigt. In zwei Arbeitsphasen werden die SuS an die vorliegenden Umfragedaten und an die Datenanalyse in CODAP herangeführt.

Das Dokument Stunde_1_Überblick bietet Gestaltungshinweise für diese Stunde.

Mit Arbeitsblatt 1 erkunden SuS den Datensatz selbständig.

Stunde_1_Überblick

Arbeitsblatt1_Datensatz

Variablenliste_JIM_2021_reduziert

Kurzeinführung in CODAP:

https://youtu.be/2z5H4anfhWM (ca. 5 min)

2-3 In diesen beiden Stunden geht es darum, dass die Schülerinnen und Schüler zu Data-Science- Experten werden, um anschließend selbständig arbeiten zu können.

Zunächst kann, sofern noch nicht geschehen, Arbeitsblatt 1 besprochen werden.

Die Präsentation zu Sitzung 2+3 kann als Lehrerhintergrundinformation oder zur Präsentation im Unterricht begleitend zu den Arbeitsblättern 3-6a genutzt werden.


Einführung in nötige Grundbegriffe und Erwartungshaltung aufbauen

Die SuS erhalten Informationen über grundlegende statistische Fachbegriffe (Infoblatt_Glossar). Die kennengelernten statistischen Grundbegriffe übertragen die SuS anhand von Arbeitsblatt 2 auf den vorliegenden Datensatz.


CODAP und Analysemethoden

Es werden Auswertungsmöglichkeiten bezüglich verschiedener Prozente und damit verbundener Aussagen erarbeitet.

Zunächst sollten interessierende Merkmale umcodiert werden, so dass die Ausprägungen von sieben (täglich, mehrmals pro Woche, … nie) auf zwei (z. B. häufig, selten) reduziert werden. Mehrere Unterrichtserprobungen haben gezeigt, dass dies ein sinnvolles Vorgehen ist und gleichzeitig das Modellieren thematisiert wird. Dies wird in Anleitung_CODAP_umcodieren (diese Anleitung ist im YouTube-Video umgesetzt) erklärt.

Eine Differenzierungsmöglichkeit besteht hier erneut darin, motivierte SuS Auswertungen mit den binären Merkmalen und zusätzlich mit den Merkmalen mit sieben Ausprägungen machen zu lassen (die Arbeitsblätter 3-5 lassen sich auf beide Arten bearbeiten).

Je nach Kurs/Klasse können sich die SuS die Auswertungsmöglichkeiten anhand der Anleitungen selbst erarbeiten und bei den Arbeitsblättern anwenden. Alternativ kann die Lehrkraft mithilfe der PowerPoint in die Analysemethoden einführen und die SuS bearbeiten dann die Arbeitsblätter. Dies ist die notwendige Voraussetzung für die eigenständige Schülerexploration in den folgenden Stunden. Erfahrungsgemäß benötigen SuS Unterstützen beim Bearbeiten und Interpretieren der prozentualen Auswertungen mit Zeilen-, Spalten- oder Zellenprozenten. Einen Einstieg auch zur Diskussion kann Arbeitsblatt 6a bieten.

Wir schlagen vor, mit der Anleitung (Anleitung_CODAP_umcodieren) in die Exploration zu starten und dann die Anleitung_CODAP_2dimProzente weiter zu nutzen.


Technik

Hier sollte den SuS auch gezeigt werden, wie sie Graphiken aus CODAP in eine Word-Datei oder eine PowerPoint Präsentation kopieren können. Ggf. ist auch das Weitergeben des CODAP-Dokuments per Link eine gute Möglichkeit, um Schülerbearbeitungen zu dokumentieren, bzw. zu kontrollieren.

Infoblatt_Glossar

Arbeitsblatt2_Begriffe

PowerPoint-Präsentation (optional)

Anleitung_CODAP_1dim

Anleitung_CODAP_umcodieren

(https://youtu.be/qcK_ZZsWfbQ)

Anleitung_CODAP_2dim_ausblenden


Arbeitsblatt 3

Arbeitsblatt 4

Arbeitsblatt 5



Arbeistblatt 6



Anleitung_Grafikenkopieren

Oder YouTube-Video zum Kopieren des Arbeitsstands per Link:

https://youtu.be/otLuX8hhtq8



4 Erwartungshaltung aufbauen und passende Fragen stellen

In dieser Stunde werden die Schülerinnen und Schüler in Kleingruppen für die komplette restliche Unterrichtseinheit eingeteilt und vier verschiedenen inhaltlichen Bereichen der Daten/Kunden der Online-Plattform zugeordnet (Arbeitsblatt_6_Gruppenbildung). Jede Gruppe sollte vier SuS umfassen, damit die spätere Think-pair-share Phase gut funktioniert.

Anhand von AB 6 findet eine theoretische Auseinandersetzung mit den Daten, resp. der Variablenliste, statt, um eine Erwartungshaltung für die kommenden Stunden aufzubauen. Diese Erwartungshaltung ist zentral für die eigene Datenanalyse und soll auf Plakaten festgehalten werden. Die hierzu erstellten Plakate sollten im Verlauf der weiteren Unterrichtseinheit sichtbar für alle SuS im Klassenraum hängen.

Die Erfahrung hat gezeigt, dass das Stellen von geeigneten (statistischen) Fragestellungen für SuS eine Hürde darstellt, deshalb liegt ein weiterer Fokus dieser Stunde darauf, die SuS anhand von AB 6b in Kleingruppen geeignete Fragen erarbeiten zu lassen. Hierfür wird die Methode Think-Pair-Share genutzt.

Arbeitsblatt7 Gruppenbildung

Plakate


PowerPoint als Hintergrundinformation für Lehrende




Arbeitsblatt_8_Fragestellung


5-6 Projektarbeit in Kleingruppen

In diesen beiden Stunden wird das Vorgehen der Datenexploration von den Kleingruppen zunächst geplant (Arbeitsblatt 9). Anschließend findet die Datenexploration in den Kleingruppen statt (Arbeitsblatt 10) und die Präsentation der Ergebnisse wird vorbereitet. Zu Beginn der sechsten Stunde können evtl. Kriterien für gute statistische Präsentationen besprochen werden, um die Erstellung der Präsentationen vorzubereiten (leere Power-Point-Vorlage). Die Lehrkraft steht in den Stunden 5-6 vor allem unterstützend für Fragen und Anregungen zur Verfügung, die SuS arbeiten möglichst selbständig mit CODAP und PowerPoint.

Arbeitsblatt_9_Planung

Arbeitsblatt_10_Datenanalyse

Anleitung_Hinweise_Präsentation

Leere PowerPoint-Vorlage für Schülerpräsentationen

7 Präsentationen der Kleingruppen

In dieser Stunde finden die Präsentationen der Schülerergebnisse statt. Dabei kann immer eine Gruppe einen speziellen Feedback-Auftrag bekommen, damit eine inhaltliche Diskussion angeregt wird (Arbeitsblatt 11). Anhand von Arbeitsblatt 12, das sich gut als Hausaufgabe und Ergebnissicherung eignet, können die SuS überprüfen, ob sie eine Datenanalyse durchführen können.

PowerPoint-Präsentationen der SuS

Arbeitsblatt_11_Feedback

Arbeitsblatt_12_Hausaufgabe

8 Reflektieren

In dieser Stunde findet eine gemeinsame Reflexion des gesamten Projekts statt. Die einzelnen Schritte der durchgeführten Datenanalyse werden den Stationen des PPDAC-Kreislaufs zugeordnet (Powerpoint Präsentation Stunde 8).

Weiter können unter anderem persönliche und gesellschaftliche Auswirkungen einer Datenexploration angesprochen werden und versucht werden, „über den Tellerrand” zu schauen.

Powerpoint Präsentation Stunde 8
Abschluss Zu Forschungszwecken bitten wir darum, dass die SuS am Ende der Unterrichtsreihe eine anonyme Umfrage ausfüllen und Feedback geben, wie Ihnen die Unterrichtsreihe gefallen hat. Link zu der Umfrage
Exkurs Datenbereinigung als Detektivarbeit

Der Bereich Datenbereinigung kann als Exkurs in einer eigenen Stunde thematisiert werden. Hierzu gibt es die nebenstehende CODAP-Umgebung, in der sich der unbereinigte JIM-Datensatz befindet. Dort findet sich ebenfalls ein Textfeld mit Erklärungen und ersten Schritten, wie mit Hilfe von CODAP eine Datenbereinigung vorgenommen werden kann.

https://tinyurl.com/jim-pb50-unbereinigt

Weitere Hinweise

Möglichkeit zur Differenzierung

Die Unterrichtsreihe ist so angelegt, dass mit einem „kleinen“ Datensatz gearbeitet wird. Dieser enthält 50 Variable und bietet reichhaltig Möglichkeiten für Explorationen.

Für besonders motivierte Schülerinnen und Schüler kann stattdessen auch mit dem großen Datensatz gearbeitet werden, der alle 160 Variablen erhält, die in der Umfrage erhoben wurden. Dies erfordert jedoch ein hohes Engagement und gutes Arbeiten mit der Variablenliste seitens der Schülerinnen und Schüler!

Eine weitere Möglichkeit zur Differenzierung besteht darin, besonders motivierte Schülerinnen und Schüler mit den „normalen“ Merkmalen mit allen sieben Ausprägungen arbeiten zu lassen. Der Standardfall sollte das Arbeiten mit binären Merkmalen sein, also Merkmalen, die zuvor von den SuS umcodiert wurden, wie in Anleitung_CODAP_umcodieren in Stunde 2+3 beschrieben.

Zum Umgang mit den Aufgaben

In der Unterrichtsreihe wird viel mit Arbeitsblättern gearbeitet. Um den Lernprozess zu dokumentieren und gleichzeitig die Motivation hoch zu halten, kann man die Aufgaben auch direkt in einer PowerPoint-Präsentation erarbeiten lassen. Neue Aufgaben können auf neuen Folien bearbeitet werden und am Ende können aus den verschiedenen Schulstunden Ergebnisse genommen werden, um die Abschlusspräsentation zu gestalten.

Zum Umgang mit CODAP

CODAP ist in weiten Teilen auf Deutsch verfügbar. Sollte die Sprache nicht auf Deutsch eingestellt sein, so kann rechts oben die Sprache umgestellt werden.

Link zum Datensatz mit allen 161 Variablen:

https://tinyurl.com/jim-pb160

Teilnahme an der Umfrage

Wer mit seiner Klasse an der Umfrage teilnehmen möchte, kann dies gerne machen. Die Daten werden vollständig anonym erfasst (eventuell mit der Schulleitung abklären). Die Daten fließen dann jährlich in eine Neuauflage des Datensatzes ein, der per CODAP-Link zugänglich bleibt.

Über diesen Link können SuS an der Umfrage teilnehmen (Achtung: 161 Fragen!, genügend Zeit einplanen):

Link

Unterseiten