Kategorie:ProDaBi/Projektkurs: Unterschied zwischen den Versionen

Aus Unterrichtsmaterial
Wechseln zu:Navigation, Suche
(Modul 1 eingefügt)
(Module 2-4 eingefügt)
Zeile 8: Zeile 8:
  
 
===Aufbau===
 
===Aufbau===
[[Datei:Roadmap-PJK2021.png|mini|Aufbau des Projektkurses|verweis=Special:FilePath/Roadmap-PJK2021.png]]
+
[[Datei:Roadmap-PJK2021.png|Aufbau des Projektkurses|verweis=Special:FilePath/Roadmap-PJK2021.png|alternativtext=|rechts]]
 
Der Projektkurs ist in 6 Module unterteilt, die verschiedene Aspekte von Data Science beleuchten. Die Module unterscheiden sich dabei darin, dass sich die Module 2-5 auf die Einführung wichtiger Konzepte und Methoden im Bereich Data Science beziehen, während in den Modulen 1 und 6 das hieraus entstandene Wissen zur Umsetzung der eigenen KI-gestützten Anwendung genutzt werden soll. Wichtig ist dabei auch zu wissen, dass die Projektarbeit - also das Erstellen der eigenen KI-gestützten Anwendung - nicht ausschließlich innerhalb des Moduls 6 geschieht, sondern während des gesamten Kurses parallel abläuft. In Modul 6 ist allerdings die gesamte Arbeit des Projektteams auf die Projektarbeit fokussiert.
 
Der Projektkurs ist in 6 Module unterteilt, die verschiedene Aspekte von Data Science beleuchten. Die Module unterscheiden sich dabei darin, dass sich die Module 2-5 auf die Einführung wichtiger Konzepte und Methoden im Bereich Data Science beziehen, während in den Modulen 1 und 6 das hieraus entstandene Wissen zur Umsetzung der eigenen KI-gestützten Anwendung genutzt werden soll. Wichtig ist dabei auch zu wissen, dass die Projektarbeit - also das Erstellen der eigenen KI-gestützten Anwendung - nicht ausschließlich innerhalb des Moduls 6 geschieht, sondern während des gesamten Kurses parallel abläuft. In Modul 6 ist allerdings die gesamte Arbeit des Projektteams auf die Projektarbeit fokussiert.
  
Zeile 16: Zeile 16:
 
====Modulübersicht:====
 
====Modulübersicht:====
 
=====Modul 1: Einführung in das Projekt=====
 
=====Modul 1: Einführung in das Projekt=====
In dieser ersten Phase werden die SuS in die Thematik des Projektkurses eingeführt.  
+
In diesem ersten Modul werden die SuS in die Thematik des Projektkurses eingeführt.  
  
 
Dazu gehören die folgenden Aspekte:
 
Dazu gehören die folgenden Aspekte:
  
* Organisation des Projektkurses
+
*Organisation des Projektkurses
** Sammeln von Vorstellungen und Vorerfahrungen im Bereich Data Science und Künstliche Intelligenz
+
**Sammeln von Vorstellungen und Vorerfahrungen im Bereich Data Science und Künstliche Intelligenz
** Vorstellen des Ablaufs (inhaltlich - anhand der Roadmap - s.o.)
+
**Vorstellen des Ablaufs (inhaltlich - anhand der Roadmap - s.o.)
** Vorstellen des Ablaufs (methodisch - anhand des [[CRISP-DM|CRISP-DM-Modells]])
+
**Vorstellen des Ablaufs (methodisch - anhand des [[CRISP-DM|CRISP-DM-Modells]])
** Verständigung über das Vorgehen innerhalb von [[SCRUM]]
+
**Verständigung über das Vorgehen innerhalb von [[SCRUM]]
* Erste grobe Planung des Projektes:
+
*Erste grobe Planung des Projektes:
** Vorstellung des "Ziel-Software-Produktes"
+
**Vorstellung des "Ziel-Software-Produktes"
** Formulierung von User-Stories nach dem Schema "Ich als <Rolle> möchte mit der KI-gestützten Anwendung <Funktion>, um damit <Nutzen>."
+
**Formulierung von User-Stories nach dem Schema "Ich als <Rolle> möchte mit der KI-gestützten Anwendung <Funktion>, um damit <Nutzen>."
  
 
=====Modul 2: Datenexploration - Teil 1=====
 
=====Modul 2: Datenexploration - Teil 1=====
 +
Im ersten Teil dieses Moduls explorieren die SuS einen Datensatz, der mit einem adaptierten Erhebungsinstrument der [https://www.mpfs.de/studien/ JIM-Studie] - eine Studie zum Medienumgang von Jugendlichen - an Paderborner Schulen erhoben wurde. Dabei entwickeln die SuS zunächst eigene Fragestellungen, zu denen sie auf Basis einer Auswertung der Daten im Tool [https://codap.concord.org CODAP] Antworten finden sollen. Die SuS sammeln ihre Ergebnisse und Erkenntnisse und stellen sie dem Kurs in einer Präsentation vor.
 +
 +
Als "Gelenkstelle" zu Modul 3 fungiert die Aufgabe, Grenzen von CODAP zu reflektieren, indem die SuS Fragestellungen entwickeln sollen, die nicht ausschließlich innerhalb von CODAP beantwortet werden können.
  
 
=====Modul 3: Datenexploration - Teil 2=====
 
=====Modul 3: Datenexploration - Teil 2=====
 +
In diesem zweiten Teil lernen die SuS [https://jupyter.org Jupyter Notebooks] als ein mächtiges, programmierbares Tool zur Datenanalyse kennen. Dabei nutzen sie Paderborner Parkplatzdaten aus den letzten Jahren, um erste Variablen herauszuarbeiten, die die Parkplatzauslastung in Paderborn beeinflussen. Die SuS erstellen dabei ein sogenanntes [[Computational Essay]], in dem sie ihre Datenanalyse dokumentieren, sodass man diese später auf interaktive Weise lesen kann. Die SuS programmieren die Datenanalyse in Python, wobei sie einem [[Epistemisches Programmieren|epistemischen Programmieransatz]] folgen, der den Erkenntnisgewinn als Ziel des Programmierens in den Vordergrund stellt. Um sich mit der Programmier-Umgebung vertraut zu machen, durchlaufen die SuS zuvor einen [https://cscircles.cemc.uwaterloo.ca/de/ Python-Online-Kurs] sowie zwei Tutorial-JupyterNotebooks.
 +
 +
Die zwei essentiellen Python-Bibliotheken, die die SuS verwenden, sind einerseits [https://pandas.pydata.org Pandas] zu Verwaltung der Datensätze und [https://plotly.com/python/ Plotly] zur Visualisierung. Natürlich können die SuS auch weitere Bibliotheken einbinden, die ihnen bei ihrer Datenanalyse behilflich sind.
  
 
=====Modul 4: Machine Learning - Teil 1=====
 
=====Modul 4: Machine Learning - Teil 1=====
 +
Im ersten Machine-Learning-Teil lernen die SuS Decision Trees als eine Art des Machine Learnings kennen, mithilfe derer sich (einfache) Vorhersagen über einen bestimmten Sachverhalt machen lassen.
 +
 +
Decision Trees
  
 
=====Modul 5: Machine Learning - Teil 2=====
 
=====Modul 5: Machine Learning - Teil 2=====
 +
KNNs
 +
 +
Brain in the Bag
  
 
=====Modul 6: Projektarbeit=====
 
=====Modul 6: Projektarbeit=====

Version vom 13. September 2021, 14:06 Uhr

Kurzbeschreibung

Das ProDaBi-Projekt führt seit dem Schuljahr 2018/2019 in Kooperation mit den Schulen Gymnasium Theodorianum Paderborn und Reismann Gymnasium Paderborn einen Projektkurs "Data Science und Künstliche Intelligenz" mit Schüler*innen der Q2 (12. Jahrgangsstufe) durch. Das Ziel ist dabei einerseits das Vermitteln von in der heutigen Zeit immer bedeutsamer werdenden Kenntnissen in den Bereichen Statistik, Datensammlung, Datenanalyse, maschinelles Lernen, Decision Trees und Künstliche Neuronale Netze sowie die Anwendung dieses Wissens zur Entwicklung einer eigenen KI-gestützten Anwendung.

Software-Produkt: Die KI-gestützte Anwendung

Als ein realitätsnahes Software-Projekt erhalten die SuS den Auftrag, eine Anwendung zu entwickeln, die die Parkplatzauslastung auf neun relevanten Parkplätzen in der Paderborner Innenstadt vorhersagen soll. Dabei erhalten die SuS Zugriff auf die aufgezeichneten Parkplatzdaten der letzten Jahre sowie auf die aktuelle Auslastung. Zusätzlich können sie weitere Daten wie Wetterdaten in Ihr Modell einbauen, um die Vorhersage zu optimieren.

Das Produkt des Projektkurses im Schuljahr 2020/2021 lässt sich hier abrufen.

Aufbau

Der Projektkurs ist in 6 Module unterteilt, die verschiedene Aspekte von Data Science beleuchten. Die Module unterscheiden sich dabei darin, dass sich die Module 2-5 auf die Einführung wichtiger Konzepte und Methoden im Bereich Data Science beziehen, während in den Modulen 1 und 6 das hieraus entstandene Wissen zur Umsetzung der eigenen KI-gestützten Anwendung genutzt werden soll. Wichtig ist dabei auch zu wissen, dass die Projektarbeit - also das Erstellen der eigenen KI-gestützten Anwendung - nicht ausschließlich innerhalb des Moduls 6 geschieht, sondern während des gesamten Kurses parallel abläuft. In Modul 6 ist allerdings die gesamte Arbeit des Projektteams auf die Projektarbeit fokussiert.

Arbeiten mit SCRUM

Innerhalb des Projektkurses sind die SuS Teil eines SCRUM-Teams, welches sich in wöchentlichen Sprints organisiert. Ein Sprint besteht dabei aus den drei Aspekten "Sprint Review", "Sprint Retrospektive" und "Sprint-Planning". Während im "Sprint-Planning" die aktuell anliegenden Aufgaben geplant und auf das Team verteilt werden, werden die Aufgaben aus der Vorwoche im "Sprint-Review" hinsichtlich ihres Abschlusses überprüft und es werden verbleibende Rückfragen geklärt. Die "Sprint-Retrospektive" dient der Reflexion der Arbeit in der letzten Woche. Hier werden Absprachen bezüglich (zu verändernder) Arbeitsorganisation und Aufgabenverteilung besprochen. Weitere Informationen zum SCRUM-Vorgehensmodell befinden sich unter SCRUM.

Modulübersicht:

Modul 1: Einführung in das Projekt

In diesem ersten Modul werden die SuS in die Thematik des Projektkurses eingeführt.

Dazu gehören die folgenden Aspekte:

  • Organisation des Projektkurses
    • Sammeln von Vorstellungen und Vorerfahrungen im Bereich Data Science und Künstliche Intelligenz
    • Vorstellen des Ablaufs (inhaltlich - anhand der Roadmap - s.o.)
    • Vorstellen des Ablaufs (methodisch - anhand des CRISP-DM-Modells)
    • Verständigung über das Vorgehen innerhalb von SCRUM
  • Erste grobe Planung des Projektes:
    • Vorstellung des "Ziel-Software-Produktes"
    • Formulierung von User-Stories nach dem Schema "Ich als <Rolle> möchte mit der KI-gestützten Anwendung <Funktion>, um damit <Nutzen>."
Modul 2: Datenexploration - Teil 1

Im ersten Teil dieses Moduls explorieren die SuS einen Datensatz, der mit einem adaptierten Erhebungsinstrument der JIM-Studie - eine Studie zum Medienumgang von Jugendlichen - an Paderborner Schulen erhoben wurde. Dabei entwickeln die SuS zunächst eigene Fragestellungen, zu denen sie auf Basis einer Auswertung der Daten im Tool CODAP Antworten finden sollen. Die SuS sammeln ihre Ergebnisse und Erkenntnisse und stellen sie dem Kurs in einer Präsentation vor.

Als "Gelenkstelle" zu Modul 3 fungiert die Aufgabe, Grenzen von CODAP zu reflektieren, indem die SuS Fragestellungen entwickeln sollen, die nicht ausschließlich innerhalb von CODAP beantwortet werden können.

Modul 3: Datenexploration - Teil 2

In diesem zweiten Teil lernen die SuS Jupyter Notebooks als ein mächtiges, programmierbares Tool zur Datenanalyse kennen. Dabei nutzen sie Paderborner Parkplatzdaten aus den letzten Jahren, um erste Variablen herauszuarbeiten, die die Parkplatzauslastung in Paderborn beeinflussen. Die SuS erstellen dabei ein sogenanntes Computational Essay, in dem sie ihre Datenanalyse dokumentieren, sodass man diese später auf interaktive Weise lesen kann. Die SuS programmieren die Datenanalyse in Python, wobei sie einem epistemischen Programmieransatz folgen, der den Erkenntnisgewinn als Ziel des Programmierens in den Vordergrund stellt. Um sich mit der Programmier-Umgebung vertraut zu machen, durchlaufen die SuS zuvor einen Python-Online-Kurs sowie zwei Tutorial-JupyterNotebooks.

Die zwei essentiellen Python-Bibliotheken, die die SuS verwenden, sind einerseits Pandas zu Verwaltung der Datensätze und Plotly zur Visualisierung. Natürlich können die SuS auch weitere Bibliotheken einbinden, die ihnen bei ihrer Datenanalyse behilflich sind.

Modul 4: Machine Learning - Teil 1

Im ersten Machine-Learning-Teil lernen die SuS Decision Trees als eine Art des Machine Learnings kennen, mithilfe derer sich (einfache) Vorhersagen über einen bestimmten Sachverhalt machen lassen.

Decision Trees

Modul 5: Machine Learning - Teil 2

KNNs

Brain in the Bag

Modul 6: Projektarbeit

Diese Kategorie enthält zurzeit keine Seiten oder Medien.