Es freut mich sehr, dass sich mit Dirk Thiede ein Datenschutzbeauftragter für einen Gastbeitrag auf Unterrichten.Digital bereiterklärt hat. Auf seiner Website Datenschutz-Schule.info stellt der Autor (behördlicher Datenschutzbeauftragter für die Schulen im Kreis Olpe, NRW) umfassende Informationen – datenschutzrechtliche Einschätzungen, Service-Materialien, Hintergrundartikel – für Schulleitungen, Lehrpersonen, Schülerinnen und Schüler und Eltern zur Verfügung. Ein toller Service und eine echte Empfehlung!


ChatGPT ist in aller Munde und auch im Bildungsbereich macht man sich Gedanken über den Nutzen der Plattform. Lehrkräfte denken dabei jedoch nicht nur an die Vorbereitung von Unterricht oder die Möglichkeiten, wie ihre Schülerinnen und Schüler damit gestellte Aufgaben drehen und ohne Lerneffekt lösen können. Viele sehen auch ein Potenzial für eine direkte unterrichtliche Nutzung mit und durch Schülerinnen und Schüler. Zahlreiche Beispiele dafür finden sich auch hier im Blog.

ChatGPT und der Datenschutz - eine erste Einschätzung 1
Einfache Oberfläche, weitgehende Fähigkeiten: ChatGPT

Wie bei jeder Online-Plattform oder mit dem Internet verbundenen App ist Schule jedoch gehalten, sich über das Thema Datenschutz Gedanken zu machen, wenn dabei personenbezogene Daten verarbeitet werden.

ChatGPT kommt sehr schlicht daher und wie in einem Chat geht es hier um die Eingabe und Ausgabe von Informationen im Textformat.

Was genau im Hintergrund geschieht, erschließt sich aus der simplen Oberfläche nicht. Klar ist, dass eine Nutzung die Erstellung eines Kontos mit Angabe von E-Mail-Adresse und Passwort und seit einiger Zeit auch einer Mobilfunknummer voraussetzt. Wer ein Konto erstellen möchte, muss laut AGB mindestens 18 Jahre alt sein. Der Dienst richtet sich laut Datenschutzerklärung nicht an Kinder unter 13 Jahren. ChatGPT kann zwar mit einem kostenfreien Zugang genutzt werden, aber die AGB beschränken kostenfreie Zugänge auf einen einzigen pro Person. Soviel zunächst in aller Kürze zum Rahmen.

ChatGPT / OpenAI – der Anbieter

Hinter OpenAI und ChatGPT steht eine US-amerikanische Firma mit Sitz in San Francisco, die von verschiedenen Kapitalgebern finanziert wird. Der wohl mächtigste Kapitalgeber dürfte Microsoft sein, der die Investitionen nun dazu nutzen wird, um die Plattform auch in seine Office-Produkte zu integrieren.

Serverstandorte

Nach allem was zu ermitteln ist, nutzt OpenAI für die Bereitstellung von Diensten wie ChatGPT Server mit Standort USA. Die exakten Standorte sind schwierig zu ermitteln, da man den US-Anbieter Cloud Flare zwischen Endnutzer und die eigenen Server schaltet. Ein erster Hinweis dazu taucht auf der ChatGPT Seite beim Laden auf. Cloud Flare lässt sich auch auf anderem Weg sicher nachweisen.

Eingesetzte Dienstleister

Aus dem beobachteten Verhalten von ChatGPT lassen sich mehrere genutzte Drittanbieter ermitteln:

  • Cloud Flare
  • Auth0
  • NextAuth.js (Auth.js)
  • Google

Es ist jedoch sicher davon auszugehen, dass weitere Anbieter genutzt werden, vor allem für den Betrieb der Server. Aus der Website von OpenAI lässt sich entnehmen, dass auch Amazon Web Services (AWS) in drei verschiedenen AWS Regionen zum Einsatz kommt. Außerdem nutzt man laut einem anderen Beitrag auf der Website Microsoft Azure.

Befragt man ChatGPT selbst, erhält man folgende Auskunft:

Um diesen Dienst bereitzustellen, nutzt OpenAI eine Kombination aus Software- und Hardwareressourcen, die Folgendes umfassen:

      • Cloud-Infrastruktur: OpenAI nutzt Cloud-Infrastrukturanbieter wie Amazon Web Services (AWS), Microsoft Azure und Google Cloud Platform (GCP), um das ChatGPT-Modell zu hosten und zu betreiben. Dies ermöglicht OpenAI eine einfache Skalierung des Dienstes, um der Nachfrage gerecht zu werden und eine hohe Verfügbarkeit zu gewährleisten.
      • Datenspeicherung: OpenAI nutzt Datenspeicheranbieter wie Amazon S3, Azure Blob Storage und Google Cloud Storage, um die Daten zu speichern, die zum Trainieren des ChatGPT-Modells verwendet werden, sowie die Daten, die durch die API- Nutzung erzeugt werden.
      • Vernetzungen: OpenAI nutzt Netzwerkanbieter wie Amazon VPC, Azure Virtual Network und Google Cloud VPC, um die verschiedenen Komponenten des Dienstes zu verbinden und eine sichere und zuverlässige Kommunikation zwischen dem Client und der API zu gewährleisten.

Man sollte bei dieser Antwort zwei Dinge beachten: ChatGPT ist trainiert mit Daten bis 2021 und die Plattform kann auch Falschinformationen ausgeben.
In der weiteren Dokumentation findet man Hinweise, dass auch Google Cloud Server für bestimmte Funktionen (OpenAI gym) eingesetzt werden. Ob alle drei der großen Anbieter genutzt werden, um ChatGPT bereitzustellen, ist nicht eindeutig zu ermitteln. Es deutet jedoch manches darauf hin, dass zum Training der Plattform andere Server genutzt werden als zum Betrieb von ChatGPT.

Beobachtetes Verhalten von ChatGPT

Beim direkten Aufruf von https://chat.openai.com/ werden neben zwei technischen Cookies im Local Storage verschiedene Cookies als 1st Party Cookies gesetzt. Diese Cookies sind den oben genannten Dienstleistern zuzuordnen und haben verschiedene Funktionen:

    • Cloud Flare – Bot Logins verhindern, Authentifizierung von Nutzern
    • Auth0 – Verwaltung von Nutzer Sessions
    • NextAuth.js – Authentifizierung von Nutzern
    • Google – ReCaptcha zur Sicherstellung, dass es sich um menschliche Nutzer handelt

Werden in der gleichen Sitzung andere OpenAI Seiten im Webauftritt des Anbieters aufgerufen, etwa Updates & FAQ, können weitere Cookies gesetzt werden, beispielsweise von Intercom, die dann mit dem angemeldeten Nutzer verbunden werden. Auch das Setzen von Google-Analytics Cookies als OpenAI 1st Party Cookies konnte nachgewiesen werden. Ihr Ursprung bei OpenAI ist jedoch unklar, rührt aber definitiv nicht unmittelbar von der Nutzung von ChatGPT her.

Datenschutzerklärung

In der Datenschutzerklärung wird über die Datenverarbeitung informiert, soweit sie die Website des Anbieters betrifft, verbundene Seiten und die Dienste von OpenAI.

Unterschieden wird bei den Daten, welche der Anbieter sammelt, zwischen denen,

    • welche Nutzer von sich aus offen legen, etwa bei der Erstellung eines Kontos,
    • denen, welche bei der Kommunikation mit dem Anbieter anfallen,
    • den Daten, welche über die Social Media-Auftritte des Anbieters anfallen,
    • und denen, welche automatisch bei der Nutzung der Dienste anfallen.

Von Bedeutung im Zusammenhang Schule und Unterricht sind hier die erstere und letztere Kategorie. Zur Nutzung von Diensten von OpenAI ist ein Konto erforderlich. Der Hauptteil der Daten fällt dann bei der Nutzung der Dienste, etwa ChatGPT, an. Dazu gehören die üblichen Logdaten wie die IP-Adresse, der Browsertyp, dessen Version und Einstellungen, Datum und Uhrzeit der Nutzung und Nutzungsdaten zur Interaktion mit dem Dienst. Zu den Nutzungsdaten, die erhoben werden können, gehören nach Angaben des Anbieters Inhaltstypen, mit denen Nutzer interagieren, genutzte Funktionen wie auch Zeitzone, Herkunftsland und Daten dazu, wann und wie lange genutzt wird, User Agent und seine Version, Art von Endgerät und ähnlich. Der Anbieter behält sich vor, auch Cookies und Analytics einzusetzen. Als Zweck wird angegeben, dieses zur Erbringung und Verbesserung der Dienste zu tun. Welche Cookies und welche Analyse-Tools oder -Dienstleister eingesetzt werden, darüber erfährt man nichts.

Es werden sechs generelle Zwecke der Datenverarbeitung genannt:

    1. Erbringung, Verbesserung und Analyse des Dienstes.
    2. Forschung, die intern genutzt wird, aber auch mit Dritten geteilt oder gar veröffentlicht werden kann.
    3. Kommunikation mit dem Nutzer.
    4. Entwicklung neuer Programme und Dienste.
    5. Sicherheit und Verhinderung von Missbrauch der Dienste.
    6. Einhaltung gesetzlicher Vorgaben.

Aggregierte Daten können genutzt werden, um die Effektivität des Dienstes zu analysieren und Einblicke in typisches Verhalten und Charakteristiken von Nutzern zu erhalten. Diese Informationen können unter anderem durch die Dienste selbst und über Cookies gesammelt werden.

OpenAI richtet sich mit seinem Dienst ausdrücklich nicht an Kinder unter dem Alter von 13 Jahren. Man weist darauf hin, dass Kinder unter 13 Jahren diesen Dienst nur mit Einwilligung der Eltern nutzen dürfen.
Weitere Informationen, die auch mit Bezug auf Datenschutz von Bedeutung sind, finden sich in den FAQ zu OpenAI. Aus diesen geht hervor, dass die Inhalte der Interaktion von Nutzern mit der Plattform (conversations)

    • von Mitarbeitern einsehen werden, um das System zu verbessern und sicherzustellen, dass die Inhalte mit den Richtlinien und Sicherheitsanforderungen der Plattform übereinstimmen,
    • von den AI Trainern eingesehen werden können, um das System zu verbessern, d.h. zu trainieren. Die eingegebenen Inhalte und Reaktionen auf Antworten werden damit Gegenstand des Corpus, aus dem OpenAI trainiert wird.

Im Hilfebereich gibt es noch weitere Informationen dazu, wie Daten von Nutzern zur Verbesserung und zum Training von OpenAI genutzt werden können. Unter How your data is used to improve model performance wird erklärt, dass man beim Zugriff auf den Dienst über die API (das meint, eingebunden in eine andere Website oder in eine App, die nicht vom Anbieter selbst kommen) Nutzerdaten verwendet, diese dazu aber vorab von jeglichen personenbezogenen Informationen befreit. Man nutzt außerdem kleine Stichproben von bis zu 200 API-Anfragen im Zeitraum von 6 Monaten.

Aussagen dazu, wie lange personenbezogene Daten in der Plattform gespeichert werden, macht die Datenschutzerklärung nicht.

AGB von ChatGPT

Gemäß der Allgemeinen Geschäftsbedingungen müssen Nutzer mindestens 18 Jahre alt sein, um ein Konto zu erstellen.

Vom Nutzer eingegebene Inhalte können vom Anbieter benutzt werden, um den Dienst zu verbessern und der Nutzer willigt darin automatisch ein.

Es ist nicht zulässig, dass ein Nutzer mehr als einen kostenlosen Zugang erstellt.

Sollen mit der Plattform personenbezogene Daten verarbeitet werden, ist der Nutzer verpflichtet, dieses auf seiner Seite rechtlich abzusichern (Information, Einwilligung) und muss dem Anbieter gegenüber darlegen, dass er diese Daten in Übereinstimmung mit geltendem Recht verarbeitet.

Für Nutzer, welche der DS-GVO unterliegen, bietet der Anbieter auf Anfrage einen Vertrag zur Auftragsverarbeitung (Data Processing Addendum) an.

Vertrag zur Auftragsverarbeitung

Lag bis zum 24.01.2023 nicht zur Prüfung vor und konnte so bisher nicht bewertet werden.

Was bedeutet das für den unterrichtlichen Einsatz in der Schule? 10 Beobachtungen

Fasst man die bisherigen Beobachtungen zusammen, ergibt sich:

    1. Da es sich bei ChatGPT um ein US-amerikanischen Anbieter handelt, unterliegt dieser US-amerikanischem Recht und muss Ermittlungsbehörden gegenüber Nutzerdaten offenlegen.
    2. Alles deutet darauf hin, dass die für den Betrieb und das Training der Plattform ChatGPT genutzten Server in den USA stehen. Auch wenn hier das weltweite Netz der Server von Cloud Flare zwischengeschaltet ist, um die eigentlichen Server zu schützen und Missbrauch zu verhindern, liegen dadurch sämtliche Nutzerdaten auf US-amerikanischen Servern. Diese unterliegen dem unmittelbaren Zugriff von US-Behörden.
    3. Es gibt keinerlei Hinweise, dass die Daten von Nutzern, hierbei an erster Stelle die Inhaltsdaten aus der Interaktion mit der Plattform, das heißt eingegebene Anfragen, in irgendeiner Weise durch eine Verschlüsselung vor dem Zugriff durch Dritte geschützt sind. Dieses würde darüber hinaus auch keinen Sinn machen, da die Daten im Fall einer Verschlüsselung, die clientseitig durch den Nutzer erfolgt, nicht für den Anbieter zum Training der Plattform und zur Kontrolle von Missbrauch einsehbar wären.
    4. Neben den Inhaltsdaten fallen neben den Kontodaten auch die üblichen Logdaten sowie Metadaten zur Nutzung der Plattform an.
    5. Während der Nutzung von ChatGPT, beginnend mit dem Login, lassen sich neben Diensten zur Authentifizierung und zur Abwehr missbräuchlicher Nutzung durch Bots keine weiteren Drittanbieterdienste in der Kommunikation zwischen Server und Client (Browser) nachweisen. Das heißt, es erfolgt hier keine direkte Analyse von Nutzerverhalten und auch keinen Tracking der Nutzer, solange dieser sich nur auf der eigentlichen ChatGPT Seite aufhält. Ruft der Nutzer andere Seiten in der Plattform von OpenAI auf, ist es möglich, dass auch Analyse Cookies gesetzt werden.
    6. Das Angebot von OpenAI richtet sich ausdrücklich nicht an Kinder unter dem Alter von 13 Jahren und die Erstellung eines Kontos ist erst ab 18 Jahren möglich. Um die missbräuchliche Nutzung von kostenlosen Kunden, die auf eines pro Nutzer beschränkt sind, technisch zu verhindern, müssen Nutzer seit einiger Zeit eine Mobilfunknummer bei der Registrierung angeben.
    7. Durch die technische Gestaltung des Anmeldeprozesses ist die Erstellung eines eigenen Kontos für ChatGPT mittlerweile nicht mehr anonym möglich. Mobilfunknummern sind immer einer individuellen Person zuzuordnen, da dieses hier in Deutschland gesetzlich vorgeschrieben ist. Da Mobilfunknummern auch im Kontext anderer Plattformen häufig hinterlegt werden, kann es auch für Dritte möglich sein, Nutzer darüber eindeutig zu identifizieren. Dadurch ist es für den Anbieter wie auch für Dritte möglich, sämtliche Interaktionen sowohl mit Blick auf die Metadaten als auch die Inhaltsdaten einer identifizierbaren Person zuzuordnen.
    8. Der Anbieter gibt an, dass ihm der Schutz der personenbezogenen Daten von Nutzern sehr wichtig ist. Die Datenschutzerklärung ist sehr transparent gestaltet, doch es fehlen beispielsweise Informationen zur Löschung von Daten. Nutzer können innerhalb von ChatGPT die verschiedenen entstandenen Chats mit ihren Eingaben und den Ausgaben der Plattform löschen. Sie können darüber hinaus eine Löschung ihrer Daten beim Anbieter per E-Mail anfordern. Es ist davon auszugehen, dass einmal eingegebene Daten ohne Löschanfrage längerfristig, möglicherweise auch nach Löschung eines Kontos, auf den Servern des Anbieters verbleiben.
    9. Zumindest aktuell scheint der Anbieter kein Interesse daran zu haben, Nutzerdaten für Werbung für die eigene Plattform nutzen zu wollen. Auch ein Profiling der Nutzer oder ein Tracking über die Plattform hinaus ist aus der direkten Interaktion zwischen Client und Servern des Anbieters nicht nachweisbar. Ob dieses immer so bleiben wird, ist abzuwarten. Die Plattform bietet jetzt erste Bezahlversionen an.
    10. OpenAI stellt auf Nachfrage einen Vertrag zur Auftragsverarbeitung zur Verfügung. Ob dieser den Anforderungen der DS-GVO genügt, wäre zu ermitteln.

Nutzungsszenarien und Bewertung

Mit Blick auf die zusammengefassten Beobachtungen ergeben sich für die folgenden Nutzungsszenarien und ihre Bewertungen:

    • Nutzen Lehrkräfte ChatGPT mit einem eigenen Konto, ob mit privater E-Mail-Adresse oder mit schulischer E-Mail-Adresse erstellt, erfolgt die darüber stattfindende Verarbeitung ihre eigenen personenbezogenen Daten in ihrer eigenen Verantwortung. Eine unterrichtliche Nutzung ist so durchaus vorstellbar, wenn die Lehrkraft eigene Prompts oder solche von Schülerinnen und Schülern dort selbst eingibt.
    • Nutzen Schülerinnen und Schüler ChatGPT über das Konto der Lehrkraft auf einem unpersonalisierten schulischen Gerät in der Schule und ohne die Verwendung von Inhalten mit biografischen Informationen, ergeben sich daraus keine Risiken.
    • Eine Nutzung von ChatGPT durch Schülerinnen und Schüler auf privaten Endgeräten oder auf personalisierten Schulgeräten über das Konto einer Lehrkraft ermöglicht es potentiell, sie als individuelle Nutzer zu identifizieren. Mögliche Risiken hängen auch von den durch die Nutzer in die Plattform eingebrachten Inhalten ab.
    • Erstellen Schülerinnen und Schüler ein eigenes Konto in ChatGPT, setzt dieses laut DS-GVO vor Vollendung des 16. Lebensjahres die Einwilligung der Erziehungsberechtigten voraus. Da die Schule keinen Vertrag zur Auftragsverarbeitung abgeschlossen hat, die Schule demnach auch nicht Verantwortlicher ist, ginge es um eine Einwilligung in die Nutzung, mit welcher die Erziehungsberechtigten ihr Einverständnis erklären, dass das Kind sich ein Konto bei ChatGPT erstellen darf. Die Erstellung eines Kontos vor dem 18. Lebensjahr würde jedoch gegen die AGB des Anbieters verstoßen.
    • Würde die Schule den Vertrag zur Auftragsverarbeitung mit dem Anbieter abschließen und vorausgesetzt, dieser würde den Anforderungen der DS-GVO entsprechen, so wäre vom Grundsatz her eine Nutzung mit individuellen Konten auf der Grundlage einer Einwilligung möglich. Da die Verarbeitung der personenbezogenen Daten jedoch höchstwahrscheinlich komplett in den USA erfolgt, wäre eine schulische Nutzung auf diesem Wege nicht mit dem Schrems II Urteil vereinbar und damit nicht datenschutzkonform möglich. Dieses könnte sich eventuell, wenn auch nur vorübergehend, durch den neuen Privacy Shield 2 ändern, sobald dieser in Kraft getreten ist. Das würde jedoch auch bedeuten, dass die Schule als verantwortliche Stelle in der Lage sein muss, ihren Rechenschaftspflichten nach Artikel 5 DS-GVO vollumfänglich nachzukommen. Ob dieses tatsächlich möglich wäre, müsste ermittelt werden.

Aus Datenschutzsicht empfiehlt es sich, die schulische Nutzung von ChatGPT mit schülereigenen Konten im Unterricht nicht zuzulassen. Lehrkräfte sollten keine Registrierung an der Plattform in der Schule erlauben, auch wenn mögliche Risiken begrenzt scheinen. Sie sind jedoch nicht sicher und abschließend abzuschätzen.

Schülerinnen und Schüler ab 18 Jahren / ab 16 Jahren

Eine Ausnahme bezüglich der Nutzung mit schülereigenen Konten im Unterricht besteht hier bei Schülerinnen und Schülern ab 18 Jahren, wenn die Nutzung von ChatGPT im Unterricht optional ist und aus einer Nichtnutzung keine Nachteile entstehen.

Bei Schülerinnen und Schülern ab Vollendung des 16. Lebensjahres wäre die Erstellung eines eigenen Kontos zwar rein formal mit Blick auf Art. 8 Abs. 1 DS-GVO möglich, würde jedoch gegen die Nutzungsbedingungen der Plattform verstoßen. Eine Nutzung kann auch in diesem Fall nur rein optional sein und darf vor allem nicht zu Nachteilen führen bzw. zu einer besseren Benotung.

Abschließende Bewertung aus Datenschutzsicht

Zusammenfassend lässt sich sagen, dass man bei einer unterrichtlichen Nutzung von ChatGPT mit Bedacht vorgehen und dabei immer das Alter und die Umstände der Nutzung im Blick behalten sollte, denn daraus leiten sich die Grenzen der Nutzung her. Was hier für ChatGPT beschrieben wird, gilt auch für Plattformen, welche ChatGPT über eine Schnittstelle in ihr eigenes Angebot einbinden. Dort kommt dann für eine Bewertung jedoch noch die Datenverarbeitung durch den Anbieter, der ChatGPT verwendet, hinzu. ChatGPT ist nicht die einzige Plattform dieser Art und was für ChatGPT gilt, lässt sich, auch wenn andere Plattformen sehr ähnlich sein mögen, nicht ohne eine weitere Prüfung auf diese übertragen. Anders als noch vor einigen Jahren, als in den Klassenzimmern jede mögliche App und Plattform ohne große Bedenken einfach mal ausprobiert wurde, sind wir mittlerweile etwas weiter und gehen bedachter vor. Das sollte auch für den Einsatz von Plattformen wie ChatGPT und vergleichbaren Angeboten gelten.

Kommentar verfassen

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.