Wie wird bei Klausuren mit AI gespickt?

  • Haben Smartwatches inzwischen eine eigene Kamera? Ich frage mich nach wie vor, wie die Aufgabenstellung in der Klausursituation "in die KI kommt". Wir haben die gleichen Probleme.

    Meine SuS übersetzen teilweise „nebenbei“ ganze Arbeitsblätter per Smartwatch (also im Unterricht), deshalb müssen die vor Klassenarbeiten auch genau wie Handys weggepackt werden.

    "Benutzen wir unsere Vernunft, der wir auch diese Medizin verdanken, um das Kostbarste zu erhalten, das wir haben: unser soziales Gewebe, unsere Menschlichkeit. Sollten wir das nicht schaffen, hätte die Pest in der Tat gewonnen. Ich warte auf euch in der Schule." Domenico Squillace

  • Auch eine gute Idee. Aber letztlich ist das auch nur ein Unteraspekt. Wenn der Bezug zu anderen Texten fehlt gibts einige Punkte Abzug, aber letztlich kommt der S doch durch, obwohl er nichts kann.

    Wenn konkrete Textbezüge verlangt werden, diese aber komplett fehlen, dann ist das spätestens ab Klasse 10 (ggf. früher) en Fall von „Thema verfehlt“. Das gibt in den Abschlussprüfungen (BW) klar null Punkte für die gesamte Aufgabe und damit spätestens ab Klasse 10 ebenfalls.

    "Benutzen wir unsere Vernunft, der wir auch diese Medizin verdanken, um das Kostbarste zu erhalten, das wir haben: unser soziales Gewebe, unsere Menschlichkeit. Sollten wir das nicht schaffen, hätte die Pest in der Tat gewonnen. Ich warte auf euch in der Schule." Domenico Squillace

  • Zweithandy und längere Klogänge, oder neben einer Wand sitzen, so dass man das Handy zwischen Oberschenkel und Wand nicht sehen kann. Dieses Schema haben wir dann früher oder später bemerkt.

    Als ich die jeweiligen Personen dann mittig und vorne platziert habe, war Ruhe. Interessanterweise kam trotz KI dasselbe (unterdurchschnittliche) Ergebnis heraus wie mit KI.

    Die KI kann in der Regel die inhaltlich-methodische Bearbeitung gar nicht so hinbekommen wie das in einer Klausur sein soll. Insbesondere dann, wenn der Text nicht vorher der KI "gefüttert" wurde.

    Man kann auch alle Schüler einmal bitten, ihre Handys mit beiden Händen über den Kopf zu heben - dann sieht man schnell die Smartwatches...

    Gruß
    #TheRealBolzbold

    Ceterum censeo factionem AfD non esse eligendam.

  • Als ich die jeweiligen Personen dann mittig und vorne platziert habe, war Ruhe. Interessanterweise kam trotz KI dasselbe (unterdurchschnittliche) Ergebnis heraus wie mit KI.

    Die KI kann in der Regel die inhaltlich-methodische Bearbeitung gar nicht so hinbekommen wie das in einer Klausur sein soll. Insbesondere dann, wenn der Text nicht vorher der KI "gefüttert" wurde.

    Ich frage mich dann immer, ob das nicht eine verquere Variante von "Survivor's Bias" ist. Das sind halt die, die wir erkennen. Wer weiß schon, wie viele es hinbekommen, die Prompts so zu formulieren oder das, was die KI ausspuckt, so anzupassen, dass es eben nicht durch diese Punkte auffällt.

  • Im Abitur neulich dasselbe: Vornote 2m, aber in der mündlichen Prüfung nur Gestammel und im zweiten Prüfungsteil bei den Nachfragen brach die geprüfte Person in Tränen aus. Note mangelhaft.
    Da könnte im Vorfeld auch einiges falsch gelaufen sein.

  • Ich frage mich dann immer, ob das nicht eine verquere Variante von "Survivor's Bias" ist. Das sind halt die, die wir erkennen. Wer weiß schon, wie viele es hinbekommen, die Prompts so zu formulieren oder das, was die KI ausspuckt, so anzupassen, dass es eben nicht durch diese Punkte auffällt.

    Die Passagen sind sprachlich "überperfekt", sprich in einen völlig verdichteten, mit vielen Fachausdrücken gespicktem Englisch, doch gehen die Passagen oft am Thema vorbei, weil wie gesagt die KI das methodisch nicht hinbekommt.
    SchülerInnen, die das im Vorfeld bei den Übungsphasen gar nicht hinbekommen - und diese Schreibproben, oder eben die KI-Betrugsversuche habe ich ja vorher schon gesehen - schaffen das auch nicht in der Klausur bzw. fallen als Betrüger auf.

    Gruß
    #TheRealBolzbold

    Ceterum censeo factionem AfD non esse eligendam.

  • Ja, ich kenne das natürlich auch, das fällt natürlich direkt auf.
    Ich wollte nur sagen: Dass alle KI-Betrugsversuche, die wir finden, so auffällig sind, sprachlich so gut und methodisch-inhaltlich eher oberflächlich, bedeutet halt auch nur, dass wir nur solche KI-Betrugsversuche finden.
    Oben wurden schon Tipps genannt, wie Schüler die sprachlichen Auffälligkeiten vermeiden. Ich bin mir sicher, es gibt auch clevere Schüler, die die inhaltlich-methodischen Unzulänglichkeiten vermeiden können. Und dann merken wir halt nicht, dass mit KI betrogen wurde.
    Die Schlussfolgerung: KI-Texte fallen immer (!) auf, weil sie inhaltlich und methodisch oberflächlich sind, ist deswegen meiner Meinung nach nicht haltbar, was die ganze Sache noch verkompliziert.

  • Ja, ich kenne das natürlich auch, das fällt natürlich direkt auf.
    Ich wollte nur sagen: Dass alle KI-Betrugsversuche, die wir finden, so auffällig sind, sprachlich so gut und methodisch-inhaltlich eher oberflächlich, bedeutet halt auch nur, dass wir nur solche KI-Betrugsversuche finden.
    Oben wurden schon Tipps genannt, wie Schüler die sprachlichen Auffälligkeiten vermeiden. Ich bin mir sicher, es gibt auch clevere Schüler, die die inhaltlich-methodischen Unzulänglichkeiten vermeiden können. Und dann merken wir halt nicht, dass mit KI betrogen wurde.
    Die Schlussfolgerung: KI-Texte fallen immer (!) auf, weil sie inhaltlich und methodisch oberflächlich sind, ist deswegen meiner Meinung nach nicht haltbar, was die ganze Sache noch verkompliziert.

    Aber wie geht ihr damit um, wenn der starke Verdacht besteht?
    Es wurde schon vorgeschlagen, die sprachlich perfekten Passagen auf deutsch dem S vorzulegen und übersetzen zu lassen was er vermutlich nicht kann. Aber dann… die ganze Arbeit mit 0P bewerten?

  • Irgendwie kommt es mir absurd vor, dass wir uns von der KI zu Hilfssheriffs machen lassen. Ein Kollege versucht, eine "KI-sichere" Klausur zu stellen. Mit einem anderen mache ich die Aufsicht nur für eine bestimmte Klasse zu zweit, wobei wir die "stelle dich hinter die verdächtigen SuS, dann trauen sie sich nicht"-Methode anwenden. Handys müssen angeschaltet und aktiviert werden, bevor sie abgegeben werden, um die Abgabe von alten Schrotthandys zu erkennen. Ich kontrolliere Handgelenke und Ohren (wobei die Kopftücher beiseite gerückt werden müssen). Klogänge müssen überwacht werden, was absurd und natürlich bei alleiniger Aufsicht unmöglich ist. Was für ein Aufwand ist das alles!

    Wir können Betrugsversuche nur geltend machen, wenn wir sie gesehen haben. Auf spätere Nachfragen nicht antworten können genügt nicht. Dabei ist das so einfach. Ein Schüler war neulich auch sofort geständig, aber da konnte ich auch nicht die ganze Klausur mit ungenügend bewerten.

    Statt uns angeblich datenschutzrechtlich sichere KI anzubieten (fobizz etc.), sollten wir die Möglichkeit bekommen, Störsender einzusetzen oder in Zweifelsfällen die Klausur durch mündliche Prüfungen zu ersetzen oder überhaupt über Prüfungsformate nachzudenken. Der Betrug mit KI hat eine ganz andere Qualität als das übliche "Abschreiben". Das ist ein Hase-und-Igel-Rennen. Wenn es nur um einzelne Noten ginge. Es geht um Schüler, die eigentlich nie im Unterricht sind, bei den Klausuren überraschend gute Resultate haben und bei denen man weiß, dass sie nichts können. Und die werden dann womöglich noch versetzt. Und die Ehrlichen sind die Dummen.

  • Es geht um Schüler, die eigentlich nie im Unterricht sind, bei den Klausuren überraschend gute Resultate haben und bei denen man weiß, dass sie nichts können. Und die werden dann womöglich noch versetzt. Und die Ehrlichen sind die Dummen.

    Da kann eine Ermittlung der Anwesenheitsquote helfen. Ist diese deutlich unter 50% sind wir im Bereich der Nicht-Bewertbarkeit. Das hat für SchülerInnen mitunter ganz erhebliche Konsequenzen.

    Gruß
    #TheRealBolzbold

    Ceterum censeo factionem AfD non esse eligendam.

  • ...

    Ich habe mittlerweile den Eindruck, von vielen S von vorne bis hinten verar… zu werden. Hemmungslos.

    Kann man das nicht eher als eine Art Sport sehen? Aufgaben so zu erstellen, dass KI nichts nützt?

    Ich hab auch Spickzettel geschrieben, nie ging es darum, Herrn X zu verarschen. Mit wenig Aufwand sollte es noch eine passable Note werden. Wenn die Vorbereitung des Spickens mehr Zeit in Anspruch nimmt als das Lernen, wird's vielleicht nervig.

    Muss man ihnen vielleicht sagen. Also dass einem durchaus bewusst ist, dass ihnen niemand derartige Sätze abnimmt und es vielleicht schlauer wäre, sich Grundlagen im Fach draufzuschaufeln, bevor irgendwann gar nichts mehr geht. Und in der nächsten Klausur dann so machen, wie von WillG vorgeschlagen oder noch eine andere Variante testen? Mehr mündliche Mitarbeit bewerten, Zeug ausarbeiten lassen und dann Fragen dazu stellen?

  • Die KI-Arbeiten bekommen durch die Bank gute Noten und die ehrlichen Schüler fühlen sich zunehmend verarscht.

    Ist halt die alte Frage: Wer bescheißt wen?
    Ich als Lehrer würde mich dadurch nicht getroffen fühlen.

    Wenn den Schülern klar ist, dass sie für sich lernen ist das kein Problem mehr.

    Planung ersetzt Zufall durch Irrtum. :P

    8) Politische Korrektheit ist das scheindemokratische Deckmäntelchen um Selbstzensur und vorauseilenden Gehorsam. :whistling:

    Moralische Entrüstung ist der Heiligenschein der Scheinheiligen.

    Einmal editiert, zuletzt von SteffdA (7. Juni 2025 19:40)

  • Ich wähle hier einen pragmatischen Ansatz. Wenn die Schüler so gut schummeln, dass es mir nicht auffällt, sei ihnen der kurze Triumph gegönnt. Dann bekommen sie die bessere Note.

    Die notorischen Schummler werden erfahrungsgemäß mit jedem Versuch übermütiger und dreister. Irgendwann kriege ich es mit und dann gibt es die Note 6/0 Punkte.

    Sie müssen erst noch die Lektion lernen, dass sie sich mit Schummeln nur selbst schaden.


    Ich hatte bislang noch keine krassen Abweichler, bei denen die gezeigte Prüfungsleistung wirklich derart nach oben hin abwich, dass ich es mir auch nicht mit "Das Thema hat ihm/ihr halt gelegen." oder "Der Schüler/die Schülerin hat vor der Klausur noch einmal kräftig gelernt." erklären konnte. Wenn, dann eher Abweichler nach unten wegen Prüfungsangst oder Blackout. Bei großen Abweichlern nach oben würde ich mir vorbehalten, eine mündliche Abfrage anzuschließen, bei der abgeprüft wird, ob die Inhalte wirklich verstanden wurden. Wenn ja, gibt es natürlich im Zweifelsfall die bessere Note. Sonst kann man Zweifel an der ursprünglichen Prüfungsleistung äußern und die Nachweise der Schulleitung vorlegen zwecks finaler Entscheidung.

  • Ich habe mittlerweile den Eindruck, von vielen S von vorne bis hinten verar… zu werden. Hemmungslos.

    Oh ja. Ich habe vor knapp zwei Jahren gleich zwei Schüler im Unterricht erwischt, die einen "Smart Cheating Pen" benutzt haben. Auf diesem ist ein winziges Display, das man nur in einem bestimmten Winkel sieht. Das Display kann der Schüler auch ausschalten und das Einschalten so programieren, dass Andere dies nicht tun können. Also selbst wenn die Lehrkraft diesen Pen in die Hand nimmt und "rumdrückt", geht das Display nicht an. Diese Pens kosten 150€ und können mit dem Smartphone oder der Smartwatch verbunden werden.

  • "Smart Cheating Pen"

    Ich werde langsam zu alt für den Job🤣.

    Kannte ich bislang wirklich noch nicht.

    An alle Deutschlehrer:
    Wer Rechtschreibfehler findet, darf sie behalten. :doc:

Werbung