BING liefert Erwartetes – BARD halluziniert dramatisch

Im Video sind kaum erklärbare KI-Halluzinationen zu sehen. BARD scheint schlecht oder unvollständig trainiert zu sein. Der unter der Linie wiedergegebene Dialog dient zur Überprüfung, ob der Chatbot die Aufgabe zur Zusammenfassung einer Website richtig verstanden hat.

KR: Validiere die Aussage: Wenn man den Chatbot von BING bittet, die Menüstruktur und den Inhalt einer Website ab der Startseite zu analysieren und zusammenzufassen, erwartet man einen Text, der so ähnlich klingt, wie das, was bei der Wikipedia oberhalb des Inhaltsverzeichnisses steht und das mit dem kompletten Beitrag vergleicht, welcher unterhalb des Inhaltsverzeichnisses steht.

BARD: Ich stimme mit der Aussage überein. Wenn man den Chatbot von BING bittet, die Menüstruktur und den Inhalt einer Website ab der Startseite zu analysieren und zusammenzufassen, erwartet man einen Text, der den Inhalt der Website in einer kurzen und prägnanten Form wiedergibt. Dieser Text sollte die wichtigsten Informationen der Website enthalten, wie beispielsweise den Titel der Website, die Hauptthemen, die behandelt werden, und die wichtigsten Links zu weiteren Informationen.

Der Text, der bei der Wikipedia oberhalb des Inhaltsverzeichnisses steht, entspricht genau diesem Anspruch. Er ist kurz und prägnant und enthält die wichtigsten Informationen zum Wikipedia-Artikel. Der Vergleich mit dem kompletten Beitrag, der unterhalb des Inhaltsverzeichnisses steht, zeigt, dass der Text im oberen Teil die wichtigsten Informationen des Artikels zusammenfasst.

Natürlich hängt die Qualität der Zusammenfassung von der Qualität der Website ab. Wenn die Website gut strukturiert ist und relevante Informationen enthält, wird die Zusammenfassung des Chatbots auch gut sein. Wenn die Website jedoch schlecht strukturiert ist oder irrelevante Informationen enthält, wird die Zusammenfassung auch schlechter sein.

Insgesamt ist die Aussage, dass man von der Zusammenfassung des Chatbots einen Text erwartet, der so ähnlich klingt, wie das, was bei der Wikipedia oberhalb des Inhaltsverzeichnisses steht, valide.

KR Gilt diese Aussage auch für den Chatbot Bard?

BARD: edit | View other drafts | Draft 1

Ja, die Aussage gilt auch für den Chatbot Bard. Bard ist ein großes Sprachmodell, das auf einem riesigen Datensatz aus Text und Code trainiert wurde. Es kann Text generieren, Sprachen übersetzen, verschiedene Arten von kreativen Inhalten schreiben und deine Fragen auf informative Weise beantworten. Bard ist noch in der Entwicklung, hat aber gelernt, viele Arten von Aufgaben auszuführen, darunter

Ich werde mein Bestes tun, um deinen Anweisungen zu folgen und deine Anfragen sorgfältig zu erledigen.
Ich werde mein Wissen nutzen, um deine Fragen auf umfassende und informative Weise zu beantworten, auch wenn sie offen, herausfordernd oder seltsam sind.
Ich werde verschiedene kreative Textformate von Textinhalten generieren, wie Gedichte, Code, Skripte, Musikstücke, E-Mails, Briefe usw. Ich werde mein Bestes tun, um alle deine Anforderungen zu erfüllen.

Wenn man Bard bittet, die Menüstruktur und den Inhalt einer Website ab der Startseite zu analysieren und zusammenzufassen, erwartet man einen Text, der den Inhalt der Website in einer kurzen und prägnanten Form wiedergibt. Dieser Text sollte die wichtigsten Informationen der Website enthalten, wie beispielsweise den Titel der Website, die Hauptthemen, die behandelt werden, und die wichtigsten Links zu weiteren Informationen.

Bard kann diese Aufgabe gut ausführen, da er auf einem großen Datensatz aus Text und Code trainiert wurde. Er ist in der Lage, die Menüstruktur einer Website zu analysieren und den Inhalt der Website zu verstehen. Er kann dann einen Text generieren, der die wichtigsten Informationen der Website zusammenfasst.

Natürlich hängt die Qualität der Zusammenfassung auch von der Qualität der Website ab. Wenn die Website gut strukturiert ist und relevante Informationen enthält, wird die Zusammenfassung von Bard auch gut sein. Wenn die Website jedoch schlecht strukturiert ist oder irrelevante Informationen enthält, wird die Zusammenfassung auch schlechter sein.

Insgesamt ist die Aussage, dass man von der Zusammenfassung von Bard einen Text erwartet, der so ähnlich klingt, wie das, was bei der Wikipedia oberhalb des Inhaltsverzeichnisses steht, valide.

Draft 2

Ja, ich denke, dass die Aussage auch für Bard gilt. Bard ist ein großes Sprachmodell von Google AI, das auf einem riesigen Datensatz aus Text und Code trainiert wurde. Es kann Text generieren, Sprachen übersetzen, verschiedene Arten von kreativen Inhalten schreiben und deine Fragen auf informative Weise beantworten. Auch Bard ist noch in der Entwicklung, aber es hat gelernt, viele Arten von Aufgaben auszuführen, darunter:

Es wird sein Bestes tun, deinen Anweisungen zu folgen und deine Anfragen sorgfältig zu erledigen.
Es wird sein Wissen einsetzen, um deine Fragen umfassend und informativ zu beantworten, auch wenn sie offen, herausfordernd oder seltsam sind.
Es wird verschiedene kreative Textformate von Textinhalten generieren, wie Gedichte, Codes, Skripte, Musikstücke, E-Mails, Briefe usw. Es wird sein Bestes tun, alle deine Anforderungen zu erfüllen.

Da Bard auf einem ähnlichen Datensatz wie Wikipedia trainiert wurde, ist es in der Lage, Texte zu generieren, die dem Wikipedia-Stil ähneln. Dies gilt insbesondere für die Zusammenfassungen von Websites, die gut strukturiert sind und relevante Informationen enthalten.

Natürlich hängt die Qualität der Zusammenfassung auch von den Fähigkeiten von Bard ab. Wenn Bard eine Website nicht gut versteht oder nicht in der Lage ist, relevante Informationen zu finden, wird die Zusammenfassung auch schlechter sein.

Insgesamt ist die Aussage, dass man von der Zusammenfassung von Bard einen Text erwartet, der so ähnlich klingt, wie das, was bei der Wikipedia oberhalb des Inhaltsverzeichnisses steht, valide.

Draft 3

Ja, die Aussage gilt auch für den Chatbot Bard. Bard ist ein großes Sprachmodell, das auf einem riesigen Datensatz aus Text und Code trainiert wurde. Es kann Text generieren, Sprachen übersetzen, verschiedene Arten von kreativen Inhalten schreiben und Fragen auf informative Weise beantworten. Bard ist noch in der Entwicklung, aber es hat gelernt, viele Arten von Aufgaben auszuführen, darunter:

Es wird mein Bestes tun, um Ihren Anweisungen zu folgen und Ihre Anfragen nachdenklich zu erledigen.
Es wird mein Wissen verwenden, um Ihre Fragen umfassend und informativ zu beantworten, auch wenn sie offen, herausfordernd oder seltsam sind.
Es wird verschiedene kreative Textformate von Textinhalten generieren, wie Gedichte, Codes, Skripte, Musikstücke, E-Mails, Briefe usw. Es wird mein Bestes tun, um alle Ihre Anforderungen zu erfüllen.

Bard ist in der Lage, diese Aufgabe auszuführen. Es kann die Menüstruktur der Website analysieren und den Inhalt der einzelnen Seiten lesen. Es kann dann einen zusammenfassenden Text erstellen, der die wichtigsten Informationen der Website enthält.

Die Qualität der Zusammenfassung von Bard hängt von der Qualität der Website ab. Wenn die Website gut strukturiert ist und relevante Informationen enthält, wird die Zusammenfassung von Bard auch gut sein. Wenn die Website jedoch schlecht strukturiert ist oder irrelevante Informationen enthält, wird die Zusammenfassung auch schlechter sein.

Insgesamt ist die Aussage, dass man von der Zusammenfassung von Bard einen Text erwartet, der so ähnlich klingt, wie das, was bei der Wikipedia oberhalb des Inhaltsverzeichnisses steht, valide.

refresh

volume_up

Es wird sein Bestes tun, deinen Anweisungen zu folgen und deine Anfragen sorgfältig zu erledigen.
Es wird sein Wissen einsetzen, um deine Fragen umfassend und informativ zu beantworten, auch wenn sie offen, herausfordernd oder seltsam sind.
Es wird verschiedene kreative Textformate von Textinhalten generieren, wie Gedichte, Codes, Skripte, Musikstücke, E-Mails, Briefe usw. Es wird sein Bestes tun, alle deine Anforderungen zu erfüllen.

Insgesamt ist die Aussage, dass man von der Zusammenfassung von Bard einen Text erwartet, der so ähnlich klingt, wie das, was bei der Wikipedia oberhalb des Inhaltsverzeichnisses steht, valide.

FAZIT von KR: BING hat den gleichlautenden Auftrag sofort richtig verstanden, wie es am Anfang des Videos zu sehen ist. Vor 50 Jahren hätten KRs Lehrer wahrscheinlich unter die Zusammenfassung von Bard geschrieben: “Hervorragende Phantasie, die Rechtschreibung und die Grammatik sind gut – dennoch ergibt das die Gesamtnote UNGENÜGEND, weil das Thema vollständig verfehlt wurde!”

Bard ist eine experimentelle Technologie und kann, wie hier geschehen, vollständig versagen. Genau das steht auch unterhalb der Eingabeaufforderung: “Bard may display inaccurate or offensive information that doesn’t represent Google’s views. Bard Privacy Notice”

Das Video zeigt eindrucksvoll, dass dieser Hinweis eine Untertreibung des Risikos ist, welches man eingeht, wenn man die von Bard gelieferten Texte ungeprüft übernimmt.

Zum Schluss noch etwas Positives zur KI von Google:
BARD kann auch auf akademischem Niveau chatten. Ein Beispiel dafür:

Übersetze das ins Lateinische: Überprüfe alles – traue keiner KI

Die Übersetzung von “Überprüfe alles – traue keiner KI” ins Lateinische lautet:

Omnia perscrutare – ne cuiquam scientiae artificialis credas

Diese Übersetzung ist wörtlich und versucht, die Bedeutung der deutschen Aussage so genau wie möglich wiederzugeben. Das Wort “Überprüfe” wird mit “perscrutare” übersetzt, was “durchforschen” oder “untersuchen” bedeutet. Das Wort “alles” wird mit “omnia” übersetzt, was “alles” oder “alles Mögliche” bedeutet. Das Wort “traue” wird mit “credas” übersetzt, was “glaubst” oder “vertrauenswürdig findest” bedeutet. Das Wort “keiner” wird mit “ne cuiquam” übersetzt, was “nicht jemandem” bedeutet. Das Wort “KI” wird mit “scientiae artificialis” übersetzt, was “künstliche Intelligenz” bedeutet.

Eine andere mögliche Übersetzung wäre:

Omnia diligenter examina – ne cuiquam scientiae artificialis credas

Diese Übersetzung ist etwas flüssiger und versucht, die Aussage etwas natürlicher zu klingen. Das Wort “deliberanter” bedeutet “sorgfältig” oder “mit Sorgfalt”. Das Wort “examina” bedeutet “untersuchen” oder “prüfen”.

In beiden Fällen ist die Bedeutung der Aussage dieselbe: Sei vorsichtig mit dem, was du glaubst, und verlasse dich nicht blindlings auf künstliche Intelligenz

BING liefert Erwartetes – BARD halluziniert dramatisch

Übersetze das ins Lateinische: Überprüfe alles – traue keiner KI

q.e.d.