Zum Inhalt springen

YouTube-Videos mit Untertiteln in mehreren Sprachen erstellen – Video 2 von 4

In diesem Video zeige ich, wie PowerPoint zur Produktion von YouTube-Videos eingesetzt werden kann. PowerPoint produziert aus der Präsentation mit dem darin enthaltenen Sprecher-Video eine mp4-Datei. Wenn Teile aus der mp4-Datei herausgeschnitten werden sollen, wird Camtasia eingesetzt. Camtasia könnte aber auch statt PowerPoint für alle Bildschirmaufnahmen einschließlich der Aufnahme des Sprechers eingesetzt werden.

Camtasia wird von Anwendern aus dem Bildungsbereich, wegen seiner einfachen Handhabung und der preiswerten Bildungslizenzen eingesetzt. Auch wenig Geübte sind mit der vorgeschlagenen Anleitung in kürzester Zeit in der Lage, ihre eigenen Aufnahmen zu bearbeiten und Screenshots, Texte und Effekte im Erklärvideo zu ergänzen.

Sind alle Bearbeitungsschritte umgesetzt, wird erneut eine mp4-Datei erzeugt. Diese wird dann bei YouTube hochgeladen. Der Upload-Assistent von YouTube wird erklärt. Am Ende des Upload-Prozesses steht ein noch nicht gelistetes Video bereit. Es kann einfach mit Untertiteln und deren Übersetzung in andere Sprachen ergänzt werden. Dazu steht der im Video gesprochene Text schon nach ca. einer Stunde als herunterladbare Textdatei bereit. Wer die vor Jahren gemachten ersten maschinellen Transkriptionen mit den heutigen Ergebnissen vergleicht, stellt fest, dass die Ergebnisse dank der gut trainierten künstlichen Intelligenz, die für die Transkription zum Einsatz kommt, wesentlich besser wurde. Wer Texte aus Büchern vorliest, wird kaum Fehler finden. Wer die Anwendung von diversen Apps beschreibt, benötigt ein Vielfaches an Zeit für die Korrekturen maschinell erstellter Transkripte. Das fehlerfreie Transkript in der Aufnahmesprache genügt, um dann mit den Standardeinstellungen in Sekundenschnelle für jede der ca. 80 bis 100 Sprachen eine sehr gute Übersetzung der Untertitel bereit zu stellen.

Der Zeitfresser in diesem Produktionsprozess ist die Überprüfung und Korrektur der automatischen Transkription. Abhängig vom Inhalt benötige ich erfahrungsgemäß für ein 10-Minuten-Video zwischen 30 Minuten und 2 Stunden für die manuellen Korrekturen des Transkriptes.

Wenig Korrekturarbeit machen PowerPoint Präsentationen, weil die Zusammenhänge beim Vortrag schnell erkannt werden. Viele manuelle Eingriffe sind nötig, wenn im Video die Bedienelemente von Apps an Beispielen erklärt werden. Gerade bei freien Vorträgen müssen die Zusammenhänge und die Ausdrucksweise bei der Erläuterung genau überprüft werden.

Die zur Unterstützung eingesetzten Chatbots erkennen derzeit noch keine Zusammenhänge zwischen den im Video abgebildeten Darstellungen von Schaltflächen und den dazu gegebenen mündlichen Erläuterungen ihrer Funktionalität. Auch die Namen von Menschen oder Produkten werden im Zusammenhang noch oft nicht erkannt. Obwohl ich mich als Kanalbetreiber als Konrad Rennert ausgewiesen habe, steht da „Renner“ als mein Name anstatt von „Rennert“. Bei der bekannten und im Video mehrfach erwähnten Übersetzungs-App “DeepL” steht da „Diebe“  oder “Dippel” und statt „Bard“, dem Chatbot von Google, steht „Bart“ im Transkript. Solche Fehler werden von der Rechtschreibprüfung immer übersehen, weil es diese Worte gibt. Hier bedarf es immer noch des sorgfältig arbeitenden Lektors.

Am Ende dieses zweiten von vier Videos der Playlist steht ein fehlerfreies Transkript für die nächsten Schritte bereit.