Das illustrierende epische Erzähler-Video: Produktion und filmische Ausdrucksformen im Vergleich (I)

Ein Beitrag von Yorck Beese und Till Baaken, 12.1.2021

Unter den verschiedenen Videogenres, die sich der Peripherie des Extremismus auf YouTube zuordnen, befinden sich neben Vortrags- und Erklärvideos auch die illustrierenden epischen Erzähler-Videos.[1] Ihr Formprinzip ist schnell umrissen: Typisch für dieses Genre ist der Einsatz einer Erzählerstimme, die Exempel aus der islamischen Lehre rezitiert, unterlegt mit selbst produzierten oder gar aus Filmen und Computerspielen angeeignetem Videomaterial, das zur Illustration der Erzählung dient. Dieses Videoformat ist in englischsprachigen wie auch in deutschsprachigen Produktionen zu beobachten, so zum Beispiel in Videos des englischsprachigen Merciful Servant-Kanals und des deutschsprachigen Botschaft des Islam-Kanals, von denen hier im Weiteren die Rede sein soll. Wie das KorRex-Projekt kürzlich festgestellt hat, treten sogar „Kopierphänomene“ unter englischsprachigen und deutschsprachigen Videos auf. Genauer scheinen sich letztere inhaltlich und formal an ersteren zu orientieren. Die besondere Ähnlichkeit der englisch- und deutschsprachigen Videos wirft die Frage danach auf, wie der Transfer in diesem Bereich funktioniert. Während jedoch anhand der formalen Gestaltungsmittel durchaus naheliegt, dass ein Austausch unter diesen Produzenten stattfinden könnte, erscheint ein Blick auf die persönlichen und institutionellen Beziehungen hinter den Kulissen durch verschiedene Hindernisse erschwert. Auch die technologischen Aspekte vergleichbarer Produktionen lassen sich im Nachhinein nur hypothetisch entschlüsseln. Anhand eines stichprobenartigen Vergleichs der Videos und ihres filmischen Stils lassen sich jedoch Merkmale feststellen, die sowohl auf Gemeinsamkeiten unter den Produzenten als auch auf Unterschiede zwischen ihnen hindeuten. Zwar wird dieser Vergleich, der sich auf das manifeste Video bezieht, die Frage nach den Wissenstransfers unter den Videoproduzenten nicht endgültig beantworten, eine Antwort auf die Ausgangsfrage wird sie jedoch zumindest eingrenzen können: Bei vergleichender Betrachtung deutsch- und englischsprachiger Videos ist nämlich erkennbar, dass sich die Videos zwar formal ähnlich sind, doch jeder Produzent anders über Bilder und deren Ausdruckskraft zu denken scheint – wie weit reicht also die Inspiration, die deutsche Produzenten wie Botschaft des Islam ihren Vorbildern von Merciful Servant abgewinnen?

Es scheint auf der Hand zu liegen, dass die Exempel, die in epischen Erzähler-Videos verdeutlicht werden, von den Produzenten in irgendeiner Form untereinander angeeignet und übersetzt werden. So werden auf dem deutschsprachigen YouTube-Kanal Botschaft des Islam immer wieder Videos hochgeladen, die nur kurze Zeit zuvor auf dem englischsprachigen Merciful Servant-Kanal veröffentlicht wurden. Geschehen ist dies zum Beispiel mit „I Almost Sold My Religion For 20 Pence “ (8.1.2015), das nur zwei Monate nach seiner Veröffentlichung von Botschaft des Islam inhaltlich angeeignet und als „Er verkaufte seinen Glauben “ (19.3.2015) in deutscher Sprache publiziert wurde. Beide Videos sollen hier stellvertretend für formal ähnliche Transferphänomene in der Peripherie des Extremismus auf YouTube behandelt und in einem stichprobenartigen Vergleich untersucht werden.

Der direkte Vergleich der Videos zeigt zunächst, dass in beiden Fällen ein Voice Over die Geschichte eines englischen Imams erzählt, der im Reisebus eine Fahrkarte kauft und während der Reise feststellt, dass der Busfahrer ihm zusätzlich zu seinem Rückgeld 20 Pence zu viel herausgegeben hat. Geplagt von Zweifeln, ob er dem Fahrer die geringe Summe von 20 Pence tatsächlich zurückgeben solle, gibt er schließlich doch seinem Gewissen nach. Im Gespräch zeigt sich überraschend, dass der Busfahrer nicht versehentlich zu viel Wechselgeld herausgab. Vielmehr entpuppt sich das Ereignis sogar als eine Prüfung des Glaubens, welchen der Imam durch seine Aufrichtigkeit bewiesen hatte.

Die Voice Overs mögen unterschiedlich sein, doch die Erzählstationen sind dieselben und teilweise lassen die Wortlaute eine direkte Übersetzung vermuten. (Links das vermeintliche Original von Merciful Servant: „It’s a very famous story.“; Rechts die deutsche Version von Botschaft des Islam: „Es ist eine sehr bekannte Geschichte.“)

Epische Erzähler-Videos wie diese ordnen sich gattungsmäßig der exempelhaften, veranschaulichenden Erzählung zu und vermögen zudem über ein ideologisches Interesse nicht immer hinwegzutäuschen. Stilistisch sind sie dabei leicht reproduzierbar. Oftmals wird im „epischer Erzähler“-Genre aus dem Internet heruntergeladenes oder sonst irgendwie aus Videospielen und Filmen besorgtes Videomaterial in die eigene Produktion eingesetzt und durch eine Erzählerstimme (Voice Over) in einen neuen Deutungszusammenhang gestellt. Doch selbst wenn einiges illustrierendes Bildmaterial durch die Produzenten selbst aufgenommen oder gar mit Animations-Software eigens erstellt wurde, was durchaus vorzukommen scheint, verrät dieses Formprinzip die Ordnung der Produktions-Pipeline: Aus filmpraktischer Sicht muss die Aufzeichnung der gesprochenen Sprache der Beschaffung der illustrierenden (Bewegt-)Bilder notwendig vorausgehen. Der Produktionsprozess bei den englischsprachigen Produzenten gliedert sich notwendig in die Arbeitsschritte „Rede aufzeichnen“ (bzw. „Redemitschnitt besorgen“), „(ggf.) Tonaufnahme mit Sound-Effekten versehen“, parallel dazu „passende Bilder aus existierenden Medien besorgen und / oder animierte Sequenzen erstellen“ und schließlich „Rede im Video-Editor mit den bewegten Bildern unterlegen“. Bei den Übersetzern in Deutschland müssen diese Arbeitsschritte ebenfalls in dieser Anordnung ausgeführt werden. Ihren Arbeitsschritten geht notwendig noch eine „Übersetzungsphase“ voraus.[2] Aus filmpraktischer Sicht ist die Film-Form damit allerdings leicht reproduzierbar, da die Bild-Ton-Schere[3] pro produziertem Video nur einmal durch die illustrierende oder sinnbildliche Funktion der Bilder für den Ton geschlossen werden muss. Es finden im epischen Erzähler-Genre – allgemein – keine Schnittexperimente statt, die ihrerseits neuen Boden für z.B. einen besonders sinnproduktiven Schnitt erschließen würden. Die Arbeit der Editors bezieht sich vor allem auf die Besorgung von Bewegtbildern, die sich symbolisch integrieren lassen (etwa weil das ursprüngliche Videomaterial Raum für Mehrdeutigkeiten lässt), sofern sie nicht selbst für eine Rede Animationen entwerfen. Die sich stark ähnelnden Formen der englischen und deutschen Videos könnten somit Thesen eines Wissenstransfers durchaus bestärken.

Deutliche Unterschiede bestehen dagegen in der Art und Weise, wie englische und deutsche Produzenten den Symbolwert ihrer Tonaufnahmen und der (teils angeeigneten) Bewegtbilder konzipieren. Dies betrifft unter anderem die sprachliche Übersetzung als den ersten Schritt der Produktion. Ist die Übersetzung wörtlich-konkret oder orientiert sie sich sprichwörtlich-vage am englischen Vorbild? Es ist tatsächlich auffällig, dass diese beiden Videos, die für viele formal ähnliche Videos stehen können, in verschiedenen Sprachen erzählen, und dies lediglich auf unterschiedliche Art und Weise tun. Sprachlich bleibt die Erzählung einschließlich ihrer Moral wenn nicht Wort-für-Wort, so doch zumindest im Kern die gleiche. Im Zuge der Übersetzung von Sprechertexten kann es zu Anpassungen kommen, um den Sprechertext auch in der jeweiligen Zielsprache verständlich und eingängig zu machen, sodass er seine Lebhaftigkeit behält (und nicht womöglich das Exempel schwächt). Ein Austausch von Manuskripten für die Übersetzung könnte also vorkommen. Die Übersetzungsleistung wird aber wohl zumindest im Falle stark voneinander abweichender Wortlaute vermutlich von jenen „Anschlussproduzenten“, die die Zielsprache beherrschen, selbst geleistet.

Zeigen sich bis hierher erste mögliche Kongruenzen und Bruchstellen im Wissenstransfer sowie in der Produktion, tun sich noch größere Unterschiede im Einsatz der filmischen Ausdrucksmittel auf. Diese deuten auf ein unterschiedliches Denken bezüglich des filmischen Ausdrucks für das jeweils erzählte Exempel hin. Teil II dieses Blog-Beitrags orientiert sich daher an der Frage: Imitieren jene Produzenten, die die übersetzte Version anfertigen, sich eigentlich „immer 1:1 auch an den filmischen Ausdrucksformen“ des erzählten Lehrbeispiels oder weicht das Denken der deutschen und englischen Produzenten über die Expressivität ihrer Bilder vielleicht sogar stark voneinander ab?

Über die Autoren

Yorck Beese M.A. ist wissenschaftlicher Mitarbeiter der Nachwuchsforscher*innengruppe Dschihadismus im Internet (BMBF). Seine Forschungsinteressen bestehen in den Bereichen der Filmsemiotik, Propagandaforschung und Kommunikation von Ideologie durch das Medium Film.

Till Baaken ist wissenschaftlicher Mitarbeiter bei modus|zad. Sein derzeitiger Arbeitsschwerpunkt liegt auf der Erforschung von Online (De-)Radikalisierung und von Prozessen individueller Distanzierung sowie im Monitoring der Peripherie des Extremismus Online. Till studierte in Berlin und London. Er ist Geschichtswissenschaftler und Ethnologe (B.A.) und Sozialwissenschaftler mit Fokus auf Terrorismus- und Sicherheitsstudien (M.A. Terrorism, Security & Society).

Neben seiner Tätigkeit für modus|zad ist Till Associate Fellow beim Global Network on Extremism and Technology (GNET) sowie wissenschaftlicher Mitarbeiter bei Violence Prevention Network. Er twittert unter @tillbaaken.

[1] Illustrierende epische Erzähler-Videos werden hier aufgefasst als Sub-Genre der epischen Erzähler-Videos. Daneben existieren weitere Geschwistergenres, z.B. jenes des epischen Erzählers, der persönlich als Redner in Erscheinung tritt.

[2] Ich lasse hier bewusst die Nachbearbeitung der Tonspur aus, da diese nicht in allen Videos zusätzlich manipuliert erscheint. Aus filmwissenschaftlicher Sicht ist die von modus|zad vorgeschlagene Bezeichnung als „epische Erzählerstimme“ nur umso treffender, da die Stimmaufzeichnung gerade in vielen deutschsprachigen Videos mit Hall oder sogar Bass verstärkt wird, um ihre Ausdruckskraft zu erhöhen. Ein tieferer Bass verleiht einer Sprecherstimme mehr „empfundenes Gewicht“ und Autorität, ein Nachhall schafft eine Fortdauer des Klanges, also einen „Nachhall“ auch im übertragenen Sinne. Beide Verfahren vertiefen so das konnotative Feld, das in die Tonspur eingeschrieben ist.

[3] Siehe dazu zu Hüningen, James (2012) „Text-Bild-Schere“. In: Lexikon der Filmbegriffe, online: https://filmlexikon.uni-kiel.de/index.php?action=lexikon&tag=det&id=6298.