News Lip-Sync Dubbing mit AI kommt wohl

  • Ersteller Ersteller leeloo
  • Erstellt am Erstellt am
  • Antworten Antworten 35
  • Aufrufe Aufrufe 1.634
  • Letzter Beitrag Neueste Aktivitäten

Willkommen bei Movieside!

Registriere Dich um ein Mitglied der Movieside-Community zu werden und Zugang zu allen Inhalten zu erhalten.

leeloo

... Intimfeind [aka Aggro-Tante]
Hier seit
18.4.2018
Beiträge
6.669
Reaktionen
13.898
Alter
42

LIP-SYNC DUBBING BETA TESTS BEGIN IN HOLLYWOOD​

featured_ai_lip_sync_dubbing.jpg

Lip-sync dubbing for content localization is a compelling early use case of generative AI that is gaining traction now among studios.

In contrast to AI dubbing, which handles the creation of speech tracks, localizing content with lip-syncing applies only to the visuals — specifically using deep learning models to realistically alter screen actors’ mouth and facial movements to synchronize with the dubbed audio.

While synthetic voices could be used for the dub, so far companies have tended to use human actor voice performances, in collaboration with localization networks. Capabilities can even extend beyond faces to visually translate text depicted in scenes, such as a street sign or TV news ticker.

The proposed potential for lip-sync dubbing of premium content is a more immersive experience and more global hits. Because lip-sync dubbing has never previously been achievable with VFX, it represents a new cost for business, though one studios are betting will pay off by growing and more deeply engaging audiences.

“The conversation changed completely when people saw it in action and realized they were watching a film that just felt like an English-language film, but actually it wasn’t. The difference did shock us all how much better it was,” said Scott Mann, co-CEO at generative AI firm Flawless.

“The more exciting [uses of this tech] are doing things that VFX could never do,” said Matt Panousis, COO at Monsters Aliens Robots Zombies (MARZ), the Toronto VFX firm that provides the lip-sync dubbing product LipDub AI. “It’s more like 0-to-1 innovation versus 1-to-1 or 1-to-2 innovation. This has just never been doable before.”

Several major Hollywood studios are currently beta testing lip-sync dubbed versions of film and TV shows to ultimately decide whether they lift audience reach and engagement enough to be worth the investment longer term.

For its part, Flawless is focused more exclusively on major U.S. studios, starting with the biggest five before scaling up, and is providing each with a capacity of 1,000 hours over the next 12 months. Armed with some learnings on where it makes the biggest impact, they can increase to 10,000 next year.

Studios involved are devising respective strategies for these market tests, deciding on the type of content — genre, shows or movies, new or catalog, factual or fictional — and specific languages to prioritize. Another question is whether to localize English-language content for international markets or the reverse, meaning English-speaking U.S. audiences might be able to experience to a fully dubbed and lip-synced foreign-language film.

Because of its standards for maximum realism, Hollywood content is the most challenging to serve relative to less premium content such as creator videos. MARZ is going broader with its product LipDub before “opening the floodgates” to Hollywood.

But since its beta launch in January, LipDub now has 80 clients on the platform, including some of the biggest creators on YouTube as well as a number of Fortune 1000 consumer brands and their advertising agencies. For example, one brand used the tech to localize an ad that featured footage of a major celebrity speaking at a live event.

Ultimately, lip-sync dubbing will need to prove out among audiences. Some audiences may be more interested, but there’s also likely to be a portion of “purists” not as receptive to a foreign-language film or show altered in this way.

Likewise, some types of content may be more accepted with alteration than others. For instance, documentary content may not be as accepted, as it arguably changes common understanding of real-world people or events as they occurred. Use in factual content would also likely need disclosure. Studios may not even always want to disclose when the technology has been used for the effect.

While studios need to secure consent from actors for some kinds of digital alteration with AI, consent isn't required for lip-sync dubbing, per an exception in the 2023 SAG-AFTRA agreement.


Per AI sollen die Münder der Schauspieler angepasst werden, so dass die synchronisierten Sprachfassungen lippensynchron sind.
 
Ich glaube, der Tag, an dem das kommt, wird der Tag, ab dem ich (neue) Filme nur noch im O-Ton schaue.
Faszinierend, dass jetzt jeder Honsel meint, KI für alles mögliche einsetzen zu können, obwohl nicht mal annähernd so etwas wie Marktreife erreicht ist.
 
Wird bei uns niemals akzeptiert werden, wir haben uns zu sehr an die deutschen Stimmen gewöhnt.
 
Wird bei uns niemals akzeptiert werden, wir haben uns zu sehr an die deutschen Stimmen gewöhnt.
nicht bei den Billigsynchros der B bis Z-Klasse-Filme, sagte ich schon woanders im Forum, jede KI wird schnell besser als die Legendary Unites-Schrottsynchros und ählicher Mumpitz. Diese Leute machen sich zurecht Sorgen um die Zukunft, wenn man jahrzehntelang Scheissdreck ablieferte (und noch tut).
 
Wird bei uns niemals akzeptiert werden, wir haben uns zu sehr an die deutschen Stimmen gewöhnt.
nicht bei den Billigsynchros der B bis Z-Klasse-Filme, sagte ich schon woanders im Forum, jede KI wird schnell besser als die Legendary Unites-Schrottsynchros und ählicher Mumpitz. Diese Leute machen sich zurecht Sorgen um die Zukunft, wenn man jahrzehntelang Scheissdreck ablieferte (und noch tut).
Ich meinte eher einen Tom Cruise, einen Brad Pitt, einen Nicolas Cage, einen Stallone, einen Arnie, etc., die bekommen ja meistens keine Billig-Synchro mit 0815-Stimmen.
 
Niemals akzeptiert würde ich so nicht sagen, wie viele Sprecher wurden schon ersetzt, weil die Alten tot sind. Und wenn dann die Schauspieler in jeder Sprache ihre Stimme behalten ist das auch gut so. Sorgen mache ich mir eher in der Übergangsphase, wenn die Lippenbewegungen irgendwie nicht so richtig zum Gesprochen passen, so wie animierte Gesichtszüge welche komisch entgleiten.
 
Wozu? Gibt doch eh blos immer das internationale Bildmaster.
Im Streaming wird sich das bestimmt realisieren lassen, dass dann ja nach Sprachauswahl ein anderes Bildfile dazu gestreamt wird.

Aber es geht hier ja erstmal (auch) um Kino, welche ja bisher auch schon lokalisierte Bildmaster haben.
 
Es geht im Text hauptsächlich darum, dass das Bild an die Synchro angepasst wird, also die Lippen dann quasi zur deutschen Sprache passen.
Und das Hauptproblem dabei wird sein, was pinheadraiser schreibt. Natürlich kann im Streaming technisch zur Sprachauswahl ein anderes Bild realisiert werden, aber das wollen die Plattformen nicht. Die versuchen aktuell händeringend Speicherplatz einzusparen und nur ein Video mit mehreren Audio- und UT-Spuren anzubieten. Vor allem Amazon versucht das aktuell öfters auf eigene Faust umzusetzen, was zu größeren Problemen führt.
 
Die versuchen aktuell händeringend Speicherplatz einzusparen und nur ein Video mit mehreren Audio- und UT-Spuren anzubieten. Vor allem Amazon versucht das aktuell öfters auf eigene Faust umzusetzen, was zu größeren Problemen führt.
Sowas liest man doch gerne :liebe: :liebe: :liebe:
 
Wozu? Gibt doch eh blos immer das internationale Bildmaster.
Im Streaming wird sich das bestimmt realisieren lassen, dass dann ja nach Sprachauswahl ein anderes Bildfile dazu gestreamt wird.

Aber es geht hier ja erstmal (auch) um Kino, welche ja bisher auch schon lokalisierte Bildmaster haben.
Das ginge ja auch jetzt schon. Selbst auf DVD ging das schon vor 25 Jahren.

Mir fällt es halt nur schwer zu glauben dass die Studios plötzlich nicht mehr zu faul dafür sein sollen, nur wegen ein paar Lippenbewegungen.

Das wird am Anfang vllt. etwas engagierter gemacht, aber wenn man merkt dass das auch nicht mehr Kohle bringt, wird man sich die Kosten auch wieder sparen. Es wird über kurz oder lang aber eher darum gehen dass man sich die Kosten für ausländische Sprecher idealerweise komplett sparen kann.
 
Das ginge ja auch jetzt schon. Selbst auf DVD ging das schon vor 25 Jahren.
Äh, nein? Da müsste der komplette Film ja doppelt bzw x-fach für jede Sprachfassung jeweils auf der Disc mit enthalten sein. Alleine durch die Platzbegrenzung ist das ja bei den allermeisten Filmen dann nicht möglich.

Es wird über kurz oder lang aber eher darum gehen dass man sich die Kosten für ausländische Sprecher idealerweise komplett sparen kann.
Ja, das denke ich auch. :sad:
 
Äh, nein? Da müsste der komplette Film ja doppelt bzw x-fach für jede Sprachfassung jeweils auf der Disc mit enthalten sein. Alleine durch die Platzbegrenzung ist das ja bei den allermeisten Filmen dann nicht möglich.
Also bei Pixar z.B. gabs doch immer multiangle. Da war nicht der ganze Film doppelt drauf.
 
Äh, nein? Da müsste der komplette Film ja doppelt bzw x-fach für jede Sprachfassung jeweils auf der Disc mit enthalten sein. Alleine durch die Platzbegrenzung ist das ja bei den allermeisten Filmen dann nicht möglich.
Also bei Pixar z.B. gabs doch immer multiangle. Da war nicht der ganze Film doppelt drauf.
Ja, aber das sind ja immer nur einzelne Szenen bei diesen Beispielen.

Wenn die Münder angepasst werden, dürfte das kA... im Durchschnitt 50% vom Film ausmachen? Und Hunderte bis Tausende Schnitte sein, falls man nur die entsprechenden Szenen austauschen will. Dann ergibt Multi Angel keinen Sinn mehr, da es viel zu viel Aufwand ist bei der Menge (falls das technisch überhaupt geht, und es nicht da auch eine Begrenzung gibt). Der ganze Film müsste dann komplett zusätzlich abgelegt sein.
 
Wird bei uns niemals akzeptiert werden, wir haben uns zu sehr an die deutschen Stimmen gewöhnt.
1. 99% aller deutschen interessieren die Sprecher überhaupt nicht. Und deren Stimmen können die auch nicht auseinander halten. Meine Frau erkennt noch nichtmal, dass Arnie und Sly in den meisten ihrer Filme dieselbe Stimme haben.

2. Gemessen an dem, was wir seit 20 Jahren von diversen Billig-Labels und in Streaming-Diensten zu sehen kriegen, kann es nur besser werden. Da sind viele Synchros so grottenmieserabel, dass ich eine AI jederzeit vorziehen würde.

3. Wenn die Studios damit Geld sparen können, werden sie es umsetzen, ob wir wollen oder nicht.
 
Es wird über kurz oder lang aber eher darum gehen dass man sich die Kosten für ausländische Sprecher idealerweise komplett sparen kann.

Das befürchte ich leider auch.........................
Gab doch mal einen Clip wo Richard Attenbourough komplett deutsch sprach mit seiner Stimme durch KI oder sowas.
DAS wäre wohl der Wunschtraum der Studios.


, jede KI wird schnell besser als die Legendary Unites-Schrottsynchros und ählicher Mumpitz.

Jep.
Das sind ja Synchros die ich selbst als Synchrogucker versuche zu meiden wie der Teufel das Weihwasser......
Diesen Klitschen würde ich tatsächlich keine Träne nachweinen.
 
Äh, nein? Da müsste der komplette Film ja doppelt bzw x-fach für jede Sprachfassung jeweils auf der Disc mit enthalten sein. Alleine durch die Platzbegrenzung ist das ja bei den allermeisten Filmen dann nicht möglich.
Also bei Pixar z.B. gabs doch immer multiangle. Da war nicht der ganze Film doppelt drauf.
Ja, aber das sind ja immer nur einzelne Szenen bei diesen Beispielen.

Wenn die Münder angepasst werden, dürfte das kA... im Durchschnitt 50% vom Film ausmachen? Und Hunderte bis Tausende Schnitte sein, falls man nur die entsprechenden Szenen austauschen will. Dann ergibt Multi Angel keinen Sinn mehr, da es viel zu viel Aufwand ist bei der Menge (falls das technisch überhaupt geht, und es nicht da auch eine Begrenzung gibt). Der ganze Film müsste dann komplett zusätzlich abgelegt sein.

Naja du kannst theoretisch ja nur den Bildausschnitt wo der Mund oben ist austauschen. Kann mir nicht vorstellen, dass das technisch so schwer machbar ist. Evtl. nicht bei der BluRay (wobei die das glaube ich sogar könnte), aber jede Streaming App würde sowas mit Leichtigkeit hinbekommen.
 
Zurück
Oben Unten