Connect with us

Wie Man

Die Sprach-Engine von OpenAI kann Ihre Stimme mit einem 15-Sekunden-Sprachclip klonen

Die Sprach-Engine von OpenAI kann Ihre Stimme mit einem 15-Sekunden-Sprachclip klonen

Was Sie wissen sollten

  • OpenAI verfügt über ein verbessertes Voice-Engine-Modell, das Stimmen mit nur 15 Sekunden Sprachprobe klonen kann.
  • Die AI-Voice-Cloning-Technologie von OpenAI hat weitreichende Auswirkungen und das Unternehmen verzögert derzeit eine umfassende Veröffentlichung.
  • In der Zwischenzeit implementiert OpenAI verschiedene Sicherheitsfunktionen und Leitplanken, um den Einsatz der Technologie zu identifizieren und zu verfolgen.

Das Voice Engine-Modell von OpenAI, das die Sprach- und Vorlesefunktionen von ChatGPT unterstützt, erhält eine leistungsstarke neue Funktion. Mit lediglich etwas Texteingabe und einem 15-sekündigen Sprachbeispiel kann nun ein natürlich klingender Klon einer menschlichen Stimme erzeugt werden, der dem Originalsprecher sehr ähnlich ist. Und die Ergebnisse sind erschreckend gut.

Zusammen mit dem Update, OpenAI geteilt auf seiner Website die Ergebnisse einiger Voice-Cloning-Tests. Jedes davon enthält ein originales „Referenzaudio“, gefolgt vom geklonten „generierten Audio“. Hier sind einige Beispiele dafür, wozu das Voice Engine-Modell in der Lage ist:

Referenz-Audio 1


Generiertes Audio 1

Referenz-Audio 2

Generiertes Audio 2

Referenz-Audio 3

Generiertes Audio 3

Mit möglichen Anwendungen im Bildungs- und Gesundheitswesen, in der Übersetzung sowie bei der Erreichung von Gemeinschaften auf der ganzen Welt scheint es für das Klonen von Stimmen viele Märkte zu geben, die darauf warten, es zu verschlingen. Doch die Auswirkungen einer solchen Technologie sind nicht nur rosig.

Bereits jetzt sind von der KI geklonte betrügerische Anrufe auf dem Vormarsch. Auch wenn zwischen den Nationen ein allgemeiner Konsens darüber besteht, die Benutzer im Zeitalter der KI zu schützen, sind die Leitplanken nicht so einfach zu installieren, insbesondere wenn die Technologie rasant voranschreitet.

OpenAI arbeitet jedoch daran, eigene Sicherheitsmaßnahmen zu implementieren, „einschließlich Wasserzeichen, um die Herkunft aller von Voice Engine generierten Audiodaten zu verfolgen“, die Nachahmung einer anderen Person zu verbieten und die ausdrückliche und informierte Zustimmung des ursprünglichen Sprechers zu verlangen.

„Wir gehen bei einer breiteren Veröffentlichung aufgrund der Möglichkeit des Missbrauchs synthetischer Stimmen vorsichtig und fundiert vor“, erklärte das Unternehmen in seinem Bericht Blogeintrag.