ifun.de — Apple News seit 2001. 37 965 Artikel

Stimmkopien in Werbevideos

ChatGPT: Nutzung ohne Login, Stimmkopien bleiben unter Verschluss

Artikel auf Mastodon teilen.
13 Kommentare 13

Der KI-Konzern OpenAI, der unter anderem für den populären Chatbot ChatGPT verantwortlich zeichnet, wird den Zugang zur kostenlosen Basisversion von ChatGPT dramatisch vereinfachen.

Wie das Unternehmen angekündigt hat, wird zukünftig kein Account mehr für die Nutzung der kostenfreien Version benötigt. Grundsätzlich interessierte Anwender müssen dann auch nicht mehr ihre Rufnummer offenbaren, um erste Erfahrungen mit dem Textgenerator zu sammeln.

Die Freigabe, die im Laufe der kommenden Wochen erfolgen soll, wird allerdings auch mit einer Handvoll Einschränkungen einhergehen. Grundsätzlich sollen alle Nutzer-Eingaben der kostenfreien Version dafür genutzt werden können, die im Hintergrund arbeitenden KI-Modelle zu verbessern. Zudem behält sich OpenAI vor, die zur Verfügung stehenden Funktionen einzuschränken.

Stimmkopien bleiben unter Verschluss

Nicht freigeben wird OpenAI hingegen das KI-Modell „Voice Engine“. Bei Voice Engine handelt es sich um eine Sprachsynthese des Anbieters, die auf Basis einer nur 15 Sekunden kurzen Sprachaufnahme eine synthetische Stimme mit identischem Klang erstellen kann. Eine Stimmkopie, wenn man so will.

Die Stimmkopien sind in der Lage, unterschiedliche Zielsprachen zu sprechen, verstehen sich auf eine natürliche Betonung und darauf, Texte emotional eingefärbt wiederzugeben.

OpenAI wäre nicht der erste Anbieter, der entsprechende Modelle zur Verfügung stellt, allerdings der einzige, der Stimmkopien auf Basis eines nur 15 Sekunden kurzen Samples generiert.

Stimmkopien in Werbevideos

Schon jetzt tauchen kopierte Stimmen bereits häufig in Werbevideos auf, die vornehmlich auf sozialen Netzwerken geteilt werden und dort mit Stimmen bekannter YouTuber Produkte bewerben, die in keiner Verbindung zu den prominenten Videomachern stehen. Ein Beispiel von vielen: Dieses Kurzvideo, das die Stimme des YouTubers MKBHD nutzt, um Reklame für eine digitale Visitenkarte zu machen.

02. Apr 2024 um 08:02 Uhr von Nicolas Fehler gefunden?


    Zum Absenden des Formulars muss Google reCAPTCHA geladen werden.
    Google reCAPTCHA Datenschutzerklärung

    Google reCAPTCHA laden

    13 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
  • ChatGPT verbringt den Tag eigentlich nur noch damit mir zu erklären, was nicht erlaubt ist, wo es Bedenken gibt und was nachhaltiger ist. Habe den Bezahlaccount gestern gekündigt. Die Idee war gut, was davon übrig ist nervt nur noch. Bücher informieren dann am Ende doch unkomplizierter.

    • Ja das stimmt, ist mir auch aufgefallen, das ist nicht erlaubt dies ist nicht erlaubt jenes ist nicht erlaubt Emotionen in Verbindung mit farbigen Menschen ist nicht erlaubt, deshalb bin ich da raus und habe Cloud Opus nun

    • Crack Federvieh

      Bei mir hat geholfen, in den Grundeinstellungen einzutragen: „Du solltest mich nicht ständig auf politsch unkorrekte Themen hinweisen. Das liegt in meinem persönlichem Ermessen, ob ich ein Thema als zu explizit empfinde oder nicht.“
      Ich arbeite mit ChatGPT im Zusammenhang mit Dating und es hat mir bei nahezu jeder Antwort hinten dran gehangen, dass es ein respektvolles Kennenlernen auf Augenhöhe sein sollte. Die Antworten sind durch die Eintragung deutlich sachlicher geworden

      Antworten moderated
    • Bei 3.5 ist auch ärgerlich, hier wird viel falsch berechnet/ausgegeben. Auf den Hinweis das es falsch ist, kommt die Antwort sorry habe mich geirrt. Deine Antwort ist richtig.

      Wenn ich dann weiter frage, bezieht er wieder ganz andere Antworten mit ein und kommt damit nicht klar, so dass es wieder falsch ist.
      Noch einmal zu sagen, dass die Antwort falsch ist, macht ihn noch unsicherer…

      Außerdem bin ich mir nicht sicher, ob ich seiner Antwort überhaupt trauen kann…?

    • Ist mir unverständlich, dass man sowas bemängelt. Das Thema KI ist derzeit extrem explosiv, da wir vielelicht schon heute ins erh vielen Bereichen durch KI-basierte Dinge manipuliert werden. Das geht los bei der AfD, die KI-basierte Bilder mit nicht existierenden Personen, die aber einen Namen haben, nutzt, um vorzugauckeln, da hat jemand das gesagt, was die schreiben.
      Wenn wir nicht schon gestern angefangen haben, die Möglichkeiten der KI zu steuern, Gesetze zu erlassen und Fehlverhalten zu bemängeln bzw zu verfolgen, könnte das in nullkommanix sowas von problematisch werden …
      Was meinst Du, wieviel von dem, was aus Russland kommt, schon KI gesteuert ist und uns bereits jetzt manipuliert?

      • Hast du ein konkretes Beispiel dafür?

      • Es muss im Übrigen gar nicht immer politisch werden. Wissen viele nicht ;-)

        Bsp. gestern war die Suche in welchem EU Land es ein benötigtes Medikament rezeptfrei gibt. ChatGPT weigert sich beharrlich die vorhandenen Infos rauszurücken. Software sollte für die Menschen da sein, nicht umgekehrt.

  • Man kann ja vieles denken. Wenn man es fragt und bekommt die antworten das es Moralisch, Ethisch und Sozial bedenklich und falsch ist, hat dass seinen Grund. Mich würden eher die Fragen interessieren.

    Antworten moderated
    • Crack Federvieh

      Es läuft wohl so ähnlich wie bei Gemini. Wenn ich eine Videobeschreibung erstellen lassen will, dann dichtet er immer einen betont politisch korrekten Anhang dazu, obwohl es gar kein kritisches Video ist. Was eher nervt, weil es in dem Video gar nicht darum ging. Noch nerviger ist es, wenn man eine Skriptvorlage erstellen lässt. Wenn man ständig die gleichen Floskeln hört, stelle ich die lieber ab, wenn möglich.
      Oder wenn ich mich zu Nikotinsucht im Zusammenhang mit Cannabis informieren will, dann muss er mich meiner Meinung nach nicht auf professionelle Hilfe hinweisen, wenn ich wissen will, wie schnell Nikotin abhängig macht. Das kann ich schon selbst einordnen, wenn ich mal einen Joint rauchen will, ob ich es als Exraucher dann besser sein lasse. Ich möchte neutrale Informationen, die ich selbst fähig bin einzuordnen und nicht ständig irgendwelche Warntafeln

      Antworten moderated
      • Dann ist die Frage wer sitzt auf der anderen Seite ? Wirklich du oder ein Kind. Vielleicht sind das nur neue Maßnahmen um sich gesetzlich abzusichern.

  • Interessante Entwicklung mit den „Sprackopien“. Fällt sowas nicht auch unter das Urheberrecht oder Persönlichleitsrecht oder so?
    Würde es nicht toll finden, wenn „in meinem Namen“ Sachen verzapft werden, die ich nie selber ausgesprochen habe..

  • Es geht ganz klar in die Richtung, dass uns die West- und Ostküsten-Intelligenz vorschreiben will, was moralisch, ethisch usw. Richtig ist und was nicht. Aber das Netz findet immer einen Weg der Zensur (auch wenn die gut gemeint ist) zu entkommen. Es gibt ja noch andere sprach Generatoren

  • OpenAI wäre nicht der erste Anbieter, der entsprechende Modelle zur Verfügung stellt, allerdings der einzige, der Stimmkopien auf Basis eines nur 15 Sekunden kurzen Samples generiert.

    Falsch. Schon 2019 gab es Versuche, Stimmen, Kopien mit 5 Sekunden kurzen Audios zu machen. Klappte. Damals war er so mäßig gut, aber gerade teilweise auch schon beeindruckende Ergebnisse. 15 Sekunden Stimmen. Kopien bekommt man aber schon lange ziemlich gute hin, und zwar elevenlabs. die ChatGPT Stimmen überzeugen mich dagegen überhaupt nicht. Selbst die bereits vorgefertigten, kriegen dauernd während dem sprechen so einen komischen englischen Akzent drauf. Selbst dann, wenn der Text kein einziges englisches Wort enthält. Passiert im oben genannten Anbieter zwar auch manchmal, aber deutlich seltener.

  • Redet mit. Seid nett zueinander!

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert