ChatGPT-4o: Wie aus einem Science-Fiction-Film - ZDFheute

    ChatGPT-4o: Wie aus einem Science-Fiction-Film

    Chatbot-Gespräche in Echtzeit:KI wie aus einem Science-Fiction-Film

    von David Metzmacher
    |

    Er spricht, scherzt, singt und kann Emotionen erkennen - OpenAI hat seinem Chatbot ChatGPT ein futuristisches Update verpasst. Das ist auch gut für nichtzahlende Nutzer.

    Bildungsexperten empfehlen KI-Tools zu nutzen
    Mit ChatGPT kann man sich jetzt wie mit einem Menschen unterhalten.
    Quelle: AFP

    Ein kleines "o" soll den Unterschied machen: ChatGPT-4o heißt das neueste Modell des KI-Giganten OpenAI (das "o" steht für "omni" - Lateinisch für "alles"). Das soll vor allem die Sprachinteraktion mit dem Chatbot "natürlicher und deutlich einfacher" machen, wie das Unternehmen in seinem "Spring Update" am Montagabend deutscher Zeit verkündete.
    Der Chatbot soll jetzt unter anderem Emotionen erkennen oder simultan übersetzen können. Das zeigt das Unternehmen in einer Reihe kurzer Demonstrationen auf seiner Webseite. Auch die mit einem Smartphone aufgenommene Umgebung oder Menschen erkennt der Chatbot demnach in Echtzeit - dadurch kann er beispielsweise die Kleidung eines Menschen kommentieren. Wie gut das Ganze auf Deutsch funktioniert, bleibt vorerst allerdings offen.
    Die Gesetzgeber der Europäischen Union stimmen über ein Gesetz zur künstlichen Intelligenz ab.
    Das EU-Parlament hat ein Gesetz zur Regulierung von KI beschlossen. Anwendungen werden künftig in vier Risiko-Kategorien eingeteilt: minimal, begrenzt, hoch, inakzeptabel.13.03.2024 | 1:51 min

    Mit dem Chatbot sprechen: Wie mit einem Menschen?

    Mit Nutzern sprechen konnte ChatGPT zwar schon vorher - aber mit längeren Pausen zur Verarbeitung der Daten. Das wirkte dann häufig etwas schwerfällig. Denn für die Funktion waren drei interne Anwendungen nötig, wie das Unternehmen erklärte: die Transkription des gesprochenen Texts, die Verarbeitung und Generierung sowie die Umwandlung der Antwort in Sprache. Das sorgte für Verzögerungen. OpenAI will das nun gelöst haben:

    Es kann auf Audioeingaben in nur 232 Millisekunden reagieren, im Durchschnitt in 320 Millisekunden, was der menschlichen Reaktionszeit in einem Gespräch ähnelt.

    OpenAI

    Jetzt zeigte OpenAI, wie die Software den Tonfall von aufgeregt bis mitfühlend sowie das Sprechtempo variieren kann - und auch fließend zwischen Englisch und Italienisch übersetzt. Die KI kann auch instruiert werden, sarkastisch zu antworten, beim Lernen einer Sprache zu helfen oder ein Gute-Nacht-Lied zu singen.
    OpenAI: Videoerkennung in Echtzeit
    Ein Klick für den Datenschutz
    Erst wenn Sie hier klicken, werden Bilder und andere Daten von Twitter nachgeladen. Ihre IP-Adresse wird dabei an externe Server von Twitter übertragen. Über den Datenschutz dieses Social Media-Anbieters können Sie sich auf der Seite von Twitter informieren. Um Ihre künftigen Besuche zu erleichtern, speichern wir Ihre Zustimmung in den Datenschutzeinstellungen. Ihre Zustimmung können Sie im Bereich „Meine News“ jederzeit widerrufen.
    Datenschutzeinstellungen anpassen
    ChatGPT wird damit zu einem echten Konkurrenten für die Sprachassistenten der Tech-Schwergewichte wie Alexa von Amazon und Siri von Apple.
    In this photo illustration, a video created by Open AI's newly released text-to-video "Sora" tool plays on a monitor in Washington, DC on February 16, 2024.
    Die Entwickler von ChatGPT haben einen Filmgenerator veröffentlicht. Er heißt Sora und kann aus kurzen Text-Vorgaben realistische Videos erzeugen.16.02.2024 | 1:31 min

    ChatGPT kann in Echtzeit auf Videos reagieren

    Gleichzeitig mit gesprochenen Befehlen kann ChatGPT auch Informationen von einer Smartphone-Kamera verarbeiten. In einem Livestream demonstrierte OpenAI unter anderem, wie das neue Modell helfen kann, eine Mathe-Gleichung zu lösen: ChatGPT gab per Stimme Ratschläge für den Rechenweg, ohne das Ergebnis zu verraten. Ein Mitarbeiter von OpenAI schrieb dafür die Gleichung auf einem Blatt Papier und richtete die Smartphone-Kamera darauf. Fragen an ChatGPT stellte er mündlich. Einziger Patzer: Der Chatbot behauptete erst, er sehe die Aufgabe, noch bevor er die Gleichung aufschrieb. Der Chatbot entschuldigte sich:

    Oops, ich war zu aufgeregt.

    ChatGPT-4o

    OpenAI: Singen und Übersetzung von Gesprächen
    Ein Klick für den Datenschutz
    Erst wenn Sie hier klicken, werden Bilder und andere Daten von Twitter nachgeladen. Ihre IP-Adresse wird dabei an externe Server von Twitter übertragen. Über den Datenschutz dieses Social Media-Anbieters können Sie sich auf der Seite von Twitter informieren. Um Ihre künftigen Besuche zu erleichtern, speichern wir Ihre Zustimmung in den Datenschutzeinstellungen. Ihre Zustimmung können Sie im Bereich „Meine News“ jederzeit widerrufen.
    Datenschutzeinstellungen anpassen

    "Hey, ChatGPT" - neue Funktionen bald verfügbar

    Auch bat ein OpenAI-Mitarbeiter den Chatbot, seine Laune an dem Gesichtsausdruck zu erkennen. Schwer machte er es ChatGPT mit einem breiten Grinsen allerdings nicht. Alle Interaktionen wurden mit dem Weck-Satz "Hey, ChatGPT" eingeleitet - ähnlich wie man es von heutigen Sprachassistenten kennt.
    Abo-Kunden von OpenAI werden mehr Leistung in dem Modell bekommen. Zugleich machte OpenAI die Interaktionen für kommerzielle Nutzer günstiger. Man werde jede Menge Dinge finden, für die man Geld verlangen könne, schrieb Altman dazu. Und das werde OpenAI helfen, kostenlos hoffentlich Milliarden Menschen zu bedienen. Nach bisherigen Angaben kommt ChatGPT auf rund 100 Millionen Nutzer. Es dürfte einige Wochen dauern, bis das neue Modell breit verfügbar ist. Wenige Stunden nach der Präsentation meldete OpenAI eine Störung bei dem Modell, die jedoch schnell wieder behoben wurde.
    Bundeskanzler Olaf Scholz auf der Hannover-Messe
    Die größte Ausstellung für Maschinenbau und Elektrotechnik findet derzeit in Hannover statt. Ein wichtiges Thema ist der Umgang mit dem Hoffnungsträger Künstliche Intelligenz.22.04.2024 | 1:31 min

    OpenAI enthüllt Neues vor Google-Event

    Der Zeitpunkt der Präsentation ist interessant: Am Dienstag hält Google seine jährliche Entwicklerkonferenz ab, bei der auch Ankündigungen zu neuen Funktionen mit Künstlicher Intelligenz erwartet werden. Google zeigte bereits vor einigen Monaten, wie seine KI-Software Gemini gesprochene und visuelle Informationen verarbeiten kann.
    ChatGPT löste vor über einem Jahr den Hype um Künstliche Intelligenz aus. Solche KI-Chatbots werden mit gewaltigen Mengen an Informationen trainiert und können Texte auf dem sprachlichen Niveau eines Menschen formulieren, Software-Code schreiben und Informationen zusammenfassen. Das Prinzip dahinter ist, dass sie Wort für Wort abschätzen, wie ein Satz weitergehen sollte.

    Bildungsexperten zu KI
    :ChatGPT und Co. als "Denkwerkzeuge" nutzen

    Trotz falscher Antworten und rechtlicher Bedenken: Bildungsexperten plädieren für den Einsatz von KI-Tools wie ChatGPT in Universitäten und Schulen. Das sind ihre Vorschläge.
    von Luisa Houben
    ChatGPT im gymnasialen Deutschunterricht
    mit Video
    Quelle: Mit Material von dpa

    Mehr zu OpenAI