Neues GPT-4o Modell im Detail

Ab jetzt kostenlos nutzen!

Multimodale Verarbeitung

OpenAI hat mit GPT-4o ein neues KI-Modell auf den Markt gebracht, das kostenlos verfügbar ist und beeindruckende neue Funktionen bietet. Ein besonders spannendes Feature ist die multimodale Verarbeitung. GPT-4o versteht und verarbeitet nicht nur Text, sondern auch gesprochene Sprache, Bilder und Videos. Zuvor wurde Sprache zuerst in Text umgewandelt und dieser dann von der KI analysiert. Nun wird gesprochene Sprache direkt verarbeitet. Dies ermöglicht es der KI, Emotionen oder auch Sarkasmus in Stimmen zu erkennen und visuelle sowie auditive Inhalte gleichzeitig zu analysieren. GPT-4o antwortet ohne nennenswerte Verzögerungen in Sprache oder Text. Besonders bei der Sprachausgabe ist es bemerkenswert, dass sich die Stimmlage und Aussprache der KI-Stimme anpasst, beispielsweise bei einer sarkastischen Antwort. 

Diese Fähigkeiten eröffnen neue Möglichkeiten für die Nutzung und Interaktion mit KI. 

Kostenloser Zugang im Free-Plan

Ein großer Vorteil von GPT-4o ist seine Verfügbarkeit im Free-Plan. Diese Entscheidung von OpenAI ermöglicht es einer breiten Nutzerbasis, die neuen Funktionen ohne zusätzliche Kosten zu testen und in den Arbeitsalltag zu integrieren. Derzeit wird GPT-4o schrittweise ausgerollt, sodass immer mehr Nutzer in den nächsten Tagen Zugang erhalten. Hierfür muss man nicht selber aktiv werden.

So sieht die Auswahl aus, wenn bereits Zugriff auf das neue GPT-4o besteht. Es wird in der Modell-Auswahl nur noch „ChatGPT“ und „ChatGPT Plus“ angezeigt.

 

Zusätzlich hat man nun, neben dem Texteingabefeld eine Büroklammer um Dateien, Fotos und Videos hinzuzufügen und man kann, wenn man bereits das neue Modell verwendet, nach einer Textausgabe das Modell nachträglich ändern.


Neue Features in der OpenAI App

Die neue App von OpenAI nutzt die verbesserten Fähigkeiten von GPT-4o optimal aus. Nutzer können jetzt multimodale Eingaben machen, es ist somit möglich Text, Sprache, Bilder und Videos als Eingabe zu verwenden. Man kann über das Kopfhörer-Symbol flüssige und authentische Gespräche mit der KI führen und diese beispielsweise für eine Echtzeit Übersetzung in eine andere Sprache nutzen. Für die neuen Funktionen sollte die App zuerst aktualisiert werden.

Desktop-App für nahtlose Integration

OpenAI hat auch eine Desktop-App vorgestellt, die demnächst zugänglich gemacht werden wird und interaktive Automatisierung direkt auf den PC bringt. Mit dieser App können Nutzer Inhalte nahtlos integrieren, ohne sie ständig kopieren und einfügen zu müssen, so ist eine Anwendungsmöglichkeit, dass GPT-4o sieht, was man auf seinem Desktop macht und darauf direkt reagieren kann. Die Desktop-App unterstützt die gleichen multimodalen Eingabemöglichkeiten wie die mobile App, was die Integration in bestehende Arbeitsabläufe erleichtert und die Produktivität steigert. Ein Anwendungsbeispiel könnte sein, dass man in einem Teams-Meeting ist und die KI mit den Teilnehmern des Meetings spricht und interagiert. Hier könnte man der KI beispielsweise sagen, dass Sie als Moderator fungieren soll.

Kosten und Token-Modelle

GPT-4o ist im Free-Plan verfügbar, was eine Nutzung für die breite Öffentlichkeit ermöglicht. Für intensivere Nutzung und spezielle Funktionen wie die Bildgenerierung muss weiterhin ChatGPT-Plus erworben werden.

Anwendungsfälle: Wie GPT-4o im Alltag hilft

Die Einsatzmöglichkeiten von GPT-4o werden vielfältig sein. In der Kundeninteraktion kann die KI beispielsweise genutzt werden, um Anfragen in Echtzeit zu beantworten und dabei Emotionen in der Stimme der Kunden zu erkennen, was eine persönlichere Betreuung ermöglicht. In der Softwareentwicklung erleichtert GPT-4o durch die verbesserten Coding-Funktionen die Programmierung und Fehlerbehebung. Auch im Bildungsbereich kann die KI eingesetzt werden, um Lerninhalte interaktiver und ansprechender zu gestalten und als „Digitaler Lehrer“ verwendet werden. 

 

GPT-4o wird auch für Menschen mit Beeinträchtigungen hilfreich sein, so können Menschen mit einer Sehbehinderung sich Ihre Umwelt durch KI beschreiben lassen, wenn man die Kamera in der App einschaltet und die KI dadurch Zugriff auf die Umwelt hat.

 

Ausblick: Wohin geht die Reise mit GPT-4o?

Mit GPT-4o stehen wir am Beginn einer neuen Reihe der KI-Entwicklung von OpenAI. Die Fähigkeit zur multimodalen Verarbeitung und die kostenlose Verfügbarkeit machen dieses Modell für eine breite Nutzerbasis attraktiv. Die kontinuierliche Verbesserung und die Aussicht auf zukünftige Modelle wie GPT-5 versprechen, die Art und Weise, wie wir arbeiten und kommunizieren, weiterhin zu revolutionieren. Vermutlich ist GPT-4o bereits eine Work-In-Progress-Version von GPT-5 und lässt uns weiter auf den Release von GPT-5 hoffen.

Weitere Informationen und Live-Demos können unter folgenden Link auf der OpenAI-Webseite eingesehen werden

Reply

or to participate.