Ungefähr ein Jahr nach seiner Veröffentlichung präsentiert OpenAI, das Unternehmen hinter ChatGPT, ein maßgebliches Update. Dieses bringt nicht nur inhaltliche Verbesserungen, sondern grundlegende Änderungen mit sich. Etwa in der Kommunikation: Bisher mussten Benutzer einen "prompt" (Befehl) verwenden, um von ChatGPT Informationen zu erhalten. Nun wird es auch per Spracheingabe möglich.
Bald werden ChatGPT-User:innen einem Chatbot sprechen können, ähnlich wie man es von Alexa oder Siri kennt. Laut The Verge aktiviert man diese Funktion durch Drücken einer Taste, spricht seine Frage aus, und ChatGPT wandelt die Sprachanfrage in Text um. Daraufhin liefert das Modell eine Antwort, die dann wiederum in gesprochene Worte umgewandelt und vorgelesen wird. Dieses Sprachfeature wird zuerst zahlenden Kunden angeboten.
Neues Feature ähnelt Google Lens
Außerdem plant OpenAI, eine bildbasierte Funktion einzuführen, vergleichbar mit Google Lens. Benutzer können ein Foto von einem Gegenstand oder Thema hochladen, das sie interessiert, und ChatGPT liefert daraufhin relevante Informationen. Bei der Bilderkennung legt OpenAI jedoch Wert auf den Datenschutz. So werden bei Fotos von Personen aus Privatsphäre-Gründen keine Informationen bereitgestellt.
KI kann bald eigene Stimme imitieren
OpenAI hat auch Fortschritte im Bereich der KI-Sprachverarbeitung erzielt. Ein neu entwickeltes Modell ermöglicht es, die KI mit einer individuellen Stimme zu trainieren, um gesprochene Texte in andere Sprachen zu übersetzen. Trotz des hohen Potenzials wird dieses Feature aufgrund möglicher Missbrauchsgefahr nicht für alle verfügbar sein.
DALL-E: Fotos bald ebenfalls per Chat generierbar
Zudem wird DALL-E, OpenAI's KI-gesteuerter Bildgenerator, bald mit ChatGPT kompatibel sein. Dies ermöglicht eine intuitivere Interaktion mit dem Bildgenerator. Mit diesen Innovationen stärkt OpenAI seine Führungsposition im Bereich generativer KI-Technologien.
Kommentar schreiben