Στην κυκλοφορία μιας νέας «ναυαρχίδας» μοντέλου τεχνητής νοημοσύνης με την ονομασία GPT-4o προχωρά το OpenAI, η οποία θα κυκλοφορήσει εκ νέου σε όλα τα προϊόντα της εταιρείας για προγραμματιστές και μη τις επόμενες εβδομάδες.
Σημειώνεται πως το «o» που προστίθεται στο λεκτικό GPT-4 σημαίνει «omni» («όλα»).
Όπως αναφέρθηκε από τον Muri Murati το GPT-4o παρέχει νοημοσύνη «επιπέδου GPT-4», ωστόσο βελτιώνει τις δυνατότητες του GPT-4 σε κείμενο, όραση καθώς και σε ήχο.
«Προχωράμε σε κάτι απίστευτα σημαντικό, διότι έτσι εξετάζουμε το μέλλον της αλληλεπίδρασης μεταξύ ημών και των μηχανών».
Σημειώνεται πως το GPT-4 Turbo -το προηγούμενο κορυφαίο μοντέλο του OpenAI, μια βελτιωμένη έκδοση του GPT-4- λειτουργούσε σε συνδυασμό εικόνων και κειμένου και μπορούσε να αναλύσει εικόνες και κείμενο για να ολοκληρώσει εργασίες όπως η εξαγωγή κειμένου από εικόνες ή ακόμη και η περιγραφή του περιεχομένου αυτών των εικόνων. Με το GPT-4o «στο παιχνίδι» μπαίνει και η ομιλία.
Το ChatGPT προσφέρει εδώ και καιρό μια φωνητική λειτουργία που μεταγράφει κείμενο από το ChatGPT χρησιμοποιώντας ένα μοντέλο μετατροπής κειμένου σε ομιλία. Αλλά το GPT-4o το ενισχύει αυτό, επιτρέποντας στους χρήστες να αλληλεπιδρούν με το ChatGPT περισσότερο, ουσιαστικά παρεμβαίνοντας.
Πλέον οι χρήστες μπορούν να κάνουν μια ερώτηση στο ChatGPT -κάτι που υποστηρίζεται από το GPT-4o- και να διακόπτουν το ChatGPT ενώ αυτό απαντά. Το μοντέλο θα ανταποκρίνεται «σε πραγματικό χρόνο», σύμφωνα με την OpenAI, και μπορεί ακόμη και να αντιληφθεί το συναίσθημα στη φωνή του χρήστη και να παράγει αντίστοιχα φωνή σε «μια σειρά διαφορετικών στυλ συναισθηματικών».
- Δύο άνθρωποι επικοινώνησαν για πρώτη φορά μέσα από τα όνειρά τους
- Φαρμακευτικά φυτά «χρωματίζουν» υφάσματα και έχουν αντηλιακή προστασία
- Πέθανε η Αλέκα Τουμαζάτου
- Ποιές διασημότητες βρίσκονται στο πλευρό της Χάρις και του Τραμπ στην κούρσα για τον Λευκό Οίκο
- Ιράν, Ρωσία και Ομάν διεξάγουν ναυτικά γυμνάσια στον Ινδικό Ωκεανό