Η NVIDIA μόλις κυκλοφόρησε το PersonaPlex-7B, και είναι η πρώτη Τεχνητή Νοημοσύνη που μπορεί να σας διακόψει στη μέση της πρότασης.
Αυτό αλλάζει τα πάντα σχετικά με την φωνητική τεχνητή νοημοσύνη.
Σκεφτείτε κάθε φωνητικό βοηθό που έχετε χρησιμοποιήσει ποτέ – Siri, Alexa, Google Assistant. Όλοι λειτουργούν με τον ίδιο ενοχλητικό τρόπο: εσείς μιλάτε, αυτοί περιμένουν, σκέφτονται και μετά απαντούν.
Είναι σαν να μιλάτε σε ένα φορητό ραδιοτηλέφωνο. Εντελώς αφύσικο.
Η NVIDIA μόλις κατέστρεψε ολόκληρο αυτό το μοντέλο.
Να τι κάνει το PersonaPlex επαναστατικό:
☑ Ακούει ΚΑΙ μιλάει ταυτόχρονα (συνομιλία πλήρους αμφίδρομης επικοινωνίας)
☑ Μπορείτε να το διακόψετε στη μέση της πρότασης και αυτό ανταποκρίνεται φυσικά
☑ Σας δίνει επιβεβαιώσεις “ωχ” και “εντάξει” ενώ μιλάτε
☑ Μηδενικές αμήχανες παύσεις που περιμένουν να “επεξεργαστεί”
☑ Οι συνομιλίες μοιάζουν πραγματικά ανθρώπινες για πρώτη φορά
Η παραδοσιακή φωνητική τεχνητή νοημοσύνη λειτουργεί ως εξής: Η ομιλία σας
→ Μετατροπή σε κείμενο
→ Αποστολή σε LLM
→ Μετατροπή απόκρισης σε ομιλία
→ Αναπαραγωγή ήχου
Αυτός ο αγωγός δημιουργεί όλες αυτές τις οδυνηρές καθυστερήσεις.
Το PersonaPlex κάνει τα πάντα σε ΕΝΑ μοντέλο:
☑ 7 δισεκατομμύρια παράμετροι που χειρίζονται ταυτόχρονα τόσο την ακρόαση όσο και την ομιλία
☑ Φυσική ροή συνομιλίας με επικαλύψεις και διακοπές
☑ Προσαρμοσμένες φωνές και περσόνες που παραμένουν σταθερές
☑ Προσαρμογή σε πραγματικό χρόνο όταν διακόπτετε
Σκεφτείτε τι επιτρέπει αυτό:
→ Εξυπηρέτηση πελατών που μοιάζει σαν να μιλάς σε άνθρωπο
→ Καθηγητές Τεχνητής Νοημοσύνης που μπορούν να παρεμβαίνουν όταν είστε μπερδεμένοι
→ Βοηθοί φωνής που ανταποκρίνονται άμεσα χωρίς προβλήματα
→ NPC παιχνιδιών που μιλούν σαν πραγματικοί χαρακτήρες
Αλλά εδώ είναι το καλύτερο μέρος – η NVIDIA το έκανε πλήρως ανοιχτού κώδικα.
Ο κώδικας βρίσκεται στο GitHub με άδεια MIT. Τα βάρη των μοντέλων βρίσκονται στο Hugging Face. Οποιοσδήποτε προγραμματιστής μπορεί να δημιουργήσει με αυτό αυτή τη στιγμή.
Αυτό σημαίνει ότι πρόκειται να δούμε μια έκρηξη εφαρμογών φωνητικής Τεχνητής Νοημοσύνης που πραγματικά αισθάνονται φυσικές.
Οι επιπτώσεις είναι τεράστιες:
Ενώ όλοι έχουν επικεντρωθεί στο να κάνουν την Τεχνητή Νοημοσύνη πιο έξυπνη, η NVIDIA την έκανε απλώς πιο ΑΝΘΡΩΠΙΝΗ.
Δεν πρόκειται για καλύτερες απαντήσεις. Πρόκειται για καλύτερες συζητήσεις.
Και μόλις βιώσετε την Τεχνητή Νοημοσύνη που μπορεί πραγματικά να έχει έναν διάλογο χωρίς αμήχανες παύσεις, δεν θα θέλετε ποτέ να επιστρέψετε.
Μόλις περάσαμε τα όρια από τις «φωνητικές εντολές» στις «φωνητικές συνομιλίες».
Το μέλλον της Τεχνητής Νοημοσύνης δεν είναι απλώς η νοημοσύνη. Είναι η παρουσία.
Και το PersonaPlex-7B μόλις μας έδειξε πώς μοιάζει αυτό το μέλλον.
