Actualizarea ChatGPT care va urma, va adăuga o funcție vocală și va permite utilizatorilor să interacționeze folosind imagini.
ChatGPT a fost adoptat în companii pentru o gamă largă de sarcini, iar odată cu timpul și cu noile actualizări, din ce în ce mai multe joburi riscă să fie înlocuite de inteligența artificială.
Cuprins
ChatGPT va primi o actualizare vocală
OpenAi a declarat că introducerea funcției vocale „deschide uși către multe aplicații creative și concentrate pe accesibilitate”.
Astfel, în curând, chatbotul va putea oferi servicii precum Siri de la Apple, Alexa de la Amazon sau Bixby de la Samsung.
Începem să lansăm noi capacități vocale și de imagini în ChatGPT. Acestea oferă un tip nou, mai intuitiv de interfață, permițându-vă să purtați o conversație vocală sau să-i arătați lui ChatGPT despre ce discutați.
OpenAI
Noua funcție de imagini a ChatGPT
Compania a menționat că noua capacitate vocală și de imagini va oferi utilizatorilor mai multe oportunități pentru a folosi ChatGPT în viața de zi cu zi. De exemplu, îi puteți arăta chatbotului o fotografie cu un obiect sau un loc despre care vreți să știți mai multe, iar acesta va răspunde în consecință.
În plus, compania a dat și exemple precum că ChatGPT poate citi cu voce tare un text, poate nara povești pentru adormit sau poate ajuta copiii cu o temă la matematică, făcând o fotografie, evidențiind problema și oferind indicii.
De când vor putea fi utilizate noile funcții?
OpenAI a declarat că vor lansa funcțiile vocale și de imagini în ChatGPT pentru utilizatorii Plus și Enterprise în următoarele două săptămâni. Funcția vocală va fi disponibilă pe iOS și Android, iar imaginile vor fi disponibile pe toate platformele.
OpenAI a menționat în postare că noua capacitate vocală este alimentată de un nou model text-to-speech, care este capabil să genereze sunet similar cu cel uman doar din text și câteva secunde de vorbire demonstrativă.
Am colaborat cu actori de voce profesioniști pentru a crea fiecare dintre vocile disponibile. De asemenea, folosim Whisper, sistemul nostru de recunoaștere a vorbirii open-source, pentru a transcrie cuvintele rostite în text.
OpenAI
Între timp, înțelegerea imaginilor este alimentată de modelele multimodale GPT-3.5 și GPT-4. Aceste modele aplică abilitățile lor de raționament în limbaj la o gamă largă de imagini.
Astfel, tehnologia ChatGPT se dezvoltă din ce în ce mai mult, iar această îmbunătățire este una extrem de semnificativă, atât pentru platformă, cât și pentru utilizatori.
Sursa informației: theguardian.com