ChatGPT se actualiza: Ahora puede recibir instrucciones de voz, ver imagenes y hablar

OpenAI anunció la llegada de una serie de novedades para ChatGPT. Ahora puede recibir instrucciones de voz, ver imagenes y hablar.

ChatGPT se actualiza: Ahora puede recibir instrucciones de voz, ver imagenes y hablar
ChatGPT

OpenAI anunció novedades para ChatGPT, la herramienta de Inteligencia Artificial más popular y utilizada en el mundo. La cual ahora soportará tanto instrucciones de voz de los usuarios como carga de imágenes.

De esta forma, los usuarios ahora podrán mantener conversaciones con ChatGPT, similar a lo que actualmente hacemos con asistentes virtuales como Alexa de Amazon, Siri de Apple o Google Assistant. Así como, pedir al bot que analice y reaccione ante cualquier imagen que suban.

OpenAI también menciona que los diálogos por voz solo estarán disponibles en las aplicaciones móviles de ChatGPT para Android e iOS. Mientras que, la entrada de imágenes estará disponible en todas las aplicaciones móviles y de escritorio.

Así funcionará el nuevo ChatGPT: Instrucciones de voz, ver, escuhcar y hablar

OpenAI asegura que las funciones han sido desarrolladas por sus propios modelos de reconocimiento de voz, síntesis y visión, y estarán disponibles para las personas suscritas a ChatGPT Plus y Enterprise en las próximas dos semanas. Mientras que, los usuarios de la versión gratuita y los desarrolladores dispondrán de estas funciones poco después.

Asimismo, la empresa ofrece estas capacidades con modelos de voz a texto y de texto a voz que funcionan casi en tiempo real, convirtiendo la voz de entrada en texto, introduciendo ese texto en el GPT-4, el gran modelo de lenguaje (LLM) subyacente de OpenAI, para ofrecer una respuesta y, por último, volviendo a convertir ese texto en la voz seleccionada por el usuario.

De esta forma, mientras que la voz añade capacidades conversacionales a ChatGPTel soporte de imágenes llegará gracias al poder de Google Lens. Permitiendo simplemente hacer clic en una foto y añadirla al chat con una pregunta potencial.

Además, ChatGPT analizará la imagen en el contexto del texto que la acompaña y producirá una respuesta. Incluso puede entablar una conversación de ida y vuelta en torno a ese tema.

Evitando el uso indebido

Por otro lado, para evitar el uso indebido de sus capacidades de síntesis de voz, de las que se puede abusar para cometer fraudes, OpenAI ha restringido su uso al chat de voz y a determinadas asociaciones aprobadas. Por ejemplo, recientemente Spotify anunció que está ayudando a sus podcasters a transcribir sus contenidos a diferentes idiomas conservando su propia voz. Gracias a la herramienta de Whisper.

De esta forma, para evitar problemas de privacidad y precisión derivados del reconocimiento de imágenes, la empresa también ha restringido la capacidad del bot para analizar y hacer declaraciones directas sobre personas si están presentes en una imagen de entrada.

Finalmente, se espera que las nuevas funciones lleguen también a los usuarios que no paguen, pero la empresa aún no ha comunicado el calendario exacto. Por lo que, se espera que ChatGPT mejore de forma considerable su capacidad de respuesta y la calidad de estas, para potenciar aún más sus funcionalidades.

Más información | OpenAI


Si te agrada nuestro contenido no olvides seguir visitando nuestro sitio Web Ellipsis Mx al igual seguirnos en nuestras redes sociales Facebook , Twitter e Instagram.