OpenAI lanza una serie de API para ChatGPT y Whisper

La oferta de voz a texto Whisper y el ‘chatbot’ impulsado por la inteligencia artificial ChatGPT, podrían costar ahora diez veces menos según ha asegurado la compañía OpenAI.

OpenAI ha puesto a disposición de los usuarios una serie de API para ChatGPT y Whisper, el servicio de transcripción y traducción basado en la inteligencia artificial (IA) de la empresa. Estas API ayudarán a las empresas a integrar ChatGPT y Whisper en sus plataformas de conversación y serán sustancialmente más baratas que utilizar el modelo lingüístico existente propio. «A través de una serie de optimizaciones en todo el sistema, hemos logrado una reducción de costes del 90% para ChatGPT desde diciembre; ahora estamos pasando esos ahorros a los usuarios de la API», confirmó la compañía mediante una entrada de blog.

OpenAI lanzó Whisper en septiembre y ChatGPT en noviembre. Ahora, con esta oferta de API, ambas plataformas pueden integrarse oficialmente en el software de terceros. «Los modelos ChatGPT y Whisper ya están disponibles en nuestra API, lo que permite a los desarrolladores acceder a funciones lingüísticas (no sólo de chat) y de voz a texto de última generación», afirma la empresa.

 

De la voz al texto con Whisper

Whisper permite la transcripción en varios idiomas, así como la traducción de esos idiomas al inglés. De hecho, la herramienta ha cosechado grandes elogios de la comunidad de desarrolladores, aunque también puede ser «difícil de manejar», admitió OpenAI. Como consecuencia, la compañía ha puesto ahora a disposición el modelo large-v2 a través de una API que ofrece un cómodo acceso bajo demanda a un precio de 0,006 dólares por minuto (de entrada de audio). “El modelo large-v2 de Whisper en la API proporciona resultados mucho más rápidos y rentables”, defiende OpenAI. La herramienta acepta archivos en múltiples formatos, como M4A, MP3, MP4, MPEG, MPGA, WAV y WEBM, y está entrenada con 680.000 horas de datos supervisados multilingües y multitarea recogidos en la web.

 

API ChatGPT basada en GPT 3.5 Turbo

Las API de ChatGPT se basan en el modelo de lenguaje GPT 3.5 Turbo, la misma «familia» que la utilizada en la última versión de ChatGPT. Así, de ahora en adelante, las empresas que utilicen ChatGPT para sus operaciones deberán pagar 0,002 dólares por cada 1.000 tokens (unas 750 palabras). OpenAI proporcionará a las empresas una herramienta para evaluar cuántos tokens costaría una consulta por usuario y traducirlo para que coincida con la escala de consultas de sus clientes. OpenAI afirma que sus precios son diez veces más baratos que los de los modelos GPT 3.5 existentes, la versión que originalmente alimentaba ChatGPT. «Los usuarios de la API ChatGPT pueden esperar mejoras continuas de los modelos y la opción de elegir capacidad dedicada para un mayor control de los mismos», afirma OpenAI.

 

La popularidad de ChatGPT sigue creciendo

ChatGPT se lanzó en noviembre cosechando un éxito instantáneo. Registró 100 millones de usuarios activos sólo dos meses después de su lanzamiento. Sin embargo, debido a esta enorme demanda, la empresa no pudo mantener el ritmo, lo que provocó tiempos de inactividad. Durante los dos últimos meses, el tiempo de actividad de ChatGPT no ha cumplido con sus propias expectativas «ni las de nuestros usuarios». «La principal prioridad de nuestro equipo de ingenieros es ahora la estabilidad de los casos de uso en producción», afirma OpenAI.

Varias organizaciones, entre ellas gigantes tecnológicos como Google, Amazon, Apple y Meta, han creado sistemas avanzados de reconocimiento de voz. Si OpenAI consigue establecerse en el mercado de la conversión de texto a voz a lo grande, puede resultar muy rentable para la compañía respaldada por Microsoft. Según un informe de MarketsandMarkets, el mercado de la conversión de texto a voz podría alcanzar un valor de 5.400 millones de dólares en 2026, frente a los 2.200 millones de 2021. La IA puede dar «oportunidades increíbles» y «poder económico a todo el mundo», afirma Open AI…

En este enlace puedes leer la noticia completa, PUBLICADA ORIGINALMENTE EN : COMPUTERWORLD

BARCELONADOT no se hace responsable de la información
que contiene este mensaje y no asume responsabilidad alguna
frente a terceros sobre su íntegro contenido, quedando igualmente
exonerada de la responsabilidad de la entidad autora del mismo.

.

Share:

Facebook
Twitter
Pinterest
LinkedIn
Scroll al inicio