Inteligencia artificial

Conversion AI Puede Ser la Clave para Evitar una Meseta Tecnológica

mm
Securities.io maintains rigorous editorial standards and may receive compensation from reviewed links. We are not a registered investment adviser and this is not investment advice. Please view our affiliate disclosure.
Conversion AI

La demanda de contenido está experimentando un crecimiento constante y pronunciado. Para obtener una idea realista sobre la tasa de crecimiento, Adobe realizó una encuesta que abarcó a más de 2,600 profesionales de experiencia del cliente y marketing en las principales economías globales. 

Los resultados de la encuesta, publicados por Adobe en marzo de 2023, indicaron un crecimiento de la demanda de contenido de al menos el doble durante los últimos dos años. Aproximadamente dos tercios estaban aún más optimistas sobre el futuro del contenido. Dijeron que esperaban que la demanda creciera entre cinco y veinte veces en las próximas veinte horas. 

Atender esta demanda ha obligado a las empresas a adoptar nuevos modelos de producción de contenido. Según la World Federation of Advertisers, más de la mitad de las grandes compañías internacionales han desarrollado capacidades de producción de contenido internas. ¿Pero es suficiente? Bueno, la conversión AI ha aceptado el desafío. 

¿Qué es Conversion AI?

Conversion AI trata de usar inteligencia artificial para ayudar a las empresas a comunicarse mejor con sus clientes y generar más ventas. Lo hace ayudando a crear, mejorar y gestionar contenido como textos, imágenes y sonidos. Esto facilita que las compañías capten la atención de su audiencia, produzcan contenido que realmente les hable y mejoren la experiencia, todo mediante tecnología de IA inteligente.

Hoy, las empresas pueden usar Conversion AI para cumplir una variedad de objetivos de marketing de contenido, incluyendo copias para anuncios de Facebook y Google, contenido de sitios web, publicaciones sociales y más. Pero, ¿cómo hace posible todo esto Conversion AI? ¿Cuál es la tecnología que lo impulsa? Para eso, necesitamos conocer los Modelos de Lenguaje Grande o LLMs. 

¿Qué es un Modelo de Lenguaje Grande?

Es un tipo de IA que puede aprender a partir de grandes cantidades de texto y datos. Existen casos de uso donde estos modelos de IA pueden manejar cientos de miles de millones de puntos de datos para generar ideas significativas, estrategias y proyecciones. 

El Origen de los LLMs en Breve

Los LLMs modernos irrumpieron en la escena hace seis años, en 2017. Estos LLMs utilizaban modelos transformer que podían manejar una gran cantidad de parámetros para comprender y generar respuestas precisas rápidamente. 

Cuatro años después, en 2021, el Stanford Institute for Human-Centered Artificial Intelligence acuñó el término y concepto de modelos fundacionales. El nombre surgió del hecho de que estos modelos, grandes e impactantes, servían como bases para posteriores optimizaciones y casos de uso. Con el desarrollo de los LLM, la generación de contenido, especialmente en forma escrita, experimentó cambios significativos. 

El Impacto de los LLMs

La investigación de ARK Invest muestra que durante los últimos dos años, la calidad de escritura de los LLM ha experimentado una mejora significativa. Esto ha generado mayor confianza y despliegue de soluciones impulsadas por LLM para generar contenido. 

Como resultado, el costo de crear contenido escrito ha disminuido drásticamente. Era relativamente constante en términos reales durante el siglo pasado, cerca de US$100 por cada 1,000 palabras escritas. Sin embargo, en los últimos dos años, esa tarifa ha bajado a US$0.10 e incluso menos. 

El rendimiento y la productividad están preparados para mejorar aún más a medida que el desempeño del entrenamiento de IA avanza rápidamente. Los investigadores de IA están innovando en entrenamiento e inferencia, hardware y diseños de modelos, mejorando el rendimiento mientras reducen costos. Se espera que esto genere más de cinco veces las ganancias de rendimiento en 2024, tomando 2023 como año base.

Ha habido varias innovaciones algorítmicas que han resultado en una capacidad de escritura superior y una mayor productividad y rendimiento de los LLM. El aprendizaje por refuerzo a partir de retroalimentación humana, por ejemplo, ha ayudado mucho. Los prompts se han optimizado para superar los prompts humanos en más del 50%. 

Las capacidades de Decodificación Especulativa han acelerado la inferencia de dos a tres veces en modelos específicos. Los investigadores también han sido proactivos al priorizar los costos de inferencia. Y sus esfuerzos están mostrando resultados en la práctica, con los costos de inferencia disminuyendo a una tasa anual cercana al 86%, más rápido que los costos de entrenamiento. Los modelos GPT han experimentado casi un aumento de 3 veces en la velocidad de entrenamiento con Flash Attention 2. 

Con todas estas mejoras y avances ocurriendo a velocidad de cohete, también se están llevando a cabo investigaciones para determinar si una meseta potencial es inminente en el uso de los LLM y si tal situación podría evitarse. 

Haga clic aquí para aprender por qué 2023 fue el año de gran avance para la inteligencia artificial.

Meseta Potencial de los LLM y su Evitación

Los investigadores están analizando un posible escenario en el que los LLM se quedarán sin datos, lo que resultaría en un rendimiento limitado. Los LLM necesitan ser alimentados con grandes volúmenes de datos de entrenamiento de forma constante para seguir aprendiendo y mejorando. Sin embargo, la potencia de cómputo y la posible falta de datos de entrenamiento parecen ser una preocupación. 

Según estimaciones de Epoch AI, las fuentes de lenguaje/datos de alta calidad, incluidos libros y artículos científicos, podrían agotarse para 2024. Y es entonces cuando habría que recurrir a un conjunto mayor de datos visuales inexplorados. Estos datos visuales sin explotar que pueden ayudar a los LLM a evitar la meseta incluyen palabras habladas y otros tipos de datos del mundo físico. 

Las investigaciones muestran que anualmente se pronuncian treinta cuatrillones de palabras. Los generadores de voz a texto y herramientas similares capturan más de 80 billones de palabras habladas diariamente. Además, hay taxis, camiones, drones y otros vehículos robóticos que generan grandes volúmenes de datos del mundo físico y datos sintéticos que complementan los datos primarios. Todos estos datos inexplorados podrían constituir una riqueza de recursos inigualable y mejorar los LLM. 

Sin embargo, las mejoras en rendimiento, productividad y calidad no se limitan solo a localizar minas de datos inexplorados. Varias empresas innovadoras están realizando esfuerzos integrales para mejorar el escenario de manera holística. 

#1. Replit AI

En lo que respecta a impulsar la productividad, Replit AI ha sido una de las principales historias de éxito. Como asistente de codificación, ha aumentado la productividad y la satisfacción laboral de los desarrolladores de software. Ayuda a eliminar las partes iterativas de la codificación para que uno se concentre en las partes creativas del trabajo. 

Replit AI simplifica la codificación al integrar un generador de código IA que elimina la necesidad de cambiar de pestaña, ofreciendo sugerencias de autocompletar código para avanzar más rápido. Mejora la comprensión del proyecto con su funcionalidad Code Context para escribir líneas siguientes relevantes y detecta proactivamente problemas, sugiriendo correcciones directamente dentro de una interfaz de editor fluida.

En conjunto, Replit AI es un conjunto eficiente de funciones de generación de código IA, que incluye Complete Code, Generate Code, Edit Code y Explain Code. 

Lo que impulsa a Replit AI son los LLM. Devuelve resultados generados a partir de grandes modelos de lenguaje entrenados con código disponible públicamente y afinados por Replit. Considera el prompt conversacional y el lenguaje de programación que se está usando para ofrecer sugerencias y explicaciones sobre el código generado. 

Las funciones de Replit AI están disponibles de forma gratuita para todos los usuarios. Todo lo que se necesita es una cuenta de Replit. Replit AI funciona mejor con código JavaScript y Python, pero admite 16 lenguajes, incluidos Bash, C, C#, C++, CSS, Go, Java, JavaScript, HTML, PHP, Perl, Python, R, Ruby, Rust y SQL. 

Según la información más reciente disponible, la empresa recaudó US$97.4 millones con una valoración de US$1.16 mil millones para expandir sus servicios en la nube y liderar el desarrollo de IA en abril de 2023. 

#2. Github Copilot

Otro servicio de asistencia de codificación, similar a Replit AI, que ha ayudado a mejorar la productividad de los desarrolladores en tareas de codificación en 2.2 veces en 2023 es Github Copilot. Github Copilot ofrece asistencia contextualizada a lo largo del ciclo de vida del desarrollo de software. 

Según los números de encuestas de satisfacción del consumidor, los desarrolladores usuarios de Github Copilot reportan hasta un 75% más de satisfacción con sus trabajos que aquellos que no lo usan y son hasta un 55% más productivos al escribir código sin comprometer la calidad. 

Github Copilot se entrena con texto en lenguaje natural y código fuente de fuentes públicas, incluido el código en repositorios públicos de GitHub. Se entrena en todos los lenguajes que aparecen en repositorios públicos. Sin embargo, los lenguajes con menor representación en repositorios públicos pueden resultar menos efectivos. Github Copilot puede ser usado por desarrolladores individuales, freelancers, estudiantes, educadores y mantenedores de código abierto.

Según declaraciones públicas del vicepresidente de Producto de Microsoft, Mario Rodriguez, GitHub Copilot está prosperando y generando ingresos a una tasa anual de $100 millones.

#3. MosaicML

MosaicML ayuda a entrenar LLM, posicionándose como una solución que lleva la IA generativa a todos, ofreciendo todo lo necesario para entrenar y desplegar modelos con datos de usuarios. Su serie MPT Foundation facilita la integración sencilla de LLM en aplicaciones que funcionan tanto con modelos de código abierto como con licencias comerciales.

El entrenamiento de MosaicML permite a los desarrolladores preentrenar o afinar modelos con control total de los datos, simplificando el proceso a un solo comando dirigido a un bucket S3. La plataforma maneja eficientemente la orquestación, fallos de nodos e infraestructura, ejemplificado por el uso de Mosaic ML por parte de Replit para entrenar su LLM Ghostwriter, mostrando resultados líderes en una semana.

El enfoque de MosaicML para entrenar en cualquier entorno de nube enfatiza la privacidad de datos, la seguridad y la plena propiedad del modelo, con funciones que soportan transiciones sin problemas entre nubes. Ofrece plena propiedad de los datos, filtrado de contenido según las necesidades empresariales e integración plug-and-play con pipelines de datos existentes, siendo agnóstico a la nube y probado en empresas.

En junio del año anterior, la adquisición de Mosaic ML por parte de Databricks en un acuerdo valorado en $1.3 mil millones destacó su significativo impacto en el mercado y su propuesta de valor.

#4. Anthropic

El producto insignia de Anthropic, Claude, funciona con dos modelos: Claude y Claude Instant. 

Claude es el modelo más potente de Anthropic que sobresale en una variedad de tareas, desde diálogos sofisticados y generación creativa de contenido hasta instrucciones detalladas. Funciona bien en escenarios que requieren razonamiento complejo, creatividad, diálogos reflexivos, codificación y creación detallada de contenido. 

Claude Instant, la versión más rápida y económica de Claude, ayuda con diálogos casuales, análisis de texto, resumido y comprensión de documentos. Funciona bien donde se requiere rendimiento a bajo costo. Realiza su trabajo con latencia reducida. 

En general, Claude es adecuado para procesar grandes volúmenes de texto, mantener conversaciones naturales, obtener respuestas y automatizar flujos de trabajo. Desde servicio al cliente hasta legal, coaching, búsqueda y tareas de back‑office, Claude es apropiado para una variedad de escenarios de uso. 

Según los informes publicados a finales de diciembre de 2023, Anthropic, visto como el rival de OpenAI, estaba en conversaciones para recaudar US$750 millones en financiación con una valoración de US$18.4 mil millones. 

#5. Humata

Con Humata, se puede avanzar rápidamente a través de extensos documentos técnicos. La IA PDF de Humata ayuda a resumir hallazgos, comparar documentos y buscar respuestas. Es compatible con archivos ilimitados cargados sin límite de tamaño. Sus respuestas de IA documental incluyen citas para que se pueda rastrear el origen del insight.

Dado que es similar a ChatGPT para PDFs, puede reescribir el resumen hasta lograr la satisfacción. Sin embargo, a diferencia de ChatGPT, Humata puede trabajar con archivos, leer cada archivo que se sube y generar respuestas basadas en el contenido de los documentos. 

El 2 de octubre de 2023, Humata AI anunció la finalización exitosa de su última ronda de financiación, en la que recaudó US$3.5M de Gradient Ventures de Google, ARK Invest de Cathie Wood, M13 y otros ángeles destacados para su ronda semilla. 

#6. OpenAI

Finalmente, ninguna discusión sobre IA, su aprendizaje LLM y sus funciones de creación de contenido puede estar completa sin mencionar a OpenAI, la empresa que ha sido la más conocida por construir modelos generativos usando una tecnología llamada aprendizaje profundo que aprovecha un gran volumen de datos para entrenar sistemas de IA. 

OpenAI cuenta con servicios de Chat, Imagen y Audio. Su GPT-3, un modelo de lenguaje autorregresivo, ha sido entrenado con 175 mil millones de parámetros. Sin embargo, ha entrenado modelos de lenguaje que son incluso mejores que GPT-3 al seguir las intenciones del usuario. 

Entre los productos relacionados con imágenes, la investigación de OpenAI sobre modelado generativo de imágenes ha dado lugar a modelos de representación como CLIP, que crea un mapa entre texto e imágenes para que la IA lo lea, y DALL‑E, una herramienta para crear imágenes vívidas a partir de descripciones de texto. 

Finalmente, ha realizado avances en el campo del audio con Whisper, Jukebox y Musenet. Whisper ofrece robustas capacidades de reconocimiento de voz en inglés, mientras que Jukebox ayuda a generar música en una variedad de géneros y estilos de artistas. MuseNet es una red neuronal profunda que puede generar composiciones musicales completas con una variedad de instrumentos. 

Según los informes publicados a finales de diciembre de 2023, OpenAI estaba en conversaciones iniciales para recaudar una nueva ronda de financiación con una valoración de US$100 mil millones o más.

Más Allá de la Meseta: El Camino por Delante 

La Inteligencia Artificial ha ayudado a que la generación de contenido avance millones de millas en un período muy corto. El futuro será más brillante y próspero, donde los sistemas computacionales y el software que crecen con los datos resolverán problemas intratables. 

Los sectores económicos de todo tipo podrán aprovechar mejor la tecnología al automatizar todo tipo de trabajo de conocimiento que es repetitivo y consume tiempo. Mientras modelos como GPT‑4 impulsarán la productividad, los modelos de IA de código abierto conducirán a una reducción drástica de los costos operativos y a una eficiencia radicalmente mejorada. Los investigadores estiman no solo la evitación de una meseta tecnológica, sino también la cuadruplicación de la productividad de los trabajadores del conocimiento para 2030. 

Esto subraya la importancia de los Modelos de Lenguaje Grande en el ecosistema tecnológico, habiendo jugado un papel crucial en todo esto. Ayudó a productos como ChatGPT a consolidar la comprensión pública de la IA mientras les permite ofrecer una interfaz de chat simple que cualquier persona que hable cualquier idioma puede utilizar en su beneficio.

Haga clic aquí para aprender todo sobre la inversión en inteligencia artificial (IA). 

Gaurav comenzó a operar con criptomonedas en 2017 y se enamoró del espacio cripto desde entonces. Su interés en todo lo relacionado con criptomonedas lo convirtió en un escritor especializado en criptomonedas y blockchain. Pronto se encontró trabajando con empresas de criptomonedas y medios de comunicación. También es un gran fanático de Batman.