La semana pasada, la Bolsa de Valores de NASDAQ, que enumera las significativas acciones tecnológicas estadounidenses, experimentó una gran caída. Esto resultó de la startup china Deepseek anunciando que había desarrollado un modelo de inteligencia artificial que realiza, así como la tecnología de IA de Openai y Meta, pero a una fracción del costo y con menos potencia informática.
Diseñador de chips de IA Nvidia perdió casi $ 600 mil millones de su capitalización de mercado (el valor total en dólares de sus acciones en circulación de acciones), la mayor caída de un solo día experimentada por una empresa en la historia del mercado estadounidense. Aunque el precio de las acciones de NVIDIA ha recuperado algo de terreno, los analistas continúan dudando en los planes ambiciosos de infraestructura de IA, incluidos los chips de unidad de procesamiento de gráficos especializados de la compañía, así como centros de datos masivos como los construidos y operados por Amazon.
Los creadores de Deepseek afirman haber encontrado una mejor manera de capacitar a su IA utilizando piezas especiales, mejorando cómo la IA aprende reglas y desplegando una estrategia para mantener la IA funcionando sin problemas sin desperdiciar recursos. Según la compañía informeestas innovaciones redujeron drásticamente la potencia informática necesaria para desarrollar y ejecutar el modelo y, por lo tanto, el costo asociado con chips y servidores. Esta fuerte reducción de costos ya ha atraído a desarrolladores de IA más pequeños que buscan una alternativa más barata a los laboratorios de IA de alto perfil.
A primera vista, la reducción de los gastos de entrenamiento de modelos de esta manera puede parecer socavar la «carrera armamentista de IA» billonaria que involucra centros de datos, semiconductores e infraestructura en la nube. Pero como muestra la historia, la tecnología más barata a menudo alimenta un mayor uso. En lugar de amortiguar los gastos de capital, los avances que hacen que la IA sea más accesible puede desatar una ola de nuevos adoptantes, incluidas no solo las nuevas empresas tecnológicas sino también las empresas de fabricación tradicionales y los proveedores de servicios, como los hospitales y el comercio minorista.
La directora ejecutiva de Microsoft, Satya Nadella, llamó a este fenómeno un «Paradoja de Jevons«Para AI. Atribuido al economista inglés del siglo XIX William Stanley Jevons, el concepto describe cómo hacer una tecnología más eficiente puede aumentar en lugar de disminuir el consumo. El vapor y la potencia eléctrica siguieron este patrón: una vez que se volvieron más eficientes y asequibles, se extendieron a más fábricas, oficinas y hogares, en última instancia, aumentando el uso.
Nadella tiene razón: los costos de desarrollo de picado de hoy para la IA generativa están listos para generar una expansión similar. Eso significa que el cielo no está cayendo en las grandes empresas tecnológicas que suministran infraestructura y servicios de IA. Los principales jugadores tecnológicos son proyectado para invertir más de $ 1 billón en infraestructura de IA para 2029y el desarrollo de Deepseek probablemente no cambiará tanto sus planes.
Si bien los costos de capacitación pueden disminuir, los requisitos de hardware a largo plazo para cargas de trabajo masivas de aprendizaje automático, el procesamiento de datos y el software de IA especializado siguen siendo enormes. Aunque los precios de los chips pueden caer a medida que la capacitación modelo se vuelve más eficiente, las aplicaciones basadas en la inteligencia artificial, como los chatbots generativos y los controles industriales automatizados, exigen servidores potentes, redes de alta velocidad para transmitir flujos de datos masivos y centros de datos confiables para manejar miles de millones de tiempo real. consultas. Las demandas regulatorias, de seguridad y cumplimiento complican aún más la implementación, que requieren soluciones avanzadas, a veces costosas, que pueden almacenar y procesar datos de manera responsable.
Las tecnologías de uso general que transforman las economías generalmente se propagan en dos etapas. Primero, durante un largo período de gestación, las organizaciones bien financiadas experimentan, refinando prototipos y procesos. Más tarde, una vez que surgen los estándares y las soluciones listas para usar, las empresas más cautelosas intervienen. En el caso de la electricidad, la primera etapa vio fábricas que pasaban años reorganizando los pisos de producción y adoptando nuevos flujos de trabajo antes de la electrificación extendida ampliamente; En el caso de la IA, ha consistido en grandes bancos, minoristas y fabricantes que hacen un uso lento y por parte de la tecnología.
Hace un siglo y medio, cuando el proceso de Bessemer introdujo el uso de aire caliente para explotar impurezas de hierro fundido y molinos descubrió cómo producir productos de acero estandarizados, los fabricantes giraron. Los precios del acero se desplomaron y el consumo se disparó, y finalmente aumentó el gasto en ese sector a pesar del uso más eficiente del mineral de hierro.
Ahora que Deepseek y otras innovaciones prometen costos más bajos, más empresas pueden estar listas para adoptar o al menos probar la IA, y es probable que la demanda de infraestructura de IA aumente. Un modelo más asequible y de vanguardia también podría alentar a las industrias, nuevas empresas y empresarios a usar la IA más ampliamente, aumentando su adopción en logística, servicio al cliente y más.
Imagine, por ejemplo, un bufete de abogados de 200 personas especializado en bienes raíces comerciales. Inicialmente, utiliza ChatGPT a veces para producir resúmenes de contratos rápidos, pero sus socios se inquietan con la calidad inconsistente y los riesgos de confidencialidad. Después de probar un modelo centrado en los contratos proporcionado por un proveedor de buena reputación, la empresa adopta tecnología que se integra directamente con su sistema de gestión de documentos. Esto permite que los abogados asociados se sumerezcan automáticamente cientos de páginas en segundos, confíen en «sugerencias de cláusula» de IA adaptadas a precedentes de bienes raíces y limitan la necesidad de buscar orientación de socios superiores a casos de lenguaje especialmente ambiguo o de alto nivel. Además, el diseño del sistema evita que los datos del cliente dejen el dominio de la empresa, aumentando la seguridad.
Con el tiempo, la empresa agrega módulos de IA para la investigación de litigios avanzados y las notas de facturación automatizadas, reduciendo constantemente tareas administrativas y permitiendo que los expertos humanos se centren en una visión legal estratégica. Ve un cambio de contrato más rápido, una facturación estandarizada y una nueva disposición entre los socios para explorar herramientas basadas en IA en otras áreas.
En resumen, las demandas de capital de la IA no se reducirán gracias a Deepseek; Se distribuirán más ampliamente. Veremos esta expansión de estímulo en redes eléctricas, sistemas de enfriamiento, centros de datos, tuberías de software e infraestructura que permite que más dispositivos usen IA, incluidos robots y automóviles sin conductor. El impulso de infraestructura billón de dólares puede persistir en los años venideros.
Victor Menaldo es profesor de ciencias políticas en la Universidad de Washington y está escribiendo un libro sobre La economía política de la Cuarta Revolución Industrial.