¿La inteligencia artificial de código abierto de China acabará con la supremacía estadounidense en este campo?

por Nueva Pensamiento Crítico · 28 de enero de 2025

Con la llegada de DeepSeek, el equilibrio de poder entre las dos naciones parece estar cambiando

Una ilustración fotográfica muestra la aplicación DeepSeek en un teléfono móvil en Pekín el lunes. (Greg Baker/AFP/Getty Images)

Por Eric Schmidty

Dhaval Adjodah

Eric Schmidt, exdirector ejecutivo y presidente de Google, es cofundador de Schmidt Sciences y presidente del grupo de expertos no partidista Special Competitive Studies Project. Dhaval Adjodah es cofundador y director ejecutivo de MakerMaker.AI.

Se ha convertido casi en un cliché decir que el panorama de la IA está cambiando rápidamente. Pero en los últimos días, incluso quienes están a la vanguardia de la investigación en IA se vieron sorprendidos por una empresa china.

Entérate de las últimas noticias y debates con nuestro boletín diario

La semana pasada, la empresa de inteligencia artificial DeepSeek lanzó su modelo de razonamiento R1 , que está a la par con el o1 de OpenAI (y es mucho mejor que los modelos ChatGPT) en una variedad de tareas lógicas, incluidas las matemáticas y la codificación. El costo de ejecutarlo también es mucho menor, solo alrededor del 2 por ciento de lo que cobra OpenAI. Y el lunes, DeepSeek lanzó Janus Pro , un modelo lo suficientemente pequeño como para ejecutarse en su computadora portátil que puede generar imágenes sintéticas, que, según afirma, superan al Dall⋅E 3 de OpenAI. La velocidad de innovación de la IA de DeepSeek está arrasando en todo el mundo.

Lo que es aún más destacable es que toda la colección de modelos de DeepSeek es de código abierto, lo que en este caso significa que tienen pesos abiertos que cualquiera puede reproducir y construir sobre ellos.🎤

Sigue las opiniones sobre las noticiasSeguir

Es un momento peculiar cuando una empresa china se convierte en el líder de facto del código abierto, mientras que la mayoría de las grandes firmas estadounidenses, con excepción de Meta, siguen manteniendo sus metodologías en secreto. De hecho, se trata de una tendencia creciente entre las empresas chinas de IA (desde empresas emergentes como Minimax hasta gigantes tecnológicos como Alibaba) que están dando a los desarrolladores de todo el mundo acceso gratuito a sus modelos de IA.

Hasta ahora, los modelos de código cerrado como el o3 de OpenAI y el Claude 3 Opus de Anthropic se consideraban los estándares de la industria con las capacidades más avanzadas, y se creaban en Estados Unidos. Se pensaba que los modelos de código abierto y chinos estaban a meses de distancia. Pero el R1 y el Janus Pro de DeepSeek muestran cuán rápido pueden cambiar las mareas de la supremacía tecnológica. La introducción de estos modelos ha sacudido los mercados bursátiles y ha provocado el desplome de las acciones tecnológicas estadounidenses . El equilibrio de poder ahora parece estar cambiando a lo largo de dos ejes clave: uno entre Estados Unidos y China, y otro entre los modelos de código cerrado y abierto.

Los defensores de los modelos de código cerrado apuestan a que pueden preservar su brecha de capacidad protegiendo los pesos de sus modelos y las metodologías de entrenamiento. Los defensores del código abierto, por otro lado, sostienen que la transparencia (permitir que otros desarrollen su trabajo) puede permitir que estos sistemas se pongan rápidamente al nivel de modelos más grandes y cerrados. Si la tesis del código abierto es correcta, esto pondría patas arriba el ecosistema de la IA. Los modelos de código abierto suelen ser más baratos de usar, por lo que cuando hay dos modelos igualmente capaces (uno abierto y otro cerrado), es probable que el modelo de código abierto gane una adopción más amplia, lo que le otorga una ventaja estratégica.

Estados Unidos ya cuenta con los mejores modelos cerrados del mundo. Para seguir siendo competitivos, también debemos apoyar el desarrollo de un ecosistema dinámico de código abierto.

La carrera entre la IA de código abierto y la de código cerrado, así como entre Estados Unidos y China, aún no tiene un ganador claro. Pero es evidente que las grandes tecnológicas estadounidenses se ven sometidas a una presión cada vez mayor si DeepSeek puede competir con ellas utilizando muchos menos recursos. Los controles a las exportaciones tenían por objeto impedir el acceso de China a los chips informáticos más avanzados, impidiéndole así seguir el ritmo. Pero, de hecho, la relativa escasez de chips de alto rendimiento en China podría haber empujado a las empresas y a los investigadores del país a ser más eficientes y a descubrir nuevas metodologías que reducen significativamente los costes de formación. Por ejemplo, DeepSeek demostró que el entrenamiento de modelos grandes podía hacerse más eficiente si se pasaba por alto la tradicional etapa de ajuste fino supervisado. Incluso crearon R1-Zero, un modelo que omite este paso en el entrenamiento de la IA, para desafiar las suposiciones de la comunidad investigadora sobre la indispensabilidad del ajuste fino.

El éxito de DeepSeek también ha puesto en tela de juicio la importancia del preentrenamiento, que implica entrenar modelos cada vez más grandes que predicen la siguiente palabra basándose en grandes cantidades de texto. Este proceso requiere una enorme inversión inicial en unidades de procesamiento gráfico (GPU) y datos, tantos que el cofundador de OpenAI, Ilya Sutskever, señaló recientemente que pronto podríamos agotar todos los datos disponibles en Internet.Opiniones sobre IAPróximo

¿La inteligencia artificial de código abierto de China acabará con la supremacía estadounidense en este campo?

Con la llegada de DeepSeek, el equilibrio de poder entre las dos naciones parece estar cambiando

Acerca de las opiniones de los invitados

Comparte esto:

Me gusta esto:

Relacionado

Descubre más desde Nueva Pensamiento Crítico

Deja un comentarioCancelar respuesta

Descubre más desde Nueva Pensamiento Crítico

Descubre más desde Nueva Pensamiento Crítico