¿La inteligencia artificial de código abierto de China acabará con la supremacía estadounidense en este campo?
Con la llegada de DeepSeek, el equilibrio de poder entre las dos naciones parece estar cambiando


Por Eric Schmidty
Dhaval Adjodah
Eric Schmidt, exdirector ejecutivo y presidente de Google, es cofundador de Schmidt Sciences y presidente del grupo de expertos no partidista Special Competitive Studies Project. Dhaval Adjodah es cofundador y director ejecutivo de MakerMaker.AI.
Se ha convertido casi en un cliché decir que el panorama de la IA está cambiando rápidamente. Pero en los últimos días, incluso quienes están a la vanguardia de la investigación en IA se vieron sorprendidos por una empresa china.
Entérate de las últimas noticias y debates con nuestro boletín diario

La semana pasada, la empresa de inteligencia artificial DeepSeek lanzó su modelo de razonamiento R1 , que está a la par con el o1 de OpenAI (y es mucho mejor que los modelos ChatGPT) en una variedad de tareas lógicas, incluidas las matemáticas y la codificación. El costo de ejecutarlo también es mucho menor, solo alrededor del 2 por ciento de lo que cobra OpenAI. Y el lunes, DeepSeek lanzó Janus Pro , un modelo lo suficientemente pequeño como para ejecutarse en su computadora portátil que puede generar imágenes sintéticas, que, según afirma, superan al Dall⋅E 3 de OpenAI. La velocidad de innovación de la IA de DeepSeek está arrasando en todo el mundo.
Lo que es aún más destacable es que toda la colección de modelos de DeepSeek es de código abierto, lo que en este caso significa que tienen pesos abiertos que cualquiera puede reproducir y construir sobre ellos.🎤
Sigue las opiniones sobre las noticiasSeguir
Es un momento peculiar cuando una empresa china se convierte en el líder de facto del código abierto, mientras que la mayoría de las grandes firmas estadounidenses, con excepción de Meta, siguen manteniendo sus metodologías en secreto. De hecho, se trata de una tendencia creciente entre las empresas chinas de IA (desde empresas emergentes como Minimax hasta gigantes tecnológicos como Alibaba) que están dando a los desarrolladores de todo el mundo acceso gratuito a sus modelos de IA.
Hasta ahora, los modelos de código cerrado como el o3 de OpenAI y el Claude 3 Opus de Anthropic se consideraban los estándares de la industria con las capacidades más avanzadas, y se creaban en Estados Unidos. Se pensaba que los modelos de código abierto y chinos estaban a meses de distancia. Pero el R1 y el Janus Pro de DeepSeek muestran cuán rápido pueden cambiar las mareas de la supremacía tecnológica. La introducción de estos modelos ha sacudido los mercados bursátiles y ha provocado el desplome de las acciones tecnológicas estadounidenses . El equilibrio de poder ahora parece estar cambiando a lo largo de dos ejes clave: uno entre Estados Unidos y China, y otro entre los modelos de código cerrado y abierto.
Los defensores de los modelos de código cerrado apuestan a que pueden preservar su brecha de capacidad protegiendo los pesos de sus modelos y las metodologías de entrenamiento. Los defensores del código abierto, por otro lado, sostienen que la transparencia (permitir que otros desarrollen su trabajo) puede permitir que estos sistemas se pongan rápidamente al nivel de modelos más grandes y cerrados. Si la tesis del código abierto es correcta, esto pondría patas arriba el ecosistema de la IA. Los modelos de código abierto suelen ser más baratos de usar, por lo que cuando hay dos modelos igualmente capaces (uno abierto y otro cerrado), es probable que el modelo de código abierto gane una adopción más amplia, lo que le otorga una ventaja estratégica.
Estados Unidos ya cuenta con los mejores modelos cerrados del mundo. Para seguir siendo competitivos, también debemos apoyar el desarrollo de un ecosistema dinámico de código abierto.
La carrera entre la IA de código abierto y la de código cerrado, así como entre Estados Unidos y China, aún no tiene un ganador claro. Pero es evidente que las grandes tecnológicas estadounidenses se ven sometidas a una presión cada vez mayor si DeepSeek puede competir con ellas utilizando muchos menos recursos. Los controles a las exportaciones tenían por objeto impedir el acceso de China a los chips informáticos más avanzados, impidiéndole así seguir el ritmo. Pero, de hecho, la relativa escasez de chips de alto rendimiento en China podría haber empujado a las empresas y a los investigadores del país a ser más eficientes y a descubrir nuevas metodologías que reducen significativamente los costes de formación. Por ejemplo, DeepSeek demostró que el entrenamiento de modelos grandes podía hacerse más eficiente si se pasaba por alto la tradicional etapa de ajuste fino supervisado. Incluso crearon R1-Zero, un modelo que omite este paso en el entrenamiento de la IA, para desafiar las suposiciones de la comunidad investigadora sobre la indispensabilidad del ajuste fino.
El éxito de DeepSeek también ha puesto en tela de juicio la importancia del preentrenamiento, que implica entrenar modelos cada vez más grandes que predicen la siguiente palabra basándose en grandes cantidades de texto. Este proceso requiere una enorme inversión inicial en unidades de procesamiento gráfico (GPU) y datos, tantos que el cofundador de OpenAI, Ilya Sutskever, señaló recientemente que pronto podríamos agotar todos los datos disponibles en Internet.Opiniones sobre IAPróximo
Hablé con el personaje de IA de Meta, Black. Esto es lo que me dijo.
Al borde de un futuro de IA inimaginable
La colaboración con empresas de inteligencia artificial es justo lo que necesitan los militares
Este año, agradecemos la IA en la medicina
Alguna esperanza para el futuro de la IA
La IA es una amenaza existencial para las universidades. ¿Pueden adaptarse?
Lo que Taylor Swift acaba de enseñarle a JD Vance y Donald Trump
‘Me sorprendió’: Oprah habla de su nuevo especial sobre inteligencia artificial con Sam Altman
El potencial de la fusión nuclear para salvar el mundo acaba de recibir un enorme impulso
¿Quién controlará el futuro de la IA?
¿Cómo cambiará tu teléfono la nueva IA de Apple? Le pregunté a Tim Cook.
Apple acaba de presentar la primera teoría racional de IA para las masas
La IA transformará las apuestas deportivas. También aumentará los riesgos.
El enfrentamiento de Scarlett Johansson en ChatGPT confirma nuestros temores sobre la IA
La IA está llegando a la clase profesional. Habrá indignación y miedo.
Cómo la IA podría transformar el béisbol para siempre
La IA podría ayudar a acabar con el predominio de las clases acreditadas
Pero hay otra forma emergente de mejorar el rendimiento de los modelos. Introducido con el modelo o1 de OpenAI en diciembre, este enfoque permite a los modelos realizar razonamientos a través de la autorreflexión, de manera similar a cómo razonan los humanos, utilizando pasos intermedios y autocorrección para llegar a una respuesta final. La receta de entrenamiento para este enfoque había sido previamente guardada celosamente por OpenAI. DeepSeek lo reveló al publicar un artículo que detalla cómo funciona, lo que permite a otros implementar el proceso.
DeepSeek incluso demostró que se puede hacer esto de manera mucho más rentable tomando un modelo base disponible públicamente como Llama 3 de Meta y enseñándole a razonar mediante aprendizaje de refuerzo, un proceso de prueba y error con retroalimentación y recompensas ideadas por humanos. Con el tiempo, los modelos parecen aprender espontáneamente a razonar, dar marcha atrás cuando llegan a un callejón sin salida y explorar enfoques novedosos. Este método elimina la necesidad de entrenar previamente y de manera costosa un nuevo modelo base, y sus implicaciones para la innovación en IA son profundas. Tradicionalmente, incluso los laboratorios universitarios mejor financiados han tenido dificultades para contribuir a la investigación en IA debido a las limitaciones de computación y datos. Con el avance de DeepSeek, el foso que rodea a las grandes empresas bien financiadas podría estar reduciéndose.
Es poco probable que las empresas estadounidenses que siguen el modelo de frontera cambien sus modelos de negocio en el futuro cercano, ni tampoco está claro de inmediato que deban hacerlo. Lo más probable es que la competencia abierta y cerrada encuentre un equilibrio natural, con una gama de ofertas y niveles de precios diferentes para distintos usuarios.
Pero el lanzamiento de DeepSeek marca un punto de inflexión.
El camino a seguir para la innovación estadounidense no implica solo acelerar el desarrollo de código abierto, sino también alentar el intercambio de metodologías de capacitación y aumentar la inversión en investigación y desarrollo de IA, ejemplificado por el reciente anuncio de la Casa Blanca del Proyecto Stargate , que apunta a gastar 500 mil millones de dólares en infraestructura de IA durante los próximos cuatro años.
La ventaja competitiva de Estados Unidos se ha basado durante mucho tiempo en la ciencia abierta y la colaboración entre la industria, el mundo académico y el gobierno. Deberíamos aceptar la posibilidad de que la ciencia abierta pueda volver a impulsar el dinamismo estadounidense en la era de la IA.
Acerca de las opiniones de los invitados
The Washington Post acepta artículos de opinión sobre cualquier tema. Aceptamos envíos sobre temas locales, nacionales e internacionales. Publicamos trabajos que varían en extensión y formato, incluidos los multimedia. Envíe una opinión como invitado o lea nuestra guía para escribir un artículo de opinión .
Post Opinions también se nutre de un diálogo animado. Si tiene alguna opinión sobre este artículo o sobre cualquier artículo publicado por The Post, envíe una carta al editor .
Descubre más desde Nueva Pensamiento Crítico
Suscríbete y recibe las últimas entradas en tu correo electrónico.

































