Mythos de Anthropic: entre la promesa defensiva y la alarma nacional

Por qué la nueva generación de modelos de IA de Anthropic obliga a la Casa Blanca, reguladores y empresas a repensar seguridad, defensa y gobernanza tecnológica

La presentación de Mythos por Anthropic ha desatado una mezcla de asombro técnico, alarma en materia de ciberseguridad y tensiones políticas que ilustran el momento crítico en el que está la gobernanza de la inteligencia artificial. El anuncio del nuevo modelo —denominado Mythos y descrito por la misma compañía como “sorprendentemente capaz” para encontrar y explotar vulnerabilidades informáticas— ha provocado que la Casa Blanca programe reuniones de alto nivel con la empresa, y ha reavivado debates sobre control, uso militar y riesgos sistémicos.

Un modelo que cambia las reglas del juego

Anthropic, con sede en San Francisco, dijo al anunciar Mythos que el sistema puede superar a expertos humanos en tareas de ciberseguridad, lo que llevó a la compañía a restringir su despliegue inicial a clientes seleccionados. En el comunicado y en presentaciones públicas, Anthropic justificó esa limitación argumentando un principio de prudencia: sistemas con capacidades ofensivas para encontrar fallos y construir exploits deben ser desplegados con controles y con socios que puedan mitigar riesgos.

Ese planteamiento conecta con una doble realidad técnica: por un lado, los modelos de lenguaje y código evolucionan rápidamente y mejoran en tareas de ingeniería inversa, búsqueda de bugs y automatización de cadenas de explotación; por otro, esa misma mejora facilita la aparición de herramientas que agentes maliciosos podrían usar para acelerar ataques cibernéticos a escala.

La reacción de la Casa Blanca y el pulso político

La magnitud de la novedad llevó a la Casa Blanca a organizar un encuentro entre Susie Wiles, jefa de gabinete, y Dario Amodei, CEO de Anthropic, con el objetivo de entender las capacidades de Mythos y su implicación para la seguridad nacional y la economía. Un funcionario de la Casa Blanca señaló que la administración está en diálogo con laboratorios avanzados de IA para evaluar modelos y la seguridad del software, y que cualquier tecnología que pueda ser usada por el gobierno requiere un período técnico de evaluación.

El episodio se enmarca además en una confrontación previa entre Anthropic y la administración: a principios de año, el entonces presidente Donald Trump intentó bloquear que las agencias federales usaran el chatbot de Anthropic, Claude, en medio de una disputa contractual con el Pentágono; posteriormente, un juez federal bloqueó la directiva de la Casa Blanca que ordenaba detener el uso de productos de Anthropic (fallos judiciales relacionados).

Preocupaciones del Pentágono y la etiqueta de “riesgo de la cadena de suministro”

El conflicto escaló cuando el entonces secretario de Defensa, Pete Hegseth, intentó declarar a Anthropic como un riesgo en la cadena de suministro —una medida sin precedentes contra una empresa estadounidense— debido a condiciones contractuales con el Departamento de Defensa. Anthropic respondió buscando garantías de que su tecnología no sería utilizada para desarrollar armas totalmente autónomas ni para la vigilancia masiva de ciudadanos estadounidenses; el Pentágono, por su parte, pidió que las empresas permitan usos que el departamento considere legales.

Este choque plantea una pregunta central: ¿cómo conciliar la necesidad del Estado de disponer de tecnologías avanzadas con las garantías éticas y de seguridad que exigen las propias empresas y amplios sectores de la sociedad?

Expertos opinan: ¿marketing o verdad técnica?

La propia presentación de Anthropic suscitó dudas: algunos la interpretaron como un movimiento estratégico de mercado para atraer atención y clientes. Sin embargo, voces críticas y escépticas han reconocido que el avance técnico podría ser real. David Sacks, exfuncionario de la Casa Blanca y crítico influyente de Anthropic, afirmó en el podcast All-In que “hay que tomar esto en serio” y que, en el campo de la ciberseguridad, la lógica de que modelos de programación más capaces encuentran más bugs y vulnerabilidades es convincente. En sus palabras: “Con el ciber, en este caso yo les daría crédito; esto es más del lado de lo real” (All-In podcast).

Ese aval crítico resuena porque confirma una intuición técnica compartida por especialistas: los modelos que generan o analizan código progresan con rapidez y pueden automatizar pasos que antes requerían experiencia humana significativa, reduciendo el tiempo para identificar vectores de ataque.

Evaluaciones externas y la voz del Reino Unido y la UE

El interés internacional no se hizo esperar. El AI Security Institute del Reino Unido revisó el modelo y lo consideró “un paso adelante” respecto a modelos previos, advirtiendo que Mythos Preview puede explotar sistemas con posturas de seguridad débiles y que es probable que aparezcan más sistemas con estas capacidades. El informe del instituto subraya que la comunidad técnica y regulatoria debe anticipar y planear mitigaciones (AI Security Institute).

Al mismo tiempo, la Comisión Europea ha mantenido conversaciones con Anthropic sobre sus modelos y su despliegue en Europa, lo que evidencia la dimensión transnacional del debate y la intención de reguladores de entender y, eventualmente, condicionar el acceso de Estados y empresas a modelos avanzados.

Project Glasswing: cooperación entre gigantes tecnológicos

Para afrontar los riesgos que detectó, Anthropic anunció Project Glasswing, una iniciativa que busca reunir a empresas tecnológicas —entre ellas Amazon, Apple, Google y Microsoft— y actores financieros como JPMorgan Chase para “proteger el software crítico mundial” frente al posible impacto severo de modelos potentes. Jack Clark, cofundador y director de políticas de Anthropic, explicó en la conferencia Semafor World Economy que la compañía está distribuyendo el acceso a Mythos a un subconjunto de organizaciones muy relevantes para que puedan usarlo para encontrar vulnerabilidades y reforzar defensas. Clark también advirtió que modelos similares aparecerán pronto de otras compañías y, en un plazo de meses a año y medio, podrían surgir versiones de código abierto o procedentes de China con capacidades comparables (Semafor).

La iniciativa refleja una apuesta por la colaboración privada para mitigar el riesgo: si las principales empresas y clientes críticos usan Mythos para endurecer sistemas, se crea una primera barrera defensiva; no obstante, la medida no elimina la posibilidad de que agentes malintencionados desarrollen o accedan a herramientas equivalentes.

Implicaciones para gobernanza, seguridad y mercado

Seguridad nacional: Estados y fuerzas armadas desean asegurar el acceso a tecnologías de punta, pero también temen la dependencia de proveedores que puedan condicionar su uso. El intento del gobierno estadounidense de bloquear o condicionar contratos con Anthropic ilustra este dilema.
Ética y control: Las empresas tecnológicas, conscientes de los riesgos, buscan mecanismos de gobernanza para limitar usos abusivos (por ejemplo, prohibir su uso en armas autónomas). Pero el alcance de esas restricciones frente a exigencias estatales sigue siendo objeto de disputa.
Mercado y competencia: Si Mythos realmente ofrece capacidades sustanciales, podría acelerar inversiones y carreras entre competidores, lo que a su vez obliga a reguladores a actuar con mayor rapidez para imponer salvaguardas.
Riesgo sistémico: La difusión de herramientas ofensivas automatizadas puede reducir la ventana de respuesta ante vulnerabilidades, aumentando la probabilidad de ataques coordinados y la necesidad de defensas automatizadas igualmente potentes.

¿Qué deben hacer los gobiernos y las empresas?

Las respuestas prácticas requieren una combinación de acciones:

Evaluaciones técnicas rigurosas: antes de autorizar el uso gubernamental, los modelos deben someterse a pruebas independientes de seguridad y robustez, incluyendo ejercicios de red-teaming con equipos adversariales.
Normas de transparencia y trazabilidad: las empresas deben documentar capacidades, límites, datos de entrenamiento relevantes y prácticas de mitigación, sin revelar información que facilite abusos.
Mecanismos contractuales y regulatorios: definir límites de uso para fines militares o de vigilancia, cláusulas de seguridad en contratos públicos y marcos internacionales para evitar brechas regulatorias entre jurisdicciones.
Cooperación público-privada: iniciativas como Project Glasswing pueden ser complementadas con centros gubernamentales de respuesta y protocolos de intercambio de inteligencia y vulnerabilidades.
Preparación del mercado laboral y ciberdefensa: invertir en capacitación para que equipos de seguridad puedan integrar modelos defensivos y gestionar riesgos emergentes.

Reflexión final

Mythos pone en evidencia que la modernización de la IA deja de ser una cuestión técnica aislada para convertirse en un asunto de interés público estratégico: la velocidad de la innovación supera a menudo la capacidad de las instituciones para adaptarse. La discusión en torno a Anthropic muestra que, ante modelos con potencial tanto defensivo como ofensivo, la única ruta viable es una gobernanza proactiva, multiactor y basada en evidencia técnica.

Como dijo un crítico reconociendo la seriedad del avance: “Anytime Anthropic is scaring people, you have to ask, ‘Is this a tactic? … Or is it real?’” —y en el caso de ciberseguridad, muchos expertos responden que el riesgo es real y exige respuestas coordinadas (All-In podcast).

Fuentes citadas: Anthropic (anuncios públicos y presentaciones), All-In podcast (declaraciones de David Sacks), reporte del AI Security Institute del Reino Unido, cobertura de Semafor sobre declaraciones de Jack Clark y comunicación de la Casa Blanca sobre reuniones con laboratorios de IA.

Este artículo fue redactado con información de Associated Press