La caída de AWS paralizó apps, aerolíneas y bancos en todo el mundo. Descubre qué pasó y por qué la nube nos hace tan dependientes.
Qué es AWS y por qué su caída afectó a todo el mundo
Qué es AWS y cómo su caída afectó al mundo | Los Bonobos

Qué es AWS y por qué su caída afectó a todo el mundo

La nube que nos sostiene… y nos suelta: así se cayó medio Internet. Un error en la región más crítica de Amazon encadenó fallas globales en apps, bancos, aerolíneas y plataformas de IA. Hubo recuperación progresiva, pero la dependencia quedó expuesta.

Qué pasó y dónde se rompió

La cadena empezó con “índices de error” inusuales en la región US-EAST-1, confirmados por la página de estado de Amazon. A las 9:11 (hora de Madrid) se detectaron anomalías; a las 10:26 se reiteró el diagnóstico. La primera pista técnica apuntó a la resolución de DNS en la API de DynamoDB, con efectos cascada en otros 71 servicios de la misma región. Más tarde, Amazon acotó otro frente: un subsistema interno de monitoreo de carga en EC2 falló, forzando a limitar la creación de nuevas instancias mientras mitigaban. La vía corta: si el “mapa” que traduce nombres a direcciones —el DNS— se tuerce, las apps no encuentran su servidor; si EC2 pierde telemetría, los cimientos tiemblan.

via GIPHY

“Recomendamos que los clientes reintenten su petición ante los fallos”, publicó Amazon en su tablero.

Hacia el mediodía, los mensajes hablaban de “signos de recuperación”. Ya por la tarde, el parte fue más optimista: “Seguimos observando la recuperación en todos los servicios de AWS”, con una salvedad técnica: Lambda regresaba aún con errores.

Quiénes cayeron y cómo se sintió

La lista fue amplia y, según DownDetector, planetaria. Entre los servicios afectados: Fortnite, Canva, ChatGPT, Perplexity, Snapchat, Alexa y tiendas de Amazon. En América Latina, el golpe se sintió en financieros y pagos. “Mercado Libre y Mercado Pago reconocen que hubo una inestabilidad en sus aplicaciones, provocada por una falla generalizada y extendida en el sistema de AWS”, comunicó la empresa.

Plataformas cripto y de inversión también acusaron recibo. Coinbase y Robinhood reportaron interrupciones asociadas a la caída. El CEO de Perplexity, Aravind Srinivas, fue directo: “Perplexity no funciona en este momento. La causa raíz es un problema en AWS”.

Los entornos de trabajo tampoco estaban a salvo. Las páginas de estado de Atlassian y Docker marcaron “incidentes activos”. En palabras llanas: tareas demoradas, tickets atrapados, despliegues en pausa. No todos los usuarios vivieron lo mismo al mismo tiempo: según dónde aterrizaban sus solicitudes —y qué rutas de red y centros de datos tocaban— el comportamiento fue irregular. Una lotería que recuerda que Internet es tanto nube como trayecto.

El tamaño del apagón, en números

Los reportes se contaron por millones. DownDetector (Ookla) informó 6,5 millones de avisos globales en el transcurso del evento. Por regiones, la ola se repartió así: Estados Unidos, más de 1,4 millones; Reino Unido, más de 800.000; Países Bajos y Australia, más de 400.000 cada uno; Francia y Japón, más de 350.000. Durante el día, los picos se movieron: por ejemplo, Amazon superó los 15.000 reportes en su punto más alto, con nuevas alzas más tarde; Snapchat tuvo un máximo superior a 22.000 reportes antes de volver a trepar.

Cronología de un día largo

9:11 (Madrid): detección de fallas en US-EAST-1.

11:01: Amazon identifica posible raíz en DNS de DynamoDB y avanza con mitigación.

11:22: primeros signos de recuperación; se sugiere reintentar solicitudes.

12:03: recuperación “en progreso”, con efectos residuales.

Tarde: “prácticamente de nuevo en línea”, con Lambda retornando gradualmente. Calificación “degradada” en algunas horas, hasta normalización.

Todo esto mientras Amazon limitaba temporalmente la capacidad de lanzar nuevas instancias EC2 para estabilizar. Un recordatorio de que, a veces, para apagar incendios hay que cerrar compuertas.

Aerolíneas, logística y vida real

Las interrupciones digitales aterrizan en pistas físicas. United Airlines informó afectaciones en su app, web y algunos sistemas internos. “United implementó sistemas de respaldo para poner fin a la interrupción tecnológica y nuestros equipos están trabajando para que nuestros clientes puedan continuar su viaje”, señaló la compañía. Desde Delta hablaron de demoras menores por la mañana, sin previsión de impactos mayores. La escena se repitió en comercios: usuarios sin poder completar compras o validar pagos, trabajadores esperando que sus herramientas volvieran en sí.

Qué tan caro fue: la factura invisible

¿Cuánto cuesta un lunes detenido? Para Mehdi Daoudi, CEO de Catchpoint, la factura escala: “El impacto financiero de esta interrupción alcanzará fácilmente los cientos de miles de millones de dólares debido a la pérdida de productividad de millones de trabajadores que no pueden realizar su trabajo, además de las operaciones comerciales que se detienen o retrasan, desde aerolíneas hasta fábricas”. ¿Exageración? Tal vez alta, pero útil para dimensionar el costo de la dependencia: cuando la nube estornuda, las economías se resfrían.

Por qué este golpe duele más

Porque pega en el corazón de la nube. US-EAST-1 es una región histórica, nodal para muchos clientes y servicios. Y porque AWS no es una isla: lideró el 37% del mercado global de nube en 2024, según Gartner; generó ingresos por 107.600 millones de dólares en 2024; opera con más de 6 millones de kilómetros de fibra; está disponible en 38 regiones; y atiende a clientes como Disney, el Ejército de EE. UU., Capital One, United Airlines y la NFL. Con esa escala, cada incidente es, en la práctica, un evento sistémico.

Poder, marketing y memes: el episodio Musk

En medio del apagón, Elon Musk celebró que X no se viera afectada. “Nosotros no”, escribió, y acompañó con memes contra Amazon y Jeff Bezos. También aprovechó para promocionar la nueva función de chat de su plataforma, comparándola con Signal: “Ya no confío en Signal” y “Los mensajes están completamente cifrados, sin anuncios publicitarios ni extrañas ‘dependencias de AWS’…”. Ironía aparte, el intercambio evidencia otra tensión: cada crisis técnica es, también, un capítulo de la guerra de plataformas por narrativa y usuarios. La caída fue un problema de infraestructura; el ruido alrededor, un recordatorio de cómo se capitaliza políticamente cualquier resbalón tecnológico.

Lecciones para empresas y usuarios

Diseñar con fallas en mente. Multi-región real, no solo multi-zona; planes de “failover” probados; límites claros a dependencias regionales de US-EAST-1.

Observabilidad que no dependa del mismo plano afectado. Si el monitor cae, el resto es ceguera.

Deudas técnicas a la vista. Servicios como Lambda, DynamoDB y EC2 son potentes, pero requieren arquitectura defensiva aguas arriba y acuerdos de nivel de servicio realistas aguas abajo.

Comunicación transparente. Las citas de estado ayudaron: “Observamos indicios de recuperación… seguimos investigando la causa raíz”. Informar a tiempo reduce la ansiedad y el costo reputacional.

Para usuarios finales, la recomendación es menos glamorosa pero eficaz: paciencia, reintentos espaciados, y alternativas temporales cuando se pueda. A nivel ecosistema, la discusión es más profunda: ¿queremos pagar menos por almacenar y escalar, a cambio de depender de tres grandes nubes? La respuesta no es obvia ni binaria.

¿Se pudo evitar?

No del todo. Incidentes pasan, incluso en infraestructuras de clase mundial. Lo que sí se puede evitar es el efecto dominó: distribución de cargas entre regiones y nubes, desacoplar componentes críticos del mismo proveedor, y establecer límites de blast radius. También ayuda diversificar proveedores de DNS y mantener caminos de contingencia fuera del plano de control de la misma nube.

la dependencia como espejo

Hay lunes en los que Internet nos recuerda que no es magia sino cables, servidores y decisiones de diseño. La nube nos dio velocidad, escala y costos previsibles. También nos dejó más expuestos a fallas concentradas. Que un error en US-EAST-1 haga temblar medio ecosistema es un bug técnico, pero sobre todo cultural: elegimos eficiencia antes que pluralidad. No es apocalipsis, es una invitación a madurar. Diseñar con humildad, distribuir con criterio, exigir transparencia. Y, cuando corresponda, reírnos del meme, sí; pero sin olvidar que detrás del chiste hay aerolíneas, comercios, escuelas y salarios en pausa. La próxima caída no la evitará un tuit. La evitará un diagrama de arquitectura mejor.

Ayúdanos a llegar más lejos:
comparte esta historia.