Hola 👋 bienvenido a la Newsletter de 🎖️ Team Hackers
Soy Felipe Polo y escribo esta newsletter para ayudar a fundadores y operadores de compañías a que sus equipos funcionen sin ellos.
Cada semana comparto ideas que generan autonomía y equipos más fuertes.
Esta semana España se quedó a oscuras por un fallo sin precedentes en la red eléctrica. Trenes detenidos, centros comerciales cerrados, negocios bloqueados, colegios aislados.
Unos negocios se congelaron, y otros siguieron funcionando como si nada.
Y en ese contraste hay una lección: la resiliencia no se improvisa.
Qué te llevarás hoy
🪨 La clave para conseguir equipos más resilientes
🐒 La historia del Chaos Monkey de Netflix
💪 Ejercicios prácticos que podrían poner a prueba a tu organización
¿Qué equipos aguantan mejor la presión?
De todos es sabido que los retos forjan el carácter. No tienes más que ver cómo crece un niño al que le dan todo hecho y le facilitan la vida para comprobarlo: dificultad para manejar la frustración y el estrés, problemas de gestión emocional, falta de responsabilidad…
No pinta bien.
Y la realidad es que en nuestro equipos el mismo principio aplica. Lo realmente interesante para mí es que estas dificultades también se pueden diseñar - no hay que esperar a que el mercado las genere.
Si tu equipo se expone de manera regular a disrupciones y dificultades, será más adaptable cuando vengan mal dadas.
Un entorno de baja volatilidad, calmado y predecible equivale a “tranquilidad”. Poco riesgo, pocos sustos, poca emoción. Y con ello, poco rendimiento también (todos conocemos alguno así).
A largo plazo, en realidad esto daña muchísimo el potencial de tu organización, porque adormece a tu equipo y le inhabilita para hacer frente a estímulos y traumas impredecibles.
Por el contrario, un equipo que se expone de manera frecuente a riesgos inteligentes se entrena para los retos del futuro. Existe un mantra entre los miembros de los NAVY Seals que reza así:
“Under pressure you don’t rise to the occasion, you sink to your level of training”.
Cómo se reacciona a los imprevistos, también se puede entrenar.
Si tu equipo actuase como un muelle cuando quedase sometido a alguna presión externa imprevista, su capacidad de absorber el impacto y gestionarlo (operacional y emocionalmente) sería mucho mayor.
Esto lo saben bien los arquitectos de zonas con riesgos de terremotos.
En los bosques se realizan quemados de control y zonas de cortafuegos, precisamente para eliminar la superficie de riesgo que haría que un incendio más grande se propagara más lejos y fuese mucho más letal.
Contraintuitivamente, exponer tu equipo de manera frecuente a pequeños daños controlados le hará mucho más fuerte y aumentará su moral.
Cómo Netflix diseña el caos
En 2011, Netflix tenía un bendito problema: estaba creciendo tan rápido que su infraestructura ya no podía depender de un único centro de datos. Por eso decidieron migrar toda su operación a la nube de Amazon Web Services (AWS).
Pero esa transición trajo nuevos retos. Ahora que todo dependía de miles de servicios distribuidos, ¿cómo podían asegurarse de que su sistema era resistente a fallos?
💥 Nace Chaos Monkey
La idea surgió del equipo de SRE (Site Reliability Engineering) de Netflix, y fue parte de un proyecto mayor llamado Simian Army. Su creador fue Greg Orzell, un ingeniero que propuso una herramienta que apagaría intencionalmente instancias en producción de manera aleatoria durante el horario laboral.
Sí, leíste bien: tirar servidores a propósito mientras la empresa está funcionando.
¿La lógica? Si tu sistema no puede tolerar que se caiga un servidor sin causar problemas, entonces no es verdaderamente resiliente. Mejor descubrirlo un martes por la mañana que un sábado a las 3 de la madrugada.
🧪 Cómo funciona
• Se ejecuta en la nube de AWS.
• Selecciona instancias de servicios en producción al azar.
• Las termina (las “mata”) sin previo aviso.
• Solo lo hace en horario de oficina, cuando los ingenieros están disponibles para arreglar los problemas que puedan surgir.
Esto obligó a los equipos a diseñar sus servicios con tolerancia a fallos desde el principio. El resultado fue una arquitectura más robusta, capaz de recuperarse automáticamente cuando algo se rompe.
🧬 Cultura del caos controlado
Lo más interesante de Chaos Monkey no es la herramienta, sino la filosofía que representa:
• Asume que los fallos son inevitables.
• Promueve una cultura de aprendizaje continuo.
• Pone a prueba los sistemas antes de que lo haga la realidad.
Netflix liberó el código como open source en 2012, y desde entonces ha sido adoptado y adaptado por muchas otras empresas como LinkedIn, Google y Amazon.
🧠 Lecciones clave
La resiliencia no se prueba en staging: si tu sistema solo es sólido cuando todo funciona perfectamente, tienes un problema.
Los errores son inevitables. Lo importante es prepararse para ellos.
Las herramientas están al servicio de una cultura: Chaos Monkey funciona porque Netflix tiene una cultura que premia la mejora continua y no castiga los errores.
Lo que buscaban no era robustez técnica. Era resiliencia organizativa.
Capacidad de responder rápido, aprender y adaptarse.
Sin dramas. Sin héroes. Por diseño.
🐒 ¿Y si aplicases el Chaos Monkey a tu equipo?
Aquí van algunos ejemplos reales que podrías probar para forzar pequeños fuegos controlados:
🔌 Infraestructura y tecnología
• Cortar acceso a Slack durante 1 hora → Comprueba si los equipos tienen canales alternativos o procesos documentados.
• Apagar el WiFi de la oficina → ¿Saben trabajar offline? ¿Se detiene todo?
• Simular la caída de un proveedor externo (ej: Stripe, AWS, Google Drive) → Ver cómo impacta y qué planes de contingencia hay.
• Bloquear temporalmente el acceso al CRM → ¿Los comerciales saben seguir vendiendo o están bloqueados?
🧠 Operaciones y equipo
• Ausencia imprevista de un líder de equipo durante 1 día → Ver si el equipo puede seguir operando sin cuellos de botella.
• Eliminar un SOP (procedimiento documentado) y ver si el equipo puede rehacerlo o improvisar con criterio.
• Prohibir reuniones por un día entero → ¿Los equipos saben avanzar sin depender del “síndrome de la reunión”?
📈 Producto y marketing
• Simular un error de campaña (email enviado con fallo) → ¿Qué pasos siguen para detectarlo, solucionarlo y responder al cliente?
• Restringir acceso a herramientas de analítica por 24h → ¿Las decisiones se pueden tomar sin datos inmediatos?
• Lanzar un producto sin previo aviso interno → Ver cómo reacciona el equipo de soporte, ventas y producto.
💬 Cliente y soporte
• Simular una queja pública grave en redes sociales → Evaluar la reacción del equipo de comunicación.
• Hacer que un cliente escriba por varios canales a la vez (chat, email, redes) → Ver si se duplica la atención o si hay coordinación.
🧪 ¿Cómo ejecutar el experimento?
Hazlos de forma controlada y con seguimiento.
Anuncia lo que está pasando después del experimento, no antes. Y que el momento de la ejecución sea aleatorio.
Evalúa resultados y documenta aprendizajes.
Repite periódicamente para fomentar una cultura resiliente.
Cuéntame, ¿te atreverías a integrar en tu organización un Chaos Monkey?
Más contenido de interés
🐒 The Chaos Monkey Project
Aquí te dejo el enlace al proyecto open source, por si te entran ganas de tirar tus servidores en producción y ver qué pasa 😅
✍️ Hackeando Meta Ads
Este post de Linkedin explica cómo investigar a la competencia y entender sus mensajes y su posicionamiento en Meta.
📺 The Book Whisperer: How to Write a New York Times Bestseller
Ni confirmo ni desmiento que en algún momento publicaré un libro. Esta entrevista es oro si estás pensando en hacer algo parecido.
✍️ Introducing the world’s first AI CMO (Chief Marketing Officer)
Este post habla de Icon, una herramienta de IA que puede planificar, crear y lanzar cientos de ads ganadores.
📲 Apúntate a los Masterminds de Escalando Agencias
Si te interesa ser parte de un grupo de trabajo con otros emprendedores de tu sector que te ayude a generar ideas y te empuje a ser mejor, puedes registrar aquí tu interés.
Dónde más me puedes encontrar
En Linkedin escribo sobre liderazgo y gestión de equipos autónomos.
En Playbooks nos sentamos mensualmente con referentes empresariales que nos descubren sus estrategias paso a paso para que las puedas replicar en tu equipo.
En Escalando Agencias nos sentamos con fundadores de consultoras y agencias del sector digital para destripar cómo gestionan su crecimiento.
Y con este temazo te deseo buen puente (quien lo tenga). Y que te pille con los tuyos. Con los buenos.
📘 De operador a diseñador de equipos autónomos
He creado para ti el minicurso “De Operador a Diseñador de equipos autónomos”, en el que explico por qué los equipos dependen demasiado de sus líderes (y cómo hacer que el tuyo funcione sin ti).
Qué interesante lo del chaos monkey. Sin duda, un ejercicio que pone a prueba de fuego la resiliencia.
Me han parecido super prácticos los ejercicios que has propuesto para forzar esos apagones controlados. A ver si se animan a compartir quién se atreve a hacerlo jeje