Dedique varias semanas en investigar como implementar CloudFormation de Amazon para montar un entorno de pruebas de Percona XtraDB Cluster con cuatro nodos, dos HAProxy, un servidor con Nagios, y una VIP, adicionalmente usando Puppet, la idea que me atrajo de usar CloudFormation fue la practicidad de definir toda una infraestructura de maquinas virtuales usando un JSON como template, el tener un formulario para definir variables, y luego tener la ventaja de poder crear y destruir cualquier cantidad de veces el cluster de forma automatizada.

Al final me di cuenta que no es seguro usar CloudFormation por varios motivos:

  • CloudFormation se asegura de mantener toda la infraestructura al 100% como está definida en el JSON. Si no hay algo que no encaja, crea una nueva maquina y destruye la anterior, al tener una Base de Datos con datos de producción los podemos perder muy fácilmente. Esto me paso al cambiar la versión de la AMI, note como se creaban nuevas maquinas, y luego cuando estaban listas, fueron remplazadas por las viejas y se perdieron todos los datos.
  • Se tendría que parametrizar mucho para reducir las probabilidades de destruir una maquina de forma accidentada. Esto le añade más complejidad en el flujo de trabajo y deja de ser intuitivo para cualquiera.
  • Contemplar todos los casos de administración de cada uno de los nodos de un cluster es complejo, por ejemplo, debemos contemplar la ampliación del disco sin perder los datos, cambiar el tipo de instancia, y cambiar las políticas de seguridad. Quien sabe que más puede pasar.

Poder superar todas las desventajas mencionadas requiere muchas horas de investigación y pruebas hasta lograr dominar todo, puede que nos demos cuenta que faltan más reglas por parte del CloudFormation, pienso que esto no fue echo para Bases de Datos, sino para servidores de API y WEB, donde los grandes volúmenes de datos no son un problema.

También pienso que usar CloudFormation en un caso de Bases de Datos está bastante bien para hacer una demo, o crear entornos para un sandbox por ejemplo, pero para producción lo veo muy peligroso.

Mi recomendación es irnos por lo clásico, crear tus propios scrips que hacen llamadas a la API de Amazon, así creas toda la infraestructura, defines tú el flujo de trabajo, y llevas el control, si yo habría echo así desde un principio, habría ahorrado mucho tiempo. De todo esto se obtiene una lección aprendida, y aquí la comparto.