Persistencia de datos - Desaf´ıos t´ ecnicos

5.2 Desaf´ıos t´ ecnicos

5.2.3 Persistencia de datos

Previamente, se mencionó la utilización de dos tipos diferentes de motores de bases de datos. El equipo tuvo que pasar por un proceso de investigación para tomar una buena decisión en cuanto a dónde (y cómo) se iban a almacenar los datos. A continuación se detalla técnicamente las opciones elegidas y una idea en alto nivel de como fueron utilizadas.

DynamoDBes una base de datos no relacional, ideal para cuando se conocen de antemano los patrones de acceso a datos que va a tener la aplicaci´on y no se necesitan cruzar datos entre registros [46]. En otras palabras, no se necesita tener el concepto de“JOIN” (durante una solicitud) de una base de datos relacional tradicional.

Las claves primarias de DynamoDB se comportan como las claves primarias de otros motores, pero ´estas se componen de una “partition key”(requerida) y una

“sorting key”(opcional). Las partition key pueden verse como un puntero a la loca- lizaci´on del dato en un servidor, recordando que DynamoDB es una base de datos distribu´ıda en varios servidores[47].

Una sorting key, también conocida como “range key” obliga a DynamoDB a guardar los registros de una partición de manera ordenada. Además, varios registros pueden ser almacenados con la mismapartition key siempre y cuando lasorting key difiera del resto. Esto genera un patrón de acceso interesante donde, por ejemplo, se puede guardar el documento de identidad de un cliente comopartition key y como sorting key losids de ventas que realizó. Esto permitir´ıa la rápida búsqueda de una compra en particular (por sorting key) u obtener todas las compras realizadas por el mismo cliente (porpartition key).

Sin embargo - y por esto es importante conocer con cierta seguridad los patrones de acceso a datos al utilizar DynamoDB - es virtualmente imposible (muy ineficiente y costoso) obtener todas las compras de un d´ıa con modelo. Es importante notar que una vez la tabla es creada con una determinadapartition key esta no puede ser modificada.

A su vez, ofrece dos tipos diferentes de ´ındices[48]:

´Indices secundarios globales: en donde la clave primaria del ´ındice pueden ser dos atributos cualesquiera de la tabla.

Indices locales secundarios: en donde la clave de partici´on del ´ındice debe ser igual a la clave de partici´on de la tabla,pero la clave de ordenamiento puede ser cualquier otro atributo.

Con este tipo de ´ındices pueden subsanarse algunas consultas como la descrita anteriormente sin embargo existe un l´ımite fijo en la cantidad de ´ındices secundarios que se pueden crear en DynamoDB (durante el tiempo de desarrollo el l´ımite era 20).

Una forma de flexibilizar estos l´ımites es utilizar el patrón de diseño propuesto por Alex DeBrie (escritor deThe DynamoDB Book[49]) [50][“single table design”] e impulsado por Amazon, en donde se modelan los datos en una única tabla, que se sirve de distintos tipos de claves e ´ındices de los datos.

Para lograr entender en profundidad los beneficios que describe este modelo es necesario adentrarse con patrones avanzados de diseño de dynamodb. Además de los recursos citados en el párrafo anterior, el lector puede informarse mas en [51, los laboratorios de AWS para DynamoDb]. La conclusión mas importante sobre el modelado en dicha base de datos es que es flexible aplicados algunos conceptos avanzados pero no tan intuitivo y definitivamente no tan familiar como una base de datos SQL.

Por otra parte,RDSes un servicio ofrecido por AWS de base de datos relacional donde, en su variante del servicio denominada “AuroraDB”, ofrececlusters de bases de datos “PostgreSQL” en formatoserverless. Esto significa que AWS es encargado de mantener la infraestructura de los servidores utilizados y provee unaData Api[52]

para consultar la base de datos mediante pedidos HTTP.

Contar con la Data Api no es menor, ya que de otra manera el equipo habr´ıa tenido que gestionar sus propias conexiones a la bases de datos, las cuales tienen

un costo de “construcción” y “destrucción”. Esto no es un problema en una infraestructura tradicional pero si en un ambiente “serverless” dondeen teor´ıa no existe memoria compartida entre ejecuciones de un mismoLambda (por lo cual no se puede mantener esa conexión abierta en memoria).

En la práctica elscope principal donde se define el manejador de laLambdano es destruido luego de cada ejecución, por lo que es posible persistir cierta información en este punto. Sin embargo, esa información es volátil dado que depende del framework de AWS cuándo y por qué destruye completamente el contexto. Eso puede suceder por ejemplo por desuso, si no hay invocaciones en un lapso de tiempo AWS libera ese entorno de ejecución (contenedor), o también puede ser ocasionado por otras necesidades de infraestructura.

En general la mejor práctica es usar ese contexto para constantes, evitando persistir información dinámica entre llamadas a funciones en la memoria del entorno.

La alternativa entonces a usar la Api HTTP es utilizar un servicio que se en- cargara de la tarea de gestionar las conexiones como Amazon RDS Proxy lo cual implicar´ıa incurrir en gastos extra para mantener dichopool de conexiones abierto.

Como el equipo contaba con nula experiencia en dise˜no de este tablas con dise˜no

“one table”, optó por usar este modelo para estructuras de datos con consultas bien definidas. Si bien algunos de los requerimientos de consultas que el equipo tuvo pudo haber sido resuelto con un diseño correcto de DynamoDB, el equipo optó por la familiaridad en “PostgreSQL” para realizarlo (particularmente para implementaciones queries conjoins dinámicos).

La persistencia de datos no relacionados, como ser datos de usuarios y las configu- raciones estáticas de su instancia de la “Consola” fueron realizadas en DynamoDB, mientras que por ejemplo, datos de las promociones o clientes los cuales pueden ser filtrados de distintas formas a elección del usuario, fueron persistidos en PostgreSQL para hacer más fácil su consulta.

El equipo igualmente no descarta que a medida que su conocimiento y dominio

del dise˜no de tablas en DynamoDB aumente y los estimativos de gastos comparan- do a los gastos incurridos por utilizar Aurora lo validen, se migren tablas a esta tecnolog´ıa.

5.3 Serverless Stack como tecnolog´ıa prin-

In document Plataforma de fidelización de clientes para Toto Calzados (página 88-91)