Lectura: 11 mins.

Dificultad:

Bases de datos relacionales vs. no relacionales: ¿qué es mejor?

Es muy común entre desarrolladores de aplicaciones encontrarse en una situación de tener que elegir si se va a usar una base de datos relacional o no relacional. La mayoría no se lo piensa demasiado y opta por la opción que más conocen y con la que más cómodos trabajan. Tampoco es una decisión catastrófica; en realidad, ya sea la base de datos relacional o no, se puede construir cualquier cosa.

Vale, entonces, ¿por qué es importante saber en qué se diferencian y cuál deberíamos usar en cada caso? Pues porque un buen diseño de base de datos con la tecnología apropiada indudablemente aporta calidad al proyecto. Dependiendo de la naturaleza de la aplicación, interesa que la base de datos tenga unas características u otras.

Un poco de historia

Las bases de datos relacionales o de lenguaje de consulta SQL se empezaron a usar en los años 80 y a día de hoy siguen siendo la opción más popular. En cambio, las bases de datos no relacionales o de lenguaje de consulta NoSQL solo están empezando a ser más populares en los últimos años. Entre 2012 y 2015, hubo un crecimiento importante en el uso de este tipo de bases de datos. Y aunque desde 2016 su racha se ha quedado un poco estancada, siguen siendo también muy populares.

Bases de datos relacionales

El principio de las bases de datos relacionales se basa en la organización de la información en trozos pequeños, que se relacionan entre ellos mediante la relación de identificadores.

En el ámbito informático se habla mucho de ACID, cuyas siglas vienen de las palabras en inglés: atomicidad, consistencia, aislamiento y durabilidad. Son propiedades que las bases de datos relacionales aportan a los sistemas y les permiten ser más robustos y menos vulnerables ante fallos.

La base de datos relacional más usada y conocida es MySQL junto con Oracle, seguida por SQL Server y PostgreSQL, entre otras.

Bases de datos no relacionales

Como su propio nombre indica, las bases de datos no relacionales son las que, a diferencia de las relacionales, no tienen un identificador que sirva de relación entre un conjunto de datos y otros. Como veremos, la información se organiza normalmente mediante documentos y es muy útil cuando no tenemos un esquema exacto de lo que se va a almacenar.

La indiscutible reina del reciente éxito de las bases de datos no relacionales es MongoDB seguida por Redis, Elasticsearch y Cassandra.

Formatos

La información puede organizarse en tablas o en documentos. Cuando organizamos información en un Excel, lo hacemos en formato tabla y, cuando los médicos hacen fichas a sus pacientes, están guardando la información en documentos. Lo habitual es que las bases de datos basadas en tablas sean bases de datos relacionales y las basadas en documentos sean no relacionales, pero esto no tiene que ser siempre así. En realidad, una tabla puede transformarse en documentos, cada uno formado por cada fila de la tabla. Solo es una cuestión de visualización.

Los dos esquemas de la imagen contienen exactamente la misma información. Lo único que cambia aquí es el formato: cada documento de la figura de la derecha es una fila de la figura de la izquierda.

Se ve más claro en la tabla, ¿verdad? Lo que pasa es que a menudo en una base de datos no relacional una unidad de datos puede llegar a ser demasiado compleja como para plasmarlo en una tabla. Por ejemplo, en el documento JSON de la imagen que se muestra a continuación, al tener elementos jerárquicos, es más difícil plasmarlo en una tabla plana. Una solución sería plasmarlo en varias tablas y, por tanto, necesitar de relaciones.

[
 {
  "student_id":1,
  "age":12,
  "subjects":{
   "mathematics":{
    "scores":[7,8,7,10],
    "final_score":8
   },
   "biology":{
    "scores":[6,6,5,7],
    "final_score":6
   }
  }
 }
]

Esto explica por qué las bases de datos relacionales suelen servirse de tablas y las no relacionales de documentos JSON. En cualquier caso, a día de hoy, las bases de datos más competitivas suelen permitir, de una forma u otra, operaciones de los dos tipos. Por ejemplo, el servicio de base de datos en la nube BigQuery que ofrece Google es, en principio, una base de datos de lenguaje de consulta SQL, por lo que permite fácilmente relacionar varias tablas, pero, a su vez, permite insertar elementos jerárquicos JSON, más propios de bases de datos no relacionales.

La diferencia entre el éxito y el fracaso recae, sobre todo, en el diseño del modelo. Es decir, si se decide que el mejor enfoque es usar una base de datos relacional, no es suficiente con meter la información a lo bruto en una base de datos relacional y esperar a que se relacione sola, porque eso no va a ocurrir. De nada sirve elegir la base de datos más apropiada para nuestro sistema, si luego no se hace un buen diseño.

¿Un poco perdidos? ¡Pasemos a la acción!

Ejemplo práctico: base de datos relacional

Imaginemos que tenemos una plataforma online que ofrece cursos de idiomas. Los clientes contratan o se suscriben al idioma y al nivel que más les puede interesar, y, además, tienen la opción de elegir qué tipo de suscripción quieren: mensual, trimestral o anual. Y dependiendo de esta opción, se les aplicará un descuento u otro.

El primer diseño de base de datos que propongo es una tabla donde cada fila corresponde con un servicio contratado por un cliente. Toda la información está contenida en una sola tabla, por tanto, no es relacional.

fecha	cliente	idioma	nivel	suscripción	precio	descuento_%	precio final
25/06/2018	Pedro	Inglés	Intermedio	Mensual	7	0	7
25/06/2018	Pedro	Chino	Principiante	Mensual	9	0	9
01/07/2018	Aurelia	Francés	Avanzado	Anual	8	25	6
03/07/2018	Federico	Inglés	Intermedio	Trimestral	7	10	6.3

Problemas que podemos encontrar con este modelo

No sabemos si el Pedro de la primera fila es el mismo cliente que el Pedro de la segunda fila o si son dos clientes con el mismo nombre. Sí, podríamos incluir el e-mail para que haga de identificador único, pero es una solución cogida con pinzas.
Si algún precio o descuento cambia, hay que modificarlo en todas las filas en las que aparece y, si no se hace correctamente, puede dar lugar a discrepancias. No tiene sentido que la información esté duplicada de esta manera.
Si un cliente cambia su suscripción, habría que cambiar tanto el campo de suscripción como el precio. Y también puede dar lugar a discrepancias si no se hace correctamente.
Al tener la columna de “precio final” se está duplicando información, ya que se puede calcular fácilmente con las columnas “precio” y “descuento_%”. Esto también puede dar lugar a discrepancias.
No hay manera de saber qué idiomas y niveles hay disponibles, ni cuál es su precio hasta que alguien lo contrate.

¿Cómo solucionamos todos estos problemas?

Parece que esta situación está pidiendo a gritos un diseño de base de datos relacional, donde se recoja la información en varias tablas y no solo en una.

Empezamos con la primera tabla; esta contendrá solamente la información del cliente.

cliente_id	nombre_cliente
1	Pedro
2	Aurelia
3	Federico

Por otro lado tenemos la tabla contenedora de las clases disponibles. Cada una con su nivel y precio base.

programa_id	idioma	nivel	precio
1	alemán	principiante	7
2	chino	principiante	9
3	francés	avanzado	8
4	inglés	intermedio	7

En esta tabla podemos ver todos los cursos disponibles. En el diseño principal, como nadie se había suscrito al curso de alemán, ni siquiera podíamos saber que existía.

A este precio base luego se descontará un porcentaje, según la suscripción que los clientes elijan.

suscripcion_id	tipo	descuento_%
1	Mensual	0
2	Trimestral	10
3	Anual	25

Y por último, tenemos la tabla que relaciona todo: a cada cliente con la clase o clases contratadas y el tipo de suscripción.

id	cliente_id	programa_id	suscripcion_id
1	1	4	1
2	1	2	1
3	2	3	3
4	3	4	2

Pedro, que es el cliente con identificador 1, se había suscrito mensualmente (id=1) a inglés intermedio (id=4) y chino principiante (id=2). Por eso, en las dos filas en las que el identificador de cliente “client_id” es 1, el identificador de programa es 4 y 2, y el identificador de suscripción es un 1.

Fijaos también que no hemos apuntado el precio final en ningún lado. No es necesario, ya que, conociendo el precio del programa y el descuento de la suscripción elegida, se puede calcular de inmediato. Y así evitaremos duplicidad y la posibilidad de discrepancias en nuestros datos.

¡Y ya lo tenemos! No es tan difícil, ¿no?

Antes de continuar, os propongo un ejercicio: ¿cómo haríais para incluir la posibilidad de tener cupones de descuento? Pensad que estos cupones son canjeables por cada curso que se contrata y cada uno puede proporcionar un descuento diferente.

Ejemplo práctico: bases de datos no relacionales

Quizá os estéis preguntando “si las bases de datos relacionales son tan prácticas, ¿en qué situaciones es buena idea trabajar con las no relacionales?”. Si algo tienen de malo las bases de datos relacionales, es que son como Sheldon Cooper, tienen que saber de antemano qué es y cómo es lo que van a almacenar. En cambio, las bases de datos no relacionales son más flexibles, se lo tragan todo, sin importar su estructura.

Imaginemos que hemos mandado unas máquinas al espacio para que nos reporten qué es lo que encuentran en su viaje. Obviamente, no sabemos a ciencia cierta qué se van a encontrar. De alguna forma, tienen una inteligencia artificial instalada que reconoce los objetos con los que se va encontrando y también tienen sensores instalados. Pero no sabemos bien qué miden, ya que cada máquina tiene sensores diferentes. Cada 24 horas envían un resumen de lo que han visto durante el día.

{
 "maquina_id":1,
 "timestamp":149992693000,
 "coordenadas":"75988823.567, 55375867.098, 12676444.311",
 "encontrado":[
  "roca", 
  "agua",
  "roca",
  "roca",
  "algo que parece un animal",
  "roca"
 ],
 "temperatura":{
  "min":-50,
  "max":-49
 },
 "ruido":{
  "min":72,
  "max":4549
 }
}

{
 "maquina_id":2,
 "timestamp":1499925677000,
 "coordenadas":"66635675.920, 78021134.727, 53580995.751",
 "temperatura":{
  "min":-50,
  "max":-49
 },
 "humedad":{
  "min":2%,
  "max":5%
 }
}

Cada uno de estos documentos JSON contiene la información reportada en cada envío por cada máquina. La máquina con identificador 1 está reportando datos de temperatura y ruido, mientras que la de identificador 2 reporta temperatura y humedad. No sabemos qué sensores tendrá instalados la siguiente y, mucho menos, qué y cómo reportarán las máquinas que aún no se han mandado y los ingenieros están montando.

No merece la pena ponerse a diseñar una base de datos relacional para almacenar esta información. En este caso, lo mejor es dejar a una base de datos no relacional que se trague todo lo que las máquinas reportan, tal cual.

Además, la finalidad del sistema es meramente científica y no se contempla la existencia de usuarios a los que se les deba la garantía de consistencia que ofrecen las bases de datos SQL. Simplemente, se quiere almacenar todo para un futuro análisis.

Una vez almacenados en la base de datos no relacional se podrá pedir y visualizar la información de diferentes maneras. Y si en algún momento se necesita consumir los datos de una forma más estructurada, siempre podremos procesar y volcar la información a una base de datos relacional. Pero es que, muy probablemente, no sea necesario.

¿Qué hacer para convertiros en expertos?

Espero que este post haya servido para aclarar algunos conceptos y dudas básicas sobre las diferencias entre las bases de datos relacionales y no relacionales. Pero, indudablemente, como se comprenden de verdad estas cosas es cacharreando, rompiendo y rediseñando (y volviendo a romper) aplicaciones. Solo así podréis convertiros en verdaderos expertos.

Comments

Roberto says:

2018-09-27 at 13:18

Ahora lo veo mucho más claro.
Muchas gracias por dejar estos ejemplos tan claros y ser tan sencilla en las explicaciones.
Me ha ayudado mucho a aclarar ideas.
Hasta pronto!

1. Ainhoa Lafuente says:
  
  2018-10-22 at 12:45
  
  Me alegro que te haya sido útil. ¡Muchas gracias Roberto!
  
Javier says:

2018-10-20 at 05:34

Ey!! Muchas gracias!!! No pudiste explicarlo mejor.

1. Ainhoa Lafuente says:
  
  2018-10-22 at 12:46
  
  ¡Muchas gracias Javier!
  
Armando says:

2020-04-06 at 22:05

Buena explicacion,Saludos!!!

Brayan says:

2020-04-26 at 03:20

Excelente explicación me sirvió mucho.

Ana says:

2020-05-08 at 10:53

Excelente post. He comenzado un curso de Big Data recientemente y este post me ha sido de mucha utilidad para entender las diferencias entre un tipo de base de datos y otro. ¡Gracias por acercarlo a la tierra, Ainhoa!

hsp says:

2020-07-06 at 10:08

Excelente explicación

Grace Salcedo says:

2020-07-16 at 06:56

Muchas gracias Ainhoa, me ha sido de mucha utilidad. Lo máximo!

Melanie says:

2020-09-24 at 15:10

Muchas gracias, me ha aclarado las dudas que tenía.

1. aukera says:
  
  2020-09-24 at 15:45
  
  ¡Gracias a ti por leernos, Melanie!
  
Lluís says:

2021-06-17 at 09:45

Felicidades Ainhoa, nunca había visto tan bien explicada la diferencia entre las diferentes BBDD 🙂
Los ejemplos están muy acertados, también. Gracias!

1. aukera says:
  
  2021-06-17 at 12:16
  
  ¡Gracias a ti por leernos!
  
Iván says:

2021-09-16 at 23:34

Buenas tardes dama .
Primero que todo MUCHAS GRACIAS y FELEICITACIONES por la información aportada. Lo explica de una manera clara, sencilla, entendible, práctica.
FELICITACIONES !!!

Una pregunta: ud comenta en su valioso artículo y cito: ” Una vez almacenados en la base de datos no relacional se podrá pedir y visualizar la información de diferentes maneras. Y si en algún momento se necesita consumir los datos de una forma más estructurada, siempre podremos procesar y volcar la información a una base de datos relacional. ” …………………Como se vuelca esa información a una BD RELACIONAL, es decir, como partiendo de una BD NOsql podemos construir un espejo en lo que respecta a la DATA de esa BD pero que sea una BD de tipo RELACIONAL?????

DBAJunior says:

2023-01-25 at 04:54

Excelente Post, no creo que se pueda explicar de manera mas breve y completo al mismo tiempo. Gracias a Dios que pude encontrar este Post
Le felicito grandemente a la autora del mismo Ainhoa Lafuente

Bases de datos relacionales vs. no relacionales: ¿qué es mejor?

Un poco de historia

Bases de datos relacionales

Bases de datos no relacionales

Formatos

Ejemplo práctico: base de datos relacional

Problemas que podemos encontrar con este modelo

¿Cómo solucionamos todos estos problemas?

Ejemplo práctico: bases de datos no relacionales

¿Qué hacer para convertiros en expertos?

Artículos relacionados

Autor del post

Ainhoa Lafuente
Warning: Use of undefined constant - assumed ' ' (this will throw an Error in a future version of PHP) in /home/customer/www/aukera.es/public_html/blog/wp-content/themes/aukera/single.php on line 100

Últimos artículos

Comments

Leave a Reply Cancel reply

Bases de datos relacionales vs. no relacionales: ¿qué es mejor?

Un poco de historia

Bases de datos relacionales

Bases de datos no relacionales

Formatos

Ejemplo práctico: base de datos relacional

Problemas que podemos encontrar con este modelo

¿Cómo solucionamos todos estos problemas?

Ejemplo práctico: bases de datos no relacionales

¿Qué hacer para convertiros en expertos?

Artículos relacionados

Autor del post

Ainhoa Lafuente Warning: Use of undefined constant - assumed ' ' (this will throw an Error in a future version of PHP) in /home/customer/www/aukera.es/public_html/blog/wp-content/themes/aukera/single.php on line 100

Últimos artículos

Comments

Leave a Reply Cancel reply

Ainhoa Lafuente
Warning: Use of undefined constant - assumed ' ' (this will throw an Error in a future version of PHP) in /home/customer/www/aukera.es/public_html/blog/wp-content/themes/aukera/single.php on line 100