¿Qué es el Sistema de Gestión de Bases de Datos?




Con la aprobación, el día 6 de diciembre de 2018, de la Ley Orgánica 3/2018, de 5 de diciembre, de Protección de Datos Personales y garantía de los derechos digitales (LOPDGDD), hay determinados conceptos que no se definen claramente y otros no contemplados. Esto lleva a cierta confusión o vacío conceptual a los responsables y encargados de los ficheros de datos personales no experimentados. Las empresas e instituciones públicas que trabajan con grandes cantidades de datos ya poseen un profesional denominado Delegado de Protección de Datos (DPD) que asesora al responsable y encargado. Sin embargo, las pymes y autónomos suelen trabajar con software o programas informáticos estándar sin conocer los procesos de gestión de los datos personales.

Tal y como viene a decir tanto el Reglamento Europeo como la nueva Ley  Orgánica, el responsable del tratamiento no debe limitarse a recopilar, almacenar y tratar datos de carácter personal. Está obligado, desde antes de recopilar y almacenar información, a diseñar y tomar las medidas técnicas y organizativas para garantizar la seguridad de los datos personales. Tras la puesta en marcha del “fichero”, deberá llevar un control y seguimiento de la gestión de los datos así como una evaluación de impacto y el establecimiento de medidas ante una brecha digital.

Por tanto, es importante tener unas nociones básicas de lo que es un Sistema de Gestión de Bases de Datos ya que el 90% de las empresas, administraciones y autónomos almacenan y tratan datos personales en bases de datos. Esto permite a los no iniciados a conocer ciertos conceptos y el funcionamiento del tratamiento para evitar fallos o brechas de seguridad.

El concepto de dato
En líneas generales, según la antigua LOPD, el RLOPD y el RGPD, el concepto de dato se aplica a cualquier información numérica, alfabética, gráfica, fotográfica, acústica o de cualquier otro tipo. Y dato de carácter personal cuando esa información identifica directa o indirectamente a una persona física.

Lo que no explican las leyes es lo que consideran información. Para tener una visión clara pongamos como ejemplo el dato “Herrera”. Puede ser un apellido, una marca comercial o un antiguo oficio realizado por mujeres. Como tal no tiene un significado especial y, por tanto, carece de información. No puede considerarse dato de carácter personal. Si juntamos dos datos “Carolina” y “Herrera” creando uno nuevo, ya se convierte en información porque tiene relevancia al significar tanto el nombre de una persona como una marca comercial. Si tomamos el dato “12345678-A” puede considerarse información porque tiene unas características iguales al Documento Nacional de Identidad.

Por tanto, no hay que confundir dato con información. El primero puede o no tener significado mientras que el segundo sí.

En este sentido las leyes deberían ser más explícitas y definir mejor este concepto para evitar confusiones. Más que hablar de dato de carácter personal debería referirse a información de carácter personal.

También hay que tener en cuenta que los datos personales son representaciones de personas físicas cuya importancia debe ser registrada. Por sí solos no tienen valor hasta que son procesados para convertirlos en información con significado.

Pongamos como ejemplo a Patricia Robles, estudiante de un Instituto. En la figura 1 encontramos una realidad (también se define como entidad) que es la imagen de la alumna y datos en una tabla que identifican a esa alumna. Por el momento no consideremos la fotografía como un dato de carácter personal sino la persona física en sí.

Figura 1

A partir de la realidad física o entidad que es la alumna, se han ido estableciendo una serie de datos: nombre, apellidos, fecha de nacimiento y nacionalidad. Si esos datos los sacáramos de la tabla, por sí solos no son considerados información. Sin embargo, juntándolos en una tabla nos da un nuevo dato con significado: alumna llamada Patricia Robles, nacida el 23 de junio de 1999 y de nacida en México.

En terminología de Base de datos relacional esa fila de datos se denomina Registro o Tupla (en lenguaje SQL se denomina Fila). Aunque está compuesta por campos (unidad mínima de una tabla que contiene un dato, en hojas de cálculo se denominan celdas) y, por tanto, por varios datos, en conjunto pasa a convertirse en un solo dato relevante que proporciona información. Ese registro o tupla es un dato personal.


Tabla, relación o Base relvar
En una tabla se encuentra estructurada los datos de una entidad (en nuestro ejemplo anterior los alumnos de un Instituto). Está dividida por un conjunto de filas (tupla o registro) y columnas (atributo), semejante a una hoja de cálculo. A su vez, debe contener un nombre que la diferencie de las demás; una Clave primaria que define y diferencia cada registro, tupla o fila; atributos que etiquetan o indican las características de un registro; y dominios que agrupan un conjunto de atributos. Los dominios sirven para realizar restricciones como por ejemplo saber cuántos alumnos del atributo “Nacimiento” nacieron en 1998.

En una base de datos no pueden existir dos o más tablas iguales.

Figura 2


Base de datos relacional
Cuando los datos de una entidad son básicos, por ejemplo la información de contacto de una persona, suele existir una sola tabla con nombre, apellidos, teléfono, dirección, correo electrónico, etc. Pero en entidades más complejas como la información de los alumnos de un Instituto es necesario el diseño de varias tablas.

Al conjunto de esas tablas se llama Base de datos. Actualmente se utiliza el modelo relacional ya que se establece una conexión entre cada una de las tablas (padre e hijo) por medio de claves primarias y claves foráneas (o ajenas).

Siguiendo con el ejemplo anterior, necesitamos saber en qué curso están varios alumnos. Nuevamente se crea otra tabla llamada “Curso” con otros atributos:

Figura 3

Ya podemos ver dos atributos esenciales: IdCurso que es la clave principal de la tabla e IdAlumnos_1 que identifica al alumno de la tabla “Alumnos”. Ambos tienen un valor numérico que identifican cada fila o tupla como única. El resto de atributos son: “Curso”, “Grupo” y “Especialidad”.

Para saber qué alumno está en un curso, grupo y especialidad hay que relacionar ambas tablas. De esta forma, a partir de unos datos creamos otros nuevos.





En el caso de Patricia Robles, además de saber que nació el 23 de junio de 1999 y es de México, cursa 3º, Grupo B y especialidad de Ciencias.


Sistema de Gestión de Bases de Datos (Database Management System)
Aunque tengamos una o varias tablas con datos y las relacionemos es necesario contar con un conjunto de programas que permitan el almacenamiento, modificación y consulta de la información. De esta forma, en base al ejemplo anterior, un profesor puede consultar los alumnos que están en su clase.

Este tipo de aplicaciones también se encargan de mantener la integridad de los datos, recuperar información en caso de fallo en el sistema y administrar el flujo de información que cada usuario necesita o puede acceder.

El lenguaje que impera actualmente para comunicarse con la base de datos es el llamado SQL (Structured Query Language). Fue creado por IBM en los años setenta y la primera empresa en utilizarlo fue Oracle.


Importancia del diseño del Sistema de Gestión de Bases de Datos
El RGPD y la LOPDGDD establecen claramente que tanto el responsable como el encargado del tratamiento deben desde el inicio mantener actualizados los datos en todo momento, suprimiendo o rectificando cuando sea necesario y solo tratando aquellos que sean imprescindibles para la finalidad establecida. También recalca el control del tratamiento de los datos personales, sobretodo los especialmente sensibles, asegurando en todo momento la integridad y seguridad.

Es por esto que un mal diseño en las tablas de las bases de datos o una mala relación entre las mismas puede provocar la creación de otros datos que no se ajusten a la realidad. Incluso fallos en la programación del Sistema de Gestión de Bases de Datos puede suponer un peligro en la integridad y seguridad, vulnerando los derechos de intimidad y honor de las personas afectadas.

No es la primera vez que una empresa ha llamado al cliente informando de una deuda inexistente o se ha producido el acceso a facturas de miles de clientes por una brecha en la página web.

Lo esencial es tener bien claro qué datos son necesarios, como diseñar la relación entre ellos, determinar qué nuevos datos crear a partir de los iniciales y controlar que la información final sea fiel reflejo de la realidad. Una vez controlada la información, se deberán poner todas las medidas de seguridad.