Configurar modelos de datos

Este es el último paso antes de poder crear tarjetas de datos y es el que más valor aporta al análisis de datos. Cualquier tarjeta de datos necesita apoyarse en un modelo para poder ejecutar las consultas.

Deberás crear un modelo, pulsando el botón “Añadir” en el listado de Modelos de Datos del Centro de Datos.

En este caso, nuestros datos están almacenados en una base de datos PostgreSQL, por lo que la gestión de los datos no la realiza Biuwer sino nuestra Organización. Por este motivo, debemos crear un modelo “No gestionado”, pues Biuwer no gestiona esos datos. Para este ejemplo hemos llamado “Rental Basic”, utilizando como origen de datos la conexión “Film rental DB”.

Creando un modelo de datos no gestionado en Biuwer

A continuación debemos añadir los conjuntos de datos y relaciones entre ellos. Para esto, sí que es necesario conocer cómo están los datos almacenados y cómo se relacionan entre ellos. Puedes usar el visor de registros de los conjuntos de datos para consultar una vista previa de los datos y en caso que requieras relacionar los datos, saber por qué campos se debe realizar esta asociación.

Para el ejemplo que estamos viendo, necesitamos los siguientes conjuntos de datos:

  • rental: es la denominada tabla de hechos, en terminología teórica de Inteligencia de Negocios, en la cual se almacenan los alquileres, con sus fechas (rental_date), códigos de clientes (customer_id) y código de inventario (inventory_id).

  • customer_list: es una tabla que actúa como dimensión, en terminología teórica de Inteligencia de Negocios, en la que se almacenan los clientes con un identificador único (id) y entre otra información, el nombre del cliente (name), su país (country) y su ciudad (city).

  • film_list: también es una tabla de dimensión, en la que se almacenan las películas con un identificador único (fid), y entre otras, un título (title) y su precio (price).

  • category: también es una tabla de dimensión, en la que se almacenan las categorías de las películas con un identificador único (category_id) y su nombre (name).

  • inventory: esta tabla se puede denominar como una tabla de relación, pues sirve para definir el inventario físico de películas en las distintas tiendas disponibles. Por tanto contiene únicamente identificadores y deberemos incluirla en las relaciones.

Habitualmente, si el modelo de datos físico está bien definido, para N conjuntos de datos incluidos en el modelo, deberemos usar, al menos, N-1 relaciones entre ellos.

Puedes consultar en el apartado Modelos de Datos del Centro de Datos para ver precisamente este mismo ejemplo.