Buenas prácticas en el Modelado Conceptual de Datos

Contenido

A continuación se describen buenas prácticas relacionadas con la creación y mantenimiento de las Fuentes de Datos compartidas de Tableau, que representan la implementación de un Modelo Conceptual de Datos compartido por una o varios Libros de Trabajo de Tableau.

Una Fuente de Datos compartida de Tableau es el resultado final de las actividades de Modelado de Datos de Negocio  y Preparación de los Datos de un Proyecto BI, y representa un conjunto de datos interrelacionados entre sí, que están disponibles (preparados) para su consulta/consumo por los distintos Cuadros de Mandos que necesiten esos datos.

Creación de nuevas Fuentes de Datos de Tableau

Al crear una Fuente de Datos hay que distinguir entre dos tipos de objetos diferentes usados en la Plataforma Tableau:

  • Libro de Trabajo para el diseño de Fuentes de Datos: Representa el diseño (código fuente) de la Fuente de Datos compartida. Es una buena práctica diferenciar aquellos libros de trabajo usados como 'código fuente' de los objetos de Fuentes de Datos (libros de trabajo 'FD - ...'), del resto de libros de trabajo de diseño de Cuadros de Mandos (libros de trabajo 'CM - ...') que representan el 'código fuente' de las Visualizaciones y los Dashboards.
  • Fuente de Datos compartida: Es un objeto generado por la Plataforma Tableau que representa a un conjunto de datos organizados e interrelacionados entre sí, que están disponibles para ser usado en cualquier Libro de Trabajo de diseño de Cuadros de Mandos.

Los Libros de Trabajo para el diseño de Fuentes de Datos serán creados por los perfiles Especialistas de Datos que desarrollan el Modelo Conceptual de Datos del Proyecto BI en el Espacio de Desarrollo del Proyecto BI (ejemplo: 'DES - Proyecto_X').  El diseño de un objeto de Fuente de datos se realiza en la pestaña 'Fuente de Datos' de éste Libro de Trabajo.: Cuando se complete una versión inicial de este diseño debe solicitarse una petición de soporte para 'Publicar una nueva Fuente de Datos compartida'. 

La publicación de una nueva Fuente de Datos Compartida será realizada por un Técnico de Soporte de la Plataforma, y tendrá como resultado la creación de dos objetos nuevos en el Espacio de Fuentes de Datos compartidas: El nuevo objeto de Fuente de Datos compartidas,  y una copia  de la versión de Libro de Trabajo de diseño de Fuente de Datos usada para generarla. Ambos objetos nuevos tendrán el mismo nombre (ejemplo: 'FD - Dataset_X'), para indicar que uno ha sido generado a partir del otro.

Al inicio de los trabajos de Preparación de los Datos y Modelado de Datos de Negocio de un nuevo Proyecto BI, los Técnicos de Soporte se encargarán de crear el Espacio de Fuente de Datos para la nueva Fuente de Datos:

  • Creación de nuevo proyecto (carpeta) de Fuente de Datos: Dentro del Espacio de FUENTES DE DATOS se creará un nuevo proyecto (carpeta) que actuará como contenedor de las nuevos objetos de Fuentes de Datos, y en su caso Flujos de Datos (procesos ETL).

Creación de nueva carpeta en Fuentes de Datos

 

Cambios en Fuentes de Datos de Tableau compartidas

Un cambio en una Fuente de Datos compartida de Tableau consistirá en un mini-proyecto con las siguientes actividades:

  1. Desarrollo de nueva versión del Libro de Trabajo de diseño de Fuente de Datos: El Especialista de datos editará/generará una nueva versión en el Espacio de Desarrollo del Proyecto BI.
  2. Petición de Soporte para Publicación de nueva versión de Fuente de Datos compartida: se registrará una petición que será atendida por los Técncios de Soporte de la Plataforma, realizando las siguientes operaciones:
    1. Reemplazo de la Fuente de Datos compartida a partir de la nueva versión entregada del Libro de Trabajo de diseño de Fuente de Datos. 
    2. Verificación de impacto en los Libros de Trabajo de Cuadros de Mando ya publicados/compartidos que usan la Fuente de Datos: Si la Fuente de Datos compartida es usada ya en uno o varios Libros de Trabajo de Cuadros de Mando pubicados, debe comprobarse que todas sus visualizaciones y dashboards siguen ofreciendo datos. Es posible que se detecte que falta algún campo, o ha sufrido algún cambio que impacte negativamente en alguna de las visualizaciones que están siendo compartidas en los espacios Públicos de la Plataforma. En ese caso, se abortará la publicación restaurando la versión anterior de la Fuente de Datos compartida, y se informará a los interesados de los errores/impacto producido con la nueva versión.
    3. Custodia de la nueva versión del Libro de Trabajo de diseño de Fuente de Datos: En caso de no detectarse ningún error/impacto producido por la nueva versión de la Fuente de Datos, se custodiará la nueva versión reemplazando el Libro de Trabajo correspondiente en el Espacio de Fuente de Datos compartida.
  3. Revisión de impacto en las versiones de Desarrollo de Libros de Trabajo de Cuadros de Mando: Los Especialistas de Datos (y/o los Analistas de Datos) del proyecto deben comprobar el impacto que puede haber producido la nueva versión de la Fuente de Datos compartida, usando para ello las versiones custodiadas en el Espacio de Desarrollo del Proyecto BI de los Libros de Trabajo de Cuadros de Mando que usan la Fuente de Datos afectada. Esta tarea debe realizarse en todos los casos, incluso cuando no se haya producido impacto en las versiones públicas/compartidas de los cuadros de mando, ya que debe evaluarse el posible impacto generado por la nueva versión de la Fuente de Datos en aquellas versiones en desarrollo (aún no publicadas) de Libros de Trabajo de Cuadros de Mando que usan la Fuente de Datos.

Estándares para el desarrollo de Fuentes de Datos de Tableau

En los trabajos de desarrollo y mantenimiento de las Fuentes de Datos en la Plataforma Tableau deben respetarse las siguientes normas y/o estándares:

Nomenclatura de objetos de Fuentes de Datos compartidas.

Los objetos de Fuente de Datos compartida generados en la Plataforma Tableau se generarán con un nombre que siga el siguiente patrón: 'FD - ' <nombre del dataset

El <nombre del dataset> debe identificar al repositorio y/o Sistema de Información que actúa como orígen de los datos. En algunos casos, será conveniente precisar haciendo referencia a la parte/módulo (o subconjunto de datos) del repositorio y/o Sistema de Información, sobre el que versan los datos ofrecidos por la Fuente de datos.

Algunos ejemplos:

  • FD - TuTurno
  • FD - Hipatia
  • FD - GIRO (Presupuestos)
  • FD - GIRO (Contratos)
  • FD - TEO (SIREC)

Los Libros de Trabajo para el diseño de la Fuente de Datos usados para custodiar el diseño de la versión publicada/compartida de la Fuente de Datos tendrá el mismo nombre que el objeto  de Fuente de Datos compartida, y se ubicará en el mismo Espacio de Fuente de Datos compartida.

Las versiones provisionales de  Libros de Trabajo para el diseño de la Fuente de Datos, ubicadas en el Espacio de Desarrollo del Proyecto BI, seguirán el siguiente patrón de nomenclatura: FD - ' <nombre del dataset>  <versión>

Algunos ejemplos:

  • FD - TuTurno V1
  • FD - TuTunro V2
  • FD - GIRO (Presupuestos) Vx

 

Nomenclatura de Tablas/Entidades en la Fuente de Datos.

...

Nomenclatura de Campos en la Fuente de Datos.

...

Organización de Campos por Carpetas.

...

Índice