Inicio > Modelo de Datos > Modelado de datos

Modelado de datos

El Modelado de Datos (MD) es una disciplina de la Gestión de la Información encargada de la construcción de modelos de datos, que son representaciones abstractas de los datos.

Dentro del MD, encontramos 3 niveles:

  1. Nivel Conceptual o de Negocio, donde se busca abstraer la forma en que el Negocio entiende la información. Es el punto de partida del modelo. Un ejemplo sería el modelo E-R (Entidad-Relación)
  2. Nivel Lógico, que está orientado a las operaciones. El Modelo Relacional es un ejemplo de modelo de datos en nivel lógico.
  3. Nivel Físico, representa el último nivel y en el intervienen los elementos relacionados ya con la base de datos, como pueden ser índices, tablas, etc.

En lo que respecta al objetivo, el MD busca ayudarnos con las capacidades que buscamos en los datos (comprender, documentar, comunicar, analizar, generalizar, clarificar, estandarizar, especificar e implementar).

El proceso de MD está basado en 3 elementos:

Proceso de Modelado de Datos

  1. Recoger los requerimientos que debe satisfacer nuestro modelo, fundamentados en el Negocio o Proceso a modelar,
  2. Planificar el proyecto, que incluiría analizar todas las fuentes de datos a considerar, posibles migraciones de los mismos, procesos de calidad de datos, etc.
  3. Diseñar y construir la base de datos, último paso, con los entregables desarrollados en las 2 primeras fases (análisis, diseños).

que cubriría las fases de análisis, diseño e implementación de la base de datos.

Existen varias clases de Modelos de Datos  (jerárquico, relacional, etc.) entre los que destacan los dos más usados: el modelo E-R (y su extensión Modelo Relacional) y el modelo Dimensional.

El modelo Relacional tiene como finalidad servir de soporte a datos operacionales. Es el principal modelo de datos para aplicaciones que tienen como finalidad servir a los procesos y actividades del Negocio. Un ejemplo de base de datos relacional estaría en una base de datos donde dar soporte a los usuarios de Facebook. O gestionar el catálogo de una biblioteca. Los ejemplos son variados. Su entorno es el que las transacciones con la base de datos están caracterizadas por ser comunes tanto los INSERT, UPDATE y DELETE sobre los registros almacenados. Con el fin de optimizar la gestión de dichas transacciones, tienen que satisfacer una serie de condiciones, recogidas en un proceso conocido como «Normalización de bases de datos«, propuesto por Codd. También se busca garantizar la inexistencia de registros duplicados, mediante la utilización de claves. Si bien durante mucho tiempo se ha defendido que las transacciones sobre las que operan las bases de datos relacionales cumplieran las características ACID, hoy en día, con la aparición de fenómenos como Facebook o Twitter, sus problemas de escalabilidad han cambiado las reglas de juego, y sustituyendo ACID con conceptos como NoSQL.

El Modelo Dimensional tiene como finalidad servir de soporte a la toma de decisiones. Aquí ya no se buscan optimizar las transacciones de tipo INSERT, UPDATE ó DELETE. Debido a ello, la Normalización pierde sentido. Se busca optimizar las consultas (transacciones SELECT) de grandes volúmenes de información, por lo que se llevan a cabo procesos como el particionamiento de tablas o la ausencia de Foreign Keys.

Por lo tanto, el Modelo Relacional se utiliza en un entorno operacional mientras que el Modelo Dimensional se utiliza en un entorno de dar soporte a la toma de decisiones.

  1. No hay comentarios aún.
  1. No trackbacks yet.

Deja un comentario