DATAWAREHOUSE
Es un almacén de datos (del inglés data warehouse) es una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza.
OBJETIVO
- Hace que la información de la organización sea accesible: los contenidos del Data WareHouse son entendibles y navegables, y el acceso a ellos son caracterizado por el rápido desempeño.
- Hacer que la información de la organización sea consistente: la información de una parte de la organización puede hacerse coincidir con la información de la otra parte de la organización.Información consistente significa, información de alta calidad.
- Es información adaptable y elástica: el Data WareHouse esta diseñado para continuos.
- Es un seguro baluarte que protege los de la información:
- Es la fundación de la toma de decisiones:
ELEMENTOS BASICOS DE UN DATA WAREHOUSE
- Sistema fuente: operacionales de registros donde sus funciones son capturar las transacciones del negocio.
- de trafico de datos: es un área de almacenamiento y grupo de procesos, que limpian transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para ser usados en el Data WareHouse.
- Servidor de presentación: la maquina física objetivo en donde los datos del Data WareHouse son organizados y almacenados para queries directos por los usuarios finales, reportes y otras aplicaciones.
- Modelo dimensional: una disciplina especifica para el modelado de datos que es una alternativa para los modelos de entidad – relación.
- Procesos de negocios: un coherente grupo de actividades de negocio que hacen sentido a los usuarios del negocio del Data WareHouse.
- Data Mart: un subgrupo lógico del Data WareHouse completo.
- Data WareHouse: búsquedas fuentes de datos de la empresa. Y es la unión de todos los data marts que la constituyen.
- Almacenamiento operacional de datos: es el de integración por los sistemas operacionales. Es el acceso al soporte de decisiones por los ejecutivos.
- OLAP: actividad general de búsquedas para presentación de texto y números del Data WareHouse,
- ROLAP: un grupo de interfases de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional.
- MOLAP: un grupo de interfases de usuarios, aplicaciones y propietarios de tecnología de bases de datos que tienen un fuerte estilo dimensional.
- Aplicaciones para usuarios finales: una colección de herramientas que hacen los queries, analizan y presentan la información objetivo para el soporte de las necesidades del negocio.
- Herramientas de acceso a datos por usuarios finales: un cliente de Data WareHouse.
- Ad Hoc Query Tool: un especifico de herramientas de acceso a datos por usuarios finales que invita al usuario a formas sus propios queries manipulando directamente las tablas relacionales y sus uniones.
- Modelado de aplicaciones: un sofisticado tipo de cliente de Data WareHouse con capacidades analíticas que transforma o digiere las salidas del Data WareHouse.
- Meta Data: toda la información en el ambiente del Data WareHouse que no son así mismo los datos actuales.
PROCESOS BAISCOS DEL DATA WAREHOUSE (ETL)
- Extracción: este es el primer paso de obtener la información hacia el ambiente del Data WareHouse.
- Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay posibles paso de transformación como; limpieza de la información, tirar la basura que no nos sirve, seleccionar únicamente los campos necesarios para el Data WareHouse, combinar fuentes de datos, haciéndolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensión.
- Carga: al del proceso de transformación, los datos están en forma para ser cargados.
No hay comentarios:
Publicar un comentario