Resumen
La
TI ayuda a hacer eficientes muchos de los procesos de negocios de las empresas
y facilita sus actividades normales, como la comunicación interna, los cierres
contables, el manejo de los inventarios, etc. Si analizamos la evolución de la
economía mundial en las últimas décadas, el papel de la TI en “la aldea global”
es imprescindible, ya que muchos de los negocios y las relaciones humanas
actuales no se podrían llevar a cabo sin una infraestructura de TI eficiente y
adecuada. La visión que se tiende a tener de la TI, es en ámbitos
transaccionales; es decir, la TI permite, facilita y/o genera procesos
transaccionales. Los sistemas transaccionales generan y almacenan datos, pero
no se diseñaron ni optimizaron para analizarlos.
¿Cómo
responde la TI a esta necesidad de información estratégica gerencial?
Por
medio de la especialización, se ha creado dentro de la TI un área para la
generación de información de alto nivel, que se conoce como Inteligencia de
Negocios (IN). Se trata de un enfoque integral que vas más allá de la propia
técnica, tratándose de una nueva área de especialización dentro de la TI.
La
IN según Elizabeth Vitt:
1.
Tomar mejores decisiones y más
rápidamente: mejorar el rendimiento de los negocios de
las organizaciones.
2.
Convertir los datos en información:
En IN se convierten estos datos en la
información requerida por estos usuarios de un alto nivel.3. Utilizar un enfoque racional en la administración: la IN se puede describir como un enfoque de la Administración, un estado mental organizacional, una filosofía de la Administración…, en resumen, se trata de la actitud de la IN” [Vitt 2002]
La
IN ayuda a las empresas a generar información a partir de sus datos, en una
forma rápida y dinámica, con lo cual se pueden tomar mejores decisiones de
negocios de una manera más rápida que en el pasado. Con esta información se
establecen y miden los resultados de los negocios de las empresas.
Los Data Warehouse y Data Marts nos brindan un enfoque histórico de los resultados generados en la empresa. Recientemente han florecido otras tecnologías que van complementando estos requerimientos de datos:
·
Balanced
Scorecards: se utilizan para llevar un control en
forma continua de los resultados de metas específicas de negocios, se “vigilan”
estadísticas, razones financieras, etc.
·
Minería
de Datos algoritmos especializados que pretenden
adelantarse al comportamiento de los clientes, del mercado, agentes económicos y
otras variables.· Customer Relationship Management (CRM). clientes con atención especial, para aprovechar las oportunidades de negocios que ellos ofrecen.
· Visualización de la información: Se trata de las herramientas del usuario final (representaciones gráficas y/o tabulares de la información almacenada en los sistemas de IN)
Sistemas de Data Warehouse, Data
Marts y Tecnología OLAP
Los
DW integran información de distintos sistemas y áreas de la empresa, y se
espera que integren la información de todos los sistemas, unidades de negocios,
oficinas, sucursales, regiones, etc. que conforman la empresa.
DW
según Inmon:
1.
Son orientados a temas específicos.
2.
Integrados3. No volátiles
4. Históricos
Según Ralph Kimball, “un Data Mart es un trozo completo del pastel tomado del pastel completo que es el Data Warehouse” Para Inmon los Data Marts se derivan del DW y para Kimball los Data Marts conforman el DW.
Depósitos
de Datos Operativos (DDO)
Éste
es un repositorio de información transaccional que incluye como mínimo los
datos que
se requiere cargar históricamente al DW. Es decir, los datos se cargan primero
al DDO y de este
se van trasladando periódicamente al DW. La desventaja de construir un DW a
partir de un DDO radica en el hecho de que los resultados se van obtener tras
un período de desarrollo que puede ser largo.
Diferencias entre los sistemas transaccionales
y los depósitos de datos (DW)
Según
Han los
sistemas informáticos transaccionales son las de ejecutar transacciones en línea y llevar a cabo el procesamiento
de consultas al instante y los DW no reciben actualizaciones
constantes de datos, la información que se almacenan proviene de “cortes” de la
información en momentos específicos del tiempo. Además el DW no brinda detalle alguno
sobre transacciones específicas, sino que proveen información resumida y
relevante.
Tecnología OLAP y Pensamiento
Multidimensional
Cubos
Multidimensionales de Datos, Dimensiones y Medidas
Las
bases de datos utilizan el concepto de Cubo de Datos Multidimensional en vez de
tablas o archivos planos. Un cubo de datos se construye a partir de un esquema
de base de datos de estrella. En los cubos multidimensionales se almacena la información
organizándola en Medidas y Dimensiones, donde se generan todas las posibles combinaciones
de medidas y dimensiones.
Esquemas
de Estrella
Compuesto
por una tabla de hechos y tablas de dimensiones. La tabla de hechos hace
referencia a las dimensiones y además tiene campos numéricos (las medidas), se
trata de los valores que se desea analizar, agregar o resumir. Las Tablas de
dimensiones contienen información descriptiva y son tablas de categorías. Se
organizan en Jerarquías
MOLAP, ROLAP y HOLAP
Son
métodos de almacenamiento de los datos de los cubos:
·
MOLAP: se almacenan en estructuras
multidimensionales. Este método es el que da los mejores tiempos de respuesta en
la consultas, pero es el que consume más espacio. Almacena los datos que se
consultan más frecuentemente.
·
ROLAP: se almacenan en tablas relacionales. Es el
que da los tiempos de respuesta más lentos en la consultas, pero es el que
consume menos espacio. Almacena los datos que se consultan con menos
frecuencia, por lo general son datos de años anteriores.· HOLAP: se utilizan métodos híbridos, repartiendo el almacenamiento de los datos entre tablas y estructuras multidimensionales con tiempos de respuesta intermedios.
Arquitectura de los sistemas de
Data Warehouse
Los
componentes típicos de la arquitectura de un DW conforman tres niveles básicos:
1. Bases de Datos Relacionales: se depositan los datos que se extraen desde las distintas
fuentes de información.
2. Bases de Datos Multidimensionales: se almacenan los cubos de datos, se trata de las estructuras de
datos que facilitan el análisis OLAP de la información.3. Herramientas dirigidas a los usuarios finales: exploran los datos de los cubos multidimensionales y de las estrellas. Las herramientas de usuario final son aplicaciones gráficas que permiten realizar consultas multidimensionales.
De
una manera simplista y resumida, podemos asignar los recursos (incluyendo el
tiempo) de un proyecto de DW de la siguiente manera:
• 75% Programación de la extracción, migración, pruebas con los
datos
• 15% Diseño y construcción de modelos de datos: conceptuales,
lógicos y físicos; tanto relacionales como multidimensionales.• 10% Instalación de aplicaciones y capacitación de usuarios y técnicos
Lo
más recomendable y natural es implementar un sistema de IN desarrollado “a la
medida” de la empresa, no un “sistema enlatado”.
El problema de la obtención de los
datos
Las
fuentes básicas de datos para el DW son los sistemas OLTP. Uno de los objetivos
de un DW es la integración de la información de diversos sistemas en un repositorio
único y completo. Una vez que se han establecido las fuentes de datos, se
procede a construir los procesos de extracción-traslado de datos al DW. Han y
Kamber organizan estos procesos en un conjunto de técnicas de extracción de
datos:
1.
Limpieza de los datos: se completan los datos faltantes, se suavizan los datos
extremos y se pueden corregir inconsistencias de la información.
2.
Integración de datos: Se unifican y homogenizan los datos de distintas fuentes.3. Transformación de datos:
a. Suavizado de datos extremos
b. Agregación de información
c. Generalización
d. Construcción de atributos (o datos derivados)
e. Normalización de información
4. Reducción de datos
Aspectos Metodológicos
Se
mencionan algunos Factores Críticos de Éxito y recomendaciones de aspectos y/o
elementos que se deberían incluir en cualquier metodología de trabajo para
sistemas de IN:
Etapas
de un proyecto de DW: El Ciclo de Vida del DW
1.
Planeación
del proyecto
2. Administración del proyecto3. Definición de requerimientos de negocios
4. Modelamiento Multidimensional
5. Diseño físico
6. Preparación de datos, diseño, desarrollo e implementación
7. Diseño de la arquitectura técnica
8. Selección e instalación de productos:
9. Aplicaciones de usuario final
10. Mantenimiento y crecimiento
11. Capacitación y divulgación de resultados
Factores
Críticos de Éxito
1.
No se
puede trabajar sin una metodología
2. Utilización de una metodología de trabajo consolidada3. Evaluación de los desarrolladores
4. Evaluación de opciones de desarrollo
5. Confiabilidad de las especificaciones del sistema
6. Datos básicos confiables
7. Disponibilidad de personal técnico y de negocios para el proyecto
8. Disponibilidad de infraestructura tecnológica
9. La evangelización lleva a generar expectativas adecuadas de los usuarios
10. Pertinencia y relevancia de los datos
11. La experiencia en IN es fundamental
Sistemas de Minería de Datos
Busca
llegar al descubrimiento de información valiosa a partir de grandes volúmenes
de datos. Etapas:1. Depuración y/o limpieza de los datos.
2. Integración de la información
3. Selección de los datos por utilizar
4. Transformación de los datos
5. Minería sobre los datos
6. Evaluación de patrones
7. Presentación del conocimiento
Tipos de Análisis
· Clasificación (Aprendizaje Supervisado)
· Predicción.
· Análisis de Agrupamiento (Aprendizaje no Supervisado.
· Asociación (Market Basket Analysis)
Algoritmos de minería de datos
Se integran técnicas, algoritmos y métodos de estudio de diversas áreas de especialización. Técnicas y en qué casos y/o circunstancias se pueden utilizar:
· Clasificación por medio de Árboles de Decisión: Gráfico con nodos que representan pruebas en atributos y las ramas, respuestas a las pruebas, las hojas, categorías finales o distribución de los datos.
· Redes Neuronales: simulaban el comportamiento del cerebro. Con neuronas están interconectadas y reaccionan ante los estímulos que reciben unas de otras.
· Elementos de Procesamiento (EP): se trata de unidades de procesamiento de datos (inputs y outputs).
· Redes de Confianza Bayesianas: La idea básica de este método es medir la probabilidad de que un objeto pertenezca a algún grupo o segmento específico.
· Teorema de Bayes
· Clasificación Bayesiana Naive
Otras tecnologías para información gerencial
Tres áreas de interés:· Balanced Scorecard (Cuadros de Mando Integral): Busca generar nuevos enfoques y modelos de gestión dado que los vigentes (Calidad Total, Justo a Tiempo, etc.) atacaban aspectos puntuales de la gestión y no conformaban un sistema global. En el BS las medidas financieras y las no financieras se organizan en dos niveles básicos:
1. Medidas de los resultados pasados (efecto)
2. Medidas que generan estos resultados (causa)
El BS se divide en cuatro grandes áreas:
1. Medidas financieras
2. Medidas de los clientes
3. Medidas de los procesos internos de negocios
4. Medias de crecimiento y aprendizaje
Un proyecto de BS consiste básicamente en tres etapas:
1. Determinar las medidas que se van a incluir dentro de cada una de las 4 áreas.
2. La generación de datos para el cálculo de estas medidas.
3. La presentación de la información.
· Visualización de la información: Las herramientas que permiten a los usuarios interactuar con los sistemas de IN de una manera inteligible. La principal utilidad de este tipo de tecnología es que permite desplegar los sistemas de IN llevándolos a muchos usuarios.
No hay comentarios:
Publicar un comentario