domingo, 17 de marzo de 2013

Resumen: Inteligencia de Negocios

Inteligencia de Negocios
Resumen

La TI ayuda a hacer eficientes muchos de los procesos de negocios de las empresas y facilita sus actividades normales, como la comunicación interna, los cierres contables, el manejo de los inventarios, etc. Si analizamos la evolución de la economía mundial en las últimas décadas, el papel de la TI en “la aldea global” es imprescindible, ya que muchos de los negocios y las relaciones humanas actuales no se podrían llevar a cabo sin una infraestructura de TI eficiente y adecuada. La visión que se tiende a tener de la TI, es en ámbitos transaccionales; es decir, la TI permite, facilita y/o genera procesos transaccionales. Los sistemas transaccionales generan y almacenan datos, pero no se diseñaron ni optimizaron para analizarlos.

¿Cómo responde la TI a esta necesidad de información estratégica gerencial?

Por medio de la especialización, se ha creado dentro de la TI un área para la generación de información de alto nivel, que se conoce como Inteligencia de Negocios (IN). Se trata de un enfoque integral que vas más allá de la propia técnica, tratándose de una nueva área de especialización dentro de la TI.

La IN según Elizabeth Vitt:

1. Tomar mejores decisiones y más rápidamente: mejorar el rendimiento de los negocios de las organizaciones.
2. Convertir los datos en información: En IN se convierten estos datos en la información requerida por estos usuarios de un alto nivel.
3. Utilizar un enfoque racional en la administración: la IN se puede describir como un enfoque de la Administración, un estado mental organizacional, una filosofía de la Administración…, en resumen, se trata de la actitud de la IN” [Vitt 2002]

La IN ayuda a las empresas a generar información a partir de sus datos, en una forma rápida y dinámica, con lo cual se pueden tomar mejores decisiones de negocios de una manera más rápida que en el pasado. Con esta información se establecen y miden los resultados de los negocios de las empresas.

Los Data Warehouse y Data Marts nos brindan un enfoque histórico de los resultados generados en la empresa. Recientemente han florecido otras tecnologías que van complementando estos requerimientos de datos:

·       Balanced Scorecards: se utilizan para llevar un control en forma continua de los resultados de metas específicas de negocios, se “vigilan” estadísticas, razones financieras, etc.
·       Minería de Datos algoritmos especializados que pretenden adelantarse al comportamiento de los clientes, del mercado, agentes económicos y otras variables.
·       Customer Relationship Management (CRM). clientes con atención especial, para aprovechar las oportunidades de negocios que ellos ofrecen.
·       Visualización de la información: Se trata de las herramientas del usuario final (representaciones gráficas y/o tabulares de la información almacenada en los sistemas de IN)

Sistemas de Data Warehouse, Data Marts y Tecnología OLAP
Los DW integran información de distintos sistemas y áreas de la empresa, y se espera que integren la información de todos los sistemas, unidades de negocios, oficinas, sucursales, regiones, etc. que conforman la empresa.

DW según Inmon:

1. Son orientados a temas específicos.
2. Integrados
3. No volátiles
4. Históricos
 
Según Ralph Kimball, “un Data Mart es un trozo completo del pastel tomado del pastel completo que es el Data Warehouse” Para Inmon los Data Marts se derivan del DW y para Kimball los Data Marts conforman el DW.

Depósitos de Datos Operativos (DDO)
Éste es un repositorio de información transaccional que incluye como mínimo los datos que se requiere cargar históricamente al DW. Es decir, los datos se cargan primero al DDO y de este se van trasladando periódicamente al DW. La desventaja de construir un DW a partir de un DDO radica en el hecho de que los resultados se van obtener tras un período de desarrollo que puede ser largo.

Diferencias entre los sistemas transaccionales y los depósitos de datos (DW)
Según Han los sistemas informáticos transaccionales son las de ejecutar transacciones en línea y llevar a cabo el procesamiento de consultas al instante y los DW no reciben actualizaciones constantes de datos, la información que se almacenan proviene de “cortes” de la información en momentos específicos del tiempo. Además el DW no brinda detalle alguno sobre transacciones específicas, sino que proveen información resumida y relevante.

Tecnología OLAP y Pensamiento Multidimensional

Cubos Multidimensionales de Datos, Dimensiones y Medidas
Las bases de datos utilizan el concepto de Cubo de Datos Multidimensional en vez de tablas o archivos planos. Un cubo de datos se construye a partir de un esquema de base de datos de estrella. En los cubos multidimensionales se almacena la información organizándola en Medidas y Dimensiones, donde se generan todas las posibles combinaciones de medidas y dimensiones.

Esquemas de Estrella
Compuesto por una tabla de hechos y tablas de dimensiones. La tabla de hechos hace referencia a las dimensiones y además tiene campos numéricos (las medidas), se trata de los valores que se desea analizar, agregar o resumir. Las Tablas de dimensiones contienen información descriptiva y son tablas de categorías. Se organizan en Jerarquías

MOLAP, ROLAP y HOLAP
Son métodos de almacenamiento de los datos de los cubos:

·         MOLAP: se almacenan en estructuras multidimensionales. Este método es el que da los mejores tiempos de respuesta en la consultas, pero es el que consume más espacio. Almacena los datos que se consultan más frecuentemente.
·         ROLAP: se almacenan en tablas relacionales. Es el que da los tiempos de respuesta más lentos en la consultas, pero es el que consume menos espacio. Almacena los datos que se consultan con menos frecuencia, por lo general son datos de años anteriores.
·         HOLAP: se utilizan métodos híbridos, repartiendo el almacenamiento de los datos entre tablas y estructuras multidimensionales con tiempos de respuesta intermedios.

Arquitectura de los sistemas de Data Warehouse
Los componentes típicos de la arquitectura de un DW conforman tres niveles básicos:

1. Bases de Datos Relacionales: se depositan los datos que se extraen desde las distintas fuentes de información.
2. Bases de Datos Multidimensionales: se almacenan los cubos de datos, se trata de las estructuras de datos que facilitan el análisis OLAP de la información.
3. Herramientas dirigidas a los usuarios finales: exploran los datos de los cubos multidimensionales y de las estrellas. Las herramientas de usuario final son aplicaciones gráficas que permiten realizar consultas multidimensionales.

De una manera simplista y resumida, podemos asignar los recursos (incluyendo el tiempo) de un proyecto de DW de la siguiente manera:

75% Programación de la extracción, migración, pruebas con los datos
15% Diseño y construcción de modelos de datos: conceptuales, lógicos y físicos; tanto relacionales como multidimensionales.
10% Instalación de aplicaciones y capacitación de usuarios y técnicos

Lo más recomendable y natural es implementar un sistema de IN desarrollado “a la medida” de la empresa, no un “sistema enlatado”.

El problema de la obtención de los datos
Las fuentes básicas de datos para el DW son los sistemas OLTP. Uno de los objetivos de un DW es la integración de la información de diversos sistemas en un repositorio único y completo. Una vez que se han establecido las fuentes de datos, se procede a construir los procesos de extracción-traslado de datos al DW. Han y Kamber organizan estos procesos en un conjunto de técnicas de extracción de datos:

1. Limpieza de los datos: se completan los datos faltantes, se suavizan los datos extremos y se pueden corregir inconsistencias de la información.
2. Integración de datos: Se unifican y homogenizan los datos de distintas fuentes.
3. Transformación de datos:

a. Suavizado de datos extremos
b. Agregación de información
c. Generalización
d. Construcción de atributos (o datos derivados)
e. Normalización de información

4. Reducción de datos

 
Aspectos Metodológicos

Se mencionan algunos Factores Críticos de Éxito y recomendaciones de aspectos y/o elementos que se deberían incluir en cualquier metodología de trabajo para sistemas de IN:

Etapas de un proyecto de DW: El Ciclo de Vida del DW

1.      Planeación del proyecto
2.      Administración del proyecto
3.      Definición de requerimientos de negocios
4.      Modelamiento Multidimensional
5.      Diseño físico
6.      Preparación de datos, diseño, desarrollo e implementación
7.      Diseño de la arquitectura técnica
8.      Selección e instalación de productos:
9.      Aplicaciones de usuario final
10.  Mantenimiento y crecimiento
11.  Capacitación y divulgación de resultados
 

Factores Críticos de Éxito

1.      No se puede trabajar sin una metodología
2.      Utilización de una metodología de trabajo consolidada
3.      Evaluación de los desarrolladores
4.      Evaluación de opciones de desarrollo
5.      Confiabilidad de las especificaciones del sistema
6.      Datos básicos confiables
7.      Disponibilidad de personal técnico y de negocios para el proyecto
8.      Disponibilidad de infraestructura tecnológica
9.      La evangelización lleva a generar expectativas adecuadas de los usuarios
10.  Pertinencia y relevancia de los datos
11.  La experiencia en IN es fundamental

 
Sistemas de Minería de Datos
Busca llegar al descubrimiento de información valiosa a partir de grandes volúmenes de datos. Etapas:

1.      Depuración y/o limpieza de los datos.
2.      Integración de la información
3.      Selección de los datos por utilizar
4.      Transformación de los datos
5.       Minería sobre los datos
6.       Evaluación de patrones
7.      Presentación del conocimiento
 
Tipos de Análisis

·         Clasificación (Aprendizaje Supervisado)
·         Predicción.
·         Análisis de Agrupamiento (Aprendizaje no Supervisado.
·         Asociación (Market Basket Analysis)
 
Algoritmos de minería de datos
Se integran técnicas, algoritmos y métodos de estudio de diversas áreas de especialización. Técnicas y en qué casos y/o circunstancias se pueden utilizar:

·         Clasificación por medio de Árboles de Decisión: Gráfico con nodos que representan pruebas en atributos y las ramas, respuestas a las pruebas,  las hojas,  categorías finales o distribución de los datos.
·         Redes Neuronales: simulaban el comportamiento del cerebro. Con neuronas están interconectadas y reaccionan ante los estímulos que reciben unas de otras.
·         Elementos de Procesamiento (EP): se trata de unidades de procesamiento de datos (inputs y outputs).
·         Redes de Confianza Bayesianas: La idea básica de este método es medir la probabilidad de que un objeto pertenezca a algún grupo o segmento específico.
·         Teorema de Bayes
·         Clasificación Bayesiana Naive
 

Otras tecnologías para información gerencial
Tres áreas de interés:

·         Balanced Scorecard (Cuadros de Mando Integral): Busca generar nuevos enfoques y modelos de gestión dado que los vigentes (Calidad Total, Justo a Tiempo, etc.) atacaban aspectos puntuales de la gestión y no conformaban un sistema global. En el BS las medidas financieras y las no financieras se organizan en dos niveles básicos:
1.      Medidas de los resultados pasados (efecto)
2.      Medidas que generan estos resultados (causa) 

El BS se divide en cuatro grandes áreas:
1.      Medidas financieras
2.      Medidas de los clientes
3.      Medidas de los procesos internos de negocios
4.      Medias de crecimiento y aprendizaje

Un proyecto de BS consiste básicamente en tres etapas:
1. Determinar las medidas que se van a incluir dentro de cada una de las 4 áreas.
2. La generación de datos para el cálculo de estas medidas.
3. La presentación de la información.
 
·         Customer Relationship Management (Administración de las relaciones con los clientes): Sistemas que almacenan información histórica y detallada de cada uno de los clientes de la empresa, así como de las transacciones que llevan a cabo.

·         Visualización de la información: Las herramientas que permiten a los usuarios interactuar con los sistemas de IN de una manera inteligible. La principal utilidad de este tipo de tecnología es que permite desplegar los sistemas de IN llevándolos a muchos usuarios.

No hay comentarios:

Publicar un comentario