domingo, 17 de marzo de 2013

Bases de Datos

Resumen: Inteligencia de Negocios

Inteligencia de Negocios
Resumen

La TI ayuda a hacer eficientes muchos de los procesos de negocios de las empresas y facilita sus actividades normales, como la comunicación interna, los cierres contables, el manejo de los inventarios, etc. Si analizamos la evolución de la economía mundial en las últimas décadas, el papel de la TI en “la aldea global” es imprescindible, ya que muchos de los negocios y las relaciones humanas actuales no se podrían llevar a cabo sin una infraestructura de TI eficiente y adecuada. La visión que se tiende a tener de la TI, es en ámbitos transaccionales; es decir, la TI permite, facilita y/o genera procesos transaccionales. Los sistemas transaccionales generan y almacenan datos, pero no se diseñaron ni optimizaron para analizarlos.

¿Cómo responde la TI a esta necesidad de información estratégica gerencial?

Por medio de la especialización, se ha creado dentro de la TI un área para la generación de información de alto nivel, que se conoce como Inteligencia de Negocios (IN). Se trata de un enfoque integral que vas más allá de la propia técnica, tratándose de una nueva área de especialización dentro de la TI.

La IN según Elizabeth Vitt:

1. Tomar mejores decisiones y más rápidamente: mejorar el rendimiento de los negocios de las organizaciones.
2. Convertir los datos en información: En IN se convierten estos datos en la información requerida por estos usuarios de un alto nivel.
3. Utilizar un enfoque racional en la administración: la IN se puede describir como un enfoque de la Administración, un estado mental organizacional, una filosofía de la Administración…, en resumen, se trata de la actitud de la IN” [Vitt 2002]

La IN ayuda a las empresas a generar información a partir de sus datos, en una forma rápida y dinámica, con lo cual se pueden tomar mejores decisiones de negocios de una manera más rápida que en el pasado. Con esta información se establecen y miden los resultados de los negocios de las empresas.

Los Data Warehouse y Data Marts nos brindan un enfoque histórico de los resultados generados en la empresa. Recientemente han florecido otras tecnologías que van complementando estos requerimientos de datos:

·       Balanced Scorecards: se utilizan para llevar un control en forma continua de los resultados de metas específicas de negocios, se “vigilan” estadísticas, razones financieras, etc.
·       Minería de Datos algoritmos especializados que pretenden adelantarse al comportamiento de los clientes, del mercado, agentes económicos y otras variables.
·       Customer Relationship Management (CRM). clientes con atención especial, para aprovechar las oportunidades de negocios que ellos ofrecen.
·       Visualización de la información: Se trata de las herramientas del usuario final (representaciones gráficas y/o tabulares de la información almacenada en los sistemas de IN)

Sistemas de Data Warehouse, Data Marts y Tecnología OLAP
Los DW integran información de distintos sistemas y áreas de la empresa, y se espera que integren la información de todos los sistemas, unidades de negocios, oficinas, sucursales, regiones, etc. que conforman la empresa.

DW según Inmon:

1. Son orientados a temas específicos.
2. Integrados
3. No volátiles
4. Históricos
 
Según Ralph Kimball, “un Data Mart es un trozo completo del pastel tomado del pastel completo que es el Data Warehouse” Para Inmon los Data Marts se derivan del DW y para Kimball los Data Marts conforman el DW.

Depósitos de Datos Operativos (DDO)
Éste es un repositorio de información transaccional que incluye como mínimo los datos que se requiere cargar históricamente al DW. Es decir, los datos se cargan primero al DDO y de este se van trasladando periódicamente al DW. La desventaja de construir un DW a partir de un DDO radica en el hecho de que los resultados se van obtener tras un período de desarrollo que puede ser largo.

Diferencias entre los sistemas transaccionales y los depósitos de datos (DW)
Según Han los sistemas informáticos transaccionales son las de ejecutar transacciones en línea y llevar a cabo el procesamiento de consultas al instante y los DW no reciben actualizaciones constantes de datos, la información que se almacenan proviene de “cortes” de la información en momentos específicos del tiempo. Además el DW no brinda detalle alguno sobre transacciones específicas, sino que proveen información resumida y relevante.

Tecnología OLAP y Pensamiento Multidimensional

Cubos Multidimensionales de Datos, Dimensiones y Medidas
Las bases de datos utilizan el concepto de Cubo de Datos Multidimensional en vez de tablas o archivos planos. Un cubo de datos se construye a partir de un esquema de base de datos de estrella. En los cubos multidimensionales se almacena la información organizándola en Medidas y Dimensiones, donde se generan todas las posibles combinaciones de medidas y dimensiones.

Esquemas de Estrella
Compuesto por una tabla de hechos y tablas de dimensiones. La tabla de hechos hace referencia a las dimensiones y además tiene campos numéricos (las medidas), se trata de los valores que se desea analizar, agregar o resumir. Las Tablas de dimensiones contienen información descriptiva y son tablas de categorías. Se organizan en Jerarquías

MOLAP, ROLAP y HOLAP
Son métodos de almacenamiento de los datos de los cubos:

·         MOLAP: se almacenan en estructuras multidimensionales. Este método es el que da los mejores tiempos de respuesta en la consultas, pero es el que consume más espacio. Almacena los datos que se consultan más frecuentemente.
·         ROLAP: se almacenan en tablas relacionales. Es el que da los tiempos de respuesta más lentos en la consultas, pero es el que consume menos espacio. Almacena los datos que se consultan con menos frecuencia, por lo general son datos de años anteriores.
·         HOLAP: se utilizan métodos híbridos, repartiendo el almacenamiento de los datos entre tablas y estructuras multidimensionales con tiempos de respuesta intermedios.

Arquitectura de los sistemas de Data Warehouse
Los componentes típicos de la arquitectura de un DW conforman tres niveles básicos:

1. Bases de Datos Relacionales: se depositan los datos que se extraen desde las distintas fuentes de información.
2. Bases de Datos Multidimensionales: se almacenan los cubos de datos, se trata de las estructuras de datos que facilitan el análisis OLAP de la información.
3. Herramientas dirigidas a los usuarios finales: exploran los datos de los cubos multidimensionales y de las estrellas. Las herramientas de usuario final son aplicaciones gráficas que permiten realizar consultas multidimensionales.

De una manera simplista y resumida, podemos asignar los recursos (incluyendo el tiempo) de un proyecto de DW de la siguiente manera:

75% Programación de la extracción, migración, pruebas con los datos
15% Diseño y construcción de modelos de datos: conceptuales, lógicos y físicos; tanto relacionales como multidimensionales.
10% Instalación de aplicaciones y capacitación de usuarios y técnicos

Lo más recomendable y natural es implementar un sistema de IN desarrollado “a la medida” de la empresa, no un “sistema enlatado”.

El problema de la obtención de los datos
Las fuentes básicas de datos para el DW son los sistemas OLTP. Uno de los objetivos de un DW es la integración de la información de diversos sistemas en un repositorio único y completo. Una vez que se han establecido las fuentes de datos, se procede a construir los procesos de extracción-traslado de datos al DW. Han y Kamber organizan estos procesos en un conjunto de técnicas de extracción de datos:

1. Limpieza de los datos: se completan los datos faltantes, se suavizan los datos extremos y se pueden corregir inconsistencias de la información.
2. Integración de datos: Se unifican y homogenizan los datos de distintas fuentes.
3. Transformación de datos:

a. Suavizado de datos extremos
b. Agregación de información
c. Generalización
d. Construcción de atributos (o datos derivados)
e. Normalización de información

4. Reducción de datos

 
Aspectos Metodológicos

Se mencionan algunos Factores Críticos de Éxito y recomendaciones de aspectos y/o elementos que se deberían incluir en cualquier metodología de trabajo para sistemas de IN:

Etapas de un proyecto de DW: El Ciclo de Vida del DW

1.      Planeación del proyecto
2.      Administración del proyecto
3.      Definición de requerimientos de negocios
4.      Modelamiento Multidimensional
5.      Diseño físico
6.      Preparación de datos, diseño, desarrollo e implementación
7.      Diseño de la arquitectura técnica
8.      Selección e instalación de productos:
9.      Aplicaciones de usuario final
10.  Mantenimiento y crecimiento
11.  Capacitación y divulgación de resultados
 

Factores Críticos de Éxito

1.      No se puede trabajar sin una metodología
2.      Utilización de una metodología de trabajo consolidada
3.      Evaluación de los desarrolladores
4.      Evaluación de opciones de desarrollo
5.      Confiabilidad de las especificaciones del sistema
6.      Datos básicos confiables
7.      Disponibilidad de personal técnico y de negocios para el proyecto
8.      Disponibilidad de infraestructura tecnológica
9.      La evangelización lleva a generar expectativas adecuadas de los usuarios
10.  Pertinencia y relevancia de los datos
11.  La experiencia en IN es fundamental

 
Sistemas de Minería de Datos
Busca llegar al descubrimiento de información valiosa a partir de grandes volúmenes de datos. Etapas:

1.      Depuración y/o limpieza de los datos.
2.      Integración de la información
3.      Selección de los datos por utilizar
4.      Transformación de los datos
5.       Minería sobre los datos
6.       Evaluación de patrones
7.      Presentación del conocimiento
 
Tipos de Análisis

·         Clasificación (Aprendizaje Supervisado)
·         Predicción.
·         Análisis de Agrupamiento (Aprendizaje no Supervisado.
·         Asociación (Market Basket Analysis)
 
Algoritmos de minería de datos
Se integran técnicas, algoritmos y métodos de estudio de diversas áreas de especialización. Técnicas y en qué casos y/o circunstancias se pueden utilizar:

·         Clasificación por medio de Árboles de Decisión: Gráfico con nodos que representan pruebas en atributos y las ramas, respuestas a las pruebas,  las hojas,  categorías finales o distribución de los datos.
·         Redes Neuronales: simulaban el comportamiento del cerebro. Con neuronas están interconectadas y reaccionan ante los estímulos que reciben unas de otras.
·         Elementos de Procesamiento (EP): se trata de unidades de procesamiento de datos (inputs y outputs).
·         Redes de Confianza Bayesianas: La idea básica de este método es medir la probabilidad de que un objeto pertenezca a algún grupo o segmento específico.
·         Teorema de Bayes
·         Clasificación Bayesiana Naive
 

Otras tecnologías para información gerencial
Tres áreas de interés:

·         Balanced Scorecard (Cuadros de Mando Integral): Busca generar nuevos enfoques y modelos de gestión dado que los vigentes (Calidad Total, Justo a Tiempo, etc.) atacaban aspectos puntuales de la gestión y no conformaban un sistema global. En el BS las medidas financieras y las no financieras se organizan en dos niveles básicos:
1.      Medidas de los resultados pasados (efecto)
2.      Medidas que generan estos resultados (causa) 

El BS se divide en cuatro grandes áreas:
1.      Medidas financieras
2.      Medidas de los clientes
3.      Medidas de los procesos internos de negocios
4.      Medias de crecimiento y aprendizaje

Un proyecto de BS consiste básicamente en tres etapas:
1. Determinar las medidas que se van a incluir dentro de cada una de las 4 áreas.
2. La generación de datos para el cálculo de estas medidas.
3. La presentación de la información.
 
·         Customer Relationship Management (Administración de las relaciones con los clientes): Sistemas que almacenan información histórica y detallada de cada uno de los clientes de la empresa, así como de las transacciones que llevan a cabo.

·         Visualización de la información: Las herramientas que permiten a los usuarios interactuar con los sistemas de IN de una manera inteligible. La principal utilidad de este tipo de tecnología es que permite desplegar los sistemas de IN llevándolos a muchos usuarios.

domingo, 10 de marzo de 2013

Proyecto: Visión

Introducción

Con el desarrollo del sistema de información se pretende que la pequeña empresa Blotech celulares tenga un control más eficaz en cuanto  al registro de los celulares que entran al taller de reparación de hardware y software de la tienda, así como los repuestos utilizados en la reparación de los mismos.

1.1 Antecedentes del problema
La empresa al no contar con un sistema formal y ordenado, de manera digital, provoca confusiones que generan atrasos en la entrega de los celulares y además causa desconciertos en los precios establecidos por las reparaciones de los mismos, ya que no se registra de manera ordenada los costos de la reparación.

1.2 Oportunidad del producto por desarrollar
Con la creación del sistema se logrará llevar un registro ordenando y puntual de los celulares por reparar, en reparación y los que ya fueron reparados. Así como los precios de por la reparación y/o los repuestos que se utilizaron, en caso de ser necesarios.
Por medio de éste sistema, la empresa Blotechtendrá oportunidad de ser más productiva,y ofrecer un mejor servicio al cliente, permitiéndole tener una mejor imagen empresarial y ahorrar aquellos gastos que se pueden presentar por confusiones.

1.3 Estatuto del problema

El problema
   Atrasos en la entrega de celulares y confusiones en los precios de reparación
Afecta
   A los clientes y a la empresa
El impacto del cual es  
   La mala imagen de la empresa por clientes insatisfechos
Una solución exitosa debería ser
   ·         Entrega de los celulares a tiempo
   ·         Mejor control de los precios por mano de obra.
   ·         Registro ordenado de los repuestos utilizados


1.4 Objetivos del sistema 

·Objetivo general:
Desarrollar un sistema que permita a la empresa mejorar su imagen mediante un servicio eficaz de reparación de celulares.

·Objetivos específicos:
-       Registrar digitalmente de forma ordenada los celulares que ingresan por reparación.
-       Mejorar el control de los repuestos que se utilizan en la reparación de los celulares.
-       Disminuir las confusiones en cuanto a los precios de reparación tanto por mano de obra como por repuestos.


1.5 Criterios de éxito
 
· Crear una base de datos que registre el estado de los celulares dentro de la tienda, en cuanto a su reparación. Es decir, aquellos que están pendientes, los que están siendo reparados y los que ya fueron reparados o los que no tienen reparación.
· El sistema asociará los celulares a aquellos repuestos que se van a utilizar en su reparación.
· A cada reparación se le asignará un costo por la mano de obra y los repuestos si se requieren.

1.6  Necesidades del cliente o del mercado
Los clientes de la tienda Blotech desean requieren que los celulares que llevan a reparar, se les entregue de manera rápida ya que éstos representan un medio importante de comunicación. Además, que el precio por la reparación sea razonable y competitivo en el mercado. Ésto se pretende lograr con la creación del sistema que será utilizado de manera práctica por los usuarios de la empresa.

1.7  Riesgos del sistema
Un registro erróneo de los datos en el sistema representa un problema que provocaría confusiones que podrían generar gastos para la empresa y descontento en los clientes ya sea por atrasos en la entrega, por una reparación que no corresponde a la solicitada, por errores en el cobro de la reparación, entre otros.

2. Visión de la solución
Proporcionar un registro eficiente de las reparaciones que se realicen en el taller de la empresa Blotech.

2.1 Estatuto de visión

Para
Los usuarios de la empresa
Quien
La empresa Blotech
El
Programa de registro
Que
Llevará un mejor control de las reparaciones de celulares
A diferencia de
Registro manual
Nuestro programa
Mejorará el servicio al cliente
 

    2.2 Características principales
·   Controlar y mostrar celulares que han ingresado al taller de reparaciones,
·   Mostrar el estado de los celulares, en cuanto su proceso de reparación.
·   Llevar un control de los repuestos utilizados.
·   Llevar un registro de los costos de reparación.

2.3 Suposiciones y dependencias

·   El empleado encargado de realizar los registros en el programa debe conocer realmente el estado de los celulares en cuanto a su reparación (en espera, en reparación, reparados o que no tienen reparación).
·   El precio establecido por la reparación dependerá del empleado ya que el sistema solo informará el costo de la mano de obra y de los repuestos.

2.4 Costo y precio
La empresa Blotech celulares es pequeña por lo tanto se considera que la instalación del sistema de información desarrollado no implicará un alto costo, por ello se considera que éste será de un valor cercano a los diez mil colones. Ya que se pretende que los empleados, los cuales son muy pocos, aprendan a utilizarlo por medio de la adquisición de un manual de bajo costo. Además, el costo del sistema de información elaborado será cerca de los ochenta mil colones, tomando en cuenta el tiempo dedicado al proceso de construcción del mismo, y las funciones que presenta.

3. Alcances y Limitaciones
Con la ejecución de este proyecto se podrá registrar y mejorar el control del proceso de reparación de celulares en la tienda Blotech Celulares, específicamente en el área de servicio técnico que se da en el taller de reparaciones de la misma. Se podrá ampliar el proyecto hacia otras empresas que requieran dicho sistema así como mejorar el sistema según las necesidades de cada empresa.

Dentro de las limitaciones se encuentra que el personal de la empresa maneja términos y programas de software muy básicos y no asimilan bien un sistema de este tipo por falta de experiencia y capacitación. A la vez si los empleados no ingresan los datos completos de manera ordenada y puntual entonces pueden presentarse confusiones entre las reparaciones.

3.1 Alcance de la versión inicial
Se observará una interfaz con una ventana de inicio en la cual se puede ingresar nuevas reparaciones, modificar el estado de las mismas o mostrar las que ya se han ingresado, desplegando una ventana para cada una de las acciones anteriores. El producto permite acoplarse fácilmente a cualquier empresa que realice reparaciones de celulares ya que se maneja un estándar de este proceso en muchos talleres de reparación, con las mismas necesidades que en este caso tiene la empresa Blotech Celulares.

3.2 Alcance de las versiones siguientes
En versiones posteriores se puede implementar nuevas opciones de ingreso de datos según lo requiera la empresa en el momento o posteriormente a la adquisición del producto. Así como relacionar dichos datos según el número de reparación, modelo de celular, repuesto utilizado, entre otros.

3.3 Limitaciones y exclusiones
Un corte del flujo eléctrico lo cual mantiene las computadoras funcionando y por ende el sistema. También algún daño en el computador donde esté instalado el sistema que no permita que funcione correctamente o que del todo pierda los datos ingresados. En dicho caso se puede utilizar un sistema manual de registro y posteriormente ser ingresado al sistema y hacer respaldos de los datos.