sábado, 17 de julio de 2010

IEEI Wiki

Es una plataforma colaborativa, que tiene por finalidad poner a disposición de los alumnos de la Escuela de Ingeniería de Ejecución en Informática de la Universidad del Pacífico, sede Melipilla:

• Un sitio donde puedan compartir apuntes y complementarlos entre profesores y alumnos.
• Dar a conocer diversos eventos relacionados con la escuela y carrera.
• Permite hacer comentarios sobre los distintos temas publicados.
• Responder pequeñas encuestas.
• Entre otras cosas, que permiten establecer un trabajo de colaboración, en un solo lugar.
Si eres alumno o profesor de la Escuela de Ingeniería de Informática de la Universidad del Pacífico y quieres cooperar con este proyecto, inscríbete y te daremos los permisos necesarios para que empieces a publicar contenido lo antes posible.
Si tienes alguna duda, visítanos en www.rinconcasero.com y no olvides revisar nuestra sección de Preguntas Frecuentes ahí resolverás todas tus dudas.

¡¡¡ LA MEJOR FORMA DE APOYAR TUS ESTUDIOS!!!

domingo, 11 de julio de 2010

NUESTRO PROYECTO ACTUAL... ***Wiki IEEI***

La Wiki IEEI tiene por finalidad implementar una plataforma compartida, en línea y fácil de utilizar, que esté bien estructurada de acuerdo a la malla de la Carrera de Ingeniería de Ejecución en Informática, y con algunos apuntes como base, de tal manera que la información esté siempre disponible para quien desee revisarla, y que además pueda ser editada y enriquecida en conjunto entre los alumnos y profesores.


1. Objetivo General:

Implementar una Wiki para los alumnos de la carrera de Ingeniería de Ejecución en Informática de la Universidad del Pacífico, en donde puedan consultar y añadir información sobre sus asignaturas anteriores, actuales y las que tendrán a futuro, y otros temas relacionados con la carrera.

2. Nuestra Herramienta Actual

Drupal:

Es un sistema de gestión de contenidos modular multipropósitos, que permite publicar artículos, imágenes, u otros archivos y servicios como foros, encuestas, votaciones, blogs y administración de usuarios y permisos.

Drupal es un sistema dinámico, en lugar de almacenar sus contenidos en archivos estáticos en el sistema de ficheros del servidor de forma fija, el contenido textual de las páginas y otras configuraciones son almacenadas en una base de datos y se editan usando entornos Web.

Funcionalidades: al ser un gestor de contenidos, este puede usarse para aplicaciones como: portales comunitarios, foros de discusión, sitios Web corporativos, aplicaciones de Intranet, sitios personales o blogs, entre otros.

Módulos: para ampliar las funcionalidades de Drupal se utilizan los módulos que son programados por la comunidad de usuarios, cabe destacar que estos se descargan de forma individual. Entre lo más importantes destacan: Drupal, Views, Token, Pathauto, entres otros.

EL CAMINO HACIA NUESTRO PROYECTO FINAL.

  1. Herramientas utilizadas:

Wikia:

Es un sitio destinado a apoyar la creación y el desarrollo de comunidades wiki en cualquier tema. Actualmente aloja a más de 71.000 wikis en más de 70 idiomas.

Todos los contenidos de Wikia están publicados bajo una licencia de contenido libre y utiliza software de código abierto para trabajar en ellos.

http://www.wikia.com/Wikia

ZOHO Wiki:

Permite establecer wikis públicas o privadas, facilita la creación de grupos de trabajo, las wikis definidas como públicas serán indexadas y aparecerán en los resultados de los motores de búsqueda. Además en sus versiones pagadas cuenta con almacenamiento ilimitado de páginas y sub-páginas.

http://wiki.zoho.com

Drupal:

Es un sistema de gestión de contenido altamente adaptable a cualquier necesidad. Es un programa de código abierto, con licencia GNU/GPL, escrito en PHP, desarrollado y mantenido por una activa comunidad de usuarios. Se destaca por la calidad de su código y de las páginas generadas.

El diseño de Drupal es especialmente idóneo para construir y gestionar comunidades en Internet. No obstante, su flexibilidad y adaptabilidad, así como la gran cantidad de módulos adicionales disponibles, hace que sea adecuado para realizar muchos tipos diferentes de sitio Web.

El sitio principal de desarrollo y coordinación de Drupal es drupal.org, en el que participan activamente varios miles de usuarios de todo el mundo.

http://drupal.org/

domingo, 6 de junio de 2010

Proyecto: Wiki IEEI

“Una forma inteligente de apoyar tus estudios”

Te invitamos a participar en nuestro proyecto WIKI IEEI, encontrarás:

  • Información bien redactada.
  • Una Plataforma agradable.
  • Fácil acceso a los apuntes.
  • Feedback (retroalimentación).
  • Además podrás comentar y compartir tus apuntes y/o aprendizaje obtenidos.

Para conocer la aplicación, solo debes ingresar en:

http://upainformatica.wiki.zoho.com/

Para formar parte de ella, escríbenos a:

upainformatica@zoho.com

Si eres estudiante de Ingeniería de Ejecución en Informática…. Esperaremos tu correo!!!!

viernes, 21 de mayo de 2010

Preguntas... Minería de Datos

Las preguntas fueron realizadas en base a la Disertación del Grupo de Rodrigo Gonzalez.

  1. ¿En que áreas se aplica la minería de datos?

- Detección de Fraudes.

- Comportamiento de Finanzas

- Comportamiento de la Bolsa/Banca

- Determinación de comportamientos en la medicina. Ej: “Una persona va al medico por un dolor de

cabeza, el medico le indica que tome una aspirina”

Se deduce: a raíz de un comportamiento continuo se pueden clasificar las patologías médicas, por ende, se implementa la minería de datos para la determinación de patrones.

  1. ¿De dónde se extrae la información para la minería de datos?

De repositorio de datos.

Se deduce: la información puede ser extraída desde pequeñas Bases de Datos, cubos de OLAP e

incluso grandes Data Warehouse.

  1. La minería de Datos se Clasifica en Predictiva y para el descubrimiento del conocimiento.

o Predictiva: usa técnicas estadísticas.

o Para el descubrimiento del conocimiento: usa técnicas de inteligencia artificial.

Minería de Datos "Data Mining"

¿QUÉ ES MINERIA DE DATOS?

Minería de Datos, O Minería de Datos, sí refiere al conjunto de Técnicas de Extracción de información, Cuyo Objetivo es información valiosa Descubrir Que Se encuentra de forma implícita en Una Base de Datos. ESTAS extraer patrones permiten Técnicas, Tendencias y regularidades Que describen Mejor de Los Datos, y permiten y Su Comportamiento Tendencias Futuras predecir.

Debido Gran La ONU Lea la versión de información Que debe Servicios analizada En Este Proceso, Análisis de Servicios Este manual ningun PUEDE, Sino Que es semiautomático.

CARACTERISTICAS PRINCIPALES OBJETIVOS Y.

· Exploración de los Datos Que Se encuentran en Las profundidades de bases de Datos de Las, Por los Ejemplos Data Warehouse (Almacenes de Datos), Los Cuales ALGUNAS Veces contienen información Que ha Sido Años almacenada liebre.

· En Ocasiones, Los Datos en Los Almacenes de Datos Sí mantienen en Servidores de Internet e intranet.

· El Entorno de la Minería de Datos suele poseer Una arquitectura cliente - Servidor.

· Las Herramientas de Minería de Datos ayudan UNO la Extracción de la información Que ESTÁ Archivada.

· Quien extrae esta información es Usuario final Con El Pecado Poca o Habilidad de Programación, El Pecado Través de Herramientas Que permiten realizar consultas, obteniendo Respuestas Rapida Ninguna.Respuestas Rapida Ninguna.

· Las Herramientas Que procesarse utiliza la Minería de Datos en Sí combinan facilmente pueden analizarse de forma aa Rápida.

· La Minería de Datos Producir Cinco Tipos de información:

o Asociaciones.

o Secuenciales.

o Clasificaciones.

o Agrupaciones.

o Pronósticos.

En La Minería de Datos en Sí coleccionan Los Datos, y de ELLOS pueden Hipótesis Nacer, ademas busca Que Los Datos describan o Formación indiquen Su, de forma ESTA SE verifican o aprueban Las Que Se Han Hipótesis Desarrollado en base de la uña de ELLOS. Es de Los En Este punto Dónde Hijo cantantes La Minería de Datos Toma exploratorio Enfoque de la ONU.

EL PROCESO KDD

Para la Aplicación adecuada de la Minería, debe ESTAR ESTA Totalmente Integrada de las Naciones, Unidas Con Almacén de Datos, Herramientas flexibles e interactivas PARA EL Análisis de Negocios. En La Actualidad Varias de las Herramientas de Minería de Datos Operan Fuera del Almacén de Datos. Ademas, Cuando Nuevos Conceptos requieren Implementación operacional, la Integración Con El Almacén de Datos simplificación la Aplicación DE LOS RESULTADOS DESDE Minería de Datos. Este Puede Ser Aplicado RESULTADOS Por El párrafo mejorar Procesos de Negocios ES UNA Organización, en áreas de Como. .. El Manejo de compañas de publicidad, Detección de Fraudes, lanzamientos de nuevos soles Productos, entre otros.

Es así, Como El Punto es ideal inicial de las Naciones, Unidas Almacén de Datos Que contenga Una Combinación de Datos de Seguimiento interno de Todos los Clientes junto EXTERNOS Con Datos de Mercado Acerca de la Actividad de Los competidores. Por esta Razón, la información histórica Más sobre potenciales Clientes También Provee Una Excelente base de Decisiones respaldar párr.

Sin embargo, Minería de Datos y Almacén de las Naciones, Unidas en solitario Hijo Datos DE UNA DE UNA Instancia Instancia Instancia de instancia de parte de Gran Proceso de la ONU Llamado KDD, del inglés Descubrimiento del Conocimiento de la Base de Datos, O Descubrimiento del Conocimiento à partir de Una Base de Datos. Este Proceso posée Diferentes Fases, Las Cuales Hijo:

· Recolección de Datos: Para qué Las Fases Siguientes puedan extraer información de Mercado Utilidad Que, SE SELECCIONA Los de cantantes Sí Hijo Dónde obtiene información la, la revista Qué bases de Servicios de Datos y pueden Otras Fuentes Diverso Muy, OLAP Como, Almacenes de Datos, entre otros. Solamente no es información de la Empresa, Sino Que También pueden Servicios de información Otras Compañías, información obtenida de Censos Demográficos Una Través o Estudios, etc

· Selección y Limpieza de los Datos: Los de Se Deben Eliminar Datos inconsistentes Sean Que, erróneos, O Que Sean irrelevantes párr Lo Que Si requiera. Ésto Sí realiza Una Través de Procesos de Selección de Datos, redefinición de los Atributos, e histogramas en Caso de Datos erróneos. Se realizan Diferentes Acciones en Caso de encontrarse Datos anómalos, Como Filtrado o Reemplazo; o Datos faltantes, Como Filtrado, Segmentación, o Espera Sí Una Que Los Datos faltantes esten disponibles ¡¡¡¡. En este último caso, se buscan Los Motivos de porqué no estan Los Datos "LOS DICHOS".

· Transformación: Los Datos transformarse requieren, El Pecado Través de Diferentes Técnicas, Como desnormalizado Tipo estrella o copo de nieve, El Cual Examinar permite ver si existencial Reglas Dentro de tipo,,, El Pecado de información, pueden USAR Y Si Las Herramientas OLAP, Intercambio de Dimensiones (Filas de las Naciones, Unidas Columnas), Transformación de Campos Números UNO o etiquetas, ante lo Cual Sí requiere dora Metadatos de qué cuentos Números significativa.

· Minería de Datos: Se Propagador Una Vez Que Se Tienen Los Datos DE INTERÉS, entonces Sí y Decidir Que Tipo de Conocimiento en Sí Quiere Descubrir. Segun Lo Que desee SI, SE APLICA Una Técnica Distinta. Sí se SABE SE ESTÁ Lo Que Buscando, ESTO SE le llama Una Minería de Datos Directa, y si no SABE Sí Que es lo Que Se busca, es Minería de Datos Indirecta.

· Evaluación: La Minería de Datos Producir UNO Más o Modelos, párr SELECCIONAR y Modelo Cual debemos utilizar, sí utilizan Criterios de Evaluación Diferentes: El Modelo de las Naciones, Unidas comprobar Banco de Datos de Ejemplo en, Experiencia Piloto del Modelo, etc De forma ESTA SE Elige El Modelo Más tificables.

· Interpretación y Difusión: Se refiere Una Que Los Datos posiblemente deban interpretarse, si es El Modelo descriptivo, Como Por Ejemplo sable Qué áreas demográficas Sí segun refiere Distribución de Producto de la ONU, y Difusión en Sí refiere Una Como se traspasará la información al resto de la Empresa, de forma Que El Mar de Utilidad.

TÉCNICAS UTILIZADAS EN La Mineria DE DATOS

Las Técnicas de Minería de Datos pueden CREAR Modelos descriptivos o predictivos. El Primero Entrega información Sobre Las Relaciones de Los Datos y Características SUS, y El Segundo Entrega información Sobre Tendencias Futuras.

Ademas Sí Brecha El Conocimiento es:

· Asociaciones: se refiere UNO la Alta Frecuencia Que dos Atributos Sí Mismo Tiempo den al

· Dependencias: Que establece patrón Que Uno. Más o determinan Atributos Su valor de El Otro.

· Clasificación: Como un atributo es Diferente valor Toma de las Naciones, Unidas en clases ya conocidas.

· Segmentación: se refiere la Detección de las Naciones, Unidas Grupo de Individuos diferenciados del resto.

· Tendencias: Como es predecir Los Valores de Una variable a Través de Su Evolución respecto Una variable continua Otra, Como El Tiempo.

· Información del Esquema: permite encontrar información Nueva párr El Esquema es Sí, Como Nuevas claves Primarias.

· Reglas Generales: en Caso Que La información en sí no Sí Pecado combinen ningun patrón establecido, Los patrones permite establecer Otros soles.

La Minería de Datos es UN CASO especial de Aprendizaje inductivo, Por Lo Que posée Diferentes Técnicas de Aprendizaje, Que Se pueden clasificar de la Siguiente Manera:

· Inductivos

o Predictivos

§ Interpolación: Una Función continua Sobre Varias Dimensiones.

§ Predicción Secuencial: Las Observaciones de forma ordenada estan secuencial, Y Si predice valor de dicha El Siguiente Secuencia.

§ Aprendizaje Supervisado: INCLUYE CADA Observación de las Naciones, Unidas valor de la Clase A La Que Por Por Por Corresponde por. Un Ejemplo de Este Tipo de Aprendizaje es K-NN (Más cercano o vecino Vecino Más cercano), El Cual mira de Los Casos Más Cercanos, y Tareas Pendientes Hijo de Clase si Misma Una, El caso nuevo en Sí clasifica en clase esa, o de lo contrario, se calcula la media DISTANCIA Por CADA Clase o Sí Asigna la ONU La Clase Más Elementos en contra. Otro Ejemplo de Este Hijo Tipo Los Árboles de decisión.

o Descriptivos

§ Aprendizaje Supervisado n: El conjunto de clases no Observaciones Asociadas Tiene, Y El Objetivo es detectar regularidades en Los Datos de cualquier Tipo. Un Ejemplo de ESTO ES Segmentación (Agrupación), Que busca agrupaciones en conjunto de las Naciones, Unidas de Datos Que ciertas semejanzas Tenga, ya El Mar de forma Jerárquica, Parámetros, etc

· Abductivos

o Explicativos

§ Abducción o Aprendizaje Analítico: Se Importancia da al Contexto, Y Si Explica la Evidencia de dicho Contexto.

ALGUNAS Técnicas de Minería de Datos Hijo:

  • Redes Neuronales Artificiales: Modelos Que Aprenden A Través de Los entrenamientos, simulando la Estructura de las Redes Neuronales en Los Humanos.
  • Árboles de decisión: Estructura de forma de árbol Que representan las Naciones, Unidas conjunto de Decisiones, Las Cuales generan Reglas párr la Clasificación de Datos de las Naciones, Unidas conjunto.
  • Algoritmos geneticos: Técnicas Que Se utilizan PARA LA Optimización Procesos en los, cuentos Combinaciones de Como, Mutaciones y Selección.
  • Método del Vecino Más Cercano: clasifica CADA Registro de las Naciones, Unidas en conjunto de Datos Basados en La Combinación de las clases de los Registros similares a EL Más En Un historial de Datos.
  • Regla de Inducción: es la Extracción de las Reglas de Estructuras de Control de Datos Como si - entonces.

EJEMPLOS DE HERRAMIENTAS DE MINERIA DE DATOS

A Continuación Sí listán Diferentes Aplicaciones, Herramientas cuentos Como PARA EL Desarrollo de los Modelos de Minería de Datos, Licencias Comerciales Con libres y:

· R: Gráficos y Lenguaje Es Pecado Entorno de Programación párr realizar Análisis estadísticos y, Su USO es Liberado.

· KNIME: Plataforma de minerías de Datos permite Que El Desarrollo de Modelos de las Naciones, Unidas en Entorno visual. Esta Herramienta es Liberada.

· SPSS: Programa informático estadístico Las aparejo en las Ciencias Sociales y Empresas de Investigación de Mercado.

· STATISTICA: Es Pecado El Paquete estadístico aparejo en Investigación, Minería de Datos y En El Ámbito Empresarial.

· RapidMiner: Programa de las Naciones, Unidas Es informático PARA EL ANÁLISIS Y Minería de Datos. Permite El Desarrollo de Procesos de Análisis de datos MEDIANTE El encadenamiento de Operadores A Través de Entorno Gráfico de la ONU. Sudeste de EE.UU. en invstigación y Empresariales en Aplicaciones. Esta Herramienta Sí Distribuye de forma gratuita.

· Weka: Es el software de la ONU El El El Aprendizaje Automático PARA EL Minería de Datos y, ESTA Desarrollado en Java, es gratuita Su Distribución.

APLICACIONES DE LA MINERIA DE DATOS

Con El transcurso del Tiempo, La Tecnología va Diverso y facilitando áreas y Creciendo Por ende párr Puede Ser Integrada: facilitar La La La búsqueda de El Trabajo de información, y en Todo sobre La Toma de Decisiones de. Es así como La Minería de Datos ha Sido incorporada a la Vida de Empresas, en Los gobiernos, Universidades, Hospitales y Organizaciones interesadas Diverso Que estan en explorar y profundizar Las bases de Datos Las SUS.

En Este Caso, Podemos evidenciar Que La Minería de Datos (Data Mining) ESTÁ PRESENTE en Las Siguientes áreas:

· GOBIERNO:

o Detección de Fraudes:

§ Es Una Aplicación Que PUEDE considerarse Como una Técnica de Clasificación, ya Que, Cuando El Algoritmo Analiza Una Gran Lea la versión de Transacciones, El mismo tratará de categorizar Aquellas Que Sean verídicas Tomando Como Referencia ciertas Características Que Tengan ESTAS Común en. Ésto Puede Ser Usados en Las Corporaciones Que Prevenir párr Culmine Proceso fraudulento de las Naciones, Unidas.

o Clasificación de Cuerpos Celestes:

§ Aplicación Que Pertenece al área del Reconocimiento de patrones de Imágenes.

o Minería de texto:

§ Se requiere de Nuevas Tecnologías encontrar Parr, clasificar patrones y detectar en la información disponible. Los MÉTODOS en La Minería de Datos aplicados a Los Datos NUMERICOS, Servicios PUEDE Integrada en Esta Categoría.

o Transacciones Detección fraudulentas.

o Evasión de Impuestos.

· EMPRESAS:

o Análisis de Riesgo en Créditos:

§ Aplicación Esta es Similar a la Detección de Fraudes, Su Ventaja Pero radica en la forma de las Naciones, Unidas de El Cabo Llevar Proceso, es Tradicionalista "Más, asignando Puntos complementados Que pueden y Servicios mejorados Con La Minería de Datos.

o Comercio - Marketing:

§ Identificar patrones de Compra de los Clientes, Por Ejemplo en supermercados de Los Andes.

§ Buscar Asociaciones Entre Clientes Características demográficas y.

§ Predecir Respuestas en Campañas de Correo.

§ Análisis de Productos comprados Por Un Cliente.

o Banca:

§ Detectar patrones de uso fraudulentos de Tarjetas de Créditos.

§ Identificar Clientes leales Una ANU Compañía.

§ Determinar GASTOS en Tarjetas de Créditos de las Naciones, Unidas Grupo.

§ Encontrar Correlación Entre Los Indicadores de Grupo Financiero de las Naciones, Unidas.

§ Identificar Reglas de Mercado de Valores à partir de Históricos.

· UNIVERSIDADES:

o Conociendo Los Recién titulados si en Una casa de Estudio, El Pecado llevan Cabo Actividades o trabajan de forma profesional de acuerdo de la ONU estudiaron Lo Que.

· HOSPITALES:

o Identificación de terapias satisfactorias Médicas Enfermedades párr.

o Agrupación de Campana y Campaña Campaña campaña Síntomas Clasificación de patologías Diverso.

o Estudio de Factores (Genética, Hábitos, Alimenticios, Entre Otras) Que Alteran la Salud en Las patologías.

o Segmentación de Pacientes párr brindar Una Atención Social de Grupo segun su.

o Predicciones de los Centros Temporales Asistencias PARA EL USO Correspondiente de los Recursos, Las consultas de Habitaciones y Las Salas.

o Estudio epidemiológicos, Análisis de rendimientos de Campañas e Información, Prevención, sustitución de Fármacos Entre Otras.

· OTRAS:

o Transporte:

§ Determinar la Planificación de la Distribución de Entre tiendas.

§ Analizar Los patrones de carga.

o Seguros y Salud Privada:

§ Analizar Los Procedimientos Médicos solicitados.

§ Que predecir Clientes compran Nuevas pólizas de salud.

§ Identificar patrones de Comportamientos párr Clientes Riesgos en contra.

§ Comportamientos Identificar fraudulentos.

¿CUANDO ES UTIL La Mineria DE DATOS?

· Sistemas Parcialmente Desconocidos: El Modelo de Datos de de de de Cuando es Fácil de Murio y entendre Sentir, de de de de no se requiere de implementar la Minería de Datos, ya Que Las variables predecibles Hijo TODAS. Pero no es Este, El caso del Comercio Electrónico, ya Que En El encontramos Una Instancia de Instancia de Instancia de instancia de parte conocida y Gran Una También Lea la versión de Datos Asociados Sistema CON EL, ESTA forma de Queda la posibilidad de encontrar Nuevos Aspectos previamente Desconocidos.

· Enorme Lea la versión de Datos: Deriva de las bases de Las Grandes Las Las de Datos, Técnicas Estós es Particularmente Cierto de Cuando de de de Las Redes Neuronales y Otras adaptativas utilizadas Hijo. En Casos Estós, es Requerido suficientes Datos PARA EL y Entrenamiento Su Verificación posterior.

· Potente Hardware y Software: Varias de las Herramientas Presentes en la Minería de Datos en Sí Basan En El USO de la Computadora, Por ende El dora Equipos De Buena Calidad y Capacidad aumentarán El Desempeño del Proceso.

FUENTES DE CONSULTA

[1] Minería de Datos y Descubrimiento de Conocimiento en Bases de Datos: http://www.answermath.com/data-mining/mineria-de-datos-1-contenido.htm

[2] "Análisis y Extracción de Conocimiento en Sistemas de Información: Datawarehouse y Datamining": http://users.dsic.upv.es/ jorallo ~ / cursoDWDM /

[3] Wikipedia - Minería de Datos: http://es.wikipedia.org/wiki/Mineria_de_datos

[4] Vallejos, Sofía: Trabajo de Adscripción, Minería de Datos de 2006: http://exa.unne.edu.ar/depar/areas/informatica/SistemasOperativos/Mineria_Datos_Vallejos.pdf

jueves, 6 de mayo de 2010

Matriz para Seleccionar Wikis

WikiMatrix permite elegir cual es la herramienta para crear una wiki, de acuerdo a lo que necesitamos, comparando diferentes características. Nosotros comparamos las siguientes herramientas:

- Drupal Wiki

- PBwiki

- Wetpaint

- Wikia

- Wikispaces

Pueden ver los resultados aquí.

martes, 27 de abril de 2010

Data Warehouse, o Almacén de Datos, y Cubo OLAP

¿QUÉ ES UN DATA WAREHOUSE?

Se llama data Warehouse, o almacén de datos, a la colección de datos en donde se encuentra la información de forma integrada de una determinada institución, con el propósito de facilitar las tomas de decisiones para esta, ya que se encuentran todos los elementos de los datos desde diversas fuentes de integración en un ambiente de aplicación, simplificando el tiempo y proceso de búsqueda.
Todas las herramientas para la toma de decisiones que se basan en un data Warehouse, hacen más práctica y fácil la explotación de los datos, esto no se logra usando los datos de las aplicaciones operacionales (operaciones cotidianas), en donde la información se obtiene mediante procesos independientes y complejos.

Características


  • - Orientado al Tema: La información se califica en base a los intereses de una empresa
  • - Integrado: La información contenida en un Data Warehouse se encuentra integrada, lo que permite que los datos se puedan visualizar de diversas maneras.
  • - De Tiempo Variante: La información es requerida en todo momento.
  • - No Volátil: La información es estable dentro del Data Warehouse.


DISEÑO DE UN ALMACÉN DE DATOS

  • - Sistema ETL (Extracción, Transformación y carga): realiza las funciones de extracción de las fuentes de datos (transaccionales o externas), transformación y la carga del almacén de datos, realizando extracción de los datos, filtrado de los datos, carga inicial del almacén y actualización del mismo. Estos procesos son importantes ya que son la forma en que se ingresan los datos al almacén.
  • - Repositorio Propio de Datos: información relevante, metadatos.
  • - Interfaces y Gestores de Consulta: permiten acceder a los datos y sobre ellos se conectan herramientas más sofisticadas, como por ejemplo, minería de datos.
  • - Sistemas de Integridad y Seguridad: se encargan del mantenimiento global y de sacar copias de seguridad.

    Criterios

  • - Situación actual de la empresa, ya que el almacén debe estar orientado a las necesidades del negocio.
  • - Características del negocio, se requiere saber los tipos de negocios que realiza y como está almacenada la información, y como se toman decisiones respecto a ella.
  • - Entorno Técnico: Se refiere a todo lo que es hardware y software, dándose énfasis al sistema de soporte a la decisión.
  • - Qué es lo que esperan los usuarios, contar con su apoyo y convencerles de las ventajas que significa contar con un almacén de datos,
  • - Etapas de desarrollo, es decir, el modelo conceptual de cómo va a construirse el almacén de datos.
  • - Un prototipo para simular el producto final, para que de esta formas los usuarios puedan ver como quedará y realizarle cambios que sean necesarios.
  • - Determinar si el almacén de datos funcionará como se espera, de acuerdo a su arquitectura.

DATA MARTS

Un Data Mart es una versión especial de almacén de datos. Son subconjuntos de datos con el propósito de ayudar a que un área específica dentro del negocio pueda tomar mejores decisiones. Los datos existentes pueden ser utilizados por múltiples grupos de usuarios
dependiendo de sus necesidades.

Comparación de Data Marts v/s Data Warehouse

  • - Su implementación es muy similar a la de un Data Warehouse, con funcionalidades similares. Necesita de los mismos recursos que su corriera sobre un Data Warehouse, por lo tanto necesita cantidad de recursos similares.
  • - No se tienen todos los datos de la empresa, sino que todos los datos de un determinado sector de la empresa, por lo que las consultas tardan lo mismo que al realizarlas a un Data Warehouse.
  • - Actualizar el data mart desde el data warehouse cuesta menos, ya que los formatos de los datos son o suelen ser idénticos.

CUBOS DE INFORMACIÓN (CUBOS OLAP)

Los cubos de información, o cubos OLAP, son herramientas que permiten una visión multidimensional de los datos, y debido a su número indefinido de dimensiones, también se les llaman hipercubos.
Está compuesto por dimensiones y variables. Las dimensiones son atributos de las variables, información complementaria que se necesita para presentar los datos a los usuarios, como nombres, zonas, descripciones, etc. Algunos ejemplos de variables son gastos, beneficios, ventas. Las variables, o indicadores de gestión, son los datos analizados. Representan un aspecto medible de los objetos o eventos a analizar. Por lo general se les representan con valores detallados para cada instancia del objeto medido. Algunos ejemplos de variables pueden ser productos, localidades, tiempo, etc.
Para obtener cierta información, el usuario hace una consulta seleccionando los atributos que desea ver, y las restricciones, como por ejemplo, determinado período de tiempo, determinado producto, etc. Sin embargo, lo que hace de esta herramienta que sea útil son sus operadores de refinamiento, drill, el cual permite agregar un nuevo criterio de agrupación, roll, que permite eliminar un criterio de agrupación, slice & dice, que permite seleccionar datos para presentarlos en un informe, y pivot, el cual permite reorientar las dimensiones del cubo.


VENTAJAS Y DESVENTAJAS DE UN ALMACÉN DE DATOS

Ventajas

  1. La estructura de un Data Warehouse permite que la información sea consultada y tratada de manera fiable y homogénea, los almacenes de datos hacen más fácil el acceso a una gran variedad de datos a los usuarios finales.
  2. Un Data Warehouse proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global de la Empresa.
  3. Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos del almacén, obteniendo un valor añadido para el negocio de dicha información.
  4. Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios.
  5. Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente.
  6. Ayuda a la optimización tecnológica y económica en entornos de Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares.
  7. Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la decisión tales como informes de tendencia, por ejemplo: obtener los items con la mayoría de las ventas en un área en particular dentro de los últimos dos años; informes de excepción, informes que muestran los resultados reales frente a los objetivos planteados a priori.
  8. Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar el valor operacional de las aplicaciones empresariales, en especial la gestión de relaciones con clientes.

Desventajas

  1. A lo largo de su vida los almacenes de datos pueden suponer altos costos. El almacén de datos no suele ser estático. Los costos de mantenimiento son elevados.
  2. Los almacenes de datos se pueden quedar obsoletos relativamente pronto.
  3. A veces, ante una petición de información estos devuelven una información subóptima, que también supone una pérdida para la organización.
  4. A menudo existe una delgada línea entre los almacenes de datos y sistemas operativos. Hay que determinar qué funcionalidades de estos se pueden aprovechar y cuáles se deben implementar en el Data Warehouse, resultaría costoso implementar operaciones no necesarias o dejar de implementar alguna que sí vaya a necesitarse.

Fuentes

http://users.dsic.upv.es/~jorallo/cursoDWDM/ Curso de Análisis y Extracción de Conocimiento de Sistemas de Información: Data Warehouse y Data Mining.

http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos Definición de Almacén de Datos