martes, 27 de abril de 2010

Data Warehouse, o Almacén de Datos, y Cubo OLAP

¿QUÉ ES UN DATA WAREHOUSE?

Se llama data Warehouse, o almacén de datos, a la colección de datos en donde se encuentra la información de forma integrada de una determinada institución, con el propósito de facilitar las tomas de decisiones para esta, ya que se encuentran todos los elementos de los datos desde diversas fuentes de integración en un ambiente de aplicación, simplificando el tiempo y proceso de búsqueda.
Todas las herramientas para la toma de decisiones que se basan en un data Warehouse, hacen más práctica y fácil la explotación de los datos, esto no se logra usando los datos de las aplicaciones operacionales (operaciones cotidianas), en donde la información se obtiene mediante procesos independientes y complejos.

Características


  • - Orientado al Tema: La información se califica en base a los intereses de una empresa
  • - Integrado: La información contenida en un Data Warehouse se encuentra integrada, lo que permite que los datos se puedan visualizar de diversas maneras.
  • - De Tiempo Variante: La información es requerida en todo momento.
  • - No Volátil: La información es estable dentro del Data Warehouse.


DISEÑO DE UN ALMACÉN DE DATOS

  • - Sistema ETL (Extracción, Transformación y carga): realiza las funciones de extracción de las fuentes de datos (transaccionales o externas), transformación y la carga del almacén de datos, realizando extracción de los datos, filtrado de los datos, carga inicial del almacén y actualización del mismo. Estos procesos son importantes ya que son la forma en que se ingresan los datos al almacén.
  • - Repositorio Propio de Datos: información relevante, metadatos.
  • - Interfaces y Gestores de Consulta: permiten acceder a los datos y sobre ellos se conectan herramientas más sofisticadas, como por ejemplo, minería de datos.
  • - Sistemas de Integridad y Seguridad: se encargan del mantenimiento global y de sacar copias de seguridad.

    Criterios

  • - Situación actual de la empresa, ya que el almacén debe estar orientado a las necesidades del negocio.
  • - Características del negocio, se requiere saber los tipos de negocios que realiza y como está almacenada la información, y como se toman decisiones respecto a ella.
  • - Entorno Técnico: Se refiere a todo lo que es hardware y software, dándose énfasis al sistema de soporte a la decisión.
  • - Qué es lo que esperan los usuarios, contar con su apoyo y convencerles de las ventajas que significa contar con un almacén de datos,
  • - Etapas de desarrollo, es decir, el modelo conceptual de cómo va a construirse el almacén de datos.
  • - Un prototipo para simular el producto final, para que de esta formas los usuarios puedan ver como quedará y realizarle cambios que sean necesarios.
  • - Determinar si el almacén de datos funcionará como se espera, de acuerdo a su arquitectura.

DATA MARTS

Un Data Mart es una versión especial de almacén de datos. Son subconjuntos de datos con el propósito de ayudar a que un área específica dentro del negocio pueda tomar mejores decisiones. Los datos existentes pueden ser utilizados por múltiples grupos de usuarios
dependiendo de sus necesidades.

Comparación de Data Marts v/s Data Warehouse

  • - Su implementación es muy similar a la de un Data Warehouse, con funcionalidades similares. Necesita de los mismos recursos que su corriera sobre un Data Warehouse, por lo tanto necesita cantidad de recursos similares.
  • - No se tienen todos los datos de la empresa, sino que todos los datos de un determinado sector de la empresa, por lo que las consultas tardan lo mismo que al realizarlas a un Data Warehouse.
  • - Actualizar el data mart desde el data warehouse cuesta menos, ya que los formatos de los datos son o suelen ser idénticos.

CUBOS DE INFORMACIÓN (CUBOS OLAP)

Los cubos de información, o cubos OLAP, son herramientas que permiten una visión multidimensional de los datos, y debido a su número indefinido de dimensiones, también se les llaman hipercubos.
Está compuesto por dimensiones y variables. Las dimensiones son atributos de las variables, información complementaria que se necesita para presentar los datos a los usuarios, como nombres, zonas, descripciones, etc. Algunos ejemplos de variables son gastos, beneficios, ventas. Las variables, o indicadores de gestión, son los datos analizados. Representan un aspecto medible de los objetos o eventos a analizar. Por lo general se les representan con valores detallados para cada instancia del objeto medido. Algunos ejemplos de variables pueden ser productos, localidades, tiempo, etc.
Para obtener cierta información, el usuario hace una consulta seleccionando los atributos que desea ver, y las restricciones, como por ejemplo, determinado período de tiempo, determinado producto, etc. Sin embargo, lo que hace de esta herramienta que sea útil son sus operadores de refinamiento, drill, el cual permite agregar un nuevo criterio de agrupación, roll, que permite eliminar un criterio de agrupación, slice & dice, que permite seleccionar datos para presentarlos en un informe, y pivot, el cual permite reorientar las dimensiones del cubo.


VENTAJAS Y DESVENTAJAS DE UN ALMACÉN DE DATOS

Ventajas

  1. La estructura de un Data Warehouse permite que la información sea consultada y tratada de manera fiable y homogénea, los almacenes de datos hacen más fácil el acceso a una gran variedad de datos a los usuarios finales.
  2. Un Data Warehouse proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global de la Empresa.
  3. Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos del almacén, obteniendo un valor añadido para el negocio de dicha información.
  4. Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios.
  5. Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente.
  6. Ayuda a la optimización tecnológica y económica en entornos de Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares.
  7. Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la decisión tales como informes de tendencia, por ejemplo: obtener los items con la mayoría de las ventas en un área en particular dentro de los últimos dos años; informes de excepción, informes que muestran los resultados reales frente a los objetivos planteados a priori.
  8. Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar el valor operacional de las aplicaciones empresariales, en especial la gestión de relaciones con clientes.

Desventajas

  1. A lo largo de su vida los almacenes de datos pueden suponer altos costos. El almacén de datos no suele ser estático. Los costos de mantenimiento son elevados.
  2. Los almacenes de datos se pueden quedar obsoletos relativamente pronto.
  3. A veces, ante una petición de información estos devuelven una información subóptima, que también supone una pérdida para la organización.
  4. A menudo existe una delgada línea entre los almacenes de datos y sistemas operativos. Hay que determinar qué funcionalidades de estos se pueden aprovechar y cuáles se deben implementar en el Data Warehouse, resultaría costoso implementar operaciones no necesarias o dejar de implementar alguna que sí vaya a necesitarse.

Fuentes

http://users.dsic.upv.es/~jorallo/cursoDWDM/ Curso de Análisis y Extracción de Conocimiento de Sistemas de Información: Data Warehouse y Data Mining.

http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos Definición de Almacén de Datos

Proyecto: “Implementación de una Wiki para para la Carrera de Ingeniería de Ejecución en Informática de la Universidad del Pacífico”

DESCRIPCIÓN DEL PROYECTO


Nuestro proyecto consiste en crear una Wiki sobre las asignaturas de la carrera de Ingeniería de Ejecución en Informática de la Universidad del Pacífico, y temas relacionados con informática en general, de tal manera que todos los alumnos que deseen o que necesiten acceder a los apuntes de cualquier ramo, los tengan siempre disponibles para su consulta, y además que puedan complementarlos con sus propios conocimientos y enlaces útiles.


¿QUÉ ES UNA WIKI?


Son páginas web cuya característica principal es que pueden ser editadas por varios usuarios voluntarios a través del navegador. Al mismo tiempo les permite crear, modificar o borrar los textos que se comparten. En la actualidad, existen aplicaciones que permiten la coordinación de información y compartir los conocimientos o investigaciones propias dentro de grupos virtuales que colaboran entre sí. Otra de las características de las wiki, es que poseen un historial que permite recuperar los estados anteriores a la modificación y ver quien los realizó, facilitando de esta manera la manutención de dicha página. Un ejemplo de Wiki es la enciclopedia colaborativa virtual Wikipedia.


JUSTIFICACIÓN DEL PROYECTO


Con la implementación de una wiki, la cual permite la escritura de artículos siendo editados a través de un navegador, se cumple con el objetivo de colaboración entre los usuarios. Además, las wiki poseen la facilidad para ser creadas y actualizadas. Por otra parte, la mayoría de estas son abiertas a los usuarios, sin que estos tengan necesidad de registrarse con una cuenta de usuario, brindándoles libertad a través de una interfaz sencilla. Esto es lo que las hace atractiva y por ende que la gente participe en su edición. Y en lo que respecta a nuestra carrera, facilitaría la obtención de apuntes de años anteriores a nuestros compañeros de nivel, y los alumnos de otros niveles podrían revisar las anotaciones de las asignaturas que tendrán a futuro, con la posibilidad de poder complementar dichos apuntes, corregirlos en caso de ser necesario, y añadir enlaces útiles.


OBJETIVOS


Objetivo General:

Implementar una Wiki para los alumnos de la carrera de Ingeniería de Ejecución en Informática de la Universidad del Pacífico, en donde puedan consultar y añadir información sobre sus asignaturas anteriores, actuales y las que tendrán a futuro, y otros temas relacionados con la carrera.

Objetivos Específicos

· Crear una Wiki para la carrera de Ingeniería de Ejecución en Informática.

· Definir los contenidos que tendrá el Wiki de la carrera.

· Añadir algunas entradas con los apuntes de años anteriores.

· Dar a conocer el proyecto a los demás alumnos.

· Incentivar a los alumnos y profesores a que aporten con sus propios apuntes y conocimientos a este proyecto.

lunes, 26 de abril de 2010

Más ejemplos de Software Colaborativos

Hoy en día, el mercado del software nos ofrece diversas herramientas que nos permiten el tratamiento de los datos y la información, permitiéndonos:

- Crear ambientes de colaboración,

- Interacción con varios usuarios de manera sincrónica,

- Fácil acceso a la información, debido a que se mantiene en un solo lugar permitiendo su acceso a ella.

Además, en lo que respecta a las últimas tendencias en Groupware, hay algunas pautas que marcan su evolución, como son las capacidades de comunicación que mejoran continuamente en un medio determinado, múltiples medios integrados en un mismo sistema de comunicación, estándares que emergen para soportar tanto las plataformas como la operabilidad entre diferentes aplicaciones. Para mayor información, hagan clic aquí.

Google Docs

Es un programa gratuito que está basado en la Web, que nos brinda la posibilidad de crear documentos en línea, como por ejemplo textos, hojas de cálculo, presentaciones y formularios. Estos documentos inclusive se pueden crear desde la misma aplicación, y también pueden ser importados utilizando su interfaz Web, o pueden ser enviados a través del correo electrónico, permitiendo la posibilidad de colaborar en grupo.


El funcionamiento de este software se basa en el almacenamiento en los servidores de Google. Los archivos almacenados pueden ser exportados en diversos formatos estándar o ser enviados por correo electrónico. Durante la edición de los documentos, éstos se guardan automáticamente para evitar pérdida de información.

Google Docs permite que los usuarios de telefonía móvil puedan navegar por sus documentos de Google Docs. Los usuarios pueden ver sus documentos y desde hace muy poco pueden editarlos.

Por todo lo mencionado anteriormente, Google Docs ofrece las características que lo convierten en un candidato bastante atractivo para utilizarlo en el diseño e implementación de un entorno groupware colaborativo. Para acceder a este software, solo ingresen a http://docs.google.com y para mayor información de como utilizarlo, pueden acceder a un curso en línea aquí.



Elluminate

Es un programa que permite hacer teleconferencias entre dos o más personas, en su versión gratuita de hasta tres personas como máximo, el cual permite mostrar el escritorio de la persona que preside la reunión, cuenta con pizarra virtual, chat, entre otras características.

Es así como este software está pensado esencialmente para capacitaciones a distancia, seminarios para personas en cualquier parte del mundo, y además se pueden grabar las conferencias o clases transmitidas, en caso que un participante quiera revisarla nuevamente, o que otro participante que no pudo asistir pueda verla.

Para mayor información sobre este software, revisen sus características en español aquí.

sábado, 10 de abril de 2010

¿Qué es Sistema de Información y Sistema Colaborativo?

Los Sistemas de Información se refieren a los elementos que tratan datos e información, los cuales se procesan y se obtiene como resultado información mucho más elaborada, relacionada con un objetivo específico, de tal manera que se puedan tomar decisiones de acuerdo a los resultados obtenidos. En lo que respecta a Informática, se refiere a los elementos que interactúan entre sí para apoyar las operaciones de la empresa. Su funcionamiento consiste básicamente en cuatro actividades:

  • Entrada de Información: en esta etapa se toman los datos necesarios para producir información, nombres, direcciones, renta, etc.
  • Almacenamiento de Información: el almacenamiento consiste básicamente en guardar la información o datos que se han ingresado al sistema en el proceso anterior.
  • Procesamiento de Información: esta actividad se encarga de realizar todo tipo de cálculos con la información almacenada o con datos ingresados recientemente. Todo esto con el fin de obtener información que apoye a la toma de decisiones.
  • Salida de Información: la salida de la información es lo que el sistema nos entrega luego de haber realizado los tres pasos anteriores. Es importante mencionar que la salida de información de un sistema puede ser la entrada de otro.

Los Sistemas Colaborativos, o Sistemas Cooperativos, son un tipo de Sistema de Información, y nacieron de la necesidad de realizar actividades que requieren trabajar en grupo. Es así como se crearon softwares orientados a la colaboración, los Groupware y Workflow:

  • Groupware: Son sistemas computacionales que permiten a un grupo de personas trabajar en conjunto en una tarea en común. Por lo tanto un groupware tiene como características que sea un ambiente de colaboración, con la información en un solo lugar, y que se pueda interactuar con los usuarios. Pueden ser además en sincrónico, es decir que se envían mensajes en tiempo real, como en sesiones de chat o pizarras compartidas, o asíncrono, como es el caso de los blogs y correos electrónicos. Un ejemplo de groupware es Moodle, el cual es una aplicación educativa que permite compartir recursos y administrar cursos.

  • Workflow: Son sistemas que automatizan e integran los procesos de negocios de una empresa, de acuerdo a determinadas estrategias. Algunas de sus actividades puede ser asignar tareas, avisar de tareas pendientes, automatizar secuencias de negocios y optimizarlas, entre otras. La principal diferencia de un workflow de un groupware es que el primero no necesariamente implica colaboración de otras personas, sino que se puede utilizar de forma individual. Un ejemplo de un sistema workflow es FlowMind, el cual permite administrar recursos, ver las diferentes etapas de un determinado proceso, como mejorar los procesos, entre otras funcionalidades, todo de forma gráfica.


Fuentes:

http://www.utm.mx/~temas/temas-docs/nfnotas518.pdf

http://www.monografias.com/trabajos7/sisinf/sisinf.shtml

http://es.wikipedia.org/wiki/Sistemas_de_informacion

http://docs.moodle.org/en/About_Moodle

http://www.flowmind.org

¿Cuál es la diferencia entre dato, información y conocimiento?

Antes de adentrarse en los temas Sistemas Colaborativos y Sistemas de Información, es necesario aclarar las diferencias entre los conceptos Datos, Información y Conocimiento, los cuales suelen utilizarse indistintamente, siendo que cada uno es sutilmente diferente del otro.

Primero que nada, los datos son elementos que por sí mismos no poseen mucho significado y, por lo tanto, no se pueden tomar decisiones a partir de ellos. Sin embargo, sirven como materia prima para obtener información. Algunos ejemplos de datos son nombre, sueldo, edad, número de teléfono, etc. Se les almacena en colecciones, ya sea en dispositivos electrónicos, archivos escritos en papel, y también están los datos que recuerdan las personas en sus mentes.

Por otra parte, la información son los datos ya procesados, y son de gran utilidad para la persona que los recibe y debe tomar una decisión, ya que disminuye la incertidumbre respecto a cual sería el mejor camino que debe tomar frente a una situación determinada. Para esto, los datos deben ponerse en contexto, ordenarse en categorías, realizar los cálculos que sean necesarios, corregir los posibles errores y hacer un resumen de ellos.


Datos à Procesos à Información


Y por último, el conocimiento se deriva de la información, pero a diferencia de ésta, además se añade la experiencia, ideas, valores, saber como hacer y como funcionan las cosas, lo cual sirve como base ante nuevas experiencias e información. Y es por esto que se origina en la mente de personas expertas en el tema. Para que la información se convierta en conocimiento, es necesario que se compare la información obtenida, que se hagan predicciones respecto a lo que podría suceder según señala la información, que se busquen conexiones, y se converse con otros entendidos en el tema.


Fuentes:

"Colección Práctica del Estudiante - Computación", Editorial Antártica, Chile

http://www.sinnexus.com/business_intelligence/piramide_negocio.aspx

jueves, 8 de abril de 2010

Sistemas Colaborativos V1.0.0.0.0

Hoy es nuestro primer día de clases de Sistemas Colaborativos y Nuevas Tecnologías, estamos muy animados, pero también preocupados por este gran desafío. Sin embargo, tenemos todas las ganas de finalizar con éxito nuestro proyecto.
EXITO A TODOS Y MUCHA SUERTE COMPAÑEROS.
Atte.
Batriz Andrade
Jessie Galarce
Richard López
Andra Nuñez