20 Nov

Fase de Selección de Minería de Datos


El descubrimiento de conocimiento en Bases de datos, conocido en la actualidad como “minería de datos”, es una Disciplina que ha crecido enormemente en los últimos años. Las organizaciones Han comprendido que grandes volúMenes de datos que residen en sus sistemas Pueden ser analizados y explotados para obtener nuevo conocimiento a partir de Los mismos.

Minería de Datos o Explotación de Información, es el proceso de extraer conocimiento útil, comprensible y novedoso De grandes volúMenes de datos, siendo su principal objetivo encontrar información oculta o implícita que no es posible obtener mediante métodos Estadísticos convencionales.

La entrada al proceso de minería está Formada generalmente por registros provenientes de bases de datos operacionales O bien bodegas de datos (Datawarehouse).

El resultado del proceso es un conjunto De patrones (modelos), los cuales serán convertidos en información valiosa para La toma de decisiones.

Los esfuerzos en el área de la minería De datos se han centrado en su gran mayoría en la investigación de técnicas Para la explotación de información y extracción de patrones (tales como árboles De decisión, análisis de conglomerados y reglas de asociación). Sin embargo, se Ha profundizado en menor medida el hecho de cómo ejecutar este proceso hasta Obtener el “nuevo conocimiento”, es decir, en las metodologías.

Las metodologías nos permiten llevar a Cabo el proceso de minería de datos en forma sistemática y no trivial. Ayudan a Las organizaciones a entender el proceso de descubrimiento de conocimiento y Proveen una guía para la planificación y ejecución de los proyectos. Una Metodología no sólo define las fases de un proceso sino también las tareas que Deberían realizarse y cómo llevarlas a cabo.

El Descubrimiento de Conocimiento en Bases de Datos (KDD Knowdlege Discovery in Databases) constituye el primer Modelo que define el descubrimiento de conocimiento en bases de datos como un “proceso”, compuesto por distintas etapas y fases que van desde la preparación De los datos hasta la interpretación y difusión de los resultados.

En el año 1996, Fayyad define a KDD Como el “proceso no trivial de identificar patrones válidos, novedosos, Potencialmente útiles y en última instancia entendibles en los datos”. El término Proceso se refiere a la secuencia iterativa de etapas o fases que lo componen. Los patrones deberían ser válidos para nuevos datos, novedosos en el sentido Que deberían aportar nuevo conocimiento al dominio de aplicación y potencialmente útiles para el usuario final o tomador de decisiones. KDD es un proceso Iterativo e interactivo. Iterativo ya que la salida de alguna de las fases Puede retroceder a pasos anteriores y porque a menudo son necesarias varias Iteraciones para extraer conocimiento de alta calidad. Es interactivo porque el Usuario, o más generalmente un experto en el dominio del problema, debe ayudar a La preparación de los datos y validación del conocimiento extraído.

El modelo de proceso KDD se resume en Las siguientes cinco fases:

·Selección De los datos sobre los que se trabajará.

·Pre-procesamiento De los datos, donde se realiza un tratamiento de los datos incorrectos y Ausentes.

·Transformación De los datos y reducción de la dimensionalidad.

·Minería De datos, donde se obtienen los patrones de interés según la tarea de minería Que llevemos a cabo (descriptiva o predictiva).

·Interpretación Y evaluación del nuevo conocimiento en el dominio de aplicación.

En los siguientes apartados hablaremos Específicamente sobre la etapa de selección del proceso KDD. Esta etapa Consiste en la elección de las fuentes de datos que se utilizarán, la integración De las mismas y la selección de las observaciones/atributos que conformarán la Vista minable. Aunque no es estrictamente necesario, en este paso podría requerirse La construcción de un almacén de datos.


Minería De Datos: Conceptos, Técnicas y Sistemas


En la Actualidad, los datos son la materia prima bruta de toda organización y en Donde a partir del momento en que el usuario les atribuye algún significado Especial, es decir comienzan a tomar gran relevancia, pasan a convertirse en Información. Y cuando esa información comienza a tomar experiencia y valores nos Referimos al conocimiento. El conocimiento se Deriva de la información, así como la información se deriva de los datos.

La Capacidad de generar y almacenar información crecíó considerablemente en los últimos tiempos, se ha estimado que la cantidad de datos en el mundo Almacenados en bases de datos se duplica cada 20 meses. Es así que hoy las Organizaciones tienen gran cantidad de datos almacenados y organizados, pero a Los cuales no les pueden analizar eficientemente en su totalidad.

            Algunos datos estadísticos Determinan que aproximadamente el 80% de la información se obtiene con técnicas Avanzadas que trataremos a lo largo de este documento, y el 20% restante es Aquella información conocida por la empresa.

            El Descubrimiento de Conocimiento en Bases de Datos (KDD) apunta a procesar automáticamente Grandes cantidades de datos para encontrar conocimiento útil en ellos, de esta manera Permitirá al usuario el uso de esta información valiosa para su conveniencia. Por Los que se desarrolla el siguiente trabajo de investigación para dar a conocer Los conceptos, el proceso ETL (extracción, transformación y carga de la Información), técnicas y sistemas involucrados en el proceso de minería de Datos que permiten a las instituciones poder tomar la mejores decisiones.


Base de Datos Deductivas


El Interés de los Sistemas de Gestión de Bases de Datos Deductivas tiende a Incrementarse conforme se amplía su campo de aplicación (Gestión, Sistemas Expertos). Los estudios relativos a tales sistemas han comenzado a realizarse Hace algunos años, inspirándose inicialmente en las técnicas desarrolladas en Inteligencia Artificial en el marco de los sistemas “Pregunta – Respuesta”, Adaptándolas a las limitaciones específicas de las Bases de Datos.

Un SGBD deductivo es un Sistema que permite derivar nuevas informaciones a partir De las introducidas explícitamente en la Base por el usuario. Este maneja la Perspectiva según la teoría de las demostraciones de una base de datos, y en Particular es capaz de deducir hechos a partir de la base de datos extensional, Es decir, las relaciones base, aplicando a esos hechos axiomas deductivos o Reglas de inferencias especificados. Esta función deductiva se realiza mediante La adecuada explotación de ciertos conocimientos generales relativos a las Informaciones de la Base.

Deja un comentario