Please use this identifier to cite or link to this item:
http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903
Title: | Seleção de modelos de classificação através de heurísticas. |
Other Titles: | Selection of classification models through heuristics. |
???metadata.dc.creator???: | SANTOS, David Moises Barreto dos. |
???metadata.dc.contributor.advisor1???: | SAMPAIO, Marcus Costa. |
???metadata.dc.contributor.referee1???: | GOMES, Herman Martins. |
???metadata.dc.contributor.referee2???: | RUIZ, Duncan Dubugras Alcoba. |
Keywords: | Bancos de Dados;Mineração de Dados;Processo de Mineração de Dados;Heurísticas;Databases;Data Mining;Data Mining Process;Heuristics |
Issue Date: | 19-Jul-2005 |
Publisher: | Universidade Federal de Campina Grande |
Citation: | SANTOS, David Moises Barreto dos. Seleção de modelos de classificação através de heurísticas. 2005. 97 f. Dissertação (Mestrado em Informática)– Programa de Pós-Graduação em Informática, Centro de Ciências e Tecnologia, Universidade Federal de Campina Grande, Paraíba, Brasil, 2005. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903 |
???metadata.dc.description.resumo???: | O processo de indução automática de modelos de classificação é composto de três etapas principais, pela ordem: amostragem, fragmentação e classificação. Devido à diversidade de técnicas que podem ser utilizadas em cada uma destas etapas, os resultados são muito instáveis — não existe a melhor técnica de amostragem, ou de fragmentação, etc. Para resolver o problema da indução do melhor modelo de classificação dentro de um espaço de busca, uma alternativa é arranjar todas as técnicas de amostragem, fragmentação e classificação disponíveis e buscar exaustivamente o melhor modelo de classificação. Entretanto, isto implicará em um alto custo computacional. Neste trabalho, descrevemos como foi possível descobrir heurísticas que podem ajudar a reduzir substancialmente o espaço de busca do melhor modelo de classificação. Também, discutimos o projeto e a implementação de um "framework" baseado nas heurísticas descobertas, objetivando guiar o minerador a escolher um modelo de classificação que satisfaça seus requisitos de qualidade, traduzidos em acurácia do modelo de classificação induzido, a um custo de processamento aceitável. |
Abstract: | The automated induction process of classification models is composed of the following steps: sampling, splitting and classification. Due to the diversity of techniques that may be used in each one of these steps, the results are much unstable — there is not the best sampling technique or the best splitting technique and so on. In order to solve the problem of inducing the best classification model within a search space, one way may arrange all available techniques for sampling, splitting and classification to search exhaustively the best classification model. However, this will imply in a high computational cost. In this work, we describe how to discover heuristics that help to reduce this computational cost. Also, we discuss the design and implementation of a framework that was developed based on the heuristics discovered in order to guide the miner in choosing a classification model which satisfies his or her quality requirements translated in the accuracy of the classification model induced with acceptable computational cost. |
Keywords: | Bancos de Dados Mineração de Dados Processo de Mineração de Dados Heurísticas Databases Data Mining Data Mining Process Heuristics |
???metadata.dc.subject.cnpq???: | Ciência da Computação |
URI: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/2903 |
Appears in Collections: | Mestrado em Ciência da Computação. |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
DAVID MOISES BARRETO DOS SANTOS-DISSERTAÇÃO-PPGI 2005.pdf | David Moises Barreto dos Santos - Dissertação (PPGCC) 2005. | 1.15 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.