-
4 FASES DO DATA MINING:
a compreensão de dados: Reveja os dados que você tem, documentá-lo, identificar gerenciamento de dados e questões de qualidade de dados. Tarefas para esta fase incluem:
Juntando informação
descrevendo
explorando
Verificando a qualidade
Preparação de dados: Obter os seus dados pronto para ser usado para a modelagem. Tarefas para esta fase incluem:
A seleção de dados
dados limpeza
construindo
integrando
formatação
Modelagem: Use técnicas matemáticas para identificar padrões dentro de seus dados. Tarefas para esta fase incluem:
selecionando técnicas
testes Designing
construção de modelos
avaliação de modelos
Avaliação: Rever os padrões que você descobriu e avaliar seu potencial para uso comercial. Tarefas para esta fase incluem:
avaliação de resultados
Revendo o processo
Determinar os próximos passos
implantação: Coloque as suas descobertas para trabalhar em negócios todos os dias. Tarefas para esta fase incluem:
implantação de planejamento (seus métodos para integrar as descobertas de mineração de dados em uso)
Relatar os resultados finais
Revendo os resultados finais
-
Segundo Carlos Barbieri (2011), em Business Intelligence (BI) pág 134:
Processos de Data Mining:
Prepraração: construir um banco de dados separado, coletar o dado, definir os metadados, atentar para a qualidade dos dados, carregar o banco de dados para o processo de mining.
Mineração: criar os modelos de data mining ,definir amostras ou população, selecionar dados para treinar o modelo.
Análise: técnicas básicas definidas para o processo de garimpagem de dados. Ex: associação, agregação...
Aplicação: depois de definido e testado o modelo a aplicação se dá pela utilização daqueles algoritmos ajustados em situações reais de sistemas.
-
A preparação dos textos é a primeira etapa do processo de descoberta de conhecimento em textos.
Esta etapa envolve a seleção das bases de textos que constituirão os dados de interesse e o trabalho inicial para tentar selecionar o núcleo que melhor expressa o conteúdo dos textos, ou seja, toda a informação que não refletir nenhuma ideia considerada importante poderá ser desprezada.
Estratégia.