//
arquivos

Mineração de dados

Esta tag está associada a 4 posts

A intervenção humana na qualificação de processos de data mining: estudo de caso em uma base de dados hipotética

BRIGNOLI, Juliano Tonizetti et al.. A intervenção humana na qualificação de processos de data mining: estudo de caso em uma base de dados hipotética. Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., Florianópolis, v.17, n.esp. 1, p.110-124,  2012. Disponível em: < http://www.periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2012v17nesp1p110 >. Acesso em: 29 dez. 2012.

Resumo
Este artigo explora argumentações acerca das contribuições da intervenção de analistas humanos em processos de Data Mining. A eficiência algorítmica destes processos não é suficiente na busca por conhecimento voltado ao apoio decisório em domínios com natureza de informação complexa e volumosa. Propriedades da intelectualidade humana, como a inferência e a percepção propiciam excelente complementação aos processos de análise de dados. Por meio de estudo de caso baseado em simulação pretende-se validar proposições que asseguram o fato dos processos de Data Mining serem conduzidos e interpretados por analistas humanos, tornando-os assim, de característica dinâmica.

Palavras-chave: Data Mining. Psicologia Cognitiva. Conhecimento.

Anúncios

Mineração de dados: busca de conhecimento sobre a evolução do canto da família Thamnophilidae

COSTA E SILVA, Letícia da; TSUNODA, Denise Fukumi; DESLANDES, Viviane. Mineração de dados: busca de conhecimento sobre a evolução do canto da família Thamnophilidae. AtoZ: novas práticas em informação e conhecimento, v. 1, n. 1, p. 61-70, jan./jun. 2011. Disponível em: <http://www.atoz.ufpr.br/index.php/atoz/article/view/5/4>. Acesso em: 6 set. 2011.

Resumo
Introdução. Descreve a utilização de uma técnica de mineração de dados sobre o canto, a biologia e o micro-habitat da família Thamnophilidae (Aves) a fim de encontrar padrões que os relacionem. Método. Uma base de dados foi construída em planilha Excel® relacionando 82 espécies da família da ave Thamnophilidae com diversos atributos referentes às características do canto, da biologia e do micro-habitat em que são encontradas. Na análise utilizou-se o algoritmo Apriori no software WEKA 3.7.1. Resultados. Ao associar os diferentes atributos de 82 espécies diferentes considerando o suporte mínimo de 10% e a confiança mínima de 90% foram encontrados 172 padrões, dos quais 42 continham um dos atributos do canto: PC1 e PC2. Os padrões que relacionavam o atributo PC2 foram os mais significativos ao indicar a relação deste com o tamanho e gênero da família. Os resultados colaboraram para gerar a hipótese de que os atributos do canto possuem comportamentos não relacionados. Conclusões. O experimento demonstrou que o algoritmo pode ser melhor aproveitado em bases de dados maiores e/ou cuja padronização dos dados apresente menor número de categorias, o que pode ser uma limitação no campo da macroecologia. Mas, ao mesmo tempo, se mostrou um instrumento alternativo para o estudo exploratório de relações entre diversos atributos, cujos resultados podem servir de objetos de análises mais aprofundadas.

Palavras-chave: Mineração de dados; Bases de dados; Aves florestais; Thamnophilidae (ave); Cantos dos pássaros.

Uso de sintagmas nominais na classificação automática de documentos eletrônicos

MAIA, Luiz Cláudio Gomes; SOUZA, Renato Rocha. Uso de sintagmas nominais na classificação automática de documentos eletrônicos. Perspectivas em Ciência da Informação, v. 15, n. 1, p. 154-172, 2010. Disponível em: <http://portaldeperiodicos.eci.ufmg.br/index.php/pci/article/view/875/717>. Acesso em: 5 jun. 2010.

Resumo
Esta pesquisa verificou se ocorre aprimoramento na classificação de documentos eletrônicos com o uso de técnicas e algoritmos de mineração de texto (análise de texto) utilizando além das palavras, sintagmas nominais como indexadores. Utilizaram-se duas ferramentas nos experimentos propostos desta pesquisa o OGMA e a WEKA. O OGMA foi desenvolvido pelo autor para automatizar a extração dos sintagmas nominas e o cálculo do peso de cada termo na indexação dos documentos para cada um dos seis métodos propostos. A WEKA foi utilizada analisar os resultados encontrados pelo OGMA utilizando aos algoritmos de agrupamento e classificação, simplekmeans e NaiveBayes, respectivamente, obtendo um valor percentual indicando quantos documentos foram classificados corretamente. Os métodos com melhores resultados foram o de termos sem stopwords e o de sintagmas nominais classificados e pontuados como descritores.

Palavras-chave: Análise de texto. Agrupamento automático de documentos. Indexação automática. Sintagmas nominais.

Tecnologias de descoberta de conhecimento na gestão do conhecimento: contextualizações com a sociedade do conhecimento

DZIEKANIAK, Gisele. Tecnologias de descoberta de conhecimento na gestão do conhecimento: contextualizações com a sociedade do conhecimento. DataGramaZero, v. 11, n. 1, fev. 2010. Disponível em: <http://www.dgz.org.br/fev10/Art_05.htm>. Acesso em: 17 fev. 2010.

Resumo
O artigo pretende fazer uma análise de tecnologias baseadas em Inteligência Artificial como é o caso do data mart, data mining e data warehouse para auxiliar na tomada de decisão do gestor de organizações tecendo relações com a gestão do conhecimento. Utilizou-se a revisão de literatura para compreender como a as ferramentas de Descoberta de Conhecimento (KDD) exploradas neste texto poderiam contribuir no que se considerou como boas práticas em gestão do conhecimento e na tomada de decisão. Tais tecnologias foram eleitas para análise por trabalharem com amplo volume de dados, sendo de grande utilidade em empresas que objetivam conhecer perfil de usuários e padrões de consumo e motivações, a fim de agregar valor ao negócio, sob a visão do business inteligence. Com relação a diferenças entre estas tecnologias se pode dizer que, enquanto o business inteligence atua no plano tácito de uma organização, as ferramentas tecnológicas trabalhadas neste artigo, atuam no plano estratégico, oferecendo, quando bem utilizadas, informações privilegiadas aos seus gestores.

Palavras-chave: Data warehouse; Data mart; Data mining; Inteligência artificial; Gestão do conhecimento; Descoberta de conhecimento.

Artigos separados por assunto

Aplicações de informação Arquitetura de informação Automação de bibliotecas Bases de dados Bibliometria / Informetria/ Cientometria / Webmetria Biblioteca escolar Bibliotecas Virtuais e Digitais Biblioteconomia Biblioterapia Catalogação Classificação Competência informacional Comportamento informacional Comunicação científica Comunicação mediada por computador Desenvolvimento de coleções Disseminação da informação Divulgação científica Economia da informação Educação à distância Epistemologia da Ciência da Informação Estudos de necessidades e usos de informação Estudos de usuários Estudos Interdisciplinares Fontes de informação Formação Profissional Fundamentos da Ciência da Informação Gestão da Informação Gestão de Qualidade de Informação Gestão do Conhecimento História da Ciência da Informação Inclusão digital Indexação Informação científica Informação em arquivos Informação em Arte Informação em bibliotecas Informação em museus Informação industrial Informação tecnológica Inteligência Competitiva Internet Internet/Web Leitura Marketing de informação Mediação da informação Metadados Metodologias da Ciência da Informação Mineração de dados Obras Raras Ontologia Organização do Conhecimento Organização e Processamento da Informação Políticas de informação Preservação e Segurança digital Processamento automático de linguagem Redes e Sistemas de informação Repositórios institucionais Representação da Informação Sistemas de recuperação da informação Tecnologias da Informação Teoria da Informação Tesauros Transferência de Informação Visualização da informação Vocabulários controlados Ética da informação Ética na informação

Arquivos