dc.contributorDemais unidades::RPCA
dc.creatorSilva, Edson Marchetti da
dc.creatorSouza, Renato Rocha
dc.date.accessioned2015-12-28T13:37:05Z
dc.date.available2015-12-28T13:37:05Z
dc.date.created2015-12-28T13:37:05Z
dc.date.issued2014
dc.identifierhttp://hdl.handle.net/10438/15027
dc.description.abstractÉ senso comum que o texto escrito é uma importante forma de registrar as informações e que atualmente grande parte desse conteúdo informacional está disponível em meio digital. Entretanto, de maneira geral, os computadores lidam com o texto como sendo uma cadeia de caracteres que não têm nenhum significado. A área de Processamento de Linguagem Natural (PLN) vem se empenhando em extrair significados do texto. Nesse sentido este trabalho apresenta uma revisão desse tema e propõe um método automatizado que utiliza uma heurística determinística denominada Heudet que visa extrair bigramas do texto. A meta é extrair o significado do texto através de um conjunto de expressões multipalavras identificadas. Os resultados obtidos foram melhores se comparados com aqueles que utilizam-se das técnicas de medidas de associação estatística obtidas pelo software Ngram Statistics Package (NSP).
dc.languagepor
dc.subjectMedidas de associação estatísticas
dc.subjectHeudet
dc.subjectMultiword expression extraction
dc.subjectMeasures of association statistics
dc.subjectExtração de expressões multipalavras
dc.titleFundamentos em processamento de linguagem natural: uma proposta para extração de bigramas
dc.typeArticle (Journal/Review)


Este ítem pertenece a la siguiente institución