dc.contributor | Demais unidades::RPCA | |
dc.creator | Silva, Edson Marchetti da | |
dc.creator | Souza, Renato Rocha | |
dc.date.accessioned | 2015-12-28T13:37:05Z | |
dc.date.available | 2015-12-28T13:37:05Z | |
dc.date.created | 2015-12-28T13:37:05Z | |
dc.date.issued | 2014 | |
dc.identifier | http://hdl.handle.net/10438/15027 | |
dc.description.abstract | É senso comum que o texto escrito é uma importante forma de registrar as informações e que atualmente grande parte desse conteúdo informacional está disponível em meio digital. Entretanto, de maneira geral, os computadores lidam com o texto como sendo uma cadeia de caracteres que não têm nenhum significado. A área de Processamento de Linguagem Natural (PLN) vem se empenhando em extrair significados do texto. Nesse sentido este trabalho apresenta uma revisão desse tema e propõe um método automatizado que utiliza uma heurística determinística denominada Heudet que visa extrair bigramas do texto. A meta é extrair o significado do texto através de um conjunto de expressões multipalavras identificadas. Os resultados obtidos foram melhores se comparados com aqueles que utilizam-se das técnicas de medidas de associação estatística obtidas pelo software Ngram Statistics Package (NSP). | |
dc.language | por | |
dc.subject | Medidas de associação estatísticas | |
dc.subject | Heudet | |
dc.subject | Multiword expression extraction | |
dc.subject | Measures of association statistics | |
dc.subject | Extração de expressões multipalavras | |
dc.title | Fundamentos em processamento de linguagem natural: uma proposta para extração de bigramas | |
dc.type | Article (Journal/Review) | |