Otro
Modelo linguístico-computacional para um dicionário analógico digital
Registro en:
ALBUQUERQUE, Felipe Iszlaji de. Modelo linguístico-computacional para um dicionário analógico digital. 2013. xv, 248 f. Tese (doutorado) - Universidade Estadual Paulista Júlio de Mesquita Filho, Faculdade de Ciências e Letras (Campus de Araraquara), 2013.
albuquerque_fi_dr_arafcl.pdf
000717762
33004030009P4
Autor
Albuquerque, Felipe Iszlaji de
Resumen
Esta pesquisa se insere no contexto da construção do website Dicionário Criativo (www.dicionariocriativo.com.br), idealizado com o objetivo de oferecer ferramentas linguísticas que, relacionadas, instrumentalizam o usuário para a produção de textos de caráter criativo (poemas, letras de canções, anúncios publicitários etc.). Para estruturar e organizar as relações entre os diferentes conteúdos linguísticos, a pesquisa em questão propõe um modelo linguístico-computacional para um dicionário analógico digital, tendo em vista que a estrutura onomasiológica dos dicionários analógicos é mais adequada às necessidades impostas. Neles, o usuário parte de uma determinada ideia e examina as diferentes maneiras pelas quais essa ideia encontrou expressão na palavra. Ou seja, eles organizam o léxico dentro de uma estrutura conceitual predefinida. O resultado desta pesquisa deverá ser parte integrante do conteúdo do Dicionário Criativo, ao mesmo tempo em que estrutura os demais conteúdos linguísticos previstos (locuções, expressões idiomáticas, provérbios e citações). Tendo em vista que esse trabalho se insere no campo de pesquisa do Processamento Automático das Línguas Naturais (PLN), nossa investigação utiliza a metodologia de Dias-da-Silva (2006), que propõe que as pesquisas em PLN sejam sistematizadas em três domínios complementares: linguístico, linguístico-computacional e computacional. No domínio linguístico, trabalhamos com a abordagem teórica da Semântica Lexical Cognitiva, especialmente com a Semântica de Frames (FILLMORE, 1976) e a Teoria de Protótipos (ROSCH, 1975). No domínio linguístico-computacional, trabalhamos com a Teoria das Redes (BARABÁSI, 2002) e a Teoria dos Conjuntos Difusos (ZADEH, 1965) para o tratamento formal dos resultados obtidos na fase linguística. O domínio computacional não faz parte do escopo desta tese.... This thesis is inserted in the context of the construction of the website Dicionário Criativo (www.dicionariocriativo.com.br), which was conceived to offer linguistic tools to help users in creative writing (such as poems, lyrics, advertisements, etc.). In order to structure and organize the relationships between the different linguistic contents, this research proposes a linguistic-computational model to a digital thesaurus, once the onomasiological structure of the onomasiological dictionaries is the more suitable to the use described. With this kind of dictionary, which organizes the lexicon in a predefined conceptual structure, the user works with an idea and examines the ways it is expressed in words. This research results will be part of the content of the Dicionário Criativo and will structure the other linguistic contents (phrases, idioms, proverbs, and quotes). We are in the field of Natural Language Processing, approached here according to Dias-da-Silva's (2006) methodology which proposition structures the researches in this field in three complementary domains: the linguistic domain, the linguistic-computational domain, and the computational domain (this later does not take part in the scope of our thesis). In the linguistic domain we work with the Cognitive Lexical Semantics theoretical approach, focusing on Frame Semantics (Fillmore, 1976) and on Theory of Prototypes (ROSCH, 1975), and in the linguistic-computational domain we work with Theory of Networks (BARABÁSI, 2002) and with Theory of Fuzzy Sets (ZADEH, 1965) for formal treatment of the results obtained in the linguistic phase. The corpus from which we extract the lexical unities and from which we infer part of the concepts is composed by lyrics of Chico Buarque's O Grande Circo Místico (1983)