Metric learning for patent similarity = Aprendizado métrico para similaridade entre patentes
Aprendizado métrico para similaridade entre patentes
dc.creator | Fonseca Arroyo, Pablo Alejandro, 1987- | |
dc.date | 2015 | |
dc.date | 2015-11-12T00:00:00Z | |
dc.date | 2017-04-03T04:37:58Z | |
dc.date | 2017-06-09T15:07:32Z | |
dc.date | 2017-04-03T04:37:58Z | |
dc.date | 2017-06-09T15:07:32Z | |
dc.date.accessioned | 2018-03-29T02:19:52Z | |
dc.date.available | 2018-03-29T02:19:52Z | |
dc.identifier | FONSECA ARROYO, Pablo Alejandro. Metric learning for patent similarity = Aprendizado métrico para similaridade entre patentes. 2015. 1 recurso online ( 38 p.). Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: <http://www.bibliotecadigital.unicamp.br/document/?code=000965693>. Acesso em: 3 abr. 2017. | |
dc.identifier | http://repositorio.unicamp.br/jspui/handle/REPOSIP/304721 | |
dc.identifier.uri | http://repositorioslatinoamericanos.uchile.cl/handle/2250/1314286 | |
dc.description | Orientador: Jacques Wainer | |
dc.description | Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação | |
dc.description | Resumo: Hoje em dia, obter uma melhor visão de um campo de tecnologia é crucial para a estratégia nos negócios, na universidade e no governo. As patentes são uma fonte muito importante de informação ao respeito. A similaridade textual entre patentes é um dos tipos de similaridade em que os analistas de patentes estão interessados, a fim de melhor compreendê-las. As técnicas comuns para medir a similaridade entre documentos de texto incluem representações bag-of-words ou distribuições de tópicos não supervisionadas, em combinação com várias opções possíveis para distâncias. No entanto, estes métodos não incorporam a informação do domínio do conhecimento, que pode ser crucial para um corpus dificil como as patentes são. Nesta tese de mestrado, uma abordagem para a aprendizagem de similaridade entre patentes é apresentada. O método utiliza aprendizado métrico e aproveita parte do processo legal que as patentes passam antes de serem concedidas. Os resultados do método proposto foram comparados com distâncias padrão, não supervisionadas como KL-divergence, a distância do coseno e a distância euclidiana com a obtenção de resultados superiores e mais confiáveis | |
dc.description | Abstract: Nowadays, gaining insight into a technology field is crucial for business, academy and government strategy. Patents are a great source of information in this regard. Textual patent similarity is one of the kinds of similarities in which patent analysts are interested in order to better understand them. Common techniques to measure similarity across text documents include bag-of-words representations or unsupervised topic distributions in combination with several possible options for distances. However, these methods do not incorporate information of the domain of knowledge, which might be crucial for approaching the challenging corpus patents are. In this master thesis, an approach for learning pairwise similarity between patents is presented. The method uses metric learning and takes advantage of some of the artifacts of the legal process patents undergo before being granted. The results of the proposed method were compared to standard, but unsupervised, distances (KL-Divergence, Cosine distance and Euclidean distance) obtaining superior and yet more trustful results | |
dc.description | Mestrado | |
dc.description | Ciência da Computação | |
dc.description | Mestre em Ciência da Computação | |
dc.description | 133548/2013-9 | |
dc.description | CNPQ | |
dc.format | 1 recurso online ( 38 p.) : il., digital, arquivo PDF. | |
dc.format | application/octet-stream | |
dc.language | Inglês | |
dc.publisher | [s.n.] | |
dc.relation | Requisitos do sistema: Software para leitura de arquivo em PDF | |
dc.subject | Mineração de dados (Computação) | |
dc.subject | Patentes | |
dc.subject | Inteligência artificial | |
dc.subject | Aprendizado de máquina | |
dc.subject | Data mining | |
dc.subject | Patents | |
dc.subject | Artificial intelligence | |
dc.subject | Machine learning | |
dc.title | Metric learning for patent similarity = Aprendizado métrico para similaridade entre patentes | |
dc.title | Aprendizado métrico para similaridade entre patentes | |
dc.type | Tesis |