Aprendizado métrico para similaridade entre patentes

dc.creatorFonseca Arroyo, Pablo Alejandro, 1987-
dc.date2015
dc.date2015-11-12T00:00:00Z
dc.date2017-04-03T04:37:58Z
dc.date2017-06-09T15:07:32Z
dc.date2017-04-03T04:37:58Z
dc.date2017-06-09T15:07:32Z
dc.date.accessioned2018-03-29T02:19:52Z
dc.date.available2018-03-29T02:19:52Z
dc.identifierFONSECA ARROYO, Pablo Alejandro. Metric learning for patent similarity = Aprendizado métrico para similaridade entre patentes. 2015. 1 recurso online ( 38 p.). Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: <http://www.bibliotecadigital.unicamp.br/document/?code=000965693>. Acesso em: 3 abr. 2017.
dc.identifierhttp://repositorio.unicamp.br/jspui/handle/REPOSIP/304721
dc.identifier.urihttp://repositorioslatinoamericanos.uchile.cl/handle/2250/1314286
dc.descriptionOrientador: Jacques Wainer
dc.descriptionDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação
dc.descriptionResumo: Hoje em dia, obter uma melhor visão de um campo de tecnologia é crucial para a estratégia nos negócios, na universidade e no governo. As patentes são uma fonte muito importante de informação ao respeito. A similaridade textual entre patentes é um dos tipos de similaridade em que os analistas de patentes estão interessados, a fim de melhor compreendê-las. As técnicas comuns para medir a similaridade entre documentos de texto incluem representações bag-of-words ou distribuições de tópicos não supervisionadas, em combinação com várias opções possíveis para distâncias. No entanto, estes métodos não incorporam a informação do domínio do conhecimento, que pode ser crucial para um corpus dificil como as patentes são. Nesta tese de mestrado, uma abordagem para a aprendizagem de similaridade entre patentes é apresentada. O método utiliza aprendizado métrico e aproveita parte do processo legal que as patentes passam antes de serem concedidas. Os resultados do método proposto foram comparados com distâncias padrão, não supervisionadas como KL-divergence, a distância do coseno e a distância euclidiana com a obtenção de resultados superiores e mais confiáveis
dc.descriptionAbstract: Nowadays, gaining insight into a technology field is crucial for business, academy and government strategy. Patents are a great source of information in this regard. Textual patent similarity is one of the kinds of similarities in which patent analysts are interested in order to better understand them. Common techniques to measure similarity across text documents include bag-of-words representations or unsupervised topic distributions in combination with several possible options for distances. However, these methods do not incorporate information of the domain of knowledge, which might be crucial for approaching the challenging corpus patents are. In this master thesis, an approach for learning pairwise similarity between patents is presented. The method uses metric learning and takes advantage of some of the artifacts of the legal process patents undergo before being granted. The results of the proposed method were compared to standard, but unsupervised, distances (KL-Divergence, Cosine distance and Euclidean distance) obtaining superior and yet more trustful results
dc.descriptionMestrado
dc.descriptionCiência da Computação
dc.descriptionMestre em Ciência da Computação
dc.description133548/2013-9
dc.descriptionCNPQ
dc.format1 recurso online ( 38 p.) : il., digital, arquivo PDF.
dc.formatapplication/octet-stream
dc.languageInglês
dc.publisher[s.n.]
dc.relationRequisitos do sistema: Software para leitura de arquivo em PDF
dc.subjectMineração de dados (Computação)
dc.subjectPatentes
dc.subjectInteligência artificial
dc.subjectAprendizado de máquina
dc.subjectData mining
dc.subjectPatents
dc.subjectArtificial intelligence
dc.subjectMachine learning
dc.titleMetric learning for patent similarity = Aprendizado métrico para similaridade entre patentes
dc.titleAprendizado métrico para similaridade entre patentes
dc.typeTesis


Este ítem pertenece a la siguiente institución