An Analysis of the use of multiscale information in mapping of PSNR for perceptual scoring

dc.contributorBARROS, Fabrício José Brito
dc.contributorhttp://lattes.cnpq.br/9758585938727609
dc.contributorZAMPOLO, Ronaldo de Freitas
dc.contributorhttp://lattes.cnpq.br/9088524620828017
dc.creatorGONÇALVES, Luan Assis
dc.date2020-02-03T14:56:33Z
dc.date2020-02-03T14:56:33Z
dc.date2019-11-18
dc.date.accessioned2023-09-28T15:19:15Z
dc.date.available2023-09-28T15:19:15Z
dc.identifierGONÇALVES, Luan Assis. Uma Análise do uso de informacões multiescala no mapeamento da PSNR para pontuacão perceptual. Orientador : Fabrício José Brito Barros. Coorientador: Ronaldo de Freitas Zampolo. 2019. 64 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2019. Disponível em: http://repositorio.ufpa.br:8080/jspui/handle/2011/12262. Acesso em:.
dc.identifierhttp://repositorio.ufpa.br:8080/jspui/handle/2011/12262
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/9012083
dc.descriptionThe prediction of visual quality is crucial in image and video systems. For this task, image quality metrics based on the mean squared error prevail in the field, due to their mathematical straightforwardness, even though they do not correlate well with the visual human perception. Latest achievements in the area support that the use of convolutional neural networks (CNN) to assess perceptual visual quality is a clear trend. Results in other applications, like blur detection and de-raining, indicate the combination of information from different scales improves the CNN performance. However, to the best of our knowledge, the best way to embody multi-scale information in visual quality characterization is still an open issue. Thus, in this work, we investigate the influence of using multi-scale information to predict the perceptual image quality. Specifically, we propose a single-stream dense network that estimates a spatially-varying parameter of a logistic function used to map values of a objective visual quality metric to subjective visual quality scores through the reference image. The proposed method achieved a reduction of 36.37% and 69.45% for the number of parameters and floating-point operations per second, respectively, and its performance is compared with a competing state-of-the-art approach by using a public image database.
dc.descriptionCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
dc.descriptionA previsão da qualidade visual é crucial nos sistemas de imagem e vídeo. Métricas de qualidade de imagem com base no erro quadrático médio prevalecem em diversas aplicacões, apesar de apresentarem baixa correlacão¸ com a percepção visual humana, devido à sua simplicidade matemática. As últimas realizacões na área sustentam que o uso de redes neurais convolucionais (CNN) para avaliar a qualidade visual perceptiva é uma tendência clara. Resultados em outras aplicacões, como deteccão de desfoque e remocão de chuva, indicam que a combinacão de informacões de diferentes escalas melhora o desempenho da CNN. No entanto, até onde sabemos, a melhor maneira de incorporar informacões em várias escalas na caracterizacão da qualidade visual ainda é uma questão em aberto. Assim, neste trabalho, investigamos a influência do uso de informacões em várias escalas para prever a qualidade perceptual de imagens. Especificamente, propomos uma rede densa de fluxo único que estima um parâmetro espacialmente variável da funcão logística usada para mapear valores de métricas objetivas de qualidade visual para as notas subjetivas de qualidade visual através da imagem de referência. O método proposto alcançou uma reducão de 36,37% e 69,45% para o número de parâmetros e de operacões de ponto flutuante por segundo, respectivamente, e seu desempenho é comparado com o estado da arte, usando um banco de dados de imagens disponível publicamente.
dc.formatapplication/pdf
dc.languagepor
dc.publisherUniversidade Federal do Pará
dc.publisherBrasil
dc.publisherInstituto de Tecnologia
dc.publisherUFPA
dc.publisherPrograma de Pós-Graduação em Engenharia Elétrica
dc.rightsAcesso Aberto
dc.source1 CD-ROM
dc.subjectRedes neurais convolucionais
dc.subjectavaliação de qualidade visual
dc.subjectEscore de opinião médio diferencial
dc.subjectDifferential mean opinion score
dc.subjectinformações multiescala
dc.subjectrelacão sinal-ruído de pico
dc.subjectCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
dc.subjectPROCESSAMENTO DIGITAL DE SINAIS
dc.subjectTELECOMUNICAÇÕES
dc.titleUma Análise do uso de informacões multiescala no mapeamento da PSNR para pontuacão perceptual
dc.titleAn Analysis of the use of multiscale information in mapping of PSNR for perceptual scoring
dc.typeDissertação


Este ítem pertenece a la siguiente institución