dc.contributor | Yamanaka, Keiji | |
dc.contributor | http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4798494D8 | |
dc.contributor | Nomura, Shigueo | |
dc.contributor | http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723707A0 | |
dc.contributor | Neves, Luiz Antônio Pereira | |
dc.contributor | Faria, Eustáquio São José de | |
dc.contributor | http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4753561Z8 | |
dc.creator | Tavares, Josimeire do Amaral | |
dc.date | 2016-06-22T18:38:43Z | |
dc.date | 2012-04-30 | |
dc.date | 2016-06-22T18:38:43Z | |
dc.date | 2011-10-28 | |
dc.date.accessioned | 2023-09-28T20:59:40Z | |
dc.date.available | 2023-09-28T20:59:40Z | |
dc.identifier | TAVARES, Josimeire do Amaral. GROSC: uma proposta de segmentação de caracteres impressos
orientada a regiões em níveis de cinza. 2011. 123 f. Dissertação (Mestrado em Engenharias) - Universidade Federal de Uberlândia, Uberlândia, 2011. | |
dc.identifier | https://repositorio.ufu.br/handle/123456789/14478 | |
dc.identifier.uri | https://repositorioslatinoamericanos.uchile.cl/handle/2250/9062138 | |
dc.description | Optical Character Recognition systems (OCR) refer generically to technologies
applied to recognize characters from an image file that contains text.
It allows, for example, that a scanned sheet of printed text could be converted
into an editable text file. These systems have been widespread over the past
years, with several commercial versions, including the ones embedded within
scanner devices. One of the steps that define the success or failure of this
type of system is the correct segmentation of text lines and characters that
constitute it. Recently, it has gained importance the correct segmentation of
words in the textto assist possible post-processing steps to correct deviations
of recognition. This paper presents two different methods for segmentation
of texts. The first method, called Segmentation of Lines and Words based
Teager energy operator (SLP-TEO), based on the Teager energy operator
(TEO), is used in the segmentation of text lines and words. The TEO is
applied to the signal abstracted from the linear projection (horizontal or vertical)
generated by the binary image of the text. A unique feature of this
method is that it can be applied to printed texts or manuscripts, without prior
arrangements. Moreover, the same algorithm is used to segmentation of text
lines and segmentation of words, no matter if they are printed or handwritten.
The adopteddatabase for this project (IAM-Database), widely used in OCR
researches, has, for all printed text, handwritten transcripts that were also
targeted using SLP-TEO method. The second method, called gray-Region
Oriented Segmentation of Characters (gROSC) is applied to grayscale word
images for the purpose of character segmentation. This method is based on
region oriented methodswhere connected pixels that are visited and labeled.
A unique feature of the method is that it should be applied to grayscale
images of the segmented words. Moreover, using the Otsu threshold and
knowing the gray levels of the image in advance, the method determines the
maximum variation between shades of gray that allows or not to visit the
neighboring pixel, adding it to the target region of interest. In the adopted
database, there are three basic types of characters problems to solve: overlapping
characters, connected characters, and font design. The gROSCmethod is applied to all previously segmented words images, and the characters are
equally segmented, without previous identification of possible character problems.
The experiments and results in all stages of segmentation with both
methods are very relevant and demonstrate the efficiency and simplicity of
the proposed methods. | |
dc.description | Mestre em Ciências | |
dc.description | Os sistemas de Optical Character Recognition (OCR, ou Reconhecimento
ótico de caracteres em português) designam genericamente tecnologias
para reconhecer caracteres a partir de um arquivo de imagem que contenha
textos. Permite, por exemplo, que uma folha de texto impresso, ao
ser digitalizada, possa ser convertida em um arquivo de texto editável. Esses
sistemas foram muito difundidos ao longo dos ´últimos anos, com viárias versões
comerciais, incluindo os incorporados em aparelhos scanner. Uma das
etapas que definem o sucesso ou fracasso deste tipo de sistema é a correta
segmentação das linhas de texto e dos caracteres que o constituem. Atualmente
ganhou importância a correta segmentação das palavras contidas no
texto, para auxiliar possíveis etapas de pós-processamento para a correção
de desvios de reconhecimento. Neste trabalho são apresentados dois métodos
diferenciados para segmentação de textos. O primeiro método, denominado
Segmentação de Linhas e Palavras baseado no Operador de Energia
de Teager (SLP-TEO) é utilizado na segmentação de linhas de texto e segmentação de palavras. O TEO ´e aplicado ao sinal abstraído da projeção
linear (horizontal ou vertical) gerada através da imagem binária do texto.
Um dos diferenciais do método é que o mesmo pode ser aplicado a textos
impressos ou manuscritos, sem nenhum ajuste prévio. Além disso, o mesmo
algoritmo é utilizado tanto na segmentação de linhas quanto na segmentação
de palavras, impressas ou manuscritas. A base de dados adotada neste projeto
(IAM-Database), consagrada em diversas pesquisas de OCR, possui,para
todo texto impresso, transcrições manuscritas que também foram alvo do
método SLP-TEO. O segundo método, denominado gray-Region Oriented
Segmentation of Characters-(gROSC) , em português Segmentação de Caracteres
Orientado à Regiões em níveis de cinza , é aplicado às imagens das
palavras em tons de cinza com a finalidade de segmentação de caracteres.
Este método baseia-se nos métodos de segmentação de regiões em que os
pixels conectados são visitados e rotulados. Um dos diferenciais do método
é que o mesmo deve ser aplicado às imagens em níveis de cinza das palavras
segmentadas. Além disso, utilizando o limiar de Otsu e conhecendo-se os níveis de cinza da imagem, o método determina a variação máxima entre
tons de cinza que permite ou não visitar o pixel vizinho, agregando-o à
região de interesse a ser segmentada. Na base de dados adotada existem três
tipos básicos de caracteres problemáticos: caracteres sobrepostos, caracteres
conectados e desenho de fontes. O método gROSC é aplicado às imagens de
todas as palavras segmentadas anteriormente e os caracteres são segmentados
igualmente sem prévia identificação dos possíveis problemas. Os experimentos
e resultados encontrados em todas as etapas de segmentação dos textos
com ambos os métodos são bastante relevantes e demonstram a eficiência e
simplicidade dos métodos propostos. | |
dc.format | application/pdf | |
dc.format | application/pdf | |
dc.language | por | |
dc.publisher | Universidade Federal de Uberlândia | |
dc.publisher | BR | |
dc.publisher | Programa de Pós-graduação em Engenharia Elétrica | |
dc.publisher | Engenharias | |
dc.publisher | UFU | |
dc.rights | Acesso Aberto | |
dc.subject | Segmentação de caracteres | |
dc.subject | Segmentação de regiões | |
dc.subject | Segmentação de linhas e palavras | |
dc.subject | Operador de energia de teager | |
dc.subject | Processamento de palavras | |
dc.subject | Processamento de textos (Computação) | |
dc.subject | Character segmentation | |
dc.subject | Region oriented segmentation | |
dc.subject | Segmentation of lines and words | |
dc.subject | Teager energy operator (TEO) | |
dc.subject | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA | |
dc.title | GROSC: uma proposta de segmentação de caracteres impressos
orientada a regiões em níveis de cinza | |
dc.type | Dissertação | |