masterThesis
Segmentação de sequências em cadeias de Markov usando máxima verossimilhança penalizada
Registro en:
RODRIGUES, Franklin Diego de Lima. Segmentação de sequências em cadeias de Markov usando máxima verossimilhança penalizada. Orientador: Francisco Moisés Cândido de Medeiros. 2023. 40f. Dissertação (Mestrado em Matemática Aplicada e Estatística) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2023.
Autor
Rodrigues, Franklin Diego de Lima
Resumen
The sequence segmentation problem aims to partition a sequence or a set of them into a
finite number of distinct segments as homogeneous as possible. In this paper, we consider
the problem of segmenting a set of random sequences, with values in a finite alphabet E,
into a finite number of independent blocks. Under the assumption that the data follow a
Markov chain, the problem consists in estimating the number and position of the change
points in the sequence. For this, we propose the using of the penalized maximum likelihood
criterion to infer, simultaneously, the number and position of the change points. The
main result of our work is the demonstration of the theorem that guarantees the strong
consistency of the set of change points estimators for a sufficiently large number of samples. O problema de segmentação de sequências tem o objetivo de particionar uma sequência
ou um conjunto delas em um número finito de segmentos distintos tão homogêneos quanto
possível. Neste trabalho, consideramos o problema de segmentação de um conjunto de
sequências aleatórias, com valores em um alfabeto E finito, em um número finito de blocos
independentes. Sob hipótese que os dados seguem uma cadeia de Markov, o problema
consiste em estimar o número e a posição dos pontos de mudança da sequência. Para isso,
propomos usar o critério da máxima verossimilhança penalizada com o objetivo de inferir,
simultaneamente, o número e a posição dos pontos de mudança. O principal resultado do
nosso trabalho é a demonstração do teorema que garante a consistência forte do conjunto
de estimadores dos pontos de mudança para um número de amostras suficientemente grande.