[bibshow file=ref.bib]
Objetivos
Estimar, de maneira síncrona, o pulso glotal de Rosenberg [bibcite key=rosenberg1971effect] que melhor aproxima temporalmente o pulso do sinal de voz, utilizando um banco de pulsos glotais e comparando o espectro de cada um dos pulsos com o espectro de um sinal de voz. Assim, é feito o uso de sinais de voz sintetizados, de acordo com a metodologia apresentada no relatório anterior, para a verificação dos resultados. Espera-se que o pulso glotal seja estimado perfeitamente para esses sinais sintetizados.
Metodologia
Modelo de Rosenberg para o pulso glotal
O modelo para o pulso glotal de Rosenberg [bibcite key=rosenberg1971effect] é dado pela seguinte expressão [bibcite key=Rabiner1978]:
(1)
em que e modelam o tempo de abertura e de fechamento da glote, respectivamente, como ilustrado na Figura 1. Comumente, na literatura, .
Estimação de frequência fundamental por autocorrelação
Para a estimação de frequência fundamental () baseada na autocorrelação do sinal, dado um sinal digitalizado , a função de autocorrelação empírica de um sinal pode ser definida como segue [bibcite key=Rabiner1978]:
(2)
em que se pode inferir que o valor máximo da função de autocorrelação é atingido quando . Também se faz notável que, para sinais periódicos, a função de autocorrelação do sinal apresenta a propriedade de manter-se periódica, com o mesmo período do sinal. Isso indica que para (em que é o período e é um número inteiro qualquer), , sugerindo, assim, que a cada ciclo o valor máximo da função de autocorrelação é atingido. Assim, a estimação de é feita por meio dessas propriedades para encontrar o período do sinal e, consequentemente, a frequência fundamental do sinal.
Método para a estimação do pulso glotal
O processo proposto para a estimação do pulso glotal utiliza a frequência fundamental do sinal analisado, obtida por meio da autocorrelação do sinal, para gerar o banco de pulsos. Com o valor estimado da foi possível determinar o tamanho do pulso, em amostras, (). Assim o banco de pulsos foi então gerado assumindo, empiricamente, que , e .
Calculando os espectros por FFT (Fast Fourier Transform) [bibcite key=mcclellan2003signal], o espectro de cada pulso do banco é comparado ao espectro do sinal de entrada por meio do erro quadrático médio. Levando em conta a resposta espectral do pulso de Rosenberg, espera-se que o pulso que apresentar o menor erro indicará o que melhor aproxima o pulso real.
Verificação dos resultados
Para verificar a acurácia do método implementado, foram utilizados sinais sintetizados de acordo com a metodologia proposta no relatório anterior. Assim, foi feita a comparação entre o pulso estimado e o pulso utilizado para a síntese.
Resultados
A implementação do método proposto ainda não está completa, de forma que existem alguns problemas a serem resolvidos. Os resultados preliminares se mostraram inadequados, como pode ser observado na Figura 2.
Conclusão e Próxima Etapa
Uma averiguação mais detalhada da implementação é necessária para que seja possível a obtenção de bons resultados com o método proposto. Assim, a próxima etapa dará continuidade a esse método, buscando solucionar os problemas encontrados. Caso os resultados com os sinais sintetizados se apresentem adequados, será feita, também, a comparação com sinais reais de voz que possuam seus respectivos sinais eletroglotográficos [bibcite key=ferrand2001speech].
[/bibshow]
Mestrando em Engenharia Elétrica e Bacharel em Engenharia Eletrônica pela Universidade Federal de Sergipe. Interessado nas áreas de Modelagem Computacional, Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões. Atualmente desenvolve pesquisa no estudo de modelos computacionais dos mecanismos de produção vocal.
Áreas de Pesquisa: Modelagem Computacional, Processamento Digital de Sinais, Reconhecimento de Padrões, Processamento de Sinais de Voz e Fala, Qualidade Vocal.
Estudante de Graduação em Engenharia Eletrônica na Universidade Federal de Sergipe. Áreas de interesse são Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões.
Estudante de Graduação em Engenharia Eletrônica na Universidade Federal de Sergipe. Interessado nas áreas de Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões