[bibshow file=ref.bib format=ieee]
Objetivos
Realizar a estimação do pulso glotal utilizando o Iterative Adaptative Inverse Filtering(IAIF) [bibcite key=alku1991analysis], método clássico para estimação baseado em filtragem inversa, e realizar uma análise subjetiva dos resultados obtidos, considerando o formato de onda comum de um sinal de pulso glotal.
Metodologia
Predição Linear
A predição linear consiste na estimação do valor de uma amostra do sinal a partir das amostras anteriores, como representado a seguir:
(1)
em que representa a perturbação aleatória independente do sinal e é a ordem do filtro.
Assim, cada elemento de pode ser representado como uma combinação linear entre elementos anteriores, a menos de um erro de predição. O ajuste dos coeficientes é realizado de acordo com o método dos míinimos quadrados, utilizando pseudo-inversão.
Com os coeficientes encontrados, a partir de (1) por meio da transformada Z, chega-se à seguinte função de transferência:
(2)
em que os polos permitem estimar o contorno espectral do sinal.
Filtragem Inversa
A função de transferência em (2) pode representar um filtro digital. O processo de filtragem inversa consiste em filtrar o sinal , removendo as influências dos polos de , utilizando um filtro que pode ser representado como segue:
(3)
Iterative Adaptative Inverse Filtering
O IAIF é um método que emprega predição linear e filtragem inversa utilizando uma estrutura iterativa para estimar o pulso glotal. Esse método consiste em realizar uma filtragem passa-altas em um sinal de voz, , e aplicar, no sinal resultante, o procedimento ilustrado na Figura 1. Primeiramente é realizada a estimação da contribuição glotal, , obtida por predição linear de ordem 1, seguida pela remoção dessa por meio de filtragem inversa. Em seguida é estimada a contribuição do trato vocal, , utilizando predição linear de ordem , sendo essa removida por filtragem inversa, seguida da eliminação do efeito da radiação dos lábios por meio de um integrador estimando assim o pulso glotal. Por fim, esse procedimento é executado mais uma vez, utilizando, entretanto, ordem na estimação da contribuição.
Resultados
Na Figura 2 encontram-se representados um sinal utilizado como exemplo e seu pulso glotal estimado , utilizando e (escolhidos de acordo com a percepção subjetiva dos autores), de acordo com o procedimento descrito anteriormente. Pode ser observado um comportamento coerente com o esperado, de acordo com as representações de pulso glotal na literatura. Entretanto, não é possível garantir a acurácia da estimação, sem que haja a comparação com uma representação válida do sinal glotal.
Na Figura 3 encontram-se representadas as contribuições espectrais do pulso glotal e trato vocal estimados nas duas iterações realizadas pelo IAIF em azul, e em vermelho o contorno espectral do processo de filtragem inversa. Nela, a estimação final da contribuição do trato vocal é representada por .
Conclusão e Próxima Etapa
O IAIF é um método de simples implementação e seus resultado apresentaram-se, aparentemente coerentes, de acordo com o referencial teórico. Entretanto, a escolha dos parâmetros da predição linear são ajustados de maneira subjetiva, sendo necessário um método de ajuste mais objetivo, para garantir melhores resultados. Também se faz necessário realizar a comparação dos sinais glotais estimados com um sinal glotal confiável, para assegurar a acurácia do método.
Na próxima etapa do trabalho, pretende-se realizar a síntese de um sinal de voz, utilizando um pulso glotal e um trato vocal conhecidos, permitindo, assim, a comparação entre o sinal glotal estimado e o utilizado para a síntese. Também serão realizados testes de ajuste do modelo de Liljencrants-Fant [bibcite key=fant1985four] à derivada do sinal glotal estimado, analisando o erro e os parâmetros ajustados, de acordo com metodologia proposta por Strik e Boves [bibcite key=strik1992relation].
[/bibshow]
Mestrando em Engenharia Elétrica e Bacharel em Engenharia Eletrônica pela Universidade Federal de Sergipe. Interessado nas áreas de Modelagem Computacional, Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões. Atualmente desenvolve pesquisa no estudo de modelos computacionais dos mecanismos de produção vocal.
Áreas de Pesquisa: Modelagem Computacional, Processamento Digital de Sinais, Reconhecimento de Padrões, Processamento de Sinais de Voz e Fala, Qualidade Vocal.
Estudante de Graduação em Engenharia Eletrônica na Universidade Federal de Sergipe. Áreas de interesse são Processamento Digital de Sinais, Processamento Digital da Fala e Reconhecimento de Padrões.
1 thought on “Estimação de Pulso Glotal com o IAIF”