O seu browser não suporta Javascript!
Você está em: Página Inicial > Comunicação > Arquivo de Notícias > Avanços na tecnologia para reprodução da voz
Publicado em: 31/03/2005
ATENÇÃO: Você está acessando o site antigo da FAPERJ, as informações contidas aqui podem estar desatualizadas. Acesse o novo site em www.faperj.br

Avanços na tecnologia para reprodução da voz

Mario Nicoll

 

Muitas vezes não nos damos conta de quanta tecnologia é necessária para tarefas cotidianas aparentemente simples como falar ao telefone, assistir TV ou ouvir rádio. Em alguns casos, para que a voz humana seja inteligível, depois de passar por um canal, é preciso suprimir os ruídos e assim realçá-la. Procura-se mascarar esses efeitos buscando zerar componentes espectrais que contenham mais ruído do que informação. Não é tarefa fácil. Com apoio da FAPERJ, o engenheiro José Antonio Apolinário Jr., do Instituto Militar de Engenharia (IME), tem se dedicado a pesquisar diferentes técnicas de realce de voz, que visam diminuir a quantidade de ruído de um sinal.

 

Contemplada no Edital Primeiros Projetos em 2004, a pesquisa "Novas Técnicas de Realce de Voz: Mono-Sensor com Supressor de Ruído Baseado em Wavelet Multi-Sensor Usando Filtragem Adaptativa Não Linear" está em fase inicial. Por enquanto, os estudos têm aplicado a filtragem adaptativa não-linear a outro cenário, que não ao de realce de voz. "Na nossa pesquisa, entendemos realçar a voz ou eliminar o ruído da mesma maneira. Poderíamos distinguir ambos no caso de termos um sinal de voz que passou por um canal e por isso terá uma degradação em seu espectro de freqüências além do ruído que é somado ao sinal já degradado ao longo do canal telefônico", explica Apolinário

 

Ouvidos mais atentos percebem que a voz humana, depois de passar por um canal, sempre apresenta aspectos diferentes dos da voz original. A diferença é notada ao telefone, por exemplo. Isso acontece porque o canal introduz uma distorção e geralmente acrescenta ruídos que não existiam no sinal original. Busca-se, então, compensar a distorção do canal e suprimir o ruído visando obter como resultado final um sinal de voz com maior inteligibilidade. 

 

As técnicas de realce de voz estudadas no projeto podem ser aplicadas em qualquer ambiente onde um sinal de voz foi corrompido com ruído auditivo. Outras técnicas existem para compensar o canal telefônico. A compensação de canal fixo (não celular) já foi objeto de outro projeto do mesmo pesquisador, que também teve financiamento da FAPERJ.

 

Desta vez, a pesquisa do Prof. Apolinário estuda a técnica num cenário onde o sinal de voz é gravemente corrompido e onde a possível distorção introduzida pelo método compense pela possibilidade de dar maior conforto ao ouvinte. O desconforto se dá, por exemplo, em comunicações HF de longa distância, típicas da região Amazônica.  Também tem aplicabilidade em casos onde se busca aprimorar a taxa de acerto de sistemas de reconhecimento de voz. É o caso de sistemas de reconhecimento automático de locutor, objeto de grande interesse para a área de segurança pública.

 

Duas técnicas de realce de voz monocanal (sinal proveniente de somente um microfone) estão sendo abordadas no projeto: a subtração espectral (compreendendo vários tipos incluindo a técnica conhecida como mascaramento perceptual ou método de Virag) e a baseada em Wavelet (Wavelet denoising).

 

A técnica conhecida como wavelet denoising tem um grande potencial de desenvolvimento e aplicações em diferentes casos, mas, para isso, precisa ter o efeito de seus parâmetros bem conhecidos para os diferentes tipos de ruídos. "Existe a possibilidade de inovarmos ao abordar o projeto de novas bases wavelet- mãe que conseguissem otimizar o desempenho para esta aplicação específica, presume Apolinário. "Pretendemos também, além de dominar a parte teórica deste assunto, implementar pelo menos alguns deste algoritmos em tempo real, utilizando kits de desenvolvimento de processador digital de sinais (DSP) que possam ser incorporados em protótipos de rádios, por exemplo", planeja.

 

Existem muitas variantes das técnicas anteriormente comentadas. O trabalho de Apolinário se propõe a comparar as diferentes possibilidades para ajudar um engenheiro de projeto a optar por uma determinada técnica com um determinado conjunto de parâmetros e efetivamente usá-los em seu projeto.

 

A supressão de ruído é particularmente dificultada quando o sinal e o ruído coexistem na mesma banda de freqüências. "Buscamos minimizar o efeito do ruído com um mínimo de distorção indesejável. Ao termos um bom balanço para cada situação, um usuário de um sistema de comunicações ruidoso poderia ter uma conversação mais confortável, com maior inteligibilidade", resumiu.

Compartilhar: Compartilhar no FaceBook Tweetar Email
  FAPERJ - Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do Rio de Janeiro
Av. Erasmo Braga 118 - 6º andar - Centro - Rio de Janeiro - RJ - Cep: 20.020-000 - Tel: (21) 2333-2000 - Fax: (21) 2332-6611

Página Inicial | Mapa do site | Central de Atendimento | Créditos | Dúvidas frequentes