Colección SciELO Chile

Departamento Gestión de Conocimiento, Monitoreo y Prospección
Consultas o comentarios: productividad@anid.cl
Búsqueda Publicación
Búsqueda por Tema Título, Abstract y Keywords



3D Localization of Multiple Simultaneous Speakers with Discrete Wavelet Transform and Proposed 3D Nested Microphone Array
Indexado
WoS WOS:000455614900072
DOI
Año 2018
Tipo proceedings paper

Citas Totales

Autores Afiliación Chile

Instituciones Chile

% Participación
Internacional

Autores
Afiliación Extranjera

Instituciones
Extranjeras


Abstract



Multiple sound source localization is one of the important topic in speech processing. GCC function is used as a traditional algorithm for sound source localization. This function estimates DOA for multiple speakers by calculation the cross-correlation between microphone signals but its accuracy decreases in adverse conditions. The aim of proposed method in this paper is localization of multiple simultaneous speakers in undesirable condition. The proposed method is based on novel 3D nested microphone array in combination with obtained information of Discrete Wavelet Transform (DWT) and subband processing. The proposed 3D nested microphone array prepares the condition for 3D localization and eliminates the spatial aliasing between microphone signals. Also, we propose the DWT for extraction the information of speech signal. Since, the spectral information of speech signal concentrates on low frequencies, we propose a structure of filter bank based on DWT to increase the frequency resolution on low frequencies. The performed evaluation on real and simulated data shows the superiority of our proposed method in comparison with Fullband and subband processing with uniform filters and uniform microphone array.

Disciplinas de Investigación



WOS
Sin Disciplinas
Scopus
Sin Disciplinas
SciELO
Sin Disciplinas

Muestra la distribución de disciplinas para esta publicación.

Publicaciones WoS (Ediciones: ISSHP, ISTP, AHCI, SSCI, SCI), Scopus, SciELO Chile.

Colaboración Institucional



Muestra la distribución de colaboración, tanto nacional como extranjera, generada en esta publicación.


Autores - Afiliación



Ord. Autor Género Institución - País
1 Dehghan Firoozabadi, Ali Hombre Universidad Tecnológica Metropolitana - Chile
2 Durney, Hugo Hombre Universidad Tecnológica Metropolitana - Chile
3 Soto, Ismael Hombre Universidad de Santiago de Chile - Chile
4 Olave, Miguel Sanhueza Hombre Universidad Tecnológica Metropolitana - Chile
5 IEEE Corporación

Muestra la afiliación y género (detectado) para los co-autores de la publicación.

Financiamiento



Fuente
Fondef
CONICYT - PIA - Anillo
Internal grant DIDA L1-03 comunicaciones inalambricas con VoIP en tiempo real sobre canal VLC utilizando SIP y RFC, UTEM

Muestra la fuente de financiamiento declarada en la publicación.

Agradecimientos



Agradecimiento
The authors acknowledge financial support from: CONICYT - PIA - Anillo ACT1416, FONDEF project code IT17M10012, USACH and Internal grant DIDA L1-03 comunicaciones inalambricas con VoIP en tiempo real sobre canal VLC utilizando SIP y RFC, UTEM.

Muestra la fuente de financiamiento declarada en la publicación.