Colección SciELO Chile

Departamento Gestión de Conocimiento, Monitoreo y Prospección
Consultas o comentarios: productividad@anid.cl
Búsqueda Publicación
Búsqueda por Tema Título, Abstract y Keywords



Speech emotion recognition with deep learning beamforming on a distant human-robot interaction scenario
Indexado
WoS WOS:001331850103066
Scopus SCOPUS_ID:85214835834
DOI 10.21437/INTERSPEECH.2024-1273
Año 2024
Tipo proceedings paper

Citas Totales

Autores Afiliación Chile

Instituciones Chile

% Participación
Internacional

Autores
Afiliación Extranjera

Instituciones
Extranjeras


Abstract



Human-robot interaction (HRI) is becoming a truly relevant topic imposing many challenges for state-of-the-art speech technology. This paper describes the first evaluation of speech emotion recognition (SER) technology with non-acted speech data recorded in a real indoor HRI scenario using deep learning-based beamforming technologies. The results presented show that deep learning beamforming gives in average an average concordance correlation coefficient (CCC) that is 15.03% higher than the ordinary minimum variance distortionless response (MVDR) beamformer when the SER system was trained with simulated conditions, which included an acoustic model of the testing HRI environment. Training by simulating the test scenarios and testing with real HRI static data provides on average an average CCC that is just 22.5% smaller than the ideal condition where training and testing were performed with the original MSP-Podcast database. This suggests the possibility to train SER engines with methods that emulates complex testing scenarios without recording further data.

Métricas Externas



PlumX Altmetric Dimensions

Muestra métricas de impacto externas asociadas a la publicación. Para mayor detalle:

Disciplinas de Investigación



WOS
Sin Disciplinas
Scopus
Sin Disciplinas
SciELO
Sin Disciplinas

Muestra la distribución de disciplinas para esta publicación.

Publicaciones WoS (Ediciones: ISSHP, ISTP, AHCI, SSCI, SCI), Scopus, SciELO Chile.

Colaboración Institucional



Muestra la distribución de colaboración, tanto nacional como extranjera, generada en esta publicación.


Autores - Afiliación



Ord. Autor Género Institución - País
1 Garcia, Ricardo - Universidad de Chile - Chile
2 Mahul, Rodrigo - Universidad de Chile - Chile
3 Grágeda, Nicolás Hombre Universidad de Chile - Chile
4 Luzanto, Alejandro Hombre Universidad de Chile - Chile
5 Bohmer, Nicolas - Universidad de Chile - Chile
6 Busso, Carlos - Univ Texas Dallas - Estados Unidos
Erik Jonsson School of Engineering and Computer Science - Estados Unidos
7 Yoma, Nestor Becerra - Universidad de Chile - Chile
8 Int Speech Commun Assoc Corporación

Muestra la afiliación y género (detectado) para los co-autores de la publicación.

Financiamiento



Fuente
Fondo Nacional de Desarrollo Científico y Tecnológico
Agencia Nacional de Investigación y Desarrollo
ANID/FONDECYT (Chile)

Muestra la fuente de financiamiento declarada en la publicación.

Agradecimientos



Agradecimiento
This research was funded by ANID/FONDECYT (Chile) grant No. 1211946.
This research was funded by ANID/FONDECYT (Chile) grant No. 1211946.

Muestra la fuente de financiamiento declarada en la publicación.