Colección SciELO Chile

Departamento Gestión de Conocimiento, Monitoreo y Prospección
Consultas o comentarios: productividad@anid.cl
Búsqueda Publicación
Búsqueda por Tema Título, Abstract y Keywords



Distant speech emotion recognition in an indoor human-robot interaction scenario
Indexado
WoS WOS:001186650303163
Scopus SCOPUS_ID:85171587744
DOI 10.21437/INTERSPEECH.2023-1169
Año 2023
Tipo proceedings paper

Citas Totales

Autores Afiliación Chile

Instituciones Chile

% Participación
Internacional

Autores
Afiliación Extranjera

Instituciones
Extranjeras


Abstract



Social robotics and human-robot partnership are becoming very relevant topics defining many challenges for state-of-the-art speech technology. This paper presents the first evaluation of speech emotion recognition (SER) technology with non-acted speech data recorded in a real indoor human-robot interaction (HRI) scenario. The challenge is typified by distant speech processing, reverberation, and additive external and robot engine noise. We train and evaluate a machine learning-based based on simulated acoustic modelling that includes room impulse responses (RIRs), external noise, and beamforming response. We observe increased performance in the prediction of arousal, valence, and dominance with the proposed training procedure combined with delay-and-sum and minimum variance distortionless response (MVDR), with gain as high as 180%, compared with the result obtained with the model trained with the original data in controlled environments. Moreover, the degradation achieved when compared with the original matched training/testing condition is just 39%.

Métricas Externas



PlumX Altmetric Dimensions

Muestra métricas de impacto externas asociadas a la publicación. Para mayor detalle:

Disciplinas de Investigación



WOS
Sin Disciplinas
Scopus
Sin Disciplinas
SciELO
Sin Disciplinas

Muestra la distribución de disciplinas para esta publicación.

Publicaciones WoS (Ediciones: ISSHP, ISTP, AHCI, SSCI, SCI), Scopus, SciELO Chile.

Colaboración Institucional



Muestra la distribución de colaboración, tanto nacional como extranjera, generada en esta publicación.


Autores - Afiliación



Ord. Autor Género Institución - País
1 Grágeda, Nicolás Hombre Universidad de Chile - Chile
2 Busso, Carlos Hombre The University of Texas at Dallas - Estados Unidos
Univ Texas Dallas - Estados Unidos
3 Alvarado, Eduardo Hombre Universidad de Chile - Chile
4 MAHU-SINCLAIR, RODRIGO MANUEL Hombre Universidad de Chile - Chile
5 Yoma, Nestor Becerra Hombre Universidad de Chile - Chile
6 Int Speech Commun Assoc Corporación

Muestra la afiliación y género (detectado) para los co-autores de la publicación.

Financiamiento



Fuente
Fondo Nacional de Desarrollo Científico y Tecnológico
Agencia Nacional de Investigación y Desarrollo
ANID/FONDECYT (Chile)

Muestra la fuente de financiamiento declarada en la publicación.

Agradecimientos



Agradecimiento
This research was funded by ANID/FONDECYT (Chile) grant No. 1211946. The last co-author is part of the Esperanto project.
This research was funded by ANID/FONDECYT (Chile) grant No. 1211946. The last co-author is part of the Esperanto project.

Muestra la fuente de financiamiento declarada en la publicación.