Colección SciELO Chile

Departamento Gestión de Conocimiento, Monitoreo y Prospección
Consultas o comentarios: productividad@anid.cl
Búsqueda Publicación
Búsqueda por Tema Título, Abstract y Keywords



Automatic Speech Recognition for Indoor HRI Scenarios
Indexado
WoS WOS:000655276100001
Scopus SCOPUS_ID:85106711397
DOI 10.1145/3442629
Año 2021
Tipo artículo de investigación

Citas Totales

Autores Afiliación Chile

Instituciones Chile

% Participación
Internacional

Autores
Afiliación Extranjera

Instituciones
Extranjeras


Abstract



This article presents a stand-alone automatic speech recognition system that accounts for listener movement, time-varying reverberation effects, environmental noise, and user position information for beamforming approaches in an HRI setting. We raise the importance of replacing the classical black-box integration of automatic speech recognition technology in HRI applications with the incorporation of the acoustic environment representation and modeling, and of the target source direction. Test data were recorded on a real robot under various moving conditions. For addressing the time-varying acoustic channel problem and incorporating environmental effect during training, clean speech samples were passed through estimated static channel responses and noise was added. Beamforming is investigated regarding oracle source tracking using, for instance, image processing. The proposed strategy is interesting for the robotics community, because it allows the development of voice-based HRI with limited training data and without relying on third-party technologies or Internet access eliminating the need to upload data to the cloud. In our mobile HRI scenario, the resulting speech recognition engine provided an average word error rate that is at least 19% and 34% lower than publicly available speech recognition APIs with the playback (i.e., loudspeaker) and human testing modalities, respectively.

Revista



Revista ISSN
2573-9522

Métricas Externas



PlumX Altmetric Dimensions

Muestra métricas de impacto externas asociadas a la publicación. Para mayor detalle:

Disciplinas de Investigación



WOS
Sin Disciplinas
Scopus
Sin Disciplinas
SciELO
Sin Disciplinas

Muestra la distribución de disciplinas para esta publicación.

Publicaciones WoS (Ediciones: ISSHP, ISTP, AHCI, SSCI, SCI), Scopus, SciELO Chile.

Colaboración Institucional



Muestra la distribución de colaboración, tanto nacional como extranjera, generada en esta publicación.


Autores - Afiliación



Ord. Autor Género Institución - País
1 Novoa, José Hombre Universidad de Chile - Chile
2 MAHU-SINCLAIR, RODRIGO MANUEL Hombre Universidad de Chile - Chile
3 Sepulveda, Jorge Hombre Universidad de Chile - Chile
4 Pablo Escudero, Juan Hombre Universidad de Chile - Chile
4 Escudero, Juan Pablo Hombre Universidad de Chile - Chile
5 Fredes, Josue Hombre Universidad de Chile - Chile
6 Yoma, Nestor Becerra Hombre Universidad de Chile - Chile
6 Yoma, Néstor Becerra - Universidad de Chile - Chile

Muestra la afiliación y género (detectado) para los co-autores de la publicación.

Financiamiento



Fuente
Conicyt-Fondecyt
ONRG

Muestra la fuente de financiamiento declarada en la publicación.

Agradecimientos



Agradecimiento
The research reported here was funded by grants Conicyt-Fondecyt 1151306 and ONRG No 62909-17-1-2002.
The research reported here was funded by grants Conicyt-Fondecyt 1151306 and ONRG N°62909-17-1-2002. Authors’ addresses: J. Novoa, R. Mahu, J. Wuth, J. P. Escudero, J. Fredes, and N. Becerra Yoma, Av. Tupper 2007, Santiago, Chile, PC 8370451; emails: {jose.novoa, rmahu, jwuth, jescudero, jfredes, nbecerra}@ing.uchile.cl.

Muestra la fuente de financiamiento declarada en la publicación.