Colección SciELO Chile

Departamento Gestión de Conocimiento, Monitoreo y Prospección
Consultas o comentarios: productividad@anid.cl
Búsqueda Publicación
Búsqueda por Tema Título, Abstract y Keywords



Applying Machine Learning Sampling Techniques to Address Data Imbalance in a Chilean COVID-19 Symptoms and Comorbidities Dataset
Indexado
WoS WOS:001418396800001
Scopus SCOPUS_ID:85217774713
DOI 10.3390/APP15031132
Año 2025
Tipo artículo de investigación

Citas Totales

Autores Afiliación Chile

Instituciones Chile

% Participación
Internacional

Autores
Afiliación Extranjera

Instituciones
Extranjeras


Abstract



Reliably detecting COVID-19 is critical for diagnosis and disease control. However, imbalanced data in medical datasets pose significant challenges for machine learning models, leading to bias and poor generalization. The dataset obtained from the EPIVIGILA system and the Chilean Epidemiological Surveillance Process contains information on over 6,000,000 patients, but, like many current datasets, it suffers from class imbalance. To address this issue, we applied various machine learning algorithms, both with and without sampling methods, and compared them using different classification and diagnostic metrics such as precision, sensitivity, specificity, likelihood ratio positive, and diagnostic odds ratio. Our results showed that applying sampling methods to this dataset improved the metric values and contributed to models with better generalization. Effectively managing imbalanced data is crucial for reliable COVID-19 diagnosis. This study enhances the understanding of how machine learning techniques can improve diagnostic reliability and contribute to better patient outcomes.

Revista



Revista ISSN
Applied Sciences Basel 2076-3417

Métricas Externas



PlumX Altmetric Dimensions

Muestra métricas de impacto externas asociadas a la publicación. Para mayor detalle:

Disciplinas de Investigación



WOS
Chemistry, Multidisciplinary
Engineering, Multidisciplinary
Physics, Applied
Materials Science, Multidisciplinary
Scopus
Sin Disciplinas
SciELO
Sin Disciplinas

Muestra la distribución de disciplinas para esta publicación.

Publicaciones WoS (Ediciones: ISSHP, ISTP, AHCI, SSCI, SCI), Scopus, SciELO Chile.

Colaboración Institucional



Muestra la distribución de colaboración, tanto nacional como extranjera, generada en esta publicación.


Autores - Afiliación



Ord. Autor Género Institución - País
1 Ormeno-Arriagada, Pablo - Universidad de Viña del Mar - Chile
2 Marquez, Gaston - Universidad del Bío Bío - Chile
3 Araya, David - Universidad Nacional Andrés Bello - Chile
4 Rimassa, Carla - Universidad de Valparaíso - Chile
5 Taramasco, Carla - Universidad Nacional Andrés Bello - Chile

Muestra la afiliación y género (detectado) para los co-autores de la publicación.

Financiamiento



Fuente
Fondo Nacional de Desarrollo Científico y Tecnológico
Agencia Nacional de Investigación y Desarrollo
Agencia Nacional de Investigacion
Millennium Science Initiative Program—Millennium Nucleus on Sociomedicine
ANID-the Millennium Science Initiative Program-Millennium Nucleus on Sociomedicine

Muestra la fuente de financiamiento declarada en la publicación.

Agradecimientos



Agradecimiento
This work was funded by ANID-the Millennium Science Initiative Program-Millennium Nucleus on Sociomedicine (NCS2021_013).
We acknowledge the COVID0739 project and the FONDECYT Regular 1201787 project, titled \u201CMultimodal Machine Learning approach for detecting pathological activity patterns in elderlies\u201D financed by the Agencia Nacional de Investigaci\u00F3n (ANID).
We acknowledge the COVID0739 project and the FONDECYT Regular 1201787 project, titled \u201CMultimodal Machine Learning approach for detecting pathological activity patterns in elderlies\u201D financed by the Agencia Nacional de Investigaci\u00F3n (ANID).

Muestra la fuente de financiamiento declarada en la publicación.