Colección SciELO Chile

Departamento Gestión de Conocimiento, Monitoreo y Prospección
Consultas o comentarios: productividad@anid.cl
Búsqueda Publicación
Búsqueda por Tema Título, Abstract y Keywords



CALA: An unsupervised URL-based web page classification system
Indexado
WoS WOS:000331781300015
Scopus SCOPUS_ID:84894905611
DOI 10.1016/J.KNOSYS.2013.12.019
Año 2014
Tipo artículo de investigación

Citas Totales

Autores Afiliación Chile

Instituciones Chile

% Participación
Internacional

Autores
Afiliación Extranjera

Instituciones
Extranjeras


Abstract



Unsupervised web page classification refers to the problem of clustering the pages in a web site so that each cluster includes a set of web pages that can be classified using a unique class. The existing proposals to perform web page classification do not fulfill a number of requirements that would make them suitable for enterprise web information integration, namely: to be based on a lightweight crawling, so as to avoid interfering with the normal operation of the web site, to be unsupervised, which avoids the need for a training set of pre-classified pages, or to use features from outside the page to be classified, which avoids having to download it. In this article, we propose CALA, a new automated proposal to generate URL-based web page classifiers. Our proposal builds a number of URL patterns that represent the different classes of pages in a web site, so further pages can be classified by matching their URLs to the patterns. Its salient features are that it fulfills all of the previous requirements, and it has been validated by a number of experiments using real-world, top-visited web sites. Our validation proves that CALA is very effective and efficient in practice. (C) 2013 Elsevier B.V. All rights reserved.

Revista



Revista ISSN
Knowledge Based Systems 0950-7051

Métricas Externas



PlumX Altmetric Dimensions

Muestra métricas de impacto externas asociadas a la publicación. Para mayor detalle:

Disciplinas de Investigación



WOS
Computer Science, Artificial Intelligence
Scopus
Artificial Intelligence
Software
Management Information Systems
Information Systems And Management
SciELO
Sin Disciplinas

Muestra la distribución de disciplinas para esta publicación.

Publicaciones WoS (Ediciones: ISSHP, ISTP, AHCI, SSCI, SCI), Scopus, SciELO Chile.

Colaboración Institucional



Muestra la distribución de colaboración, tanto nacional como extranjera, generada en esta publicación.


Autores - Afiliación



Ord. Autor Género Institución - País
1 Hernandez, Inma Mujer Universidad Autónoma de Chile - Chile
2 Rivero, Carlos R. Hombre Univ Idaho - Estados Unidos
University of Idaho - Estados Unidos
3 Ruiz, David Hombre Universidad de Sevilla - España
University of Seville - España
Univ Seville - España
4 Corchuelo, Rafael Hombre Universidad de Sevilla - España
University of Seville - España
Univ Seville - España

Muestra la afiliación y género (detectado) para los co-autores de la publicación.

Financiamiento



Fuente
European Commission
European Regional Development Fund
European Commission (FEDER)
Spanish and the Andalusian RDI programmes

Muestra la fuente de financiamiento declarada en la publicación.

Agradecimientos



Agradecimiento
This work was supported by the European Commission (FEDER), the Spanish and the Andalusian R&D&I programmes (Grants TIN2007-64119, P07-TIC-2602, P08-TIC-4100, TIN2008-04718-E, TIN2010-21744, TIN2010-09809-E, TIN2010-10811-E, TIN2010-09988-E, and TIN2011-15497-E).
This work was supported by the European Commission (FEDER), the Spanish and the Andalusian R&D&I programmes (Grants TIN2007-64119 , P07-TIC-2602 , P08-TIC-4100 , TIN2008-04718-E , TIN2010-21744 , TIN2010-09809-E , TIN2010-10811-E , TIN2010-09988-E , and TIN2011-15497-E ).

Muestra la fuente de financiamiento declarada en la publicación.