Colección SciELO Chile

Departamento Gestión de Conocimiento, Monitoreo y Prospección
Consultas o comentarios: productividad@anid.cl
Búsqueda Publicación
Búsqueda por Tema Título, Abstract y Keywords



Document Spanners for Extracting Incomplete Information: Expressiveness and Complexity
Indexado
WoS WOS:000455483100010
DOI 10.1145/3196959.3196968
Año 2018
Tipo proceedings paper

Citas Totales

Autores Afiliación Chile

Instituciones Chile

% Participación
Internacional

Autores
Afiliación Extranjera

Instituciones
Extranjeras


Abstract



Rule-based information extraction has lately received a fair amount of attention from the database community, with several languages appearing in the last few years. Although information extraction systems are intended to deal with semistructured data, all language proposals introduced so far are designed to output relations, thus making them incapable of handling incomplete information. To remedy the situation, we propose to extend information extraction languages with the ability to use mappings, thus allowing us to work with documents which have missing or optional parts. Using this approach, we simplify the semantics of regex formulas and extraction rules, two previously defined methods for extracting information. We extend them with the ability to handle incomplete data, and study how they compare in terms of expressive power. We also study computational properties of these languages, focusing on the query enumeration problem, as well as satisfiability and containment.

Métricas Externas



PlumX Altmetric Dimensions

Muestra métricas de impacto externas asociadas a la publicación. Para mayor detalle:

Disciplinas de Investigación



WOS
Sin Disciplinas
Scopus
Sin Disciplinas
SciELO
Sin Disciplinas

Muestra la distribución de disciplinas para esta publicación.

Publicaciones WoS (Ediciones: ISSHP, ISTP, AHCI, SSCI, SCI), Scopus, SciELO Chile.

Colaboración Institucional



Muestra la distribución de colaboración, tanto nacional como extranjera, generada en esta publicación.


Autores - Afiliación



Ord. Autor Género Institución - País
1 Maturana, Francisco Hombre Carnegie Mellon Univ - Estados Unidos
2 Riveros, Cristian Hombre Pontificia Universidad Católica de Chile - Chile
3 Vrgoc, Domagoj Hombre Pontificia Universidad Católica de Chile - Chile
4 Arenas, M -
5 Ugarte, M -
6 VanDenBussche, J -

Muestra la afiliación y género (detectado) para los co-autores de la publicación.

Origen de Citas Identificadas



Muestra la distribución de países cuyos autores citan a la publicación consultada.

Citas identificadas: Las citas provienen de documentos incluidos en la base de datos de DATACIENCIA

Citas Identificadas: 4.76 %
Citas No-identificadas: 95.24 %

Muestra la distribución de instituciones nacionales o extranjeras cuyos autores citan a la publicación consultada.

Citas identificadas: Las citas provienen de documentos incluidos en la base de datos de DATACIENCIA

Citas Identificadas: 4.76 %
Citas No-identificadas: 95.24 %

Financiamiento



Fuente
FONDECYT
Nucleus Millennium Center for Semantic Web Research
Nucleus Millennium Center for Semantic Web Research

Muestra la fuente de financiamiento declarada en la publicación.

Agradecimientos



Agradecimiento
The authors would like to thank Juan L. Reutter for many helpful comments during the preparation of this paper. The authors were supported by the Nucleus Millennium Center for Semantic Web Research grant NC120004. Vrgoc was also supported by FONDECYT project nr. 11160383, and Riveros by FONDECYT project nr. 11150653.

Muestra la fuente de financiamiento declarada en la publicación.