Colección SciELO Chile

Departamento Gestión de Conocimiento, Monitoreo y Prospección
Consultas o comentarios: productividad@anid.cl
Búsqueda Publicación
Búsqueda por Tema Título, Abstract y Keywords



Constant Delay Algorithms for Regular Document Spanners
Indexado
WoS WOS:000455483100013
Scopus SCOPUS_ID:85048022489
DOI 10.1145/3196959.3196987
Año 2018
Tipo proceedings paper

Citas Totales

Autores Afiliación Chile

Instituciones Chile

% Participación
Internacional

Autores
Afiliación Extranjera

Instituciones
Extranjeras


Abstract



Regular expressions and automata models with capture variables are core tools in rule-based information extraction. These formalisms, also called regular document spanners, use regular languages in order to locate the data that a user wants to extract from a text document, and then store this data into variables. Since document spanners can easily generate large outputs, it is important to have good evaluation algorithms that can generate the extracted data in a quick succession, and with relatively little precomputation time. Towards this goal, we present a practical evaluation algorithm that allows constant delay enumeration of a spanner's output after a precomputation phase that is linear in the document. While the algorithm assumes that the spanner is specified in a syntactic variant of variable set automata, we also study how it can be applied when the spanner is specified by general variable set automata, regex formulas, or spanner algebras. Finally, we study the related problem of counting the number of outputs of a document spanner, providing a fine grained analysis of the classes of document spanners that support efficient enumeration of their results.

Métricas Externas



PlumX Altmetric Dimensions

Muestra métricas de impacto externas asociadas a la publicación. Para mayor detalle:

Disciplinas de Investigación



WOS
Sin Disciplinas
Scopus
Sin Disciplinas
SciELO
Sin Disciplinas

Muestra la distribución de disciplinas para esta publicación.

Publicaciones WoS (Ediciones: ISSHP, ISTP, AHCI, SSCI, SCI), Scopus, SciELO Chile.

Colaboración Institucional



Muestra la distribución de colaboración, tanto nacional como extranjera, generada en esta publicación.


Autores - Afiliación



Ord. Autor Género Institución - País
1 Florenzano, Fernando Hombre Pontificia Universidad Católica de Chile - Chile
2 Riveros, Cristian Hombre Pontificia Universidad Católica de Chile - Chile
3 Ugarte, Martin Hombre Univ Libre Bruxelles - Bélgica
Université libre de Bruxelles (ULB) - Bélgica
Université libre de Bruxelles - Bélgica
4 Vansummeren, Stijn Hombre Univ Libre Bruxelles - Bélgica
Université libre de Bruxelles (ULB) - Bélgica
Université libre de Bruxelles - Bélgica
5 Vrgoc, Domagoj Hombre Pontificia Universidad Católica de Chile - Chile
6 Arenas, M -
7 Ugarte, Martin Hombre Univ Libre Bruxelles - Bélgica
Université libre de Bruxelles (ULB) - Bélgica
Université libre de Bruxelles - Bélgica
8 VanDenBussche, J -

Muestra la afiliación y género (detectado) para los co-autores de la publicación.

Financiamiento



Fuente
FONDECYT
Fondo Nacional de Desarrollo Científico y Tecnológico
Westmead Millennium Institute for Medical Research
FONDE-CYT
Innoviris, the Brussels Institute for Research and Innovation (project SPICES)
Nucleus Millennium Center for Semantic Web Research
Innoviris

Muestra la fuente de financiamiento declarada en la publicación.

Agradecimientos



Agradecimiento
Florenzano, Riveros and Vrgoc were partially supported by Nucleus Millennium Center for Semantic Web Research grant NC12004. Vrgoc was also supported by the FONDECYT project nr. 11160383, and Riveros by the FONDECYT project nr. 11150653. Ugarte acknowledges support from Innoviris, the Brussels Institute for Research and Innovation (project SPICES).
Acknowledgements. Florenzano, Riveros and Vrgoč were partially supported by Nucleus Millennium Center for Semantic Web Research grant NC12004. Vrgoč was also supported by the FONDE-CYT project nr. 11160383, and Riveros by the FONDECYT project nr. 11150653. Ugarte acknowledges support from Innoviris, the Brussels Institute for Research and Innovation (project SPICES).

Muestra la fuente de financiamiento declarada en la publicación.