Colección SciELO Chile

Departamento Gestión de Conocimiento, Monitoreo y Prospección
Consultas o comentarios: productividad@anid.cl
Búsqueda Publicación
Búsqueda por Tema Título, Abstract y Keywords



Using Linked Data to Mine RDF from Wikipedia's Tables
Indexado
WoS WOS:000485476600054
Scopus SCOPUS_ID:84906875576
DOI 10.1145/2556195.2556266
Año 2014
Tipo proceedings paper

Citas Totales

Autores Afiliación Chile

Instituciones Chile

% Participación
Internacional

Autores
Afiliación Extranjera

Instituciones
Extranjeras


Abstract



The tables embedded in Wikipedia articles contain rich, semi-structured encyclopaedic content. However, the cumulative content of these tables cannot be queried against. We thus propose methods to recover the semantics of Wikipedia tables and, in particular, to extract facts from them in the form of RDF triples. Our core method uses an existing Linked Data knowledge-base to find pre-existing relations between entities in Wikipedia tables, suggesting the same relations as holding for other entities in analogous columns on different rows. We find that such an approach extracts RDF triples from Wikipedia's tables at a raw precision of 40%. To improve the raw precision, we de fi ne a set of features for extracted triples that are tracked during the extraction phase. Using a manually labelled gold standard, we then test a variety of machine learning methods for classifying correct/incorrect triples. One such method extracts 7.9 million unique and novel RDF triples from over one million Wikipedia tables at an estimated precision of 81.5%.

Métricas Externas



PlumX Altmetric Dimensions

Muestra métricas de impacto externas asociadas a la publicación. Para mayor detalle:

Disciplinas de Investigación



WOS
Sin Disciplinas
Scopus
Sin Disciplinas
SciELO
Sin Disciplinas

Muestra la distribución de disciplinas para esta publicación.

Publicaciones WoS (Ediciones: ISSHP, ISTP, AHCI, SSCI, SCI), Scopus, SciELO Chile.

Colaboración Institucional



Muestra la distribución de colaboración, tanto nacional como extranjera, generada en esta publicación.


Autores - Afiliación



Ord. Autor Género Institución - País
1 Munoz, Emir Hombre Fujitsu Ireland Ltd - Irlanda
Fujitsu Ireland Limited - Irlanda
2 Hogan, Aidan Hombre Universidad de Chile - Chile
3 Mileo, Alessandra Mujer NUI Galway - Irlanda
National University of Ireland Galway - Irlanda
University of Galway - Irlanda
4 Assoc Comp Machinery Corporación

Muestra la afiliación y género (detectado) para los co-autores de la publicación.

Origen de Citas Identificadas



Muestra la distribución de países cuyos autores citan a la publicación consultada.

Citas identificadas: Las citas provienen de documentos incluidos en la base de datos de DATACIENCIA

Citas Identificadas: 2.5 %
Citas No-identificadas: 97.5 %

Muestra la distribución de instituciones nacionales o extranjeras cuyos autores citan a la publicación consultada.

Citas identificadas: Las citas provienen de documentos incluidos en la base de datos de DATACIENCIA

Citas Identificadas: 2.5 %
Citas No-identificadas: 97.5 %

Financiamiento



Fuente
Science Foundation Ireland
Science Foundation Ireland (SFI)
Millennium Nucleus Center for Semantic Web Research
Fujitsu (Ireland) Ltd.

Muestra la fuente de financiamiento declarada en la publicación.

Agradecimientos



Agradecimiento
This work was supported in part by Fujitsu (Ireland) Ltd., by the Millennium Nucleus Center for Semantic Web Research under Grant NC120004, and by Science Foundation Ireland (SFI) under Grant Number SFI/12/RC/2289.

Muestra la fuente de financiamiento declarada en la publicación.