Pour donner une idée concise du contenu d’un graphe de connaissances, il est classique de montrer les classes et les propriétés qui y sont instanciées. Pourtant, d’autres éléments informent sur ce contenu au moins autant que les classes et les propriétés : les termes de vocabulaires contrôlés, des mots associés à des concepts définis au sein de thésaurus. À partir de 23 points d’accès SPARQL, nous présentons différentes techniques pour retrouver automatiquement des termes qui ne sont pas des noms de classes. Les résultats obtenus par chaque technique nous permettent de proposer une méthodologie pour trouver les termes présents dans un graphe de connaissances. Les résultats des expérimentations et les requêtes support de la méthodologie sont accessibles en ligne.
To give a quick idea of a knowledge graph content, it is usual to show the classes and properties it instantiates. However, controlled vocabulary’s terms, i.e. words associated with concepts defined in thesauri, can also inform about its content, as much as the class names. Based on 23 SPARQL Endpoints, we present different techniques for automatically retrieving terms that are not class names. The results obtained by each technique enable us to propose a methodology for finding terms present in a knowledge graph. Experimental results and queries supporting the methodology are available online.
Keywords: CIDOC CRM, knowledge graph, ontology, SPARQL, term, terminology, thesaurus.
Manon Ovide 1 ; Béatrice Markhoff 2 ; Arnaud Soulet 1
CC-BY 4.0
@article{ROIA_2025__6_1-2_131_0,
author = {Manon Ovide and B\'eatrice Markhoff and Arnaud Soulet},
title = {De l{\textquoteright}importance des termes dans les graphes de connaissances et comment les trouver},
journal = {Revue Ouverte d'Intelligence Artificielle},
pages = {131--155},
year = {2025},
publisher = {Association pour la diffusion de la recherche francophone en intelligence artificielle},
volume = {6},
number = {1-2},
doi = {10.5802/roia.96},
language = {fr},
url = {https://roia.centre-mersenne.org/articles/10.5802/roia.96/}
}
TY - JOUR AU - Manon Ovide AU - Béatrice Markhoff AU - Arnaud Soulet TI - De l’importance des termes dans les graphes de connaissances et comment les trouver JO - Revue Ouverte d'Intelligence Artificielle PY - 2025 SP - 131 EP - 155 VL - 6 IS - 1-2 PB - Association pour la diffusion de la recherche francophone en intelligence artificielle UR - https://roia.centre-mersenne.org/articles/10.5802/roia.96/ DO - 10.5802/roia.96 LA - fr ID - ROIA_2025__6_1-2_131_0 ER -
%0 Journal Article %A Manon Ovide %A Béatrice Markhoff %A Arnaud Soulet %T De l’importance des termes dans les graphes de connaissances et comment les trouver %J Revue Ouverte d'Intelligence Artificielle %D 2025 %P 131-155 %V 6 %N 1-2 %I Association pour la diffusion de la recherche francophone en intelligence artificielle %U https://roia.centre-mersenne.org/articles/10.5802/roia.96/ %R 10.5802/roia.96 %G fr %F ROIA_2025__6_1-2_131_0
Manon Ovide; Béatrice Markhoff; Arnaud Soulet. De l’importance des termes dans les graphes de connaissances et comment les trouver. Revue Ouverte d'Intelligence Artificielle, Post-actes de la conférence Ingénierie des Connaissances (IC 2021-2022-2023), Volume 6 (2025) no. 1-2, pp. 131-155. doi: 10.5802/roia.96
[1] État de l’art : Extraction d’information à partir de thésaurus pour générer une ontologie, INFORSID (2013), pp. 29-44 hal-01135098
[2] Definition of the CIDOC Conceptual Reference Model. Last official version : 7.1.1 (2021) (Technical report) | DOI
[3] The Web Data Commons Schema.org Data Set Series, Companion Proceedings of the ACM Web Conference 2023 (WWW ’23 Companion), Association for Computing Machinery (2023), p. 136–139 | DOI
[4] The Water Health Open Knowledge Graph (2023) (https://arxiv.org/abs/2305.11051)
[5] Summarizing Semantic Graphs : A Survey, The VLDB Journal, Volume 28 (2018), pp. 295-327 | DOI
[6] Schema.org : How is it used ?, ISWC 2023, CEUR Workshop Proceedings (CEUR Workshop Proceedings), Volume 3632, CEUR-WS.org (2023) hal-04250523
[7] TTProfiler : Computing Types and Terms Profiles of Assertional Knowledge Graphs, Proceedings of the Semantic Web and Ontology Design for Cultural Heritage workshop co-located with (BOSK 2021) (CEUR Workshop Proceedings), Volume 2949, CEUR-WS.org (2021) http://ceur-ws.org/vol-2949/paper4.pdf
[8] TTProfiler : Types and Terms Profile Building for Online Cultural Heritage Knowledge Graphs, Journal of Computing and Cultural Heritage, Volume 16 (2023) no. 3, pp. 1-22 | DOI
[9] Data on the Web Best Practices (W3C Recommendation 31 January 2017) : Best Practice 15, https://www.w3.org/TR/dwbp/, 2017 (Accessed on 2022-28-02)
[10] Le Thésaurus PACTOLS, https://www.frantiq.fr/pactols/le-thesaurus/, 2020 (Accessed on 2022-28-02)
[11] FAIR Linked Data – Towards a Linked Data Backbone for Users and Machines, Companion Proceedings of the Web Conference 2021 (WWW ’21), Association for Computing Machinery (2021), p. 431–435 | DOI
[12] Le Web sémantique, Dunod, 2012
[13] RDF graph summarization for first-sight structure discovery, VLDB J., Volume 29 (2020) no. 5, pp. 1191-1218 | DOI
[14] Schema.org : evolution of structured data on the web, Communications of the ACM, Volume 59 (2016) no. 2, pp. 44-51 | DOI
[15] Knowledge Graphs, ACM Comput. Surv., Volume 54 (2021) no. 4, 71, 37 pages | DOI
[16] A content-focused method for re-engineering thesauri into semantically adequate ontologies using OWL, Semantic Web, Volume 7 (2016) no. 5, pp. 543-576 | DOI
[17] Thesaurus and ontology structure : Formal and pragmatic differences and similarities, Journal of the Association for information science and technology, Volume 66 (2015) no. 7, pp. 1348-1366 | DOI
[18] Heterotoki : non-structured and heterogeneous terminology alignment for Digital Humanities data producers, Workshop on Open Data and Ontologies for Cultural Heritage co-located with CAiSE, ODOCHCAiSE 2019 (CEUR Workshop Proceedings), Volume 2375, CEUR-WS.org (2019), pp. 37-48 http://ceur-ws.org/vol-2375/paper4.pdf
[19] Universaux (GP), dans Maxime Kristanek (Dir.), l’Encyclopédie philosophique, https://encyclo-philo.fr/universaux-gp, 2019 (Consulté le 15/03/2022)
[20] Où sont les termes ?, Ingénierie des Connaissances IC 2022 (2022)
[21] Thésaurus et interopérabilité des données archéologiques : le projet HyperThesau, Humanités numériques, Volume 4 (2021) http://journals.openedition.org/revuehn/2384
[22] Rencontre entre une philologue et un terminologue au pays des ontologies, Revue Ouverte d’Intelligence Artificielle, Volume 1 (2020) no. 1, pp. 43-70 | DOI
[23] VOYAGE : A Large Collection of Vocabulary Usage in Open RDF Datasets, The Semantic Web – ISWC 2023, Springer Nature Switzerland (2023), pp. 211-229 | DOI
[24] ABSTAT : Ontology-Driven Linked Data Summaries with Pattern Minimalization, The Semantic Web - ESWC 2016 Satellite Events, Revised Selected Papers, Springer (2016), pp. 381-395
[25] Integrating the Wikidata Taxonomy into YAGO (2023) (https://arxiv.org/abs/2308.11884)
[26] Wikidata : The Making Of, Companion Proceedings of the ACM Web Conference 2023 (WWW ’23 Companion), Association for Computing Machinery (2023), pp. 615-624 | DOI
[27] The FAIR Guiding Principles for scientific data management and stewardship, Scientific Data, Volume 3 (2016) no. 1, 160018 https://www.nature.com/articles/sdata201618 (Accessed 2024-09-26) | DOI
Cité par Sources :