De l’importance des termes dans les graphes de connaissances et comment les trouver
Revue Ouverte d'Intelligence Artificielle, Post-actes de la conférence Ingénierie des Connaissances (IC 2021-2022-2023), Volume 6 (2025) no. 1-2, pp. 131-155

Pour donner une idée concise du contenu d’un graphe de connaissances, il est classique de montrer les classes et les propriétés qui y sont instanciées. Pourtant, d’autres éléments informent sur ce contenu au moins autant que les classes et les propriétés  : les termes de vocabulaires contrôlés, des mots associés à des concepts définis au sein de thésaurus. À partir de 23 points d’accès SPARQL, nous présentons différentes techniques pour retrouver automatiquement des termes qui ne sont pas des noms de classes. Les résultats obtenus par chaque technique nous permettent de proposer une méthodologie pour trouver les termes présents dans un graphe de connaissances. Les résultats des expérimentations et les requêtes support de la méthodologie sont accessibles en ligne.

To give a quick idea of a knowledge graph content, it is usual to show the classes and properties it instantiates. However, controlled vocabulary’s terms, i.e. words associated with concepts defined in thesauri, can also inform about its content, as much as the class names. Based on 23 SPARQL Endpoints, we present different techniques for automatically retrieving terms that are not class names. The results obtained by each technique enable us to propose a methodology for finding terms present in a knowledge graph. Experimental results and queries supporting the methodology are available online.

Publié le :
DOI : 10.5802/roia.96
Mots-clés : CIDOC CRM, graphe de connaissances, ontologie, SPARQL, terme, terminologie, thésaurus.
Keywords: CIDOC CRM, knowledge graph, ontology, SPARQL, term, terminology, thesaurus.

Manon Ovide 1 ; Béatrice Markhoff 2 ; Arnaud Soulet 1

1 Université de Tours, UR 6300 LIFAT (France)
2 Université de Tours, UMR 7324 CITERES – LAT (France)
Licence : CC-BY 4.0
Droits d'auteur : Les auteurs conservent leurs droits
@article{ROIA_2025__6_1-2_131_0,
     author = {Manon Ovide and B\'eatrice Markhoff and Arnaud Soulet},
     title = {De l{\textquoteright}importance des termes dans les graphes de connaissances et comment les trouver},
     journal = {Revue Ouverte d'Intelligence Artificielle},
     pages = {131--155},
     year = {2025},
     publisher = {Association pour la diffusion de la recherche francophone en intelligence artificielle},
     volume = {6},
     number = {1-2},
     doi = {10.5802/roia.96},
     language = {fr},
     url = {https://roia.centre-mersenne.org/articles/10.5802/roia.96/}
}
TY  - JOUR
AU  - Manon Ovide
AU  - Béatrice Markhoff
AU  - Arnaud Soulet
TI  - De l’importance des termes dans les graphes de connaissances et comment les trouver
JO  - Revue Ouverte d'Intelligence Artificielle
PY  - 2025
SP  - 131
EP  - 155
VL  - 6
IS  - 1-2
PB  - Association pour la diffusion de la recherche francophone en intelligence artificielle
UR  - https://roia.centre-mersenne.org/articles/10.5802/roia.96/
DO  - 10.5802/roia.96
LA  - fr
ID  - ROIA_2025__6_1-2_131_0
ER  - 
%0 Journal Article
%A Manon Ovide
%A Béatrice Markhoff
%A Arnaud Soulet
%T De l’importance des termes dans les graphes de connaissances et comment les trouver
%J Revue Ouverte d'Intelligence Artificielle
%D 2025
%P 131-155
%V 6
%N 1-2
%I Association pour la diffusion de la recherche francophone en intelligence artificielle
%U https://roia.centre-mersenne.org/articles/10.5802/roia.96/
%R 10.5802/roia.96
%G fr
%F ROIA_2025__6_1-2_131_0
Manon Ovide; Béatrice Markhoff; Arnaud Soulet. De l’importance des termes dans les graphes de connaissances et comment les trouver. Revue Ouverte d'Intelligence Artificielle, Post-actes de la conférence Ingénierie des Connaissances (IC 2021-2022-2023), Volume 6 (2025) no. 1-2, pp. 131-155. doi: 10.5802/roia.96

[1] Fabien Amarger; Catherine Roussey; Jean-Pierre Chanet; Olivier Haemmerlé; Nathalie Hernandez État de l’art : Extraction d’information à partir de thésaurus pour générer une ontologie, INFORSID (2013), pp. 29-44 hal-01135098

[2] Chryssoula Bekiari; George Bruseker; Martin Doerr; Christian-Emil Ore; Stephen Stead; Athanasios Velios Definition of the CIDOC Conceptual Reference Model. Last official version : 7.1.1 (2021) (Technical report) | DOI

[3] Alexander Brinkmann; Anna Primpeli; Christian Bizer The Web Data Commons Schema.org Data Set Series, Companion Proceedings of the ACM Web Conference 2023 (WWW ’23 Companion), Association for Computing Machinery (2023), p. 136–139 | DOI

[4] Gianluca Carletti; Elio Giulianelli; Anna Sofia Lippolis; Giorgia Lodi; Andrea Giovanni Nuzzolese; Marco Picone; Giulio Settanta The Water Health Open Knowledge Graph (2023) (https://arxiv.org/abs/2305.11051)

[5] S. Cebiric; F. Goasdoue; H. Kondylakis; D. Kotzinos; I. Manolescu; G. Troullinou; M. Zneika Summarizing Semantic Graphs : A Survey, The VLDB Journal, Volume 28 (2018), pp. 295-327 | DOI

[6] Minh-Hoang Dang; Alban Gaignard; Hala Skaf-Molli; Molli Pascal Schema.org : How is it used ?, ISWC 2023, CEUR Workshop Proceedings (CEUR Workshop Proceedings), Volume 3632, CEUR-WS.org (2023) hal-04250523

[7] Lamine Diop; Arnaud Giacometti; Béatrice Markhoff; Arnaud Soulet TTProfiler : Computing Types and Terms Profiles of Assertional Knowledge Graphs, Proceedings of the Semantic Web and Ontology Design for Cultural Heritage workshop co-located with (BOSK 2021) (CEUR Workshop Proceedings), Volume 2949, CEUR-WS.org (2021) http://ceur-ws.org/vol-2949/paper4.pdf

[8] Lamine Diop; Béatrice Markhoff; Arnaud Soulet TTProfiler : Types and Terms Profile Building for Online Cultural Heritage Knowledge Graphs, Journal of Computing and Cultural Heritage, Volume 16 (2023) no. 3, pp. 1-22 | DOI

[9] Bernadette Farias Lóscio; Caroline Burle; Newton Calegari Data on the Web Best Practices (W3C Recommendation 31 January 2017) : Best Practice 15, https://www.w3.org/TR/dwbp/, 2017 (Accessed on 2022-28-02)

[10] FRANTIQ Le Thésaurus PACTOLS, https://www.frantiq.fr/pactols/le-thesaurus/, 2020 (Accessed on 2022-28-02)

[11] Johannes Frey; Sebastian Hellman FAIR Linked Data – Towards a Linked Data Backbone for Users and Machines, Companion Proceedings of the Web Conference 2021 (WWW ’21), Association for Computing Machinery (2021), p. 431–435 | DOI

[12] Fabien Gandon; Catherine Faron-Zucker; Olivier Corby Le Web sémantique, Dunod, 2012

[13] François Goasdoué; Pawel Guzewicz; Ioana Manolescu RDF graph summarization for first-sight structure discovery, VLDB J., Volume 29 (2020) no. 5, pp. 1191-1218 | DOI

[14] Ramanathan V Guha; Dan Brickley; Steve Macbeth Schema.org : evolution of structured data on the web, Communications of the ACM, Volume 59 (2016) no. 2, pp. 44-51 | DOI

[15] Aidan Hogan; Eva Blomqvist; Michael Cochez; Claudia d’Amato; Gerard de Melo; Claudio Gutiérrez; Sabrina Kirrane; José Emilio Labra Gayo; Roberto Navigli; Sebastian Neumaier; Axel-Cyrille Ngonga Ngomo; Axel Polleres; Sabbir M. Rashid; Anisa Rula; Lukas Schmelzeisen; Juan F. Sequeda; Steffen Staab; Antoine Zimmermann Knowledge Graphs, ACM Comput. Surv., Volume 54 (2021) no. 4, 71, 37 pages | DOI

[16] D. Kless; L. Jansen; S. Milton A content-focused method for re-engineering thesauri into semantically adequate ontologies using OWL, Semantic Web, Volume 7 (2016) no. 5, pp. 543-576 | DOI

[17] D. Kless; S. Milton; E. Kazmierczak; J. Lindenthal Thesaurus and ontology structure : Formal and pragmatic differences and similarities, Journal of the Association for information science and technology, Volume 66 (2015) no. 7, pp. 1348-1366 | DOI

[18] Marion Lamé; Perrine Pittet; Federico Ponchio; Béatrice Markhoff; Emilio M. Sanfilippo Heterotoki : non-structured and heterogeneous terminology alignment for Digital Humanities data producers, Workshop on Open Data and Ontologies for Cultural Heritage co-located with CAiSE, ODOCHCAiSE 2019 (CEUR Workshop Proceedings), Volume 2375, CEUR-WS.org (2019), pp. 37-48 http://ceur-ws.org/vol-2375/paper4.pdf

[19] Bruno Langlet Universaux (GP), dans Maxime Kristanek (Dir.), l’Encyclopédie philosophique, https://encyclo-philo.fr/universaux-gp, 2019 (Consulté le 15/03/2022)

[20] Béatrice Markhoff; Arnaud Soulet Où sont les termes ?, Ingénierie des Connaissances IC 2022 (2022)

[21] Emmanuelle Perrin Thésaurus et interopérabilité des données archéologiques : le projet HyperThesau, Humanités numériques, Volume 4 (2021) http://journals.openedition.org/revuehn/2384

[22] Christophe Roche; Maria Papadopoulou Rencontre entre une philologue et un terminologue au pays des ontologies, Revue Ouverte d’Intelligence Artificielle, Volume 1 (2020) no. 1, pp. 43-70 | DOI

[23] Qing Shi; Junrui Wang; Jeff Z. Pan; Gong Cheng VOYAGE : A Large Collection of Vocabulary Usage in Open RDF Datasets, The Semantic Web – ISWC 2023, Springer Nature Switzerland (2023), pp. 211-229 | DOI

[24] Blerina Spahiu; Riccardo Porrini; Matteo Palmonari; Anisa Rula; Andrea Maurino ABSTAT : Ontology-Driven Linked Data Summaries with Pattern Minimalization, The Semantic Web - ESWC 2016 Satellite Events, Revised Selected Papers, Springer (2016), pp. 381-395

[25] Fabian Suchanek; Mehwish Alam; Thomas Bonald; Pierre-Henri Paris; Jules Soria Integrating the Wikidata Taxonomy into YAGO (2023) (https://arxiv.org/abs/2308.11884)

[26] Denny Vrandečić; Lydia Pintscher; Markus Krötzsch Wikidata : The Making Of, Companion Proceedings of the ACM Web Conference 2023 (WWW ’23 Companion), Association for Computing Machinery (2023), pp. 615-624 | DOI

[27] Mark D. Wilkinson; Michel Dumontier; IJsbrand Jan Aalbersberg; Gabrielle Appleton; Myles Axton; Arie Baak; Niklas Blomberg; Jan-Willem Boiten; Luiz Bonino da Silva Santos; Philip E. Bourne; Jildau Bouwman; Anthony J. Brookes; Tim Clark; Mercè Crosas; Ingrid Dillo; Olivier Dumon; Scott Edmunds; Chris T. Evelo; Richard Finkers; Alejandra Gonzalez-Beltran; Alasdair J. G. Gray; Paul Groth; Carole Goble; Jeffrey S. Grethe; Jaap Heringa; Peter A. C. ’t Hoen; Rob Hooft; Tobias Kuhn; Ruben Kok; Joost Kok; Scott J. Lusher; Maryann E. Martone; Albert Mons; Abel L. Packer; Bengt Persson; Philippe Rocca-Serra; Marco Roos; Rene van Schaik; Susanna-Assunta Sansone; Erik Schultes; Thierry Sengstag; Ted Slater; George Strawn; Morris A. Swertz; Mark Thompson; Johan van der Lei; Erik van Mulligen; Jan Velterop; Andra Waagmeester; Peter Wittenburg; Katherine Wolstencroft; Jun Zhao; Barend Mons The FAIR Guiding Principles for scientific data management and stewardship, Scientific Data, Volume 3 (2016) no. 1, 160018 https://www.nature.com/articles/sdata201618 (Accessed 2024-09-26) | DOI

Cité par Sources :