Le patrimoine numérique national à l’heure de l’intelligence artificielle
Revue Ouverte d'Intelligence Artificielle, Volume 1 (2020) no. 1, pp. 89-109.

Dans un contexte d’augmentation des volumétries des données et de réduction des temps de traitement, la Bibliothèque nationale de France est confrontée à plusieurs défis et évolutions. Afin de collecter, préserver, décrire et permettre l’étude d’ensembles de données massifs et hétérogènes, elle fait non seulement appel aux méthodes relevant des sciences de l’information mais elle recourt aussi aux techniques issues de l’informatique, de plus en plus développées dans le domaine de l’intelligence artificielle. Cette nécessité croissante de convoquer des compétences complémentaires, s’ajoutant aux opportunités ouvertes par les collections numériques pour la recherche, notamment en sciences humaines et sociales, induit pour la Bibliothèque la définition d’un espace pour le développement des humanités numériques.

In a context of increasing volumes of data and reduced processing times, the National Library of France is facing several challenges and developments. In order to collect, preserve, describe and enable the study of massive and heterogeneous data sets, the Library uses not only methods of information sciences but also techniques developed in the field of computer science, especially in artificial intelligence. This growing need to convene complementary skills, combined with the research opportunities opened by these digital collections, has led the Library to create a space for supporting digital humanities.

En un contexto de aumento de los volúmenes de datos y de reducción de los tiempos de procesamiento, la Biblioteca nacional de Francia se enfrenta a varios retos y evoluciones. Con el objetivo de colectar, preservar, describir y permitir el estudio de conjuntos de datos masivos y heterogéneos, ésta no sólo recurre a los métodos de la ciencia de la información, sino que también utiliza técnicas informáticas cada vez más desarrolladas en el ámbito de la inteligencia artificial. Esta creciente necesidad de convocar competencias complementarias, además de las oportunidades que ofrecen las colecciones digitales para la investigación, en particular en las ciencias humanas y sociales, induce a la Biblioteca a la definición de un espacio para el desarrollo de las humanidades digitales.

Reçu le :
Accepté le :
Publié le :
DOI : 10.5802/roia.5
Mot clés : Patrimoine numérique, fouille de données, apprentissage profond, intelligence artificielle, humanités numériques, sciences de l’information, mégadonnées.
Mots clés : Digital heritage, digital corpora, data mining, artificial intelligence, machine learning, deep learning, digital humanities, information science, digital scholarship, big data., Patrimonio digital, text and data mining, deep learning, inteligencia artificial, humanidades digitales, ciencias de la información, big data
Emmanuelle Bermès 1 ; Eleonora Moiraghi 1

1 Bibliothèque nationale de France, Quai François Mauriac, 75706 Paris Cedex 13, France.
@article{ROIA_2020__1_1_89_0,
     author = {Emmanuelle Berm\`es and Eleonora Moiraghi},
     title = {Le patrimoine num\'erique national \`a l{\textquoteright}heure de l{\textquoteright}intelligence artificielle},
     journal = {Revue Ouverte d'Intelligence Artificielle},
     pages = {89--109},
     publisher = {Association pour la diffusion de la recherche francophone en intelligence artificielle},
     volume = {1},
     number = {1},
     year = {2020},
     doi = {10.5802/roia.5},
     language = {fr},
     url = {https://roia.centre-mersenne.org/articles/10.5802/roia.5/}
}
TY  - JOUR
AU  - Emmanuelle Bermès
AU  - Eleonora Moiraghi
TI  - Le patrimoine numérique national à l’heure de l’intelligence artificielle
JO  - Revue Ouverte d'Intelligence Artificielle
PY  - 2020
SP  - 89
EP  - 109
VL  - 1
IS  - 1
PB  - Association pour la diffusion de la recherche francophone en intelligence artificielle
UR  - https://roia.centre-mersenne.org/articles/10.5802/roia.5/
DO  - 10.5802/roia.5
LA  - fr
ID  - ROIA_2020__1_1_89_0
ER  - 
%0 Journal Article
%A Emmanuelle Bermès
%A Eleonora Moiraghi
%T Le patrimoine numérique national à l’heure de l’intelligence artificielle
%J Revue Ouverte d'Intelligence Artificielle
%D 2020
%P 89-109
%V 1
%N 1
%I Association pour la diffusion de la recherche francophone en intelligence artificielle
%U https://roia.centre-mersenne.org/articles/10.5802/roia.5/
%R 10.5802/roia.5
%G fr
%F ROIA_2020__1_1_89_0
Emmanuelle Bermès; Eleonora Moiraghi. Le patrimoine numérique national à l’heure de l’intelligence artificielle. Revue Ouverte d'Intelligence Artificielle, Volume 1 (2020) no. 1, pp. 89-109. doi : 10.5802/roia.5. https://roia.centre-mersenne.org/articles/10.5802/roia.5/

[1] Valérie Beaudouin Forums en ligne : des espaces de co-production de la connaissance et du lien social, L’ordinaire d’internet (O. Martin; É. Dagiral, eds.), Armand Colin, Paris, 2016, pp. 203-225

[2] Valérie Beaudouin; Philippe Chevallier; Lionel Maurel Le web français de la Grande Guerre. Réseaux amateurs et institutionnels, Presses Universitaires de Paris Nanterre, 2018

[3] Valérie Beaudouin; Lionel Maurel La commémoration de la Grande Guerre sur le web : présence et diffusion du patrimoine numérisé, Matériaux pour l’histoire de notre temps, Volume 121-122 (2017), pp. 10-17

[4] Valérie Beaudouin; Zeynep Pehlivan Cartographie de la Grande Guerre sur le Web : Rapport final de la phase 2 du projet “Le devenir en ligne du patrimoine numérisé : l’exemple de la Grande Guerre” (2017) (https://hal.archives-ouvertes.fr/hal-01425600) (Research Report)

[5] Emmanuelle Bermès Préfiguration d’un service de fourniture de corpus numériques à destination de la recherche, 2017 (http://c.bnf.fr/fom)

[6] Emmanuelle Bermès Text, data and link-mining in digital libraries : looking for the heritage gold, IFLA Satellite Meeting – Digital Humanities – Opportunities and Risks : Connecting Libraries and Research (2017) (https://hal.inria.fr/hal-01643293)

[7] Emmanuelle Bermès Text, data and link-mining in digital libraries : looking for the heritage gold, 2018 (Library Science Talks 2018 https://indico.cern.ch/event/714588/attachments/1617718/2585647/LSTalks-20180326-Bermes_EN_v3.pdf)

[8] Emmanuelle Bermès Quand le dépôt légal devient numérique  : épistémologie d’un nouvel objet patrimonial, Quaderni, Volume 98 (2019), pp. 73-86 | DOI

[9] Bibliothèque nationale de France Contrat d’objectifs et de performance 2017-2021 (2017) (http://www.bnf.fr/documents/contrat_performance.pdf)

[10] Bibliothèque nationale de France Il était une fois dans le web : 20 ans d’archives de l’internet en France (2017) (http://c.bnf.fr/fse)

[11] Bibliothèque nationale de France Quels usages aujourd’hui des bibliothèques numériques  ? Enseignements et perspectives à partir de Gallica (2017) (http://c.bnf.fr/fuZ)

[12] Ariane Bouchard Présentation du projet CORPUS à la BnF (2017) (https://webcorpora.hypotheses.org/119)

[13] Philippe Chevallier Web de la mémoire et mémoire du web, Revue de la BnF, Volume 54 (2017) no. 1, pp. 179-193 | DOI

[14] Frédéric Glorieux Femmes de lettres, démographie (data.bnf.fr 2017) (2017) (https://resultats.hypotheses.org/1048)

[15] Gildas Illien; Pascal Sanz; Sophie Sepetjan; Peter Stirling La situation du dépôt légal de l’internet en France : retour sur cette nouvelle législation, sur sa mise en pratique depuis cinq ans, et perspectives pour le futur, Actes du 77e congrès de la Fédération internationale des associations de bibliothécaires et d’institutions (IFLA) (2011) (http://conference.ifla.org/past-wlic/2011/193-stirling-fr.pdf)

[16] Olivier Jacquot Stratégie de recherche de la Bibliothèque nationale de France, Revue Patrimoines. Enjeux contemporains de la recherche, Volume 137 (2018), pp. 22-23

[17] Annick Le Follic; Peter Stirling; Bert Wendland Putting it all together : creating a unified web harvesting workflow at the Bibliothèque nationale de France (2013) (http://netpreserve.org/wp-content/uploads/IIPC_project-Putting_it_all_together-web_harversting_workflow_at_BnF.pdf)

[18] Eleonora Moiraghi Décrire, transcrire et diffuser un corpus documentaire hétérogène : méthodes, formats, outils (2017) (https://bnf.hypotheses.org/2214)

[19] Eleonora Moiraghi Géolocalisation et spatialisation de documents patrimoniaux : trois heures de partage autour de la cartographie numérique (2017) (https://bnf.hypotheses.org/2299)

[20] Eleonora Moiraghi Données liées et données à lier : quels outils pour quels alignements  ? (2018) (https://bnf.hypotheses.org/4128)

[21] Eleonora Moiraghi Le projet Corpus et ses publics potentiels  : Une étude prospective sur les besoins et les attentes des futurs usagers (2018) (https://hal-bnf.archives-ouvertes.fr/hal-01739730)

[22] Eleonora Moiraghi Penser, classer, modéliser. L’exemple du projet Foucault Fiches de Lecture (2018) (https://bnf.hypotheses.org/7445)

[23] Eleonora Moiraghi; Jean-Philippe Moreux Explorer des corpus d’images. L’IA au service du patrimoine (2018) (https://bnf.hypotheses.org/2809)

[24] Franco Moretti Distant reading, Verso, 2013

[25] Jean-Philippe Moreux Approches innovantes pour la presse ancienne numérisée : fouille et visualisation de données (2016) (https://bnf.hypotheses.org/208)

[26] Jean-Philippe Moreux Data Mining Historical Newspaper Metadata – Old News Teaches History, IFLA News Media Section Conference 2016 (2016)

[27] Jean-Philippe Moreux Plongez dans les images de 14-18 avec notre nouveau moteur de recherche iconographique GallicaPix (2018) (https://c.bnf.fr/gxS)

[28] Jean-Philippe Moreux Recherche d’images dans les bibliothèques numériques patrimoniales – Expérimentation de techniques d’apprentissage profond, Documentation et bibliothèques, Volume 65 (2019) no. 2, pp. 5-27 | DOI

[29] Jean-Philippe Moreux; Guillaume Chiron Hybrid Image Retrieval in Digital Libraries : A Large Scale Multicollection Experimentation of Deep Learning techniques, Digital Libraries for Open Knowledge (2018), pp. 354-358 (22nd International Conference on Theory and Practice of Digital Libraries 2018, Porto) | DOI

[30] Adrien Nouvellet; Valérie Beaudouin; D’Alché-Buc Florence; Christophe Prieur; François Roueff Analyse des traces d’usage de Gallica  : une étude à partir des logs de connexions au site Gallica (2017) (https://hal.archives-ouvertes.fr/hal-01709264)

[31] Thierry Pardé; Jacquot Olivier Les humanités numériques à la Bibliothèque nationale de France, Revue Patrimoines. Enjeux contemporains de la recherche (2015) no. 133, pp. 67-69

[32] Stirling Peter Le dépôt légal de l’internet dans le projet CORPUS (2017) (https://webcorpora.hypotheses.org/111)

[33] Ventresque Vincent Atelier BnF Corpus (II) – Penser, classer, modéliser (2018) (https://ffl.hypotheses.org/1079)

Cité par Sources :