Dans un contexte d’augmentation des volumétries des données et de réduction des temps de traitement, la Bibliothèque nationale de France est confrontée à plusieurs défis et évolutions. Afin de collecter, préserver, décrire et permettre l’étude d’ensembles de données massifs et hétérogènes, elle fait non seulement appel aux méthodes relevant des sciences de l’information mais elle recourt aussi aux techniques issues de l’informatique, de plus en plus développées dans le domaine de l’intelligence artificielle. Cette nécessité croissante de convoquer des compétences complémentaires, s’ajoutant aux opportunités ouvertes par les collections numériques pour la recherche, notamment en sciences humaines et sociales, induit pour la Bibliothèque la définition d’un espace pour le développement des humanités numériques.
In a context of increasing volumes of data and reduced processing times, the National Library of France is facing several challenges and developments. In order to collect, preserve, describe and enable the study of massive and heterogeneous data sets, the Library uses not only methods of information sciences but also techniques developed in the field of computer science, especially in artificial intelligence. This growing need to convene complementary skills, combined with the research opportunities opened by these digital collections, has led the Library to create a space for supporting digital humanities.
En un contexto de aumento de los volúmenes de datos y de reducción de los tiempos de procesamiento, la Biblioteca nacional de Francia se enfrenta a varios retos y evoluciones. Con el objetivo de colectar, preservar, describir y permitir el estudio de conjuntos de datos masivos y heterogéneos, ésta no sólo recurre a los métodos de la ciencia de la información, sino que también utiliza técnicas informáticas cada vez más desarrolladas en el ámbito de la inteligencia artificial. Esta creciente necesidad de convocar competencias complementarias, además de las oportunidades que ofrecen las colecciones digitales para la investigación, en particular en las ciencias humanas y sociales, induce a la Biblioteca a la definición de un espacio para el desarrollo de las humanidades digitales.
Accepté le :
Publié le :
Mots clés : Digital heritage, digital corpora, data mining, artificial intelligence, machine learning, deep learning, digital humanities, information science, digital scholarship, big data., Patrimonio digital, text and data mining, deep learning, inteligencia artificial, humanidades digitales, ciencias de la información, big data
Emmanuelle Bermès 1 ; Eleonora Moiraghi 1
@article{ROIA_2020__1_1_89_0, author = {Emmanuelle Berm\`es and Eleonora Moiraghi}, title = {Le patrimoine num\'erique national \`a l{\textquoteright}heure de l{\textquoteright}intelligence artificielle}, journal = {Revue Ouverte d'Intelligence Artificielle}, pages = {89--109}, publisher = {Association pour la diffusion de la recherche francophone en intelligence artificielle}, volume = {1}, number = {1}, year = {2020}, doi = {10.5802/roia.5}, language = {fr}, url = {https://roia.centre-mersenne.org/articles/10.5802/roia.5/} }
TY - JOUR AU - Emmanuelle Bermès AU - Eleonora Moiraghi TI - Le patrimoine numérique national à l’heure de l’intelligence artificielle JO - Revue Ouverte d'Intelligence Artificielle PY - 2020 SP - 89 EP - 109 VL - 1 IS - 1 PB - Association pour la diffusion de la recherche francophone en intelligence artificielle UR - https://roia.centre-mersenne.org/articles/10.5802/roia.5/ DO - 10.5802/roia.5 LA - fr ID - ROIA_2020__1_1_89_0 ER -
%0 Journal Article %A Emmanuelle Bermès %A Eleonora Moiraghi %T Le patrimoine numérique national à l’heure de l’intelligence artificielle %J Revue Ouverte d'Intelligence Artificielle %D 2020 %P 89-109 %V 1 %N 1 %I Association pour la diffusion de la recherche francophone en intelligence artificielle %U https://roia.centre-mersenne.org/articles/10.5802/roia.5/ %R 10.5802/roia.5 %G fr %F ROIA_2020__1_1_89_0
Emmanuelle Bermès; Eleonora Moiraghi. Le patrimoine numérique national à l’heure de l’intelligence artificielle. Revue Ouverte d'Intelligence Artificielle, Volume 1 (2020) no. 1, pp. 89-109. doi : 10.5802/roia.5. https://roia.centre-mersenne.org/articles/10.5802/roia.5/
[1] Forums en ligne : des espaces de co-production de la connaissance et du lien social, L’ordinaire d’internet (O. Martin; É. Dagiral, eds.), Armand Colin, Paris, 2016, pp. 203-225
[2] Le web français de la Grande Guerre. Réseaux amateurs et institutionnels, Presses Universitaires de Paris Nanterre, 2018
[3] La commémoration de la Grande Guerre sur le web : présence et diffusion du patrimoine numérisé, Matériaux pour l’histoire de notre temps, Volume 121-122 (2017), pp. 10-17
[4] Cartographie de la Grande Guerre sur le Web : Rapport final de la phase 2 du projet “Le devenir en ligne du patrimoine numérisé : l’exemple de la Grande Guerre” (2017) (https://hal.archives-ouvertes.fr/hal-01425600) (Research Report)
[5] Préfiguration d’un service de fourniture de corpus numériques à destination de la recherche, 2017 (http://c.bnf.fr/fom)
[6] Text, data and link-mining in digital libraries : looking for the heritage gold, IFLA Satellite Meeting – Digital Humanities – Opportunities and Risks : Connecting Libraries and Research (2017) (https://hal.inria.fr/hal-01643293)
[7] Text, data and link-mining in digital libraries : looking for the heritage gold, 2018 (Library Science Talks 2018 https://indico.cern.ch/event/714588/attachments/1617718/2585647/LSTalks-20180326-Bermes_EN_v3.pdf)
[8] Quand le dépôt légal devient numérique : épistémologie d’un nouvel objet patrimonial, Quaderni, Volume 98 (2019), pp. 73-86 | DOI
[9] Contrat d’objectifs et de performance 2017-2021 (2017) (http://www.bnf.fr/documents/contrat_performance.pdf)
[10] Il était une fois dans le web : 20 ans d’archives de l’internet en France (2017) (http://c.bnf.fr/fse)
[11] Quels usages aujourd’hui des bibliothèques numériques ? Enseignements et perspectives à partir de Gallica (2017) (http://c.bnf.fr/fuZ)
[12] Présentation du projet CORPUS à la BnF (2017) (https://webcorpora.hypotheses.org/119)
[13] Web de la mémoire et mémoire du web, Revue de la BnF, Volume 54 (2017) no. 1, pp. 179-193 | DOI
[14] Femmes de lettres, démographie (data.bnf.fr 2017) (2017) (https://resultats.hypotheses.org/1048)
[15] La situation du dépôt légal de l’internet en France : retour sur cette nouvelle législation, sur sa mise en pratique depuis cinq ans, et perspectives pour le futur, Actes du 77e congrès de la Fédération internationale des associations de bibliothécaires et d’institutions (IFLA) (2011) (http://conference.ifla.org/past-wlic/2011/193-stirling-fr.pdf)
[16] Stratégie de recherche de la Bibliothèque nationale de France, Revue Patrimoines. Enjeux contemporains de la recherche, Volume 137 (2018), pp. 22-23
[17] Putting it all together : creating a unified web harvesting workflow at the Bibliothèque nationale de France (2013) (http://netpreserve.org/wp-content/uploads/IIPC_project-Putting_it_all_together-web_harversting_workflow_at_BnF.pdf)
[18] Décrire, transcrire et diffuser un corpus documentaire hétérogène : méthodes, formats, outils (2017) (https://bnf.hypotheses.org/2214)
[19] Géolocalisation et spatialisation de documents patrimoniaux : trois heures de partage autour de la cartographie numérique (2017) (https://bnf.hypotheses.org/2299)
[20] Données liées et données à lier : quels outils pour quels alignements ? (2018) (https://bnf.hypotheses.org/4128)
[21] Le projet Corpus et ses publics potentiels : Une étude prospective sur les besoins et les attentes des futurs usagers (2018) (https://hal-bnf.archives-ouvertes.fr/hal-01739730)
[22] Penser, classer, modéliser. L’exemple du projet Foucault Fiches de Lecture (2018) (https://bnf.hypotheses.org/7445)
[23] Explorer des corpus d’images. L’IA au service du patrimoine (2018) (https://bnf.hypotheses.org/2809)
[24] Distant reading, Verso, 2013
[25] Approches innovantes pour la presse ancienne numérisée : fouille et visualisation de données (2016) (https://bnf.hypotheses.org/208)
[26] Data Mining Historical Newspaper Metadata – Old News Teaches History, IFLA News Media Section Conference 2016 (2016)
[27] Plongez dans les images de 14-18 avec notre nouveau moteur de recherche iconographique GallicaPix (2018) (https://c.bnf.fr/gxS)
[28] Recherche d’images dans les bibliothèques numériques patrimoniales – Expérimentation de techniques d’apprentissage profond, Documentation et bibliothèques, Volume 65 (2019) no. 2, pp. 5-27 | DOI
[29] Hybrid Image Retrieval in Digital Libraries : A Large Scale Multicollection Experimentation of Deep Learning techniques, Digital Libraries for Open Knowledge (2018), pp. 354-358 (22nd International Conference on Theory and Practice of Digital Libraries 2018, Porto) | DOI
[30] Analyse des traces d’usage de Gallica : une étude à partir des logs de connexions au site Gallica (2017) (https://hal.archives-ouvertes.fr/hal-01709264)
[31] Les humanités numériques à la Bibliothèque nationale de France, Revue Patrimoines. Enjeux contemporains de la recherche (2015) no. 133, pp. 67-69
[32] Le dépôt légal de l’internet dans le projet CORPUS (2017) (https://webcorpora.hypotheses.org/111)
[33] Atelier BnF Corpus (II) – Penser, classer, modéliser (2018) (https://ffl.hypotheses.org/1079)
Cité par Sources :