(BROUILLON) Les propriétés thématiques dans Wikidata
Historiquement, les pratiques de catalogage et de traitement documentaire d’oeuvres ont toujours été très réticentes à utiliser une indexation thématique profonde/ fine/ complète pour interpréter et ajouter des mots-clés décrivant le sujet principal ou les sujets secondaires représentés. Par exemple, elles sont exclues de l’indexation analytique de la BNF :
«L’indexation analytique par matière s’applique aux seules œuvres documentaires. En sont généralement exclus les œuvres littéraires et les textes classiques, philosophiques ou religieux. Cependant, dans les cas particuliers de fonds spécialisés de telles œuvres pourront être indexées.» (norme AFNOR Z 44-070).
Enjeux
Le manque d’utilisation de ces propriétés thématiques réduit le potentiel de Wikidata comme outil de découverte et d’exploration.
Pourquoi ?
Voici une liste non ordonnée de raisons possibles pour lesquelles les propriétés thématiques sont peu indexées dans les catalogues :
- Absence des mots-clés dans le vocabulaire contrôlé
- Difficulté à apparier des sujets flous, mouvants, historiquement datés, etc.
- Conflit entre l’intention des auteurs et celles des catalogueurs
- Culture de la neutralité dans la profession du catalogage
- Manque de ressources pour cataloguer de manière appropriée et cohérente : temps, formation, expertise.
- Décider ce qui constitue un « sujet important » versus un sujet secondaire ou implicite demande un jugement. Cela varie selon l’indexeur, le contexte et le public attendu.
- Biais culturel : un sujet peut être plus facilement reconnu dans un contexte culturel, linguistique ou disciplinaire que dans un autre.
- Difficilement automatisable: les outils automatiques (text mining, IA, etc.) peuvent repérer des mots-clés, mais ont souvent du mal avec les métaphores, l’ironie, les implicites, les multiplicités de sens. L’intervention humaine est presque toujours nécessaire.
Définitions
Le catalogage «pur» sert à repérer les informations bibliographiques simples et objectives : titre, auteur, date de publication, source, citation, contient une bibliographie, contient des cartes, etc.
Le traitement documentaire est une tâche supplémentaire qui permet de mettre en valeur la notice produite par le catalogage. Dans ce traitement documentaire, on trouve le résumé, la classification (un sujet général), l’indexation par mots-clés contrôlés ou mots-clés libres, etc. C’est de cette indexation thématique que je parle.
États de l’art
Propriétés thématiques de Wikidata
Dans Wikidata, les mots-clés utilisés dans les propriétés thématiques (main subject, depicts, etc.), sont à la fois contrôlés et libres. Contrôlés car il faut qu’il y ait un élément avec un identifiant. Libres car parfois cet élément n’est pas placé dans une organisation de mots-clés (on dit ontologie, ou taxonomie, ou thésaurus), dans le sens où il n’est pas la sous-classe d’une classe existante.
Principales propriétés thématiques :
- genre (genre artistique), catégorie dans laquelle l’œuvre ou l’artiste se situe
- facet of (aspect de), sujet général dont cet élément est un aspect
- main subject (sujet ou thème principal)
- depicts (dépeint), entité visuellement dépeinte dans une image, décrite littéralement décrite dans une œuvre, ou incorporée dans un médium audio-visuel ou autre. Peut être utilisé pour sujet ou thème secondaire.
Autres propriétés thématiques plus spécifiques :
- narrative motif
- commemorates
- named after
- fictional or mythical analog of
- significant person
- movement
- publication type of scholarly work
- form of creative work
- depicted format
Utilisation de ces propriétés dans Wikidata
Compter combien est-ce qu’il y a de chansons dans Wikidata et combien de ces chansons possèdent au moins une propriété thématique.
# Count total songs and songs with P921 (main subject) property
SELECT DISTINCT
(COUNT(DISTINCT ?song) AS ?totalSongs)
(COUNT(DISTINCT ?songWithP921) AS ?songsWithP921)
(COUNT(DISTINCT ?songWithP136) AS ?songWithP136)
WHERE {
VALUES ?songType {wd:Q7366 # song
wd:Q105543609 # musical work/composition
wd:Q207628 # composed musical work
wd:Q2188189 # musical work
wd:Q7302866 # audio track
}.
?song wdt:P31 ?songType.
# Optional: check if song has P921 (main subject)
OPTIONAL {
?song wdt:P921 ?subject .
BIND(?song AS ?songWithP921)
}
# Optional: check if song has P136 (genre)
OPTIONAL {
?song wdt:P136 ?genre .
BIND(?song AS ?songWithP136)
}
}
- Résultats du 7 octobre 2025: Nombre de chansons au total = 214 538
- Avec main subject (P921) = 1615
- Avec genre (P136) = 61 500
- (Avec facet of (P1269) = 0)
- (Avec depicts (P180) = 0)
Exemples de sujets
Exemples de sujets profonds :
- deuil
- relation père-fils
- mémoire coloniale
- rapport au corps
- quête de l’identité
Exemples de termes proches et plus spécifiques de ces sujets profonds :
- deuil impossible
- transmission de la mémoire familiale
- déni des exactions coloniales
- rejet du vieillissement physique
- exploration de ses origines
Peu de présence de ces sujets dans Wikidata Difficulté à ajouter (il faut créer le concept et enrichir sa notice pour qu’il soit repérable), au moins une classe. Difficulté à implémenter pour que d’autres oeuvres utilisent ce concept, car la fonction principale de ces termes est non seulement la description d’une oeuvre mais aussi le rassemblement d’autres oeuvres sur ce même sujet. Pour cela, faire des projets autour d’un thème est une bonne idée.
Pour aller plus loin… quelques pratiques d’indexation avancée
- Technique de la double indexation pour capter les nuances dans différents vocabulaires contrôlés.
- Technique de la limite du nombre de mots-clés : trois pour la BNF avec Rameau.
- Distinguer entre les sujets principaux et les sujets secondaires d’une oeuvre (distingué par * dans PubMed, Medline, etc.)
Enjoy Reading This Article?
Here are some more articles you might like to read next: