48  Wikipédia & Wikidata pour la recherche

48.0.1 Évaluer une page Wikipédia

  • Deux écueils principaux :

    • Une page Wikipédia peut comporter des erreurs, il va falloir que vous vérifiez vous-même chaque information que vous y trouvez.

    • Une page Wikipédia peut lister des informations vraies MAIS ne traiter que très partiellement d’un sujet ou de faire un contresens en ordonnant mal les informations présentées.

      • Attention à l’impression de « consensus » trompeur et d’exhaustivité trompeuse qui semblent se dégager d’une page Wikipédia.

      • Il peut manquer ce qui est le plus important à savoir sur un sujet, ou avoir un traitement biaisé de la question (intentionnel ou incompétent).

      • Il n’y a pas d’autorité sur laquelle s’appuyer.

      • Exemple au 21 février 2022, sur le Wikipédia en français, la page Bushido laisse à penser qu’il y avait réellement un « code d’honneur » des samourais dans le japon pré-moderne, or ce n’est pas le cas car c’est principalement une invention littéraire et romantique du XIXe siècle avec une très faible réalité historique. Pourtant sur la page Wikipédia, toutes les informations sont vraies et sourcées mais leur quantité et leur présentation biaisée en faveur de la valeur littéraire induisent un contresens.

  • Quelques critères simples :

    • La page a-t-elle beaucoup de contenu ? Est-elle bien rédigée ?

    • Les informations sont-elles bien sourcées ? Les sources sont-elles de qualité ?

    • Les pages du même sujet dans d’autres langues sont-elles intéressantes ? Y a-t-il des différences significatives ?

    • Existe-t-il d’autres pages liées intéressantes (liens dans le texte, dans les catégories en bas de page, etc.) ?

  • Quelques critères avancés :

    • Onglet Discussion >

      • Quel est le statut de la page selon la communauté Wikipédia ? Le meilleur statut estArticle de qualité(featured article), puis Bon article (good article) et ainsi de suite jusqu’à Ébauche (stub).

      • Le sujet de la page est-il considéré comme important selon communauté Wikipédia ? Importance : maximum, élevée, moyenne ou faible.

    • Menu de gauche > Informations sur la page >

      • Nombre de contributeurs ayant la page dans leur liste de suivi.

      • Vues de la page dans les 30 derniers jours.

      • Nombre total de modifications.

    • Menu de gauche > Pages liées : tous les pages qui mênent à l’article en cours.

    • Onglet Voir l’historique > Regarder qui a contribué à la page.

  • Considérer Wikipédia comme un simple portail de liens et de références pour débuter une recherche d’informations.

48.0.2 Citer une page Wikipédia ?

  • Il n’est pas recommandé de citer une page Wikipédia car ces trois piliers de l’évaluation sont absents ou fragiles :

    • Auteur : anonymat complet. Il n’est pas possible de vérifier l’identité d’un.e contributeur.trice. Donc pas d’expertise non plus, les contributeurs ont peut-être oublié une ou toutes les notions essentielles à connaître sur le sujet.

    • Éditeur : aucune responsabilité. Wikipédia est un hébergeur de pages web et non un éditeur. Dans leur page d’avertissement, il est dit explicitement de ne pas baser ses prises de décision (santé, juridiques, financières) sur les informations dans Wikipédia mais sur des professionnels agréés.

    • Contenu : intéressant souvent, accessible et synthétique, … mais instable. La mention d’une page Wikipédia devrait toujours être datée car une page peut complètement être remaniée en l’espace de quelques semaines.

      • Voir l’historique > Cliquer sur la date heure la plus récente. Dans la boîte jaune : « Ceci est la version actuelle de cette page… ». Récupérer l’URL sous la forme ?title=__&oldid=___

48.0.2.1 Creative Commons

  • Wikipédia est sous licence CC-BY-SA 3.0

    • Vous devez légalement citer Wikipédia correctement si vous réutilisez ou adaptez du contenu (copie, vente, remix, transformation).

    • Pour l’éthique de la recherche vous devez AUSSI citer Wikipédia.

48.0.3 Contribuer à Wikipédia

    • Votre adresse IP n’est pas rendue publique quand vous contribuez.

    • Votre compte va accumuler et lister toutes vos contributions.

    • Espace personnel (page personnelle, messagerie interne, alertes de suivi).

    • Possibilité de modifier des pages semi-protégées.

    • Possibilité de participer aux votes communautaires.

  • Contribuer progressivement : commencer simplement et augmenter en complexité au fur et à mesure Un parcours ludifié en 5 niveaux : https://github.com/pmartinolli/TM-Wikipedibus.

    • Créer des liens entre les pages.

    • Ajouter une source.

    • Ajouter des catégories. Ajouter un bandeau à une page problématique / critiquer dans Discussion

    • Rédiger un paragraphe avec une ou deux sources.

    • Traduire une page vers le français.

    • Rédiger une nouvelle page avec une quizaine de sources.

    • Restructurer les informations d’une page existante (le plus difficile selon moi car il faut prendre en compte la réaction de la communauté).

  • Faire valoriser ses contributions :

    • Quantitativement : lister le nombre de vos contributions

    • Qualitativement : avoir créé une nouvelle page ou avoir significativement amélioré ou enrichi une page existante. en

    • Dans l’espace personnel Wikipédia : créer une mini-page vers vos contributions et des liens vers compteurs de contributions Exemple : https://fr.wikipedia.org/wiki/Utilisateur:Pmartinolli.

    • Dans votre CV : indiquer votre identifiant avec quelques-unes de vos importantes contributions).

48.0.4 Utiliser les données de Wikidata

  • Wikidata https://www.wikidata.org/ est une immense base de connaissances (une base de données avec des informations hétérogènes mais toutes reliées entre elles).

    • Elle incomplète mais elle peut être intérrogée pour repérer de l’information et l’exporter dans des formats exploitables.
  • Peut servir pour vos données de recherche :

    • En support partiel ou complet.

      • Complet ? Plusieurs chercheurs mentionnent que l’ontologie (l’organisation des informations) de Wikidata est trop sommaire pour décrire toutes les données de certains projets de recherche.

      • Partiel ? Pour compléter vos données ou pour les aligner sur des identifiants externes.

    • En phase exploratoire, ou en phase d’éxécution ou en phase de diffusion Pascal Martinolli « Wikidata : un outil pour vous, les chercheurs » ACFAS Magazine, 4 juin 2020. .

      • Liste normalisée de concepts / thèmes disciplinaires : sélection de 65000 concepts, classés en 5 niveaux, de OpenAlex.

48.0.4.1 Creative Commons

  • Les données dans Wikidata sont sous licence CC0.

    • Donc vous n’avez pas d’obligation légale de citer l’origine des données.

    • MAIS pour l’éthique de la recherche, il faut citer l’origine des données.

48.0.4.2 SPARQL

48.0.5 Contribuer à Wikidata

48.0.6 Indexer son profil de chercheur dans Wikidata

  • Pourquoi ?

    • Wikidata est devenu le principal outil fédérateur des identifiants ouverts. On devrait l’appeler « Wikimetadata ». Il est aussi utilisé par les moteurs de recherche sémantiques (comme Google) pour améliorer leurs résultats de recherche. Indirectement, avoir un identifiant Wikidata bien indexé et bien aligné avec vos différents profils peut améliorer votre présence dans les résultats de recherche de Google J’avais tenté de vérifier l’impact mais il est insignifiant pour des personnes ayant déjà une page sur le site de l’UdeM (une institution qui a un grand poids dans le PageRank). Il est possible que l’impact soit plus fort pour une personne n’ayant pas de présence sur le site de l’UdeM. https://www.wikidata.org/wiki/User:Pmartinolli/Curation_chercheurs_UdeM/Impact_on_PageRank.
  • Comment ? [1h]

    • Éligibilité : En juin 2019, le consensus social sur la notoriété des éléments de Wikidata dit qu’il est possible de créer un élément Wikidata au nom d’un.e chercheur.se si :

      • la personne a publié au moins un article dans une revue universitaire avec comité de lecture;

      • ou un livre publié dont elle est l’autrice ou l’auteur.

    • Tutoriel et suggestions pour créer ou améliorer son identifiant Wikidata

    • Avertissement : Il est recommandé de se créer un compte Wikimedia et d’ajouter la page de votre élément Q à votre liste de suivi (watchlist) pour être alerté de toutes modifications sur celui-ci. Si vous avez une page Wikipédia à votre nom, faîtes de même. En effet, il est possible que des personnes mal informées ou mal intentionnées indexent des déclarations (statements) privées ou diffamatoires. Si c’est le cas, envoyer un courriel immédiatement au Wikidata Oversight pour masquer les déclarations concernées et leurs historiques de modification. Exemples de déclarations à surveiller :Place of birth(P19), Date of birth(P569), Located at street address(P6375), Phone number(P1329), E-mail address(P968), Sexual orientation(P91), Political ideology(P1142), Religion(P140), Medical condition(P1050), Cause of death(P509),…

    • Utiliser Author-disambiguator pour réclamer vos publications.

      • Connectez-vous avec votre login/mot de passe Wikimedia.

      • Lancez une recherche avec votre nom.

      • Cochez vos publications. Décochez celles qui ne sont pas de vous.

      • Associez avec votre QID.