Guide d'Utilisation du Catalogue

Ce guide vous explique comment naviguer et utiliser efficacement les fonctionnalités du catalogue Recherche Data Gouv pour découvrir les jeux de données de la recherche française.

Les Outils de Recherche Principaux

Au cœur du catalogue se trouvent deux types de barres de recherche conçues pour des besoins différents :

1. Recherche Sémantique (Sens Global)

Cette recherche va au-delà des mots-clés exacts. Elle tente de comprendre le **sens** de votre requête. Elle est idéale lorsque vous cherchez des concepts ou des thèmes, même si vous n'utilisez pas les termes précis présents dans les titres ou les résumés des jeux de données.

  • Quand l'utiliser ? Pour des explorations thématiques larges, pour découvrir des datasets liés par le concept plutôt que par les mots exacts.
  • Exemple : "Impact du changement climatique sur la biodiversité marine en Méditerranée" trouvera des documents pertinents même s'ils n'utilisent pas tous ces mots exacts.
  • Astuce : Utilisez des phrases complètes ou des questions naturelles.

2. Recherche par Mots-clés (Titre, Résumé)

Cette recherche est plus traditionnelle. Elle cible les mots-clés que vous spécifiez dans les champs "Titre" et "Résumé" des jeux de données. Elle est tolérante aux fautes de frappe et aux variations mineures.

  • Quand l'utiliser ? Lorsque vous connaissez des termes spécifiques, des noms de projets, des acronymes ou des mots-clés précis que vous vous attendez à trouver.
  • Exemple : "données hydrologie ORléans" cherchera les documents contenant ces termes.
  • Astuce : Vous pouvez utiliser des opérateurs booléens simples comme `OR` (en majuscules).

Affiner avec les Filtres (Facettes)

Sur la gauche de la page des résultats, vous trouverez une colonne de filtres, aussi appelés facettes. Ces filtres vous permettent d'affiner votre recherche en fonction de critères spécifiques.

  • Types de Filtres : Vous pouvez filtrer par "Affiliation (organisme)", "Acronyme Affiliation", "Affiliation raw" (brute), "Repository (Source)", "Pays", "Champ disciplinaire", "Mots-clés", "Auteur", "Point de contact", et par "Plage de dates de publication".
  • Utilisation :
    • Cliquez sur un menu déroulant pour voir les options disponibles pour ce filtre.
    • Certains filtres (ceux avec beaucoup d'options) proposent une **barre de recherche interne** pour trouver rapidement une valeur.
    • Sélectionnez une valeur. La liste des options dans les *autres* filtres se mettra à jour pour ne montrer que les valeurs encore pertinentes compte tenu de votre sélection (filtrage dépendant).
    • Vous pouvez sélectionner plusieurs filtres différents simultanément.
  • Effacer un Filtre :
    • Pour effacer un filtre spécifique, cliquez sur la petite croix (X) à côté du menu déroulant correspondant.
    • Vous pouvez aussi resélectionner l'option "-- Tous --" (ou le placeholder) dans le menu déroulant.
  • Lancer la Recherche Filtrée : Après avoir sélectionné vos filtres, cliquez sur le bouton "Rechercher avec les filtres" dans la colonne de gauche, ou sur le bouton "Rechercher" sous les barres de recherche principales si vous avez aussi saisi du texte.

Comprendre les Résultats de Recherche

Les résultats sont affichés en deux colonnes principales :

1. Résultats Initiaux (Colonne de Gauche)

Cette colonne affiche les résultats directement retournés par notre moteur de recherche (Typesense) en fonction de votre requête texte et/ou de vos filtres.

  • Tri : Les résultats sont triés par pertinence selon l'algorithme de Typesense. Si vous avez utilisé une recherche sémantique, la distance vectorielle joue un rôle important.
  • Nombre Total : Le titre de cette colonne indique le nombre total de jeux de données trouvés correspondant à vos critères.
  • Pagination : Si de nombreux résultats sont trouvés, des contrôles de pagination (Précédent, Suivant, numéros de page) apparaîtront sous cette colonne pour vous permettre de naviguer.

2. Résultats Re-classés (Colonne de Droite)

Cette colonne n'est active **que si vous avez effectué une recherche sémantique**. Elle présente un sous-ensemble des résultats initiaux qui ont été ré-évalués et re-classés par un modèle d'intelligence artificielle plus avancé (Cross-Encoder) pour une pertinence sémantique encore plus fine.

  • Pertinence : Ces résultats sont souvent les plus pertinents sémantiquement par rapport à votre requête.
  • Score CE : Un "Score CE" (Cross-Encoder) est affiché, indiquant le degré de confiance du modèle dans la pertinence du résultat. Plus le score est élevé, plus le modèle estime le résultat pertinent.
  • Limitation : Cette colonne affiche généralement un nombre limité de résultats (par exemple, le top 5 ou top 10) parmi les plus pertinents après re-classement.

Détails d'un Jeu de Données

Chaque résultat est présenté dans un accordéon. Cliquez sur le titre pour afficher les détails :

  • DOI, Résumé, Mots-clés, Affiliations, Auteurs, Date de publication, etc.
  • Lien vers la "Page de destination" du jeu de données (si disponible).
  • Boutons d'action (voir section suivante).

Découvrir du Contenu Similaire

Pour chaque jeu de données affiché, vous trouverez deux boutons permettant d'explorer du contenu lié :

Datasets similaires

En cliquant sur ce bouton, vous lancez une nouvelle recherche sémantique basée sur le **titre et le résumé** du jeu de données actuel. Cela vous permet de trouver d'autres jeux de données dans le catalogue qui sont sémantiquement proches. Vous serez redirigé vers une page dédiée affichant ces résultats similaires.

Documents liés

Ce bouton utilise le **titre et le résumé** du jeu de données actuel pour trouver des **documents** (publications, articles, rapports, etc., issus d'une collection séparée) qui sont sémantiquement les plus proches. Cela vous permet d'explorer des ressources textuelles en lien avec le jeu de données. Vous serez redirigé vers une page dédiée.

Exploration par Discipline

Accessible depuis le menu en haut de page, cette section vous permet de naviguer dans le catalogue en suivant une arborescence de champs disciplinaires (Grands Domaines, Panels, Sous-Panels).

  • Chaque page de discipline vous offre une description et un bouton pour voir directement les jeux de données correspondants dans le catalogue (avec le filtre "Champ disciplinaire" présélectionné).
  • Naviguez de niveau en niveau pour affiner votre exploration thématique.

Nous espérons que ce guide vous aidera à tirer le meilleur parti du catalogue Recherche Data Gouv. N'hésitez pas à explorer et à expérimenter avec les différentes fonctionnalités !