Skip to main content
Version: 2.3.0

Monitor crawling

Pour suivre les aspirations de données dans le catalogue REGARDS (Elasticsearch), cliquez sur Ajout de données dans le menu latéral de REGARDS, puis dans la carte Crawling, cliquez sur monitor Monitor data crawling .


L'écran présente la liste des aspirations de données en cours ou terminées.

add datasource

Plusieurs informations sont disponibles :

  • Label correspond au nom donné à la chaîne d'aspiration lors de sa création
  • Last ingest date indique la dernière date de scan de la source d'aspiration
  • Duration durée de la dernière aspiration en secondes. Celle-ci n'est pas affichée dans le cas où la colonne Status n'est pas FINISHED
  • Status indique le statut du traitement de l'aspiration, accompagné d'un panneau cliquable décrivant la stacktrace du traitement Il y a sept états possibles :
    • NEW, si la datasource n'a encore jamais été scannée,
    • STARTED, si la datasource a été prise en compte et est en train d'être scannée,
    • FINISHED, si la dernière aspiration de données s'est terminée sans erreur,
    • FINISHED_WITH_WARNINGS, si la dernière aspiration de données s'est terminée avec des alertes,
    • ERROR, si la dernière aspiration de données s'est terminée en erreur,
    • NOT_FINISHED, si la dernière aspiration ne s'est pas entièrement terminée,
    • INACTIVE, si l'aspiration de données n'est pas activée
  • Number of entities indique le nombre de données traitées lors de la dernière aspiration.
  • Next ingest date affiche la prochaine date d'aspiration de données prévue.
  • Last entity ingested date indique la date de la dernière entité aspirée, seulement si l'aspiration est incrémentale et par date (ce qui est le cas par défaut pour les aspirations de type FEM et OAIS). Cette date correspond à la date de dernière modification.

Il y a également des boutons d'action :

  • refresh le bouton Refresh mets à jour les informations de la page
  • clock les boutons Schedule an ingestion permettent de démarrer une nouvelle aspiration. Cela n'a un impact que sur les nouvelles données n'ayant pas encore été aspirées. Cette fonctionnalité est utile si vous ne souhaitez pas attendre la prochaine aspiration programmée.
    Dans le cas d'une aspiration incrémentale par date (ce qui est le cas pour les aspirations de type FEM ou OAIS), il est possible de renseigner une date à laquelle l'aspiration reprendra son aspiration. Cette date correspond à la date de dernière modification des entités.
  • reset les boutons Delete relancent l'aspiration de la totalité de la source de données correspondantes. Contrairement à une réindexation complète, seules les données de la datasource concernée sont aspirées. Les éventuelles modifications de modèles ne sont pas prises en compte lors de cette aspiration. Les données de la datasource déjà aspirées ne sont pas supprimées mais susceptibles d'être mises à jour. Le catalogue reste toujours disponible pendant cette aspiration.

En cas de réindexation en cours

Si un utilisateur a lancé une Réindexation du catalogue, alors il y a désormais deux indexs ElasticSearch dans lesquels les données doivent être ajoutées. Aussi, dans ce cas, les aspirations sont dédoublées, chaque datasource ayant une aspiration pour l'index "courant" et une autre pour l'index en cours de construction.

Cela se traduit dans l'IHM par l'apparition d'un nouvel onglet "Building Index" et d'une indication "Reindexing in progress" :

add datasource

Les aspirations du nouvel onglet correspondent à celles qui alimentent l'index en cours de réindexation. Les boutons d'action ne sont pas disponibles sur ces aspirations, sauf si l'une d'elle est en erreur.