ESUP- CRISalid

Arborescence des pages

Vous regardez une version antérieure (v. /wiki/spaces/ESUPCRISalid/pages/1478328329/Import+des+donn%C3%A9es+chercheurs) de cette page.

afficher les différences afficher l'historique de la page

« Afficher la version précédente Vous regardez la version actuelle de cette page. (v. 33) afficher la version suivante »

Présentation générale

La construction du graphe de connaissance institutionnel nécessite l'acquisition et la mise à jour du référentiel de personnes de l'établissement, au moins pour la partie comprenant la population des chercheurs et personnels d'appui à la recherche

Pour la démarche générale d'import des référentiels établissements, qu'il s'agisse des structures ou des personnes, veuillez vous référer à la page Import des données structueres


Périmètre de la population à prendre en compte

Il n'y a malheureusement pas de critère simple pour délimiter la population pertinente pour le graphe de connaissance institutionnel.

  • Les chercheurs et enseignants-chercheurs en font nécessairement partie
  • Les enseignants peuvent y être inclus si le graphe a vocation à devenir un graphe enseignement/recherche
  • Les personnels d'appui à la recherche en font également partie mais leur identification peut-être délicate (certains personnels de laboratoires ayant une mission purement administrative alors qu'à l'inverse,  dans certains établissements, on trouve des personnels d'appui à la recherche au sein des services centraux)
  • Outre leurs membres "statutaires" ou "titulaires", certains laboratoires reconnaissent une variété de membres non titulaires tels que les "membres associés", les "anciens membres" ou "membres émérites", des "membres invités", "honoraires", des "correspondants", etc. Il revient à chaque établissement de définir le périmètre des membres qu'il reconnaît et souhaite inclure dans son périmètre scientifique, sachant que le graphe de connaissance institutionnel sera capable de discriminer ces différents modes d'appartenance.

Relations personnes organisations

Il faut distinguer la relation que les personnes entretiennent avec les institutions de celles qu'ils entretiennent avec les structures (voir Import des données structures pour ces notions).

Relation personne-institution

Une personne est généralement rattachée à une et une seule institution par une relation d'emploi (en anglais, employment). Cette relation d'emploi est caractérisée par une "position" : par exemple, "Maître de conférence". En France, où les personnels de la recherche des établissements ESR sont généralement des agents publics, les positions renvoient en général à un système de corps administratifs, mais certains postes, notamment de contractuels, sont caractérisés de façon plus souple.

La position ne doit pas être confondue avec la nature juridique de la relation d'emploi : ainsi, un "ingénieur d'étude" (position) peut être, du point de vue de son statut juridique, un agent contractuel (CDD ou CDI) ou un agent titulaire (fonctionnaire).

Cet aspect juridique est une notion purement RH qui n'est pas à renseigner dans les données en entrée et n'est pas prise en compte par le graphe de connaissance institutionnel.

Une liste de codes de positions d'emploi est fournie ci-dessous.

La notion d'emploi renvoie précisément à Employment dans Cerif 2 et celle de position à Position.

Relation personne-structure(s)

Une personne peut-être rattaché à une ou plusieurs structures de recherche : c'est l'appartenance (en anglais membership). Dans certains établissements et laboratoires, la notion d'appartenance est générique. D'autres distinguent des modes d'appartenance. À côté des membres "titulaires" ou "statutaires" existent alors des formes d’appartenances pouvant être qualifiées de secondaires ou provisoires : "membres associés", les "anciens membres" ou "membres émérites", des "membres invités"... Pour cette raison, les appartenances peuvent, à l'instar des emplois, être caractérisées (de manière optionnelle) par des positions (La notion de  Position dans Cerif 2 n'étant définie ni sur Employment , ni sur Membership, mais sur leur type parent commun, Involvement). En français, pour plus de craté, lorsque les positions caractérisent l'appartenance, nous parlerons de modes d'appartenance. Une liste sera fournie ci-dessous.

Noms de personnes

Même si le format Cerif 2 permet de gérer la variabilité de l'état civil des personnes ou l'existence de multiples graphies pour les noms (ex. latin/cyrillique), aucune source de données de l'ESR français ne prend actuellement en charge cette complexité.

C'est pourquoi elle n'est pas proposée dans le format du fichier d'import.


Spécifications du fichier d'import des personnes

Comme pour les structures, les institutions qui ne peuvent pas charger le graphe de connaissance depuis un annuaire ou une plateforme référentiel peuvent fournir un fichier 'people.csv' conforme aux spécifications ci-dessous (encodage UTF-8, séparateur virgule).

On notera que pour la partie finale des identifiants d'auteurs, le format de fichier est identique à celui demandé par l'ABES pour les opérations d'alignement de masse.


Nom du champDescriptionValeurs licitesExempleChamp obligatoireCommentaires
first_namesPrénom(s) du chercheur/de la chercheuse séparés par des espaces

Tous caractères présents dans les prénoms,

y compris accents, guillemets et caractères non latins.

Séparateur : espace standard.

Longueur maximale 255

Henri PaulouiLes prénoms accolés par des espaces sont considérés comme des prénoms successifs
last_nameNom du chercheur

Tous caractères présents dans les noms,

y compris accents, guillemets et caractères non latins .

Longueur maximale 255

Dupondoui

Que la chaîne comporte ou nom des espaces,

elle est considérée comme un nom unique.

tracking_idIdentifiant unique du chercheur au sein de la plateforme source

Valeur alphanumérique unique au sein de l'établissement

Les caractères "-", "_", ":" sont autorisés.

Longueur maximale 10.

hpdupontouiIl peut s'agir du login ldap. 
Emploi
institution_identifierCode UAI de l'institution du chercheur
1234567Xoui
positionPosition, généralement le corps d'appartenance

Tous les codes de la nomenclature HCERES .

Si besoin d'autres valeurs, signaler.

MCFoui
employment_start_dateDate d'arrivée en poste (avec la position indiquée)Dates Iso8601 passéesYYYY-MM-DDnon
employment_departure_dateDate de départ du posteDates Iso8601 passéesYYYY-MM-DD
Si renseignée, le chercheur est considéré comme ancien chercheur de l'institution
hdrHabilitation à diriger des recherchesoui / nonouinonSi manquante, "non" par défaut
Appartenances
main_research_structureIdentifiant du laboratoire  de référence du chercheur au sein de l'institution
(tracking_id renseigné dans le fichier structures.csv)

U01ouiIl s'agit généralement du laboratoire dont le chercheur est membre "statutaire".
membership_start_dateDate d'arrivée du chercheur dans le laboratoire
DD-MM-YYYY

membership_end_dateDate de départ du chercheur du laboratoire
DD-MM-YYYY

membership_typeStatut du chercheur au sein du laboratoire


membre
research_poleAxes de recherche du chercheur



Identifiants
eppneduPersonPrincipalName de Supann Cf spécification Supannjdupont@univ-exemple.frnon

Le login suivi du nom de domaine de l'établissement.

À ne pas confondre avec l'adresse email professionnelle.


idhal_sIdentifiant Hal alphanumériqueIdentifiants Hal alphanumérique valideshenry-dupondnon
idhal_iIdentifiant Hal numériqueIdentifiants Hal numérique valides252nonNe pas confondre avec les formes auteurs.
Préférer, dans le cas général, l'idHal_s
orcidIdentifiant ORCIDIdentifiant ORCID valides0000-0000-0000-0000non

Un identifiant ORCID fourni de cette façon sera utilisé

pour moissonner les publications mais ne pourra être utilisé

pour s'authentifier sur les applications CRISalid tant que le chercheur ne l'aura pas

revendiqué avec succès par une authentification ORCID.

idrefIdentifiant idref

Identifiant Idref valides (cf www.idref.fr).

Ce sont des chaînes de caractères et non des valeurs numériques (présence d'un zéro à gauche)

028167392non

Conserver le zéro à gauche

Attention ! Si la cellule de tableur est formatée comme une valeur numérique, le premier zéro à gauche sera perdu.


scopus_eidIdentifiant Scopus
46854213non
researcher_idIdentifiant WOS
(non utilisé dans la version actuelle)

B-9809-2012non
  • Aucune étiquette