Avant de se lancer dans la constitution d’une base de données (généalogique, au hasard) il est tout à fait utile de se poser quelques questions afin de partir dans les bonnes directions. En l’occurrence, quelle est la méthode la plus adaptée pour noter les lieux dans un logiciel de généalogie ?

Les noms de lieux dans GeneWeb

Pour ma part j’utilise comme logiciel GeneWeb qui n’est pas bien compliqué à ce sujet : sur les fiches individuelles, un champ « lieu » est à remplir pour chaque événement (naissance, baptême, mariage, décès, inhumation). gw_lieu.jpg Puisque mon arbre atterrit au final sur Geneanet, pour une indexation optimisée je fournissais donc le nom du lieu, le code postal (aïe), le nom du département, le nom de la région, le code pays. Ce qui permet pour tout un tas d’application d’éviter les confusions entre deux lieux portant le même nom mais situés dans des départements différents.

De l’utilité des codes

Un code permet justement d’assurer à divers outils (Geneanet, GeoGed…) de localiser sans erreur possible un lieu. C’est également utile, lorsqu’un nom de lieu a changé entre deux époques, pour inscrire une continuité si deux personnes sont nées au même endroit (même code) mais que le nom n’est plus le même.

Le code postal m’apparaissait pour diverses raisons une solution pratique à mettre en place : plus facilement trouvable qu’un code Insee grâce à divers sites ou logiciels (notamment le fameux Code Postal) [1]. Or, quelle est la fiabilité de ce système pour identifier précisément un lieu ? Aujourd’hui il n’est pas rare qu’un code postal regroupe plusieurs communes, notamment en milieu rural [2]. Et une personne née à Saint-Révérien n’est pas née à Moraches. Pourtant le code postal est le même (58420).

À l’inverse, le système de code mis en place par l’Insee en 1943 est lui unique pour chaque commune. Ainsi Saint-Révérien porte le 58266 et Moraches le 58181 : pas d’erreur possible.
Il faut tout de même admettre que les codes Insee ne sont pas non plus infaillibles. Le village de Montmartre, annexé à Paris en 1860, n’a ainsi pas de code Insee. Théoriquement, je suppose qu’on doit lui donner le code Insee du XVIIIème arrondissement de Paris (75118). La commune de Caudéran, rattachée à Bordeaux en 1965 disposait d’un code Insee (33110) mais elle est aujourd’hui noyée dans le code bordelais (33063)…
Néanmoins, cela me parait actuellement représenter le système le plus sûr, et facile à mettre en œuvre, d’identification d’un lieu en France [3].

Méthode de transfert des codes

J’ai donc décidé de reprendre entièrement mon arbre généalogique, pour uniformiser les noms de lieux et changer les codes postaux en codes Insee. Lourd travail en perspective, même si mon arbre n’est pas d’une taille démesurée. Il contient actuellement environ 527 personnes ce qui représente 527 fiches individuelles nécessitant potentiellement une modification du code de lieu, ou du moins une vérification.
La solution qui m’est apparue la plus certaine pour n’oublier personne dans ce grand changement, a été de faire un export de mon arbre dans un fichier source GeneWeb [4], plutôt que de travailler directement avec le logiciel. Une copie est mise de côté pour la sauvegarde (je ne tiens pas à perdre tout ce travail !). J’ai ensuite édité mon fichier source dans le bloc-notes de Windows [5].
À partir de là débute le minutieux travail de recherche : repérer dans le texte brut tous les lieux afin de faire passer les codes postaux en codes Insee. Voici par exemple ce que donne le texte brut pour une personne (ici : sexe, prénom, date de naissance, lieu de naissance, date de décès, lieu de décès) :

- f Joséphine 19/3/1826 #bp Hasparren,_F64240,_Pyrénées-Atlantiques,_Aquitaine,_FRA 10/6/1902 #dp Mauleon-Licharre,_F64130,_Pyrénées-Atlantiques,_Aquitaine,_FRA

Il suffit de remplacer les codes postaux (64240, 64130) par les codes Insee (64256, 64371). Pour trouver les codes Insee je me suis tantôt servi du site de l’Insee, tantôt du logiciel Codutil, les deux se valent, tout dépend si vous disposez d’une connexion internet au moment de votre travail. En fonction des cas, j’en ai également profité pour compléter les informations manquantes et harmoniser les indications de lieu, selon un modèle unique : nom de la commune, code Insee, nom du département, nom de la région, code du pays. Certes le nom de la région n’était peut-être pas indispensable, mais autant tout compléter, tant que j’y étais.

All you need is code

Ce fut long et fastidieux, je fus plein de précautions, mais j’y suis arrivé. Une fois le fichier source achevé et enregistré (Fichier/Enregistrer), je l’ai réimporté dans GeneWeb [6] pour constater le résultat. Ouf ! Tout a fonctionné ! Les noms de lieux sont uniformes, et je n’ai pour le moment pas repéré d’erreur dans le fichier généalogique. Tout va bien !

Restait donc à clairement annoncer la chose, pour éviter les confusions : les codes à cinq chiffres que l’on voit sur mon arbre sont donc désormais des codes Insee et non plus des codes postaux ! ;-)

Pour aller plus loin, on trouve, sur GeneaWiki, un dossier très complet à propos de la saisie informatique des noms de lieux.

Notes

[1] Quelqu’un a parlé de fainéantise ?

[2] Le code postal est en fait celui de la commune du bureau distributeur au moment de la création du code postal (1972).

[3] Étonnament, c’est du code postal dont se sert GeoGed ! mais cela semble fonctionner avec !

[4] Dans le menu GWsetup, choisir un fichier source GeneWeb sous Extraire d’une base de données….

[5] Le bloc-notes permet d’éditer et de sauver le contenu du fichier de façon pure, sans rajouter des marqueurs comme Word, marqueurs qui risqueraient de corrompre le fichier.

[6] Dans le menu GWsetup, sélectionner à partir d’un fichier source GeneWeb sous Créer une base de données….