BSD-pour-Tous



Rejoignez le forum, c’est rapide et facile

BSD-pour-Tous

BSD-pour-Tous

Vous souhaitez réagir à ce message ? Créez un compte en quelques clics ou connectez-vous pour continuer.

Heredis, généalogie et histoire

Derniers sujets

» Index Hors Limite (4)
par Marie-Hélène R Hier à 11:14

» Lancement Heredis 2021 impossible
par Christian57 Lun 29 Avr 2024, 14:57

» Régressions et bogues sur Heredis 2024 Pro
par Jean-Yves Fornara Ven 26 Avr 2024, 10:17

» Partage d'actes qui m'ont agréablement surpris...
par Pascal56 Mer 24 Avr 2024, 13:01

» Recherche Intelligente
par Delzons Lun 22 Avr 2024, 17:12

» Hérédis 2024
par Clt57 Lun 22 Avr 2024, 00:02

» Quatre nouveaux thèmes pour Heredis 2018 à 2021
par Cédric Dim 21 Avr 2024, 22:18

» LISIBILITE DU LOGICIEL
par Cédric Dim 21 Avr 2024, 22:16

» fiche individu sans renseignement
par genealam Dim 21 Avr 2024, 16:16

» Représentation d'un arbre noyau familial élargi ?
par VinceBR Sam 20 Avr 2024, 19:05

» fiche individu sans renseignement
par VinceBR Sam 20 Avr 2024, 18:38

» Evénements partagés
par VinceBR Sam 20 Avr 2024, 18:32

» Heredis 2018 pro
par Christian57 Ven 19 Avr 2024, 18:59

» Détacher définitivement une branche
par Geneagranny Mar 16 Avr 2024, 17:00

» Ré-Installation de Hérédis
par VBL Jeu 04 Avr 2024, 11:29

Tag moteur

http://bsd-pour-tous.forumactif.com/forum.htm
Le Deal du moment : -20%
Ecran PC GIGABYTE 28″ LED M28U 4K ( IPS, 1 ms, ...
Voir le deal
399 €

2 participants

    caractères spéciaux coupés en 2 lors d'un export UTF-8

    fouderg
    fouderg
    Membre actif
    Membre actif


    Masculin Age : 78
    Localisation : Villard (74420)
    Je travaille sous : PC
    Date d'inscription : 15/02/2011

    caractères spéciaux coupés en 2 lors d'un export UTF-8 Empty caractères spéciaux coupés en 2 lors d'un export UTF-8

    Message par fouderg Ven 08 Mar 2013, 20:42

    Bonjour,

    Il me semble que lors d'un export Gedcom en encodage UTF-8, lorsqu'un caractère accentué ou spécial (codé sur 2 octets) se trouve placé en fin de ligne dans le fichier Gedcom, il arrive que les 2 caractères qui forment un tout soient séparés, l'un restant en bout de ligne et l'autre étant placé sur la ligne de continuation. Ceci fait apparaître des caractères mal décodés à la lecture du gedcom (par Geneanet).

    Par exemple, le texte suivant est mal découpé :

    3 CONC donne et lègue le dit testateur (......) payable par ses dits h"xc3"
    3 CONC "xa9"itiers des le décès de la Jeanne DEPOTE leur mère .....

    les 2 parties d'un caractère spécial ne doivent pas être séparées lors du découpage des lignes de continuation
    le "é" de héritiers se code dans ce cas "c3a9" et si on ne peut pas le mettre en entier en fin de ligne, il faut le mettre en entier sur la ligne suivante.

    Je suis encore en v12.2 et n'ai pas testé en v13 clinoeil
    Tahiti
    Tahiti
    Fondateur
    Fondateur


    Masculin Age : 58
    Localisation : Pontvallain - Sarthe (72)
    Je travaille sous : Windows 11 - 64bits
    Date d'inscription : 28/02/2009

    caractères spéciaux coupés en 2 lors d'un export UTF-8 Empty Re: caractères spéciaux coupés en 2 lors d'un export UTF-8

    Message par Tahiti Ven 08 Mar 2013, 21:06

    Cela ne va pas faire avancer les choses, mais depuis l'arrivé de l'UTF-8 j'ai toujours eu des soucis (comme par exemple sous Geneanet), je ne sais pas du reste pourquoi, ni cherché raisons, et pourtant cela était une chose demandée.

    Je laisse les experts en la matière nous répondre, la norme ou la non norme gedcom ne ma jamais passionné....


    _________________
    La terre sur laquelle nous vivons n'est pas un don de nos parents, ce sont nos enfants qui nous la prêtent. (proverbe amérindien)

    Christophe MENU dit Tahiti
    Le groupe Facebook du forum : Si toi aussi tu utilises Heredis et les produits de BSD Concept | Facebook
    Membre adhérent et bénévole : CRGPG n°1532, CGDT n°2663, CGMP n°4948, La Marquise n°706, CGP 86 n°3057, CGCP n°2843, etc.
    Co-fondateur de ce forum - Mes généalogies sur http://Chr.Menu.Free.Fr etc.
    Impression d'arbres généalogiques : http://empreinte.genea.free.fr/

    Merci de votre présence et ne pas hésiter à participer ou à développer et l'adresse pour nous écrire c'est : bsd.pour.tous@ free.fr (supprimer l'espace après le @)
    avatar
    Invité
    Invité


    caractères spéciaux coupés en 2 lors d'un export UTF-8 Empty Re: caractères spéciaux coupés en 2 lors d'un export UTF-8

    Message par Invité Sam 09 Mar 2013, 00:12

    L'erreur ne vient pas de H12 ni de son export UTF-8, j'ai fait le test et j'obtiens ceci :

    0 HEAD
    1 SOUR HEREDIS 12 PC
    2 VERS 12
    2 NAME HEREDIS PC
    2 CORP BSD Concept ©
    3 ADDR www.heredis.com
    1 DATE 8 MAR 2013
    2 TIME 18:07:00
    1 GEDC
    2 VERS 5.5
    2 FORM LINEAGE-LINKED
    1 CHAR UTF-8
    1 PLAC
    2 FORM Town , Area code , County , Region , Country, Subdivision
    1 SUBM @S0@
    0 @S0@ SUBM
    1 NAME Hervé
    1 ADDR
    0 @3I@ INDI
    1 NAME Test/TEST/
    2 GIVN Test
    2 SURN TEST
    1 EVEN
    2 SOUR @5S@
    1 _FIL LEGITIMATE_CHILD
    0 @5S@ SOUR
    1 ABBR test
    1 QUAY 0
    1 TEXT blablabla
    2 CONT blalbla
    2 CONT donne et lègue le dit testateur (......) payable par ses dits héritiers des le décès de la Jeanne DEPOTE leur mère .....
    2 CONT blabla
    0 TRLR

    Les codages "x... viennent, je pense, d'un copier-coller d'un texte en RTF fait dans la note de la transcription. Remplacez manuellement votre texte dans la zone de saisie si l'export du Gedcom en Texte Brut (et non pas RTF) donne le même résultat, mais l'export en Texte brut devrait résoudre votre problème
    caractères spéciaux coupés en 2 lors d'un export UTF-8 Utf10
    fouderg
    fouderg
    Membre actif
    Membre actif


    Masculin Age : 78
    Localisation : Villard (74420)
    Je travaille sous : PC
    Date d'inscription : 15/02/2011

    caractères spéciaux coupés en 2 lors d'un export UTF-8 Empty Re: caractères spéciaux coupés en 2 lors d'un export UTF-8

    Message par fouderg Sam 09 Mar 2013, 10:33

    Merci pour votre réponse rapide.

    L'export est déjà en texte brut : ça ne vient donc pas de là.

    Par contre, j'ai déjà identifié un pb de copier/coller entre (MS)Word et Heredis au sujet de l'apostrophe : Word utilise l'apostrophe "caligraphique" et Heredis l'apostrophe simple.
    Il n'y a qu'une seule apostrophe sur un clavier standard, donc elle est transcrite en fonction du logiciel lors d'une frappe au clavier, mais cette transcription n'est pas refaite lors du copier/coller entre 2 softs qui ne sont pas du même avis.
    Les 2 apostrophes sont bien affichables par Heredis.

    L'apostrophe tapée "manuellement" dans Heredis passe bien à travers l'export, mais pas la "caligraphique" introduite par un copier/coller, et cela est vrai autant pour un export "Ansel" qu"UTF-8".

    J'ai identifié le même problème avec les caractères "œ", "î", "…" lors d'un export Ansel, mais pour ces 3 derniers caractères, il sont correctement traités par l'export UTF-8. J'ai cru qu'il y avait un progrès.

    Jusqu'à présent, je corrigeais le Gedcom après l'export (Ansel, texte brut) par une série de "replace" à l'aide d'un utilitaire du type Notepad++
    Et comme le problème grossit en même temps que mon fichier, j'ai voulu programmer ce bricolage.

    VB express ne connait pas le codage Ansel (ce n'est d'ailleurs pas le seul ...), je suis donc passé en UTF-8, ce qui m'a fait découvrir le pot aux roses.

    Mes notes d'évènements contiennent beaucoup de transcriptions (voir exemple :]http://gw1.geneanet.org/fouderg_w?lang=fr&p=francois&n=taberlet+masson&oc=1).

    J'utilise une dictée vocale (DNS) couplée à word ou wordpad, suivie d'un copier/coller. Je souffre donc de ce copier/coller un peu trop "basique".
    Cette méthode est sans défaut tant que l'on ne fait pas d'export : tous ces caractères sont bien collés et affichés correctement par Heredis. Mais plus dans le Gedcom.

    Je suis coincé : ma base Heredis contient des milliers de ces caractères impossibles à exporter. Je ne peux pas envisager de les reprendre à la main.

    Peut-on envisager un "replace" directement sur la base, un peu comme je le fais avec Notepad++ ?
    Ou bien une sorte de filtre de ces caractères au moment de l'export ? (sans doute le plus efficace, car on connait alors le codage souhaité)
    Ou encore ce même filtre lors du copier/coller ?

    J'ai repris mes "corrections de Gedcom" avec Notepad++, (merci Notepad++, mais beurk quand même!) mais je pense qu'en filtrant 5 ou 6 caractères lors de l'export, on résoudrait sans doute 99% du problème.
    Pourquoi pas un dictionnaire des caractères mal exportés ? On donnerait à gauche l'apostrophe calligraphique et à droite l'apostrophe simple et ainsi pour chaque caractère à problème ? Et ce dico serait utilisé lors de l'export ...

    PS : à quand un API sur Héredis ?
    Je rêve de pouvoir ajouter un enfant, un décès, une source et tous ces gestes simples par API plutôt que par un bricolage de macros VBA qui lancent des scripts AutoIt ...

    Mais merci quand même d'avoir su inventer Heredis dont je ne peux plus me passer.


    Contenu sponsorisé


    caractères spéciaux coupés en 2 lors d'un export UTF-8 Empty Re: caractères spéciaux coupés en 2 lors d'un export UTF-8

    Message par Contenu sponsorisé


      La date/heure actuelle est Jeu 02 Mai 2024, 03:06