recherche
sous-menu
Vous êtes ici : Accueil  ❭  Forum  ❭  Langues asiatiques  ❭  Apprendre le chinois  ❭  CFDICT

CFDICT au format XML


» Rendez-vous sur la page officielle du projet de dictionnaire chinois gratuit CFDICT, cliquez ici
photo
Ses participations : 2898
Ses discussions : 928
Changsha
28/03/2011 à 07:50 - CFDICT au format XML
Bonjour,

Pour ceux qui s'intéressent de près à l'évolution du projet de dictionnaire chinois libre, gratuit et téléchargeable CFDICT, je tenais à vous informer, qu'il est désormais possible de télécharger la base de donnée au format XML.

Plus d'infos sur la page officielle de CFDICT :
https://chine.in/mandarin/dictionnaire/CFDICT/
photo
Ses participations : 4
Ses discussions : 1
01/12/2011 à 16:14 - Erreurs dans le fichier XML ?
Bonjour,

J'ai découvert CFDICT et je suis impressionné par le travail effectué. Toutes mes félicitations pour ce projet et j'espère pouvoir contribuer à mon tour

En essayant de parser le dictionnaire au format XML, j'ai découvert certaines choses étranges:

1) Il y a un "[" de trop dans les traductions. Par exemple:
<word>
<traditional>謝謝</traditional>
<simplified>谢谢</simplified>
<pinyin>"xie4xie5"</pinyin>
<translations>
<translation><![CDATA[[merci]]></translation>
<translation><![CDATA[[remercier]]></translation>
</translations>
</word>

Il faudrait avoir <![CDATA[merci]]> au lieu de <![CDATA[[merci]]>

2) A la ligne 1711230, la fermeture de l'attribut "simplified" est à la ligne suivante:
<simplified>CC-CEDICT
</simplified>

au lieu de:
<simplified>CC-CEDICT</simplified>

De plus, il y a deux entrées CC-CEDICT, et sont-elles vraiment utiles ?

3) Deux traductions font planter le parser, à cause de caractères incorrects:

<word>
<traditional>比不上</traditional>
<simplified>比不上</simplified>
<pinyin>"bi3bu4shang4"</pinyin>
<translations>
<translation><![CDATA[[ne pouvoir se comparer \u0005]]></translation>
</translations>
</word>

<word>
<traditional>米拉之家</traditional>
<simplified>米拉之家</simplified>
<pinyin>"mi3la1zhi1jia1"</pinyin>
<translations>
<translation><![CDATA[[Casa Mil \u000F]]></translation>
</translations>
</word>


J'ai remplacé les caractères problématiques par le code Unicode. Il faut les enlever pour que le parser fonctionne.

Voilà, j'espère vous avoir aidé !
photo
Ses participations : 2898
Ses discussions : 928
Changsha
03/12/2011 à 02:13 - CFDICT au format XML
Bonjour Andreas !

Merci pour ces observations et de votre contribution, je vais essayer de corriger ça !

Ce genre de remarque est toujours très utile

La Chine 中国 (Zhongguó), pays de l'Asie orientale, est le sujet principal abordé sur CHINE INFORMATIONS (autrement appelé "CHINE INFOS") ; ce guide en ligne est mis à jour pour et par des passionnés depuis 2001. Cependant, les autres pays d'Asie du sud-est ne sont pas oubliés avec en outre le Japon, la Corée, l'Inde, le Vietnam, la Mongolie, la Malaisie, ou la Thailande.