Ce message s'adresse aux contributeurs de CFDICT.
Je découvre CFDICT et je suis frappé par une chose : la base de données contient beaucoup d'entrées (le double de CEDICT!) mais il me semble que la qualité n'est pas à la hauteur de la quantité.
On voit:
- beaucoup d'entrées avec le pinyin vide,
- beaucoup d'entrées avec la forme traditionnelle vide,
- beaucoup d'entrées à l'utilisée discutable. Ne croyez pas que j'aie quelque chose contre l'Amérique centrale
mais je pense qu'inclure l'expression "Armoiries de la République dominicaine" alourdit la base de données pour peu de résultat.
Encore une fois, je ne veux pas être brutal (encore moins dénigrer le travail qui est fait). Plutôt poser une interrogation sur les usages de CFDICT.
Si je peux risquer un avis, il me semble que les bases chinois->français (ou anglais ou allemand) de la famille CEDICT-CFDICT-HanDeDict sont plutôt dirigées aux utilisateurs débutants-intermédiaires. Les utilisateurs avancés ayant besoin d'un dictionnaire avec plus de nuances d'usage et d'aspects grammaticaux. Pour cette raison, je crois qu'il est plus important de se concentrer sur la qualité des entrées du vocabulaire de base plutôt que de rechercher la quantité.
Evidemment, débroussailler une base de données existante est un travail très difficile (cf. le fonctionnement actuel de CEDICT, à mon sens assez exigeant en qualité, et qui repose sur un groupe conséquent d'utilisateurs ayant un très bon niveau).
... pour lancer la discussion!