Inference Group
.
.




Search :
.
logo

Le concept de Dasher fonctionne avec presque toutes les langues. Plusieurs languages Européens et le Japonais sont courament supportés par Dasher. Pour utiliser Dasher avec un language Européen non Anglais, vous avez besoin d'entraîner Dasher avec un fichier texte en écriture naturelle dans votre langue - placez ce fichier à l'emplacement input/source ou input/source.txt. Assurez vous que la coche "Word" dans le programme est enlevée, ou alors remplacez le fichier input/dict avec un dictionaire en votre langue.

Quand la version 3 sera réalisée, nous avons l'intention d'augmenter considérablement le nombre de languages manipulés dans Dasher, avec l'aide de la communauté "Open Source". [La version 3 fonctionnera en Unicode.] Avec la version 3, comme avec la version 1.6, chaques language nécessitera un fichier texte en écriture naturelle (environs 300K ou plus).

Plus de suggestions sur comment créer un fichier d'entraînement


JDasher

daishoya - JDasher - Dasher japonais - DAISHOYA

Le nom Japonais pour Dasher est Daishoya (daishoya), qui veut dire `scribe'.

Demonstration
Un film décrivant Daishoya en Japonais.
howareyouH

Comme première étape vers une version entièrement Japonaise de Dasher traitant aussi bien Kana que Kanji, David Ward a écrit une version Hiragana, disponible en version 1.6.3 de Dasher. (NB: les versions plus tardives de windows-Dasher, telles que 1.6.8, ne supporte pas Hiragana, à cause des problèmes de fonts Tcl; la version linux 1.6.8 fonctione assez bien en Hiragana.)

La conversion de Dasher en Daishoya est simple: nous remplaçons l'alphabet Anglais a..z par l'alphabet Hiragana, aiueo... (a,i,u,e,o, ka,ki,ku,ke,ko,...); et nous remplaçons le texte d'entraînement Anglais par un document en Hiragana. [Malheureusement, nous n'avons pas été capable de trouver un grand document purement en Hiragana, donc le language modèle n'est pas aussi bien entraîné que nous le voudrions.]

Deux commandes de l'alphabet Hiragana sont disponibles (options "japan1" et "japan2"). Dans "japan2" les accents diacritiques (",o) sont inclus comme caractères séparés; dans "japan1" ils sont intégrés en incluant les caractères pa,ba, etc. dans l'alphabet ("pa", "ba").

Les collaborateurs qui aiderons à tester Daishoya et le présenter à une grande population d'utilisateurs, seront les bienvenus.

Nous avons aussi besoin de données Hiragana, sous format texte, pour le language modèle.


The Dasher Project is supported by the Gatsby Foundation
David MacKay
Dernière modification du site Fri Oct 1 10:33:26 BST 2010