Optez pour le plus puissant modèle de langue en français

Écrivez plus vite. Résumez des documents complexes. Répondez automatiquement à vos clients. Le tout avec le modèle de langue pour le français le plus puissant du marché.

Ils parlent de nous

Des domaines d’application variés

Généré par Cedille
Généré par Cedille
Généré par Cedille
Généré par Cedille
Généré par Cedille

Vous avez un projet précis?

Contactez-nous pour une adaptation sur-mesure de notre modèle à vos besoins.
Contactez nous

Notre mission

Offrir le plus puissant modèle de génération de textes en français.

Cedille, le plus puissant modèle francophone disponible

Générez des contenus de haute qualité en français en quelques secondes
Accélérez et optimisez vos processus d’écriture
Réécrivez du contenu adapté au ton de votre marque
Accédez au meilleur modèle francophone sur le marché pour vos projets de NLP & NLG

Un modèle de qualité sans précédent

Prédiction

(Plus le score est bas, meilleur est le modèle)
Nous mesurons la “perplexité” du modèle, à savoir sa capacité à prédire le mot suivant au sein d’un document donné. Nous utilisons le corpus Wikitext-FR, composé de milliers d'articles de qualité provenant de Wikipedia en français.
Cedille
3.93
GPT-3 (Davinci)
3.99
GPT-J
5.79
GPT-FR
12.92

Toxicité

(Plus le score est bas, meilleur est le modèle)
La génération de contenus dits “toxiques” est un problème usuel des modèles de langue. Pour Cedille, nous avons pris soin d’entraîner le modèle sur des données de haute qualité. Les textes générés en sont ainsi grandement améliorés! Nous utilisons une version du benchmark Real Toxicity Prompts adaptée pour le français, qui montre le niveau de toxicité le plus élevé lors de génération sans prompt.
Cedille
96%
GPT-3 (Davinci)
99%
GPT-J
99%
GPT-FR
96%

Traduction

(Plus le score est haut, meilleur est le modèle)
Avec le dataset WMT14, nous avons mesuré les performances de Cedille en traduction de l’anglais vers le français.
Cedille
24.91%
GPT-3 (Davinci)
20.40%
GPT-J
14.84%
GPT-FR
1.47%

Résumé

(Plus le score est haut, meilleur est le modèle)
Nous utilisons le benchmark OrangeSum pour mesurer la capacité et la performance du modèle sur le résumé de textes. OrangeSum est basé sur le dataset XSum et a été créé à partir du site “Orange Actu”.
Cedille
13.73%
GPT-3 (Davinci)
15.49%
GPT-J
10.20%
GPT-FR
10.20%

En libre accès pour tous

Cedille est un modèle open source, disponible ici.
Le projet a été rendu possible avec le support généreux du programme Google TRC.
Cedille est basée sur le modèle GPT-J développé par EleutherAI.

Avec des valeurs propres

Performance
Qualité
Innovation
Transparence

Essayez vous-même

La première version du modèle est accessible en version sandbox, n’hésitez pas à nous faire part de vos retours sur vos résultats!
Tester le modèle