Nous avons benchmarké les deux modèles sur 50 réunions clients réelles (anonymisées). Voici les résultats détaillés.
Méthodologie
50 transcripts FR (5 à 60 min), prompt système identique, évaluation par 3 humains (notes 1-5 sur fidélité, concision, structure, lisibilité).
Résultats globaux
| Mistral L2 | GPT-4o | |
|---|---|---|
| Fidélité | 4.6 | 4.5 |
| Concision | 4.7 | 4.2 |
| Structure | 4.4 | 4.5 |
| Lisibilité FR | 4.8 | 4.3 |
Coût
Mistral Large 2 : 2$/M in, 6$/M out. GPT-4o : 5$/M in, 15$/M out. Soit 2,5x moins cher à qualité équivalente.
Latence
Depuis OVH Roubaix : Mistral 1.2s p50 / 3.8s p99. GPT-4o 2.5s p50 / 7s p99. Mistral est ~2x plus rapide pour nous.
Souveraineté
Mistral SAS française, RGPD natif, DPA self-service. OpenAI : Cloud Act, DPA via Microsoft Azure (complexe).
Verdict
Pour le français business : Mistral Large 2 gagne sur tous les axes. C'est notre choix par défaut.
Prêt à essayer Tensha ?
14 jours gratuits, sans carte bancaire. Souverain, RGPD, hébergé en France.
Créer un compte gratuitPour aller plus loin
Articles connexes
Pourquoi nous avons choisi Mistral plutôt qu'OpenAI ou Anthropic
Mistral Large 2, Codestral, Pixtral : pourquoi le LLM français est devenu best-in-class pour le résumé en français, et 100% souverain.
De 80% à 96% de précision avec votre vocabulaire métier
Le secret : injecter votre jargon (Schneider, NF C 15-100, anamnèse...) dans le prompt initial. Tutoriel pas à pas.