L'IA veut qu'on lui parle en polonais : la langue de Mickiewicz est la meilleure pour les prompts
Des chercheurs ont testé les performances des modèles linguistiques d'IA en matière de compréhension des langues naturelles. Les modèles testés étaient OpenAI, Google Gemini, Qwen, Llama et DeepSeek.
"Notre expérience a donné lieu à des résultats surprenants et peu intuitifs. Tout d'abord, l'anglais n'a pas obtenu les meilleurs résultats dans tous les modèles ; en fait, il est arrivé en sixième position sur 26 langues lors de l'évaluation de textes longs, tandis que le polonais s'est avéré être la langue la plus performante", ont écrit les auteurs du rapport de l'étude.
Selon les chercheurs, le polonais a été efficace dans 88 % des cas. Pourquoi a-t-il battu la concurrence ?
"Comme le montre l'analyse, c'est la langue la plus précise pour donner des ordres à l'intelligence artificielle. Jusqu'à présent, le polonais était largement considéré comme l'une des langues les plus difficiles à apprendre. Il s'avère que les humains ont des difficultés avec cette langue, mais pas l'intelligence artificielle", explique l'Office polonais des brevets dans un message publié sur Facebook.
Il est intéressant de noter que le polonais est bien compris par l'IA, même si la base de données de textes dans cette langue sur laquelle les modèles peuvent entraîner leurs capacités est beaucoup plus petite que pour l'anglais ou le chinois. Le chinois a obtenu des résultats particulièrement médiocres dans la comparaison : il est arrivé avant-dernier parmi 26 langues.
Les 10 langues les plus efficaces pour l'IA conversationnelle sont les suivantes :
- polonais 88
- français 87
- italien 86
- espagnol 85
- Russe 84
- Anglais 83,9
- Ukrainien 83,5
- Portugais 82
- Allemand 81
- Néerlandais 80%.
Il est intéressant de noter que toutes les langues susmentionnées appartiennent à la famille des langues indo-européennes.
Today