BackBackMenuCloseFermerPlusPlusSearchUluleUluleUluleChatFacebookInstagramLinkedInTwitterYouTubefacebooktwitterB Corporation

Grammalecte

Correcteur grammatical open source

Grammalecte 1.x — Bilan des travaux accomplis

AMÉLIORATION DE LA CORRECTION GRAMMATICALE

Le cœur du correcteur grammatical a été complètement réécrit. Il est plus efficace pour détecter les erreurs et bien plus rapide.

Au lieu de chercher des erreurs avec une longue suite d’expressions régulières, le moteur sépare dorénavant les phrases en tokens (c’est-à-dire en mots et divers éléments textuels) puis parcourt plusieurs graphes de tokens à la recherche de motifs d’erreurs.
Cette nouvelle méthode n’a pas complètement remplacé l’ancienne qui reste toujours pertinente dans quelques cas de figure. La combinaison des deux solutions apporte une grande souplesse d’utilisation.

L’énorme avantage qu’apporte la nouvelle méthode, c’est de pouvoir gérer des cas bien trop complexes pour l’ancienne (uniquement possibles au prix d’un coût de traitement énorme). Il est bien moins difficile (quoique pas facile pour autant) de connaître le contexte et de traiter un nombre croissant de cas particuliers. Pour un coût la plupart du temps négligeable. Les graphes permettent en effet de traiter un nombre considérable de règles sans gréver notablement les performances d’analyse.
Quoique traitant plus de deux fois plus de règles qu’autrefois, Grammalecte va environ deux fois plus vite pour traiter un même texte qu’avec la version précédente (pour le cas Python/LibreOffice). Avec JavaScript (Firefox/Thunderbird/Chrome), l’amélioration n’est pas si notable, mais ça va environ 20 % plus vite qu’avec Python. Par ailleurs, l’ajout de nouvelles règles ne change presque rien aux performances actuelles, si tant est qu’on prenne garde à les écrire de manière à minimiser le coût de traitement.

Grammalecte 0.6.5 :
— Analyse des paragraphes : 159 règles par expression régulière.
— Analyse des phrases : 1934 règles par expression régulière.

Grammalecte 1.2.1 :
— Analyse des paragraphes : 169 règles par expression régulière.
— Analyse des phrases : 5971 règles par description de tokens réparties en 9 graphes différents, et 24 règles par expression régulière.

Bien que la manière de compter les règles soit quelque peu différente (certaines règles antérieures ont été fusionnées, beaucoup d’autres ont été décomposées), la nouvelle version comporte de très nombreuses nouvelles règles de contrôle. La réécriture quasi totale des anciennes règles m’a permis de resserrer les mailles du filet dans de nombreux cas de figure. Les nouvelles règles concernent à peu près tous les domaines, mais plus notablement la détection de certaines confusions et différentes formes de conjugaison. J’espère que cela sera visible à l’usage.

En ce qui concerne les faux positifs, énormément ont été éradiqués. Le nouveau moteur permet d’écrire des règles d’immunité qui facilite la tâche.

Cependant les nouvelles règles engendrent elles aussi inévitablement des possibilités de faire de nouveaux faux positifs. Selon le principe suivi par Grammalecte depuis le commencement, tout est fait pour les supprimer autant que possible et vous ne devriez pas en rencontrer plus qu’auparavant, et même j’espère bien moins.

 

CRÉER UN DICTIONNAIRE PERSONNALISÉ

L’éditeur lexical permet d’ajouter à votre lexique personnel toutes sortes de mots de natures grammaticales variées.

Ce dictionnaire est exportable et peut être importé dans les autres applications utilisant Grammalecte.

 

LIBREOFFICE

— Révision de l’interface du conjugueur, du formateur de texte et de l’éditeur lexical.

— Nouvel outil : Recenseur de mots.

— [LibreOffice 6.2+] Les erreurs peuvent dorénavant être affichées avec des couleurs différentes.

— [LibreOffice 6.3+] La forme et l’épaisseur du soulignement des erreurs grammaticales peuvent être modifiées.

 

FIREFOX / CHROME

— Portage de l’ancienne extension pour Firefox dans le système WebExtension.

— Portage de l’extension pour Firefox sur Chrome.

— Unification de plusieurs panneaux dans un seul.

— Formateur de texte accessible pour tous les types de texte analysés.

— [Firefox 63+] Grâce au ShadowDOM, les menus et panneaux de Grammalecte inclus dans une page ne sont plus altérés par les règles d’affichage de la page web (fonctionnalité apportée par un contributeur externe).

 

AUTRES NOUVEAUTÉS ET AMÉLIORATIONS

— Écriture des règles grandement facilitée (ça ne concerne que le développement, mais cette facilité rend plus aisée l’amélioration de l’existant).

— Nouvelle option pour la normalisation des graphies épicènes (avec points médians).

— Le correcteur orthographique de Grammalecte, nommé Graphspell, est désormais un paquet indépendant et pleinement fonctionnel. La suggestion orthographique a été beaucoup améliorée. Entre autres choses, le correcteur orthographique sait à présent séparer les mots qui ont été fusionnés (desordres -> des ordres, lorsquil -> lorsqu’il). Ce correcteur peut aussi faire des suggestions ad hoc pour gérer les cas particuliers.

 

SITE WEB

Le site vitrine a été refait. Les logiciels et le code sont dorénavant accessibles sur un nouveau nom de domaine : grammalecte.net.

 

L’AVENIR

Les travaux engagés par la campagne de financement sont à présent clos, mais cela ne signifie aucunement que Grammalecte ne sera plus amélioré. Le développement va se poursuivre.

Ce qui est envisagé :

Firefox / Chrome : Créer une interface intégrée qui insère directement les erreurs dans les zones de texte éditables, de sorte qu’il soit inutile d’ouvrir un panneau de correction annexe. Pour toutes sortes de raisons, c’est une fonctionnalité difficile à implémenter, il se pourrait que ça prenne du temps avant d’arriver.

Dictionnaires communautaires : Étendre les dictionnaires existants avec d’autres fournis par un serveur de dictionnaires communautaires.

Thunderbird : Une fois de plus, encore une fois, l’interface de programmation pour la prochaine version de Thunderbird (68) a été modifiée. Et elle sera encore modifiée pour la version suivante… ce qui devient plus que pénible. Et dans la version suivante, tout sera à refaire, attendu que l’“ancien” système (celui pour la version 68) sera rendu obsolète. Bref, le système traverse une période de turbulences fortes. Du coup, si les modifications pour la version 68 demandent trop de travail, aucune version de Grammalecte ne sera publiée jusqu’à la version suivante. Quant à l’interface de programmation suivante, il s’agit d’une forme de WebExtension étendue, c’est-à-dire qu’elle sera basera sur le système de Firefox, avec en sus d’autres interfaces spécifiques pour Thunderbird. Ce nouveau système s’appelle MailExtension, et on ne sait pas encore ce qui sera possible. Bref, orages en vue et mauvaise visibilité.

Améliorer la correction grammaticale, encore et toujours.