À propos

Du texte brut aux insights linguistiques, en quelques clics.

SA7BY® est un laboratoire NLP pour les corpus tabulaires : importez un fichier Excel ou CSV, choisissez la colonne qui contient votre texte, puis lancez la tokenisation, les lemmes, les POS et les dépendances en arrière-plan, puis explorez l'analyse sémantique avec WOLF et FastText.

Votre corpus, structuré et explorable

Importez un fichier CSV, Excel, XML ou PDF. En quelques minutes, chaque mot est annoté, chaque phrase est en contexte. Explorez les cooccurrences, les n-grammes, la proximité entre mots et les relations sémantiques. Exportez vos résultats en CSV à tout moment.

Conçu pour les chercheurs en linguistique, textométrie et humanités numériques.

Fonctionnalités clés

Import intelligent

CSV, Excel ou PDF. Prévisualisez les colonnes ou les pages, choisissez votre source et lancez le traitement.

Lexique complet

Tous les mots de votre corpus triés par fréquence ou alphabétiquement. Filtre multi-POS, nuage de mots interactif et export CSV.

Concordances

Chaque occurrence d'un mot avec son contexte gauche et droit. Tri KWIC (L1, L2, R1, R2), taille de contexte configurable et mode lecture.

Filtres par métadonnées

Filtrez votre corpus par auteur, date, genre ou toute colonne du fichier d'origine. Multi-sélection, filtres en cascade, conservés entre les pages.

Cooccurrences

Découvrez les mots qui apparaissent souvent ensemble. Cinq mesures statistiques et un empan configurable pour analyser les associations lexicales.

N-grammes

Identifiez les expressions et séquences de mots récurrentes, de 2 à 5 mots. Basculez entre lemme et forme de surface.

Recherche de proximité

Trouvez les phrases où deux mots apparaissent proches. Contrôlez la distance, l'ordre et filtrez par catégorie grammaticale.

Entités nommées

Détectez automatiquement les personnes, lieux et organisations dans votre corpus. Filtrez par type et consultez les phrases.

Recherche de motifs

Construisez des séquences de mots avec des catégories, lemmes et écarts. Trouvez tous les motifs linguistiques dans votre corpus.

Annotation manuelle

Ajoutez vos propres colonnes au tableau de concordance pour classer chaque occurrence. Texte libre ou liste de choix, inclus dans l'export CSV.

Mots-clés

Découvrez les mots spécifiques à votre corpus par rapport au français général. Score de spécificité et taille d'effet.

Comment ça marche

1

Importez

Déposez votre fichier, choisissez la colonne texte ou les pages du PDF. Le traitement linguistique démarre automatiquement.

2

Explorez

Parcourez le lexique, les concordances, les n-grammes et les cooccurrences. Filtrez par catégorie grammaticale et exportez en CSV.

3

Analysez

Recherchez deux mots proches, explorez les associations lexicales et lancez une analyse sémantique avec graphe interactif.

Des questions ? Consultez la FAQ ou la documentation.