SA7BY® est un laboratoire NLP pour les corpus tabulaires : importez un fichier Excel ou CSV, choisissez la colonne qui contient votre texte, puis lancez la tokenisation, les lemmes, les POS et les dépendances en arrière-plan, puis explorez l'analyse sémantique avec WordNet, WOLF, ConceptNet et FastText.

Une plateforme dédiée à l'analyse de corpus français

SA7BY® aide les chercheurs et doctorants à passer des exports tableurs à une exploration linguistique structurée. Vous pouvez importer un corpus, inspecter les annotations token par token, explorer le contexte des phrases et lancer des analyses sémantiques avec WordNet, WOLF, ConceptNet et FastText.

La plateforme est pensée pour des workflows reproductibles en linguistique de corpus et en humanités numériques : de colonnes texte brutes vers des tokens lemmatisés, des POS tags, des dépendances et des voisinages sémantiques utiles pour l'interprétation.

Besoin d'un apercu rapide ? Consultez la FAQ pour les questions fréquentes sur les fonctionnalités, l'accès et le workflow.

Importer et traiter

Importez des corpus CSV/Excel et traitez vos colonnes texte avec un enrichissement linguistique automatique.

Explorer les tables de tokens

Parcourez les lemmes, POS tags et dependances avec filtres et recherche sur votre corpus.

Analyse sémantique

Analysez les mots français avec des réseaux lexicaux, voisins proches et vues graphe sémantiques.

Workflow type

Étape 1

Importer

Importez votre corpus puis lancez le traitement linguistique de la colonne choisie.

Étape 2

Explorer

Parcourez les tables de tokens, filtrez lemmes et POS, puis ouvrez le contexte des phrases.

Étape 3

Analyser

Lancez l'analyse sémantique sur des termes cibles et inspectez les relations lexicales.