Import intelligent
CSV, Excel ou PDF. Prévisualisez les colonnes ou les pages, choisissez votre source et lancez le traitement.
SA7BY® est un laboratoire NLP pour les corpus tabulaires : importez un fichier Excel ou CSV, choisissez la colonne qui contient votre texte, puis lancez la tokenisation, les lemmes, les POS et les dépendances en arrière-plan, puis explorez l'analyse sémantique avec WOLF et FastText.
Importez un fichier CSV, Excel, XML ou PDF. En quelques minutes, chaque mot est annoté, chaque phrase est en contexte. Explorez les cooccurrences, les n-grammes, la proximité entre mots et les relations sémantiques. Exportez vos résultats en CSV à tout moment.
Conçu pour les chercheurs en linguistique, textométrie et humanités numériques.
CSV, Excel ou PDF. Prévisualisez les colonnes ou les pages, choisissez votre source et lancez le traitement.
Tous les mots de votre corpus triés par fréquence ou alphabétiquement. Filtre multi-POS, nuage de mots interactif et export CSV.
Chaque occurrence d'un mot avec son contexte gauche et droit. Tri KWIC (L1, L2, R1, R2), taille de contexte configurable et mode lecture.
Filtrez votre corpus par auteur, date, genre ou toute colonne du fichier d'origine. Multi-sélection, filtres en cascade, conservés entre les pages.
Découvrez les mots qui apparaissent souvent ensemble. Cinq mesures statistiques et un empan configurable pour analyser les associations lexicales.
Identifiez les expressions et séquences de mots récurrentes, de 2 à 5 mots. Basculez entre lemme et forme de surface.
Trouvez les phrases où deux mots apparaissent proches. Contrôlez la distance, l'ordre et filtrez par catégorie grammaticale.
Détectez automatiquement les personnes, lieux et organisations dans votre corpus. Filtrez par type et consultez les phrases.
Construisez des séquences de mots avec des catégories, lemmes et écarts. Trouvez tous les motifs linguistiques dans votre corpus.
Ajoutez vos propres colonnes au tableau de concordance pour classer chaque occurrence. Texte libre ou liste de choix, inclus dans l'export CSV.
Découvrez les mots spécifiques à votre corpus par rapport au français général. Score de spécificité et taille d'effet.
Déposez votre fichier, choisissez la colonne texte ou les pages du PDF. Le traitement linguistique démarre automatiquement.
Parcourez le lexique, les concordances, les n-grammes et les cooccurrences. Filtrez par catégorie grammaticale et exportez en CSV.
Recherchez deux mots proches, explorez les associations lexicales et lancez une analyse sémantique avec graphe interactif.
Des questions ? Consultez la FAQ ou la documentation.