Question
#1SA7BY® est une plateforme d'analyse de corpus français. Importez vos textes, explorez les annotations linguistiques mot par mot, consultez les phrases en contexte et lancez des analyses sémantiques, le tout depuis une seule interface.
Question
#2Pour les chercheurs, enseignants-chercheurs, doctorants et étudiants avancés en linguistique de corpus, textométrie et humanités numériques.
Question
#3CSV, Excel (.xlsx), XML (export Frantext) et PDF. Pour les fichiers tabulaires, choisissez les colonnes contenant le texte. Pour les PDF, sélectionnez la première et la dernière page à analyser, ou laissez le nombre maximum de phrases faire le travail.
Question
#4Après l'import, le texte est découpé en phrases puis analysé automatiquement : lemmatisation, catégories grammaticales (POS), dépendances syntaxiques. Vous suivez l'avancement en temps réel. Le traitement utilise un modèle transformer français de haute précision.
Question
#5La vue concordance affiche chaque occurrence d'un mot avec son contexte gauche et droit. Vous pouvez aussi ouvrir un mode lecture pour voir les phrases voisines et mieux comprendre l'usage du mot dans le texte.
Question
#6Oui. Le filtre POS est multi-sélection : choisissez par exemple Noms + Verbes pour ne voir que ces catégories dans le lexique ou les concordances. Vous pouvez aussi affiner par sous-catégorie : temps des verbes, genre, nombre, type de déterminant (défini, possessif, démonstratif), et plus encore.
Question
#7Entrez un mot français et la plateforme combine deux sources: WOLF et FastText, pour révéler synonymes, hyperonymes, hyponymes et mots proches dans un graphe interactif.
Question
#8Cela dépend de la taille du corpus. Un PDF de 100 pages prend généralement 2 à 5 minutes. Vous pouvez naviguer librement sur la plateforme pendant le traitement.
Question
#9Oui. L'espace d'analyse est protégé par un code PIN. Les pages publiques (accueil, FAQ, documentation) restent accessibles sans connexion.
Question
#10Oui. Vos corpus et analyses sont privés et accessibles uniquement avec votre session. Rien n'est partagé ou rendu public.
Question
#11La page Cooccurrences montre les mots qui apparaissent fréquemment avec un mot donné. Vous pouvez choisir parmi cinq mesures statistiques (MI, T-score, Z-score, Dice, Fréquence) et ajuster la distance de recherche. Un encadré explique chaque mesure.
Question
#12Les n-grammes révèlent les séquences de mots récurrentes dans votre corpus (de 2 à 5 mots). Par exemple, « il y a » ou « c'est un ». Vous pouvez basculer entre la forme canonique (lemme) et la forme telle qu'écrite.
Question
#13Entrez deux mots et trouvez toutes les phrases où ils apparaissent proches l'un de l'autre. Vous pouvez régler la distance maximale, imposer un ordre (A avant B ou l'inverse) et filtrer par catégorie grammaticale pour chaque mot.
Question
#14Si votre fichier contient des colonnes comme l'auteur, la date ou le genre, vous pouvez les utiliser pour filtrer votre corpus. Les filtres apparaissent automatiquement sur chaque page d'analyse. Sélectionnez un ou plusieurs auteurs, une période ou un genre, et toutes les statistiques se recalculent instantanément. Vos filtres sont conservés quand vous naviguez entre les pages.
Question
#15Oui. Dans le tableau de concordance, cliquez sur l'icône engrenage pour ajouter vos propres colonnes d'annotation (texte libre ou liste de choix). Annotez chaque occurrence, puis exportez le tout en CSV avec vos annotations.
Question
#16Oui. Chaque page dispose d'un bouton de téléchargement qui exporte les données au format CSV, compatible Excel. Si des filtres sont actifs, seules les données filtrées sont exportées. Les colonnes d'annotation sont incluses dans l'export des concordances.
Question
#17Le nuage de mots est une visualisation dans le Lexique qui affiche les mots les plus fréquents. Plus un mot est gros, plus il est fréquent. Les couleurs correspondent aux catégories grammaticales. Cliquez sur un mot pour voir ses concordances.
Question
#18Connectez-vous, importez un fichier sur la page Import, puis explorez le lexique et les phrases dans la Bibliothèque. Pour aller plus loin, consultez les cooccurrences, les n-grammes ou lancez une analyse sémantique.