FAQ

Tout ce qu'il faut savoir pour bien démarrer. Voir aussi la Documentation.

Question
#1
À quoi sert SA7BY® ?
SA7BY® est une plateforme d'analyse de corpus français. Importez vos textes, explorez les annotations linguistiques mot par mot, consultez les phrases en contexte et lancez des analyses sémantiques, le tout depuis une seule interface.
Question
#2
Pour qui est SA7BY® ?
Pour les chercheurs, enseignants-chercheurs, doctorants et étudiants avancés en linguistique de corpus, textométrie et humanités numériques.
Question
#3
Quels formats de fichier puis-je importer ?
CSV, Excel (.xlsx), XML (export Frantext) et PDF. Pour les fichiers tabulaires, choisissez les colonnes contenant le texte. Pour les PDF, sélectionnez la première et la dernière page à analyser, ou laissez le nombre maximum de phrases faire le travail.
Question
#4
Comment fonctionne le traitement d'un corpus ?
Après l'import, le texte est découpé en phrases puis analysé automatiquement : lemmatisation, catégories grammaticales (POS), dépendances syntaxiques. Vous suivez l'avancement en temps réel. Le traitement utilise un modèle transformer français de haute précision.
Question
#5
Qu'est-ce que la vue concordance ?
La vue concordance affiche chaque occurrence d'un mot avec son contexte gauche et droit. Vous pouvez aussi ouvrir un mode lecture pour voir les phrases voisines et mieux comprendre l'usage du mot dans le texte.
Question
#6
Puis-je filtrer par plusieurs catégories grammaticales ?
Oui. Le filtre POS est multi-sélection : choisissez par exemple Noms + Verbes pour ne voir que ces catégories dans le lexique ou les concordances. Vous pouvez aussi affiner par sous-catégorie : temps des verbes, genre, nombre, type de déterminant (défini, possessif, démonstratif), et plus encore.
Question
#7
Comment fonctionne l'analyse sémantique ?
Entrez un mot français et la plateforme combine deux sources: WOLF et FastText, pour révéler synonymes, hyperonymes, hyponymes et mots proches dans un graphe interactif.
Question
#8
Combien de temps prend le traitement ?
Cela dépend de la taille du corpus. Un PDF de 100 pages prend généralement 2 à 5 minutes. Vous pouvez naviguer librement sur la plateforme pendant le traitement.
Question
#9
Dois-je me connecter pour utiliser SA7BY® ?
Oui. L'espace d'analyse est protégé par un code PIN. Les pages publiques (accueil, FAQ, documentation) restent accessibles sans connexion.
Question
#10
Mes données sont-elles sécurisées ?
Oui. Vos corpus et analyses sont privés et accessibles uniquement avec votre session. Rien n'est partagé ou rendu public.
Question
#11
Qu'est-ce que la page Cooccurrences ?
La page Cooccurrences montre les mots qui apparaissent fréquemment avec un mot donné. Vous pouvez choisir parmi cinq mesures statistiques (MI, T-score, Z-score, Dice, Fréquence) et ajuster la distance de recherche. Un encadré explique chaque mesure.
Question
#12
À quoi servent les N-grammes ?
Les n-grammes révèlent les séquences de mots récurrentes dans votre corpus (de 2 à 5 mots). Par exemple, « il y a » ou « c'est un ». Vous pouvez basculer entre la forme canonique (lemme) et la forme telle qu'écrite.
Question
#13
Comment fonctionne la recherche de proximité ?
Entrez deux mots et trouvez toutes les phrases où ils apparaissent proches l'un de l'autre. Vous pouvez régler la distance maximale, imposer un ordre (A avant B ou l'inverse) et filtrer par catégorie grammaticale pour chaque mot.
Question
#14
Comment filtrer par auteur ou par date ?
Si votre fichier contient des colonnes comme l'auteur, la date ou le genre, vous pouvez les utiliser pour filtrer votre corpus. Les filtres apparaissent automatiquement sur chaque page d'analyse. Sélectionnez un ou plusieurs auteurs, une période ou un genre, et toutes les statistiques se recalculent instantanément. Vos filtres sont conservés quand vous naviguez entre les pages.
Question
#15
Puis-je annoter les occurrences d'un mot ?
Oui. Dans le tableau de concordance, cliquez sur l'icône engrenage pour ajouter vos propres colonnes d'annotation (texte libre ou liste de choix). Annotez chaque occurrence, puis exportez le tout en CSV avec vos annotations.
Question
#16
Puis-je exporter les résultats ?
Oui. Chaque page dispose d'un bouton de téléchargement qui exporte les données au format CSV, compatible Excel. Si des filtres sont actifs, seules les données filtrées sont exportées. Les colonnes d'annotation sont incluses dans l'export des concordances.
Question
#17
Qu'est-ce que le nuage de mots ?
Le nuage de mots est une visualisation dans le Lexique qui affiche les mots les plus fréquents. Plus un mot est gros, plus il est fréquent. Les couleurs correspondent aux catégories grammaticales. Cliquez sur un mot pour voir ses concordances.
Question
#18
Par où commencer ?
Connectez-vous, importez un fichier sur la page Import, puis explorez le lexique et les phrases dans la Bibliothèque. Pour aller plus loin, consultez les cooccurrences, les n-grammes ou lancez une analyse sémantique.

À quoi sert SA7BY® ?

Pour qui est SA7BY® ?

Quels formats de fichier puis-je importer ?

Comment fonctionne le traitement d'un corpus ?

Qu'est-ce que la vue concordance ?

Puis-je filtrer par plusieurs catégories grammaticales ?

Comment fonctionne l'analyse sémantique ?

Combien de temps prend le traitement ?

Dois-je me connecter pour utiliser SA7BY® ?

Mes données sont-elles sécurisées ?

Qu'est-ce que la page Cooccurrences ?

À quoi servent les N-grammes ?

Comment fonctionne la recherche de proximité ?

Comment filtrer par auteur ou par date ?

Puis-je annoter les occurrences d'un mot ?

Puis-je exporter les résultats ?

Qu'est-ce que le nuage de mots ?

Par où commencer ?