Paramètres supportés
Plusieurs paramètres sont disponibles pour mieux répondre à vos besoins, qui doivent être ajoutés dans votre charge utile de requête :guided_choice
: la sortie sera exactement l’un des choix proposés.guided_regex
: la sortie suivra le modèle regex.guided_json
: la sortie suivra le schéma JSON.
Choix Guidés
Utilisez le paramètreguided_choice
pour forcer un modèle à choisir l’une des options que vous définissez.Voici un exemple ci-dessous.
Exemple de Choix Guidés
Exemple de Choix Guidés
positif
.Regex Guidée
Utilisez le paramètre guided_regex pour générer du texte suivant un modèle regex.Voici un exemple ci-dessous.
Exemple de Regex Guidée
Exemple de Regex Guidée
alan_turing@enigma.com
par exemple.Intégrité et Validation des DonnéesLe schéma JSON maintient une haute qualité des données en appliquant une structure prédéfinie et des règles de validation, minimisant le besoin de vérifications supplémentaires.
Créez votre Schéma JSON
Vous avez 2 possibilités pour créer votre schéma JSON :- Créer manuellement un schéma JSON : vous pouvez trouver un guide étape par étape ici.
- Définir un modèle Pydantic et en extraire le schéma JSON.
Le Rôle des Séquences d’Arrêt
Les séquences d’arrêt sont essentielles dans les tâches de données structurées, marquant la fin des réponses du modèle pour maintenir les sorties dans la structure de votre schéma.Séquence d’Arrêt ObligatoireUtilisez toujours une séquence d’arrêt appropriée d’un modèle (par défaut pour
mistral
c’est stop=["</s>"]
) pour garantir une terminaison précise de la sortie du modèle, en l’alignant avec votre schéma JSON.Exemple de code
Les exemples suivants montrent comment utiliser le paramètreguided_json
avec un schéma JSON explicite ainsi qu’avec un modèle Pydantic.
JSON Guidé : Schéma Explicite
JSON Guidé : Schéma Explicite
JSON Guidé : Modèle Pydantic
JSON Guidé : Modèle Pydantic
Exploiter la Correspondance de ModèlesUtilisez l’attribut
pattern
dans le schéma JSON pour définir des expressions régulières (regex) pour faire correspondre des formats de texte spécifiques. La regex (.+)
est particulièrement utile pour capturer des segments de texte variés, permettant une extraction précise des informations souhaitées à partir de textes. Cette fonctionnalité est essentielle pour analyser des points de données spécifiques à partir de texte non structuré ou semi-structuré.Utilisation des Données Extraites
Exploitez les données structurées de vos extractions pour enrichir les bases de données, les systèmes CRM, ou automatiser les flux de travail, améliorant ainsi l’efficacité opérationnelle.Correspondance de Modèles PréciseVérifiez que les modèles regex de votre schéma JSON s’alignent avec les formats attendus de votre texte. Des incompatibilités peuvent entraîner des erreurs d’extraction de données ou des inexactitudes.En utilisant le schéma JSON, vous pouvez transformer efficacement du texte non structuré en données structurées et exploitables, offrant une solution évolutive pour vos besoins de traitement de données.
Conclusion
Les sorties structurées enrichissent l’expérience utilisateur avec un contenu détaillé et garantissent la cohérence des données à l’échelle de l’application. C’est crucial pour les applications qui dépendent de l’intégrité des données structurées.Pièges Courants
- L’exclusion de propriétés de schéma nécessaires peut entraîner des sorties de données partielles.
- L’imposition de contraintes trop strictes peut restreindre la capacité de l’IA à produire du contenu pertinent.
- Négliger d’inclure des séquences d’arrêt dans les appels API peut causer des problèmes de traitement.