Partager via


Cas d'utilisation pour la reconnaissance d’entités nommées personnalisées

Important

Les traductions non anglaises sont fournies uniquement pour des raisons pratiques. Veuillez consulter la version EN-US de ce document pour la version faisant foi.

Qu’est-ce qu’une note de transparence ?

Un système d’IA comprend non seulement la technologie, mais aussi ses utilisateurs, les personnes concernées et l’environnement dans lequel elle est déployée. Créer un système adapté à l’objectif visé exige de bien comprendre comment la technologie fonctionne, de connaître ses capacités et ses limites et de savoir comment atteindre le meilleur niveau de performance.

Microsoft propose des notes de transparence pour vous aider à comprendre comment fonctionne notre technologie IA. Elles traitent notamment des choix que les propriétaires de système peuvent faire et qui influencent le niveau de performance et le comportement du système, et l’importance d’appréhender le système dans son ensemble, en englobant la technologie, les personnes et l’environnement. Vous pouvez utiliser les notes de transparence pendant le développement ou le déploiement de votre propre système ou les partager avec les personnes qui utiliseront votre système ou qui seront affectées par celui-ci.

Les notes de transparence s’inscrivent dans une optique plus large de Microsoft de mettre en pratique ses principes d’IA. Pour en savoir plus, consultez les principes de l’IA de Microsoft.

Présentation de la reconnaissance d’entités nommées personnalisées

La reconnaissance d’entité nommée personnalisée (NER personnalisé) est un service d’API basé sur le cloud pour l’extraction d’informations. Le service applique l’intelligence machine learning afin de créer des modèles personnalisés pour les tâches d’extraction d’informations.

Le NER personnalisé peut être utilisé pour extraire des informations à partir de fichiers .txt. Par exemple, une institution financière peut vouloir créer un système de notification automatisé pour rappeler aux clients leurs paiements. L’organisation utilise le NER personnalisé pour extraire les informations pertinentes des contrats de prêt, telles que le nom du client, le montant du prêt, le taux d’intérêt et la date de paiement. Le système peut traiter davantage les entités extraites pour envoyer un rappel au client avec la date et le montant du paiement suivants.

Principes de base de la reconnaissance d’entité nommée personnalisée

La reconnaissance d’entité nommée personnalisée permet à ses utilisateurs de créer des modèles Machine Learning personnalisés pour extraire des entités spécifiques au domaine à partir de texte non structuré, tels que des contrats ou des documents financiers.

En créant un projet NER personnalisé, les développeurs peuvent étiqueter de manière itérative des entités au sein des données, entraîner, évaluer et améliorer les performances du modèle avant de les rendre disponibles pour la consommation. La qualité des données étiquetées affecte considérablement les performances du modèle. Pour simplifier la création et la personnalisation de votre modèle, le service propose un portail web personnalisé accessible via Language Studio.

Terminologie NER personnalisée

Les termes suivants sont couramment utilisés avec cette fonctionnalité :

Terme Définition
Projet Un projet est un domaine de travail permettant de créer vos modèles ML personnalisés en fonction de vos données. Vous et les autres personnes qui disposent d’un accès à la ressource Azure utilisée peuvent accéder à votre projet. Dans un projet, vous pouvez baliser des entités dans les données, générer des modèles, évaluer et améliorer les modèles si nécessaire, puis déployer un modèle. Vous pouvez avoir plusieurs modèles au sein de votre projet, tous basés sur le même jeu de données.
Modèle Un modèle est un objet formé pour effectuer une certaine tâche, dans ce cas la reconnaissance d’entité personnalisée. Les modèles sont entraînés en fournissant des données étiquetées pour permettre ensuite leur utilisation dans des tâches de reconnaissance.
Entité Une entité est une étendue de texte qui indique un certain type d’informations. L’étendue de texte peut se composer d’un ou plusieurs mots. Dans l’étendue du NER personnalisé, les entités représentent les informations que l’utilisateur souhaite extraire du texte. Les développeurs étiquetent des entités au sein de leurs données avec les entités nécessaires avant de les transmettre au modèle pour l’entraînement. Par exemple , « Numéro de facture », « Date de début », « Numéro d’expédition », « Lieu de naissance », « Ville d’origine », « Nom du fournisseur » ou « Adresse du client ».

Exemples de cas d’utilisation

Voici quelques exemples de cas où vous pouvez utiliser un NER personnalisé :

  • Exploration de connaissances pour améliorer la recherche sémantique : La recherche est fondamentale pour n’importe quelle application qui expose le contenu texte aux utilisateurs. Les scénarios courants incluent la recherche dans des catalogues ou des documents, la recherche de produits de vente au détail ou l’exploration de connaissances pour la science des données. De nombreuses entreprises issues de divers secteurs souhaitent créer une expérience de recherche enrichie à partir d’un contenu privé hétérogène comprenant à la fois des documents structurés et des documents non structurés. Dans le cadre de leur pipeline, les développeurs peuvent utiliser une NER personnalisée afin d’extraire du texte les entités pertinentes pour leur secteur d’activité. Ces entités peuvent être utilisées pour enrichir l’indexation du fichier afin d’offrir une expérience de recherche plus personnalisée.

  • Extraction d’informations à partir d’un texte non structuré : De nombreuses organisations financières et juridiques extraient et normalisent des données provenant de milliers de sources de texte complexes et non structurées quotidiennement. Ces sources incluent les relevés bancaires, les accords juridiques ou les formulaires bancaires. Par exemple, l’extraction des données d’application hypothécaire effectuée manuellement par des réviseurs humains peut prendre plusieurs jours. L’automatisation de ces étapes simplifie le processus et réduit les coûts, le temps et l’effort.

  • Audit et conformité : Au lieu d’examiner manuellement des fichiers texte beaucoup longs pour auditer et appliquer des stratégies, les services informatiques des entreprises financières ou juridiques peuvent utiliser NER personnalisé pour créer des solutions automatisées. Ces solutions peuvent permettre d’appliquer les stratégies de conformité et de configurer les règles d’entreprise nécessaires en fonction des pipelines d’extraction de connaissances qui traitent des contenus structurés et non structurés.

Aspects à prendre en considération lors du choix d’un cas d’usage de l’analyse spatiale

Tenez compte des conseils suivants lorsque vous utilisez un NER personnalisé :

  • Évitez d’utiliser l’NER personnalisé pour les décisions susceptibles d’avoir des répercussions négatives graves. Par exemple, évitez les scénarios qui incluent un diagnostic médical fondé sur des informations extraites du formulaire de l’historique médical d’un individu, ou en débitant le compte bancaire d’un utilisateur en fonction des valeurs extraites. De plus, il est conseillé d’inclure l’examen humain des décisions susceptibles d’avoir des répercussions graves sur les individus.

  • Évitez de créer des entités personnalisées qui extraient des informations inutiles ou sensibles. Évitez d’extraire des informations utilisateur sensibles s’il n’est pas nécessaire pour votre cas d’usage. Par exemple, si votre scénario nécessite l’extraction de la ville et du pays de votre utilisateur, créez des entités qui extraient uniquement la ville et le pays à partir de l’adresse d’un utilisateur au lieu d’extraire l’adresse entière

  • Considérations juridiques et réglementaires : les organisations doivent évaluer des obligations légales et réglementaires spécifiques potentielles lors de l’utilisation de services et de solutions IA, ce qui peut ne pas convenir à une utilisation dans chaque secteur ou scénario. En outre, les services ou solutions IA ne sont pas conçus pour et peuvent ne pas être utilisés de manière interdite en termes de service applicables et codes de conduite pertinents.

Étapes suivantes