AI Series 6: Intelligence Artificielle et Alimentation des Données : Comment commercialiser des « données » pour les licences IA ?
Auteurs
1. La licence de données IA est-elle attrayante pour tout le monde ?
Vous pourriez penser que vendre ou de licencier vos données à un fournisseur d'outils IA n'est pas votre domaine d'activité, puisque vous ne travaillez pas dans l'industrie du logiciel ou que vous n'êtes pas aussi grand que les géants de la technologie et ne possédez pas une quantité substantielle de données. Vous pourriez vous tromper. Même une entreprise non numérique (PME) peut détenir des informations ou des données précieuses pour l'IA (par exemple, un fournisseur d'électricité qui sait quand et pourquoi l'électricité est utilisée par quel utilisateur, dans quelle région, à quel degré et à quelle fréquence, toutes ces informations pouvant fournir des perspectives sur les planifications énergétiques prédictives dans une ville suisse). Considérez donc la valeur de vos données en premier lieu. Vous pourriez être assis sur un trésor sans le savoir.
2. Avant de décider de partager ou de licencier des données à un fournisseur d'outils IA, que dois-je faire ?
Vous devez considérer qui possède les données, techniquement parlant. Bien sûr, vous « avez » les données, mais cela ne signifie pas que vous avez le droit de les vendre ou de les divulguer à un tiers. Les données pertinentes peuvent vous avoir été confiées de manière confidentielle, ce qui ne vous permet pas de les divulguer à des tiers. Cela peut également avoir des implications pénales, par exemple, trahir un secret commercial que vous êtes tenu de protéger peut être puni par le droit pénal suisse (Art. 162 du Code pénal suisse). Considérez également que vos données peuvent être protégées par des droits d'auteur de tiers (par exemple, des textes d'auteurs ou des photographies) et ne peuvent donc pas être dupliquées ou partagées avec d'autres sans une licence respective. Plus important encore, assurez-vous de qualifier la nature de vos données : s'agit-il de données personnelles (c'est-à-dire relatives à une personne identifiable) ou non ? Si oui, vous devez prendre en compte les implications de la confidentialité des données de votre partage de données envisagé. Avez-vous informé les individus au préalable que vous pourriez partager des données avec des tiers à des fins d'apprentissage automatique (et expliqué grossièrement quel type d'analyse de données sera réalisé à quelles fins spécifiques d'apprentissage automatique) ? Cela peut ne pas être simple à évaluer, et il est essentiel de recueillir autant d'informations que possible auprès du fournisseur d'outils d'IA pour comprendre ses activités prévues. Ensuite, assurez-vous de mettre en place tous les cadres nécessaires pour garantir la transparence et le respect des droits des individus concernés. Enfin, n'oubliez pas de prendre en compte les questions de concurrence et d'antitrust : comme vous le savez peut-être, les données ne doivent généralement pas être partagées entre concurrents sur le marché si cela facilite une collusion en matière de prix, de quantités ou de territoires.
3. D'accord, cela semble difficile. La licence de données IA est-elle légale ?
Ce qui a été discuté dans la Section 2 peut vous sembler être un champ de mines juridique. Cependant, cela ne signifie pas nécessairement que s'engager dans le partage de données est impossible. Les problèmes diagnostiqués ci-dessus sont surmontables s'ils sont soigneusement considérés d'un point de vue juridique. En outre, envisagez l'option de « anonymiser » complètement les données pertinentes comme une couche supplémentaire de conformité. Dans ce cas, n'oubliez pas que l'anonymisation doit être permanente et irréversible pour en bénéficier (le fournisseur d'outils IA ne doit pas être en mesure de désanonymiser les données avec une clé appropriée).
4. D'accord, j'ai pris ma décision. Qu'est-ce qu'un accord de licence de données IA et comment dois-je procéder pour en rédiger un ?
Un accord de licence est essentiellement un « droit d'utilisation » accordé à quelqu'un. En d'autres termes, vous pouvez accorder à quelqu'un un droit d'utiliser vos données pour un champ d'application, un territoire et une durée spécifiques et êtes même libre d'imposer certaines formes de restrictions d'utilisateur en plus. Très honnêtement, vous pouvez surfer sur Internet et trouver quelques modèles et envisager d'utiliser des fragments, mais ils ne conviendront pas tous, ni l'ensemble ne ressemblera à un accord reflétant vos besoins et risques particuliers. Par conséquent, permettez-nous de vous donner une idée globale des clauses auxquelles vous devriez prêter attention :
- Définir le contenu de vos données et la préparation du format et la structure lors du partage : De quoi parlent vos données, quelles caractéristiques ont-elles ? Répondront-elles à certains critères de qualité (par exemple, êtes-vous en mesure de garantir que vos données seront précises ou préférez-vous dire non à cela ?) ? Envisagez si les données seront fournies en une fois ou si vous seriez prêt à partager vos données de manière continue. Par exemple, si les métriques de vos données sont mises à jour régulièrement, seriez-vous disposé à fournir ces informations de suivi. En termes de format et de structure, discutez avec le fournisseur d'outils IA du format requis par lui et, pour l'ordre, assurez-vous d'étiqueter les ensembles de données individuels (par exemple, avec des numéros ou des valeurs de hachage). Les données ne sont utiles pour le fournisseur d'outils IA que s'il peut utiliser le format pertinent et si elles sont compatibles avec d'autres formats de données qu'il peut avoir reçues d'autres vendeurs de données. Réfléchissez également à la manière dont vous souhaitez partager les données : envisagez-vous de les transférer directement au fournisseur d'outils d'IA, ou préférez-vous simplement lui accorder un accès en lecture seule à vos données stockées ?
- Aborder les questions de confidentialité des données et de propriété intellectuelle : Le fournisseur d'outils IA peut-il supposer que vos données contiennent des données personnelles ou qu'elles sont pseudonymisées ou anonymisées ? Afin de vous protéger de la responsabilité liée à la confidentialité des données, vous devriez idéalement stipuler que le fournisseur d'outils IA empêchera la réidentification des données personnelles. En tout état de cause, si une réidentification se produisait (par exemple par coïncidence via des analyses de big data), alors le fournisseur d'outils IA devrait s'engager à se conformer à toutes les dispositions pertinentes des lois sur la protection des données vis-à-vis de l'individu respectif concerné. Vos données sont-elles protégées par des droits d'auteur ou contiennent-elles des secrets commerciaux ou sont-elles grevées d'engagements de confidentialité ? Si oui, vous devez vous assurer non seulement que votre divulgation de données est approuvée par les propriétaires des droits concernés, mais aussi que le fournisseur d'outils IA ne peut pas redistribuer ces données à des tiers, mais les utiliser uniquement à des fins internes.
- Portée de la licence : Dans quelle mesure et à quelles fins le fournisseur d'outils IA peut-il utiliser les données pertinentes ? N'oubliez pas que c'est à vous de le définir en tant que propriétaire de vos données. Alors que le fournisseur d'outils IA peut être intéressé par le champ d'application le plus large possible (pour diverses raisons), il peut être dans votre intérêt de restreindre la portée de la licence. Par exemple, vous pourriez ne pas vouloir autoriser certaines formes d'utilisation d'un point de vue commercial (parce que votre tarification ne prend pas en compte ces formes d'utilisation) ou parce qu'elles pourraient être contraires à l'éthique. Considérez également l'aspect de la sous-licence. Voulez-vous permettre que les données soient transférées du fournisseur d'outils IA à des tiers ou non ? Considérez que vous perdez le contrôle sur l'utilisation de vos données, plus vous permettez de sous-licences et que cela a également un impact commercial sur la valeur de votre licence.
- Paiement : Diverses formes de compensation peuvent être convenues pour l'octroi d'une licence de données IA. Une divulgation unique de données est plus susceptible d'être compensée par un paiement initial tandis qu'un accès périodique aux données stockées dans votre dépôt ou une fourniture régulière de mises à jour de données sont plus susceptibles d'être compensés par des frais récurrents. D'autres modèles de rémunération sont envisageables. Par exemple, si les données ne sont pas transférées au fournisseur d'outils IA du tout, mais simplement rendues accessibles au sein d'un « pool de données », un modèle « pay per use » est également envisageable (basé sur la quantité et/ou l'intensité de l'utilisation des données).
- Garanties, engagements, responsabilité : Le fournisseur d'outils IA peut demander une garantie que vous avez des droits suffisants pour accorder le droit d'utiliser les données respectives et que vous avez obtenu toutes les approbations nécessaires ou fourni toutes les informations nécessaires aux individus concernés. En retour, assurez-vous également d'obtenir une garantie bilatérale : le fournisseur d'outils IA doit déclarer et garantir qu'il n'utilisera les données que pour les fins autorisées en vertu de l'octroi des droits. Sécurité informatique ? Si des données anonymisées ont été rendues accessibles, vous devez demander un engagement qu'il n'entreprendra pas de pratiques de réidentification et/ou vous informera si cela s'est produit accidentellement. En fonction de la quantité de données divulguées par vous au fournisseur d'outils IA, votre exposition au risque pourrait être trop élevée en termes de précision et de qualité des données. Assurez-vous donc de limiter vos garanties (par exemple, les données ne sont fournies que « telles quelles ») et la responsabilité à cet égard (par exemple, en fixant des plafonds sur les dommages récupérables ou sur la « pertinence » de vos données).
- Cybersécurité et/ou droits d'audit : Le fournisseur d'outils IA doit être tenu de traiter vos données avec soin et avec des mesures de sécurité en place contre les tiers non autorisés. Plus les données que vous partagez sont sensibles et personnelles (voir ci-dessus), plus vous devez non seulement vous fier aux garanties et aux engagements contractuels, mais simplement ajouter des exigences spécifiques de cybersécurité à la « to-do list » du fournisseur d'outils IA. Bien que vous ne puissiez pas toujours appliquer cela, un droit d'audit régulier vous fournira un outil pour évaluer de temps à autre si le fournisseur d'outils IA prend ces choses au sérieux ou non. En cas d'inexactitudes détectées lors d'un audit, le fournisseur d'outils IA devrait être tenu de supporter les coûts.
- Durée et résiliation : Vous pourriez dire que la durée et la résiliation sont des dispositions de base habituelles. C'est vrai. Mais rappelez-vous que dans le contexte de la licence IA, la résiliation est un outil efficace pour faire respecter la conformité. Si vous remarquez que votre licencié utilise les données de manière inadéquate, une résiliation anticipée sera un outil puissant pour le discipliner. Certaines conditions de licence préfèrent même conditionner la licence au respect de toutes les conditions de licence, ce qui la rendra invalide automatiquement en cas de déclenchement d'un événement de non-conformité (comme cela est souvent vu dans les termes des logiciels open source). C'est un autre moyen de faire respecter les termes de la licence IA de manière plus directe. La durée du contrat elle-même est en effet un aspect commercial influençant la valeur du contrat et doit être reflétée dans l'offre de prix également.
- Assurance : Envisagez si le fournisseur d'outils IA doit fournir une preuve d'une assurance adéquate en place pour s'assurer qu'il peut réellement supporter les coûts de responsabilité qu'il assume en tant que risques en vertu de ses propres garanties.
5. Tout cela semble compliqué et chronophage. Existe-t-il des moyens plus simples et standardisés de faire cela ?
Bien entendu. Ce n'est qu'une question de temps avant que des offres standardisées de grands collecteurs de données IA avec leurs propres termes contractuels émergent. Certains de ces modèles ont déjà émergé dans l'industrie de la musique et surtout dans le secteur des médias sociaux (jetez un œil aux termes de Reddit, un agrégateur de nouvelles sociales qui se réserve le droit d'utiliser vos données partagées à des fins d'analyse IA, ainsi que d'autres plateformes de médias sociaux faisant de même).
Il est également envisageable que de grands agrégateurs collectent à long terme des données sur le marché, les assemblent, puis les concèdent sous licence à des fournisseurs d'outils IA. Dans l'industrie de la musique, ce rôle est déjà prédominant pour les éditeurs de musique, qui par exemple, signent des auteurs-compositeurs et concèdent des licences de contenu à des organisations de droits collectifs, des maisons de disques et des entreprises de médias. Dans ce contexte, vous pourriez probablement « vendre » vos données à de tels grands collecteurs de données pour qu'ils les commercialisent pour vous ou en leur propre nom.
Des accords standardisés devraient également émerger de la communauté open source. Cela vous permettrait, en tant que propriétaire de données, de divulguer le contenu sous une licence open source connue (vous devriez indiquer cela quelque part en ligne avec « sous licence selon les termes OSS de [nom de l'organisation OSS] avec les termes de licence disponibles sous [lien]). Néanmoins, du point de vue d'un propriétaire de données, ce modèle pourrait être moins attractif car il vous empêcherait de générer des revenus.
Perspective
La licence de données IA est une tendance émergente de la licence qui nécessitera une attention accrue à l'avenir. Bien qu'il existe des connaissances sur les accords de licence traditionnels, la licence de données IA est un peu plus complexe et doit être traitée avec les délicatesses requises par la nature légèrement différente des « données » et le potentiel moins prévisible de l'IA pour exploiter ces données