Question:
Retirer les données factuelles du Web et les réorganiser pour les publier sous licence propriétaire?
datasn.io
2015-08-24 11:39:34 UTC
view on stackexchange narkive permalink

De nombreux fragments d'informations et de données chaotiques se répandent sur le Web et il en coûte un bras et une jambe pour les rassembler pour former quelque chose de plus grand et cohérent qui se révélerait beaucoup plus utile.

Est-il légalement viable de récupérer ces données factuelles / informations de différents sites Web, de les compiler et de les réorganiser en tant que bases de données / ensembles de données qui seront ensuite concédés sous une licence licence propriétaire ?

Jusqu'à présent, après quelques recherches, je trouve que les données factuelles ne peuvent pas être protégées par copyright , mais la compilation / structure particulière des données le peut. Cela signifie-t-il que je peux faire n'importe quoi avec les données factuelles récupérées tant que j'ai ma propre organisation / compilation / structure de données ?

Par exemple, je veux créer une entreprise base de données d'informations sur des centaines de sites Web différents, puis réorganiser / restructurer / réindexer radicalement ces différents ensembles de données dans une base de données qui est meilleure que l'une des sources. Puis-je faire une licence propriétaire de cette base de données que j'ai créée?

Je sais que je ne pourrai jamais posséder les données car ce sont des faits simples. Droite? Mais puis-je POSSÉDER l'organisation de données en particulier et en tirer un profit légal?

Nous opérons aux États-Unis, mais les données peuvent provenir de sites Web d'autres continents.

Les commentaires ne sont pas destinés à une discussion approfondie; cette conversation a été [déplacée vers le chat] (https://chat.stackexchange.com/rooms/99259/discussion-on-question-by-datasn-io-scraping-factual-data-off-the-web-and- re-org).
Trois réponses:
gracey209
2015-09-10 21:32:28 UTC
view on stackexchange narkive permalink

D'après votre (vos) question (s), ainsi que vos divers commentaires, je crois comprendre que vous avez deux questions d'ordre général:

1. Y a-t-il une infraction aux lois sur les droits d'auteur si vous utilisez des éléments tels que les titres de livres, de jeux, d'applications, de noms, d'adresses (et tout autre nombre de choses) que vous placerez ensuite dans des ensembles de données qui seront concédés sous licence à des fins commerciales exclusives?

Vous pouvez librement mettre des titres, des noms de personnes, des lieux ou des choses dans des ensembles de données sans craindre d'enfreindre les droits d'auteur ou toute autre loi. C'est clair.

La loi sur les droits d'auteur ne protège pas les noms, titres, phrases courtes ou expressions. Même si un nom, un titre ou une phrase courte est nouveau ou distinctif, il ne peut pas être protégé par le droit d'auteur. Donc, il est inutile de discuter de la doctrine de l'utilisation équitable dans ce contexte, car Fair Use est une défense, ou une sphère de sécurité légale qui est simplement une exception à la violation du droit d'auteur permettant aux personnes d'utiliser un droit d'auteur fonctionne dans des circonstances spécifiques.

Si je comprends bien votre objectif, vous ne violerez aucun droit d'auteur dans la mesure où vous utilisez simplement des données factuelles, comme des noms d'objets protégés par des droits d'auteur, dans le but de créer un ensemble de données ou une application pour vous aider y accéder. C'est pourquoi je dis que vous n'avez pas besoin de vous préoccuper du test d'utilisation équitable en ce qui concerne ce problème.

Le Copyright Office déclare clairement, malgré ce que les gens peuvent penser, qu'il n'y a pas de droits exclusifs dans de brèves combinaisons de mots tels que:

• Noms de produits ou de services • Noms d'entreprises, d'organisations ou de groupes (y compris les noms de groupes d'interprètes) • Pseudonymes d'individus (y compris les noms de stylo ou de scène) • Titres d'œuvres • Mots clés, slogans, devises, slogans ou courtes expressions publicitaires • Listes d'ingrédients, comme dans les recettes, les étiquettes ou les formules. Lorsqu'une recette ou une formule est accompagnée d'une explication ou d'instructions, les instructions du texte peuvent être protégées par le droit d'auteur, mais la recette ou la formule elle-même ne le sont pas.

Par conséquent, ces choses ne sont pas enregistrables sous un droit d'auteur.

Bien que quelque chose puisse être potentiellement attaché ou inclus dans du matériel protégé par le droit d'auteur, n'est pas en soi soumis aux protections de ces lois. Si il (quel qu'il soit) ne peut pas être enregistré pour un droit d'auteur, il n'est pas sous copyright. Parce que l'enregistrement / les avis de droit d'auteur sont facultatifs depuis 1989, lorsque les États-Unis se sont attachés à la Convention de Berne, selon laquelle la protection du droit d'auteur est automatique dès qu'une œuvre est «fixée sur un support d'expression tangible» (écrit, enregistré, peint, etc. .) il est protégé. Aucun avis n'est requis. L'enregistrement n'est requis qu'à des fins de litige ou d'exécution. Mais cela est vraiment étranger à votre demande de toute façon, dans la mesure où cela s'applique aux données réelles. Lorsque vous commencez à copier des bases de données entières à vos fins, cette analyse est différente.

2. Vous souhaitez «nettoyer» Internet à la recherche d'informations que vous avez l'intention de mettre dans vos ensembles de données propriétaires et d'utiliser à des fins commerciales, dont une partie ou la plupart sont déjà dans une base de données ou une forme organisée, et vous voulez savoir s'il existe une sorte des droits d'auteur ou des devoirs appartenant à la personne qui a initialement créé les données?

Étant donné que les idées, procédures, principes, découvertes et appareils sont tous spécifiquement exclus de la protection des droits d'auteur, si vous souhaitez compiler ceci type d'informations provenant d'Internet dans le but de créer des ensembles de données ou des bases de données interrogeables, cela est autorisé.

Cela dit, il existe des protections pour les bases de données existantes en vertu de la loi sur le droit d'auteur, fournies sous le concept de "copyright de compilation". Un droit d'auteur de compilation protège la collecte et l'assemblage créatif de données ou d'autres éléments . Les droits d'auteur de compilation protègent la collecte et l'assemblage de données ou d'autres éléments, de sorte que les bases de données sont généralement protégées par la loi sur le droit d'auteur en tant que compilations.

En vertu de la loi sur le droit d'auteur, une compilation est définie comme «une collection et un assemblage de documents préexistants ou de données sélectionnées de manière à ce que l'œuvre résultante dans son ensemble constitue une œuvre d'auteur originale. " 17. U.S.C. § 101.

Les matériaux ou données préexistants peuvent être protégés par le droit d'auteur puisque les sélections de matériaux et la forme qu'ils prennent dans une base de données existante peuvent être suffisamment originaux pour faire l'objet d'un droit d'auteur. Cependant, les données elles-mêmes ne sont que des informations et ne peuvent pas être protégées.

La loi sur les droits d'auteur stipule spécifiquement que le droit d'auteur d'une compilation s'étend uniquement à la compilation elle-même, et non aux éléments ou données sous-jacents. 17 U.S.C. § 103 b). Par conséquent, les "droits d'auteur de compilation" ne peuvent pas être utilisés pour protéger les éléments qui ne seraient pas autrement protégeables.

Dans le cas de Feist Publications, Inc. c. Rural Telephone Service Company , Inc. , la Cour suprême des États-Unis a statué qu'un travail de compilation tel qu'une base de données doit contenir un niveau minimum de créativité pour pouvoir être protégé en vertu du Copyright Act. Feist indique clairement que même une base de données protégée par le droit d'auteur ne détient pas le droit d'empêcher un individu d'extraire des données factuelles de la base de données (tant que vous ne copiez pas la base de données entière dans son ensemble). Si vous prenez un ensemble de données déjà compilé et protégé par copyright dans son intégralité, vous devez obtenir une licence pour son utilisation. Cependant, si vous ne faites que rassembler de grandes quantités de données pour les mettre ensuite dans votre propre ensemble de données, vous êtes libre de le faire.

Le gros problème sera (et vous semblez vous en rendre compte) vous allez rassembler ces données. Certains sites Web ont des licences spécifiques en place qui indiquent que vous ne pouvez pas utiliser ou retravailler leur contenu. Cependant, souvent, ces sites Web jettent simplement ces exigences de licence pour que les utilisateurs puissent les voir, même si elles ne sont peut-être pas (et certains diraient) qu'elles ne sont pas exécutoires.

Les tribunaux ont entendu des arguments selon lesquels les "contrats" (les licences d'utilisateur final) qui protègent les bases de données et les informations sur les sites Web dépassent la protection offerte par la loi sur le droit d'auteur et devraient être "préemptés" par la loi sur le droit d'auteur elle-même.

Le L'argument de préemption est le suivant: la loi fédérale contrôlant quelque chose qui est soumis au commerce ou à l'utilisation entre États devrait être contrôlée par les lois fédérales. Ainsi, étant donné que le gouvernement fédéral a promulgué la Loi sur le droit d'auteur pour régir toute protection de toute œuvre originale, les États devraient (sans doute sont) interdits d'avoir des lois contradictoires.

En raison de la capacité d'une loi fédérale à préjuger de la loi d'un État et du fait que la loi sur le droit d'auteur à 17 U.S.C. Le § 301 énonce des préemptions spécifiques, aucun État ne peut créer des droits équivalents à l'un des droits exclusifs prévus par la Loi.

C'est ce concept de préemption qui empêche la protection du droit d'auteur de varier en fonction de l'État où une œuvre d'auteur est créée. On peut soutenir qu'il en va de même pour Internet et la prétendue relation contractuelle créée par le biais de licences qui dicte la manière dont le matériel non protégé par le droit d'auteur peut être utilisé.

Dans le cas de ProCD, Incorporated v. Matthew Zeidenberg et Services Web Silken Mountain, Inc. . le tribunal a examiné si un utilisateur final d'une base de données téléphonique sur CD-ROM était soumis à la licence, lorsqu'il a extrait une grande partie de la base de données et l'a mise à disposition sur Internet.

La base de données était presque identique au type de données dans l'affaire Feist-Le tribunal inférieur a rejeté toutes les réclamations pour droits d'auteur et a conclu que la licence d'emballage rétractable qui contrôlait le droit de l'utilisateur final d'utiliser les données était à la fois inapplicable (sous forme de film rétractable licence) et préempté par la Loi sur le droit d'auteur. En conséquence, le créateur de la base de données des téléphones n’était pas soulagé et l’utilisateur final était libre d’extraire les données et de les utiliser à sa guise. Cependant, en appel, cette décision a été annulée (7ème circuit).

La cour d’appel a reconnu que la base de données (sur le CD) n’était pas suffisamment originale pour être protégée par le droit d’auteur (constatant qu’il n’y avait pas de violation du droit d’auteur à la fin -utilisateur); Cependant, ils ont constaté que l'utilisateur final avait rompu le contrat, car la licence sous film rétractable interdisait la conduite de l'utilisateur final.

Ce que cela nous indique, c'est que ces licences (sur des sites Web) peuvent être exécutoires ou non. Alors que le 7ème circuit a trouvé un droit contractuel en vertu de la licence, malgré l'argument de la préemption, une autre cour d'appel plus libérale peut conclure autrement. De plus, il s'agissait d'un disque, et non d'Internet, qui est le «Far West» de l'information, largement non réglementé et non autorisé en ce qui concerne la légalité et l'applicabilité de (certaines) réglementations en vigueur. Les accords de licence pour l'utilisation du site sur Internet sont partout. Si vous prenez une base de données d'un site qui a une licence disant que vous ne pouvez pas prendre leur travail et y ajouter, ou quoi que ce soit, et que vous l'ajoutez à d'autres bases de données qui ne sont pas sous licence et que vous créez votre propre ensemble de données - il y a de fortes chances que vous ne l'êtes PAS va enfreindre les droits d'auteur de quiconque. Cela dit, vous pouvez être en rupture de contrat (la licence) s'ils le découvrent et vous poursuivent en justice (l'utiliser ne vous met pas en violation; seulement être poursuivi et qu'un tribunal détermine que vous êtes en violation vous met Cela peut être une distinction qui vaut la peine d'être examinée, mais cela dépend de vous). Le pari le plus sûr serait d'obtenir une licence de leur part pour retravailler les matériaux. Si le matériel est suffisamment générique et sera suffisamment modifié, que vous créez votre propre nouvelle œuvre (protégée par le droit d'auteur) - je ne sais pas comment ils sauraient que vous "avez nettoyé les données en violation de leur contrat de licence (je n'ai AUCUN indice s'il y a un code ou des métadonnées qui lui sont attachés de telle sorte qu'ils soient identifiables de cette manière. Je n'ai pas d'expérience technique et je n'approuve pas de prendre ce qui n'est pas le vôtre). Mais s'ils le savent et le savent, ils pourraient vous causer des problèmes.

Enfin, je dirai simplement qu'Internet est jonché de sites qui revendiquent des droits d'auteur ou imposent des licences inapplicables sur du matériel prêt à être utilisé par le public. Ce n'est pas parce qu'il dit que c'est le leur. L'inverse est aussi vrai. Ce n'est pas parce qu'un site ne revendique aucun droit d'auteur sur quelque chose qu'il appartient au domaine public.

Je recommanderais de vous en tenir aux sites du domaine public / d'utilisation pour vos efforts de nettoyage, ou de rechercher des autorisations auprès des sites qui imposent des exigences de licence. En dehors de cela, je recommanderais (comme je l'ai déjà fait) de demander un avis juridique formel pour dire que vous n'imposez les droits d'auteur de personne (cela ne pourrait être fait qu'une fois que vous avez montré à un avocat tous les endroits où vous avez pris du matériel, ainsi que ce le matériel est), et que les licences de sites contenant des informations généralisées qui peuvent tenter de limiter l'utilisation, sont inapplicables. Je ferais cela avant que vous n'investissiez beaucoup de temps ou d'argent dans quelque chose qui est largement basé sur l'accumulation du produit du travail d'autres personnes.

Je souhaite qu'il y ait une réponse certaine, mais il n'y en a pas sans tout voir à la fin.

Il vaut toujours la peine de lire une réponse d'@gracey209, ne serait-ce que pour les petites perles, comme: "* Internet est jonché de sites qui revendiquent des droits d'auteur ou imposent des licences inapplicables sur du matériel qui est mûr pour un usage public. Tout simplement parce qu'il dit que c'est le leur le fait pas en faire ainsi. * "
Merci beaucoup pour une réponse aussi approfondie! Il me semble qu'il me faudra quelques jours pour tout digérer.
@kavoir,, vous êtes les bienvenus. Merci pour la prime! Bonne chance. Faites-moi savoir et nous pourrons discuter si vous avez des questions de suivi après avoir tout examiné.
Joe
2015-08-24 21:52:37 UTC
view on stackexchange narkive permalink

Il est en fait impossible de répondre sans savoir où vous comptez faire cela. Aux États-Unis, les critères de collecte de la présentation & pourraient rendre la présentation sous copyright. Dans d'autres endroits (par exemple, au Royaume-Uni & Europe), les bases de données sont protégées par des sui generis droits de base de données.

Vous voudriez savoir quand & où vous avez obtenu chaque bit de données et sous quelles licences il a été fourni, afin de réduire les risques de poursuites prolongées. ( Lorsque est important, car les sites Web peuvent modifier leurs conditions de licence, vous voudrez donc prendre un instantané des conditions de licence chaque jour où vous les avez supprimées.)

Aussi notez que certains "faits" sont écrits sous forme de phrases ou présentés sous forme de graphiques - aux États-Unis, ils sont protégés par le droit d'auteur, tout comme les photographies établissant des faits. Prenons le cas des programmes télévisés: l'heure à laquelle une émission est programmée sur une chaîne donnée est un fait et n'est pas protégée par le droit d'auteur aux États-Unis, mais le résumé de l'épisode est une œuvre créative et peut être protégé par le droit d'auteur. Le filtrage (sélection) ou la présentation créative peuvent être protégés par le droit d'auteur; cette question a été laissée ouverte dans Feist v. Rural.

J'allais écrire presque exactement cela dans un commentaire, puis poser la question avec des faits réels concernant toutes ces choses.
Alexanne Senger
2015-09-09 05:04:04 UTC
view on stackexchange narkive permalink

Réponse courte

Vous n'avez pas besoin d'octroyer une licence de données à vos utilisateurs pour générer des revenus si vous adoptez l'un des modèles commerciaux suivants.

  • Logiciel en tant que service (SaaS)

  • Application Web payante à l'utilisation

  • API de données

Explication

On dirait que vous êtes décrivant l'un des modèles commerciaux ci-dessus dans votre question. Dans tous les cas, la valeur de vos ensembles de données réorganisés sera dans la manière dont votre application ou service permet à l'utilisateur d'interagir avec lui pour faire des choses utiles. Je pense donc que vous ne voudrez peut-être pas vraiment ou n'avez pas besoin de licence pour les ensembles de données - facturez simplement le service et l'utilisation de votre logiciel, application ou API.

Implémentation d'un modèle d'API de données

Si vous préférez vous concentrer uniquement sur les données et laisser vos utilisateurs créer leurs propres applications, la création d'une API de données pourrait être votre meilleure option. Avec ce produit, vous permettriez à vos utilisateurs d'envoyer des requêtes HTTP RESTful à votre service de données.

Le service répondrait (très probablement) avec un JSON-P callback pour fournir les données. Vous devrez documenter en détail toutes les méthodes disponibles à partir de votre API ainsi que des exemples d'appels dans divers langages courants. (Commencez par cURL car c'est relativement universel.)

Dans ce modèle, comme pour les autres, vous émettriez des identifiants d'autorisation à tous vos utilisateurs (c'est ce qu'ils paieraient pour). Ensuite, à chaque appel de données, ils fourniraient ces informations d'identification qui seraient à leur tour vérifiées côté serveur avant d'envoyer la réponse.


Clause de non-responsabilité : je ne suis pas un avocat alors ne suivez pas mes conseils. Consultez un vrai avocat, car c'est la seule façon de vous éviter les ennuis.
Merci. C'est plus ou moins ce que j'ai à l'esprit, mais la valeur fondamentale reste les données plutôt que l'application. Nous allons permettre à nos clients / clients de construire facilement leurs propres applications sur nos données mais à notre fin, nous nous concentrerons uniquement sur la partie données. Donc, ce que nous monétisons directement, ce sont toujours les données, pas l'application. Une autre idée s'il vous plaît?
@kavoir.com: J'ai mis à jour ma réponse en fonction de vos commentaires. Vous souhaiterez probablement créer une *** API de données *** et autoriser l'utilisation de cette API. Assurez-vous donc de lire attentivement cette partie de ma réponse.
Beaux détails techniques. Merci! Vous n'êtes pas un avocat, mais vous êtes certainement un programmeur méchant (d'une manière cool :)). Ce sont d'excellents conseils et je les suivrai certainement. Cependant, ce qui m'inquiète le plus, c'est que les sites Web sur lesquels je grattes pourraient me poursuivre en justice pour avoir profité des données factuelles de leur site Web. Il peut sembler que je charge les demandes d'API, mais la valeur fondamentale reste les données. Si je ne donne pas de licence aux données, que dois-je dire lorsqu'un client me demande de quelle licence il s'agit et dans quelle mesure il peut utiliser nos données? En fin de compte, je vends les données, pas les demandes d'abonnement ou d'API.


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...