Question:
Légalité de la création d'une réplique SE en utilisant le contenu de SE
JBis
2019-10-06 02:04:17 UTC
view on stackexchange narkive permalink

En raison de la controverse (s) récente (s) concernant StackExchange, quelques autres utilisateurs et moi-même discutions de la légalité de la création d'une copie de SE et du raclage du contenu.

Si nous n'avons pas copié le code réel de SE, juste le contenu que les utilisateurs ont mis sur le site, et nous avons créé un autre site public entièrement à but non lucratif, et nous avons attribué tout le contenu pris à StackExchange serait-ce légal? Avons-nous besoin de l'autorisation de chaque utilisateur sur SE? Avons-nous besoin de l'autorisation de SE?

Certaines parties pertinentes des Conditions d'utilisation:

Vous acceptez que tout le contenu, y compris sans limitation tous les textes, graphiques, logos, outils, photographies, images, illustrations, logiciels ou code source, audio et vidéo, animations et commentaires sur les produits (collectivement, «Contenu») que vous fournissez au réseau public (collectivement, «Contenu de l'abonné» ), est sous licence perpétuelle et irrévocable à Stack Overflow sur une base mondiale, libre de redevance et non exclusive conformément aux termes de licence Creative Commons (CC-BY-SA), et vous accordez à Stack Overflow le droit et la licence d'accès perpétuels et irrévocables , utiliser, traiter, copier, distribuer, exporter, afficher et exploiter commercialement ce contenu d'abonné


Tout autre téléchargement, copie ou stockage de tout contenu réseau public (autre que le contenu de l'abonné ou le contenu mis à disposition via l'API Stack Overflow) à des fins autres que personnelles et non commerciales est expressément interdit sans l'autorisation écrite préalable de Stack Overflow ou de le titulaire du droit d'auteur identifié dans l'avis de droit d'auteur par la licence Creative Commons. Dans le cas où vous téléchargez un logiciel à partir du réseau public (autre que le contenu de l'abonné ou le contenu mis à disposition par l'API Stack Overflow), le logiciel, y compris tous les fichiers, images incorporés ou générés par le logiciel, les données accompagnant le logiciel (collectivement, le " Logiciel ”) vous est concédé sous licence par Stack Overflow ou par des concédants de licence tiers pour votre usage personnel et non commercial, et aucun titre du Logiciel ne vous sera transféré. Stack Overflow ou les concédants de licence tiers conservent le titre complet et complet du Logiciel et tous les droits de propriété intellectuelle y afférents.

Cela n'a-t-il pas été répondu par les liens au bas de chaque page? [cc by-sa 4.0] (https://creativecommons.org/licenses/by-sa/4.0/) et [attribution requise] (https://stackoverflow.blog/2009/06/25/attribution-required/)
Notez que gratter chaque site n'est pas un bon moyen d'obtenir le contenu. Vous devez d'abord télécharger le vidage hebdomadaire de la base de données. Vous pouvez ensuite remplir les informations manquantes à l'aide des données de l'API Stack Exchange. Vous pouvez utiliser exclusivement l'API SE pour obtenir toutes les données de contenu, mais cela prendrait plus de temps, en raison des limites de quota. Si vous essayez de gratter toutes les pages, vous atteindrez probablement un bloc de limite de taux assez rapidement. L'API SE fournit les données de contenu environ 500 à 1000 fois plus rapidement que vous ne pouvez l'obtenir en grattant des pages (en raison de la limitation du débit sur les deux méthodes).
@AndrewLeach, note qu'apparemment, la licence mentionnée dans le pied de page vient d'être modifiée il y a quelque temps, c'était CC-BY-SA 3.0 ou quelque chose comme ça.
@ilkkachuYes, Je le sais. Et alors? C'est toujours la réponse à la question.
@AndrewLeach bien que ce qui vous arrive si SE est poursuivi (parce que vous n'avez pas demandé l'autorisation de changer la licence) et doit revenir à 3.0 n'est pas clair.
Vous avez besoin de l'autorisation de chaque utilisateur sur SE [qui a publié quelque chose que vous copiez]. Et vous avez une telle autorisation par le biais de leur publication du contenu sous CC-BY-SA. Notez que vous devriez mieux attribuer les utilisateurs eux-mêmes en tant qu'auteurs, pas StackExchange lui-même (par exemple, attribuer à l'utilisateur Law StackExchange JBis (22305), ne pas l'attribuer comme s'il appartenait à SE, ce qui ne le fait pas),
@AndrewLeach Le contenu fourni reste sous CC-BY-SA 3 reste sous cette version de la licence, et SO peut être sur le point de perdre sa licence.
@AndrewLeach Ce n'est pas la réponse complète, puisque ce pied de page se trouve dans la majorité des cas. Actuellement, il est très difficile de reproduire du contenu avec la licence _correct_ (lire: légalement) car le site ne vous dit pas quelle est la licence correcte pour un message donné.
Deux réponses:
user27947
2019-10-06 02:13:11 UTC
view on stackexchange narkive permalink

Stack Exchange a déjà couvert cela à plusieurs endroits, depuis MSE Un site (ou un scraper) copie le contenu de Stack Exchange. Que dois-je faire?:

Quand dois-je ne pas signaler ces sites?

  • Ils respectent toutes les exigences d'attribution. Comme mentionné précédemment, il n'y a rien de mal à copier notre contenu ailleurs sur le Web, tant qu'ils respectent toutes les exigences d'attribution données. Nous ne pouvons prendre aucune mesure contre un gratteur qui respecte toutes les règles.

Et l'ancien article de blog Attribution Required mentionne que les exigences réelles sont:

  1. Indiquez visuellement que le contenu provient de Stack Overflow ou du réseau Stack Exchange d'une manière ou d'une autre. Cela n'a pas à être désagréable; un texte de présentation discret convient parfaitement.
  2. Lien hypertexte directement vers la question d'origine sur le site source (par exemple, http: // stackoverflow.com/questions/12345)
  3. Afficher les noms des auteurs pour chaque question et réponse
  4. Lien hypertexte pour chaque nom d'auteur directement à leur page de profil utilisateur sur le site source (par exemple, http://stackoverflow.com/users/1234567890/username)

Par «Directement», je veux dire que chaque lien hypertexte doit pointer directement vers notre domaine en HTML standard visible même avec JavaScript désactivé, et ne pas utiliser un tinyurl ou toute autre forme d'obfuscation ou de redirection. De plus, les liens ne doivent pas être non suivis

La restriction nofollow semble totalement inapplicable. La licence nécessite une «attribution», pas un renforcement du référencement.
Et je pense que SE n'emploie pas de suivi sur les liens que nous incluons dans les réponses, donc c'est un peu un double standard.
Je ne vois pas en quoi cela est pertinent. L'OP postule la copie de * contenu utilisateur * sous licence SE sous licence CC-by-sa. Je ne vois pas la théorie selon laquelle SE peut imposer des restrictions supplémentaires sur la façon dont n'importe qui peut utiliser ce contenu. L'attribution est un peu délicate, car l'identification de l'utilisateur est médiée par SE, mais c'est à peu près tout.
Notez que cette exigence est suffisante pour permettre aux moteurs de recherche de gérer le problème du scraping de contenu, s'ils le souhaitent, pour quiconque ne fait pas de copie illicite. Le robot d'exploration peut suivre les liens d'attribution, les utiliser pour déterminer que le site est un contenu récupéré et le déclasser / le supprimer.
Serait-ce avec un lien direct vers des images imgur stackexchange, ou un fork devrait-il copier ces images et les héberger ailleurs?
@hobbs Oui, cela s'est déjà produit sur law.stackexchange: https://law.stackexchange.com/a/429
Notez que le billet de blog cité n'est pas une bonne source pour ce à quoi l'attribution doit ressembler. Il répertorie les éléments qui ne sont pas requis par la licence et il [manque l'obligation de faire référence à la licence] (https://meta.stackexchange.com/q/225486/193139).
Matthew Elvey
2019-12-09 07:59:52 UTC
view on stackexchange narkive permalink

Destiné à compléter l'excellente réponse de '947, une réponse directe:

Oui. Non. Vous l'avez déjà, par CC-BY-SA. (En réponse à "... serait-ce légal? Avons-nous besoin de l'autorisation de chaque utilisateur sur SE? Avons-nous besoin de l'autorisation de SE?"

Tout le contenu de l'abonné est disponible sous une licence CC-BY-SA. De plus, comme il a été fourni à SE uniquement "conformément aux termes de la licence Creative Commons", vous n'avez pas à le supprimer. En raison du "-SA", SE ne peut pas utiliser des «mesures technologiques efficaces» (voir cette clause et suivantes) et je considérerais la limitation de débit de HTTP ou de l'API, malgré une demande de levée à cet effet, comme une seule - donc si vous voulez tout le contenu de l'abonné, SE ne serait pas sage de ne pas vous le donner si vous le demandiez, sous une forme mutuellement convenable, comme un vidage de base de données compressé (comme ceux fournis par Wikipedia / WMF).

PS Err, il semble que cette information ait déjà été largement fournie dans un commentaire de @ Ángel - "Vous avez besoin de la permission de chaque utilisateur sur SE [qui a publié quelque chose que vous copiez] et vous avez cette permission par le biais de leurs publications le contenu sous CC-BY-SA. Notez que vous devriez mieux attribuer les utilisateurs eux-mêmes en tant qu'auteurs, pas StackExchange lui-même (par exemple attribuer à l'utilisateur Law StackExchange JBis (22305), ne pas l'attribuer comme s'il avait été créé par SE, ce qui ne le fait pas) "(modifié pour plus de clarté)

IANAL, BIPOOTI.

Les haineux continueront de détester. -1 et pas de commentaire.


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 4.0 sous laquelle il est distribué.
Loading...