Question:
Une liste des mots anglais les plus courants est-elle protégée par la loi américaine?
NK1406
2019-10-07 03:17:39 UTC
view on stackexchange narkive permalink

Je suis actuellement intéressé à faire des recherches en effectuant diverses mesures et algorithmes sur les mots les plus courants en anglais. J'ai trouvé en ligne quelques bonnes listes de mots qui conviendraient, mais je crains qu'elles ne soient soumises au droit d'auteur et j'aimerais être sûr de leur statut avant de les utiliser. Les listes se présentent sous la forme d'un simple fichier texte avec un mot par ligne.

Je comprends que les collections de mots comme les dictionnaires sont soumises au droit d'auteur car elles contiennent une grande quantité de mots et leurs définitions qui peuvent être considérée comme exigeant un travail original et de la créativité, mais qu'en est-il des mots sans définition ni information supplémentaire?

J'ai vu cette autre question sur Law Stack Exchange, qui mentionne des listes de mots , mais l'auteur semble avoir été intéressé par l'utilisation de quelques définitions courtes, et je ne suis pas certain que la réponse se réfère à des listes de mots simples.

Une liste de mots courants est-elle protégée par le droit d'auteur? Si tel est le cas, serait-il toujours considéré comme une utilisation équitable d'utiliser la liste de mots pour générer des données non liées aux mots eux-mêmes?

Nommez votre juridiction.
Selon la juridiction, les droits sur les bases de données peuvent en fait être le droit pertinent plutôt que le droit d'auteur.
Relevant Wikipedia article: https://en.wikipedia.org/wiki/Sweat_of_the_brow
Si vous n'utilisez que la liste et que vous ne redistribuez pas cette liste ou un travail dérivé basé sur cette liste, alors je ne vois pas en quoi son droit d'auteur serait pertinent. Un usage loyal ne serait pas non plus pertinent; cela ne serait nécessaire que si vous copiez ou redistribuiez réellement la liste (en supposant qu'elle était sous copyright en premier lieu).
Deux réponses:
gnasher729
2019-10-07 14:46:32 UTC
view on stackexchange narkive permalink

Selon votre juridiction, ces listes peuvent être protégées, mais pas par le droit d'auteur.

Par exemple, en Allemagne, il y a eu une décision de justice selon laquelle scanner tous les annuaires téléphoniques du pays et les vendre sur CD constituait une «concurrence déloyale» et était illégal, tout en embauchant 1000 dactylos qui saisiraient manuellement toutes ces informations ne serait pas.

Les bases de données sont protégées dans de nombreuses juridictions, et une liste des 1000 mots anglais les plus couramment utilisés pourrait raisonnablement être appelée une base de données.

user6726
2019-10-07 05:07:40 UTC
view on stackexchange narkive permalink

Les mots eux-mêmes ne sont pas protégés par le droit d'auteur, car ce sont des "faits" (de la langue anglaise - également, le listeur n'a pas créé les mots). Les listes de mots créées par un algorithme sont des «faits» et n'ont pas le grain de créativité qui rend les pages Web protégées. Les corpus qui sous-tendent les listes sont protégés, tout comme le programme qui les filtre pour donner des nombres de jetons, mais le tableau d’informations qui en résulte ne l’est pas, voir Feist v. Rural Telephone.

Vous semblez assumer une juridiction particulière sans jamais nommer laquelle. En outre, la raison pour laquelle vous supposez que cette juridiction particulière est la seule et unique n'est pas claire, étant donné que le PO n'a nommé aucune juridiction particulière. En particulier, dans 99,5% de toutes les juridictions, la référence que vous avez citée est complètement et totalement dénuée de pertinence.
«Le créateur de listes n'a pas créé les mots» est hors de propos. Peu de gens essaieraient de soutenir qu'un roman n'est pas protégé par le droit d'auteur parce que l'auteur n'a créé aucun des mots qu'il contient. Le * arrangement * des mots (et si oui ou non c'est "trivial" et / ou "notoire") est le point important.
La séquence des mots anglais les plus courants est le résultat d'un algorithme bien défini, pas d'un travail créatif. Il est difficile de voir comment une juridiction dotée d'une définition raisonnable du droit d'auteur protégerait cette liste.
@JörgWMittag Bien que votre commentaire ait une certaine validité, la Cour suprême contrôle dans la grande majorité des juridictions, pondérée par la probabilité que quelqu'un demande, sur un site Web en anglais, quelle est la loi concernant les mots anglais.
@Acccumulation * Quelle * Cour suprême? Il y en a au moins quelques-uns, et rien ne dit que cette question concerne le droit anglais (uniquement sur l'utilisation de listes de mots anglais - pour tout ce que nous savons, il pourrait s'agir d'une recherche comparative en Thaïlande comparant les mots anglais les plus utilisés aux mots coréens) , et ce site a des utilisateurs partout dans le monde. Je veux dire, selon toute vraisemblance, il s'agit de la loi américaine puisque le profil de l'interlocuteur dit qu'ils sont aux États-Unis, mais il est idiot de supposer que toutes les questions sur le site sont centrées sur les États-Unis.
En ce qui concerne "toute juridiction avec une définition raisonnable du droit d'auteur", en fait, je ne connais aucune juridiction avec ce que je considérerais comme une définition raisonnable ou une mise en œuvre du droit d'auteur.
@asgallant: Vous avez raison, cette liste n'est probablement protégée nulle part. Il * pourrait * cependant être protégé sous * protection de base de données * dans plusieurs juridictions, y compris en Allemagne et en fait dans toute l'UE. Même si la question porte explicitement sur le droit d'auteur * uniquement *, je considérerais toute réponse qui ne mentionne pas la protection de la base de données incomplète, tout comme je considérerais toute réponse qui ne mentionne pas que cela dépend entièrement de la juridiction incomplète.
@JörgWMittag est en fait pertinent pour 4% de la population mondiale ou 27% du monde développé
@Delioth Mon commentaire contestait l'idée qu'il n'y a que 0,5% de chance que l'OP pose des questions sur les États-Unis.
La sélection @asgallant d'un corpus approprié vers lequel pointer votre algorithme est une tâche non triviale (dans un sens académique - je ne connais pas assez le sens juridique); si cela est fait par algorithme, vous avez un algorithme non trivial
De nombreuses juridictions, y compris les États-Unis, ont un concept de «sueur du front» (voir https://en.wikipedia.org/wiki/Sweat_of_the_brow), qui s'appliquerait ici, mais pas dans le cas cité. L'idée de base étant que si quelque chose nécessite un effort important pour créer, alors le produit de ce travail attire intrinsèquement les droits de propriété et est donc protégé par le droit d'auteur.
@asgallant, également, _ "la" _ (comme dans le seul et unique) séquence des mots les plus courants n'existe probablement même pas - même [la page Wikipédia en a deux] (https://en.wikipedia.org/wiki/ Most_common_words_in_English) ensembles de rangs. Plus une mention du fait qu'un mot écrit de la même manière peut avoir deux significations différentes, et cela pourrait être pris en compte (ou non). Un algorithme pour identifier les différentes significations d'un seul mot n'est probablement pas si trivial.
@james Depuis Feist, les États-Unis n'ont plus la doctrine de la «sueur du front». Plus important encore, aux États-Unis, vous ne pouvez pas violer le droit d'auteur d'une œuvre à laquelle vous n'avez pas accédé. Dix personnes qui créent indépendamment même précisément la même œuvre ont toutes le droit d'en bénéficier.
J'aimerais voir l'algorithme «bien défini» pour créer une liste des 1 000 mots anglais les plus utilisés.
@Acccumulation SCOTUS n'a juridiction que sur les États-Unis. Si vous ne considérez que le Royaume-Uni, l'Australie, le Canada et la Nouvelle-Zélande, cela laisse encore SCOTUS avec juridiction sur seulement environ 70% des juridictions anglophones pondérées par la population. Je ne pense pas vraiment que cela compte comme une «grande majorité».
@asgallant "La séquence des mots anglais les plus courants est la sortie d'un algorithme bien défini". Tout roman aussi: `imprimer" Il était une fois, [...] "`. Plus important encore, l '_entrée_ de l'algorithme auquel vous faites allusion n'est pas claire. Maintenant, je ne prétends pas que la liste est protégée par le droit d'auteur, mais l'idée que vous pouvez, je pourrais à la fois exécuter la même procédure et trouverait nécessairement la même réponse n'est pas vraiment vraie.


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 4.0 sous laquelle il est distribué.
Loading...