Licencia Unicode

35

Los Términos de uso de Unicode establecen que cualquier software que use sus archivos de datos (o una modificación de ellos) debe llevar las referencias de licencia de Unicode. Me parece que la mayoría de las bibliotecas Unicode tienen funciones para verificar si un carácter es un dígito, una letra, un símbolo, etc., y por lo tanto contendrá una modificación de los archivos de datos Unicode (generalmente en forma de tablas). ¿Eso significa que la licencia se aplica y todas las aplicaciones que usan dichas bibliotecas Unicode deben llevar la licencia?

He revisado, y parece que muy pocos programas Unicode tienen la licencia, aunque podría decirse que la mayoría de los que no la tenían eran de compañías que eran miembros del consorcio Unicode (¿obtienen exenciones de licencia?).

Algunos (por ejemplo, Mozilla) son solo "Miembros de Enlace", y aunque su software no tiene la licencia (por lo que puedo decir), obviamente se basan en datos derivados de esos archivos de datos. ¿Mozilla infringe la licencia?

¿Deberíamos llevar la licencia en todas las aplicaciones que incluyen algún tipo de soporte avanzado de Unicode (es decir, están obligados a confiar en los archivos de datos Unicode)? ¿O hay alguna forma de exención amplia (ya que muy pocos programas tienen licencia)?


He enviado esta pregunta al personal de Unicode. Publicaré la respuesta aquí cuando / si recibo una.

Eric Grange
fuente
FWIW Firefox tiene muchos textos de licencia:about:license
Thilo
1
@Thilo Sí y ninguno de ellos se refiere a Unicode AFAICT. El hecho de que reconocen tantos, pero no el Unicode, fue parte de lo que provocó esta pregunta.
Eric Grange
1
Firefox usa la biblioteca ICU. La licencia Unicode no es una licencia viral.
Hans Passant
1
La licencia Unicode afecta los datos, no el código, si ICU incluye los datos, entonces también lo hace Firefox. A menos que sea una cláusula de exclusión, pero no pude encontrar ninguna ...
Eric Grange

Respuestas:

21

Comentario preliminar: ya no soy abogado y nunca me especialicé en leyes relacionadas con los derechos de autor y la propiedad intelectual. Si desea una respuesta incuestionable, debe consultar a un abogado.

1. Los datos y los archivos de datos no son lo mismo

Como se afirma, la exposición 1 cubre archivos de datos:

DESCARGANDO, INSTALANDO, COPIANDO O DE OTRA MANERA UTILIZANDO LOS ARCHIVOS DE DATOS DE UNICODE INC. [...]

Los archivos de datos y los datos en sí no son lo mismo. Cuando Microsoft implementa métodos en mayúsculas y minúsculas en .NET Framework, se utiliza el estándar Unicode, pero esto no significa que .NET Framework contenga, en algún lugar, los archivos descargados de http://www.unicode.org/

Ilustración simple de una diferencia entre los datos y el soporte:

Imagine que creo una base de datos con una lista de países, ciudades y los códigos postales correspondientes. Expongo estos datos a través de un servicio web y en mi sitio web.

Los datos en sí son de dominio público: no puede proteger razonablemente los derechos de autor de la lista de países y pedir a todas las personas que utilizan dicha lista que le paguen o que distribuyan una copia de sus derechos de autor.

Por otro lado, nada me impide hacer cumplir una licencia restrictiva sobre el uso del servicio web o el sitio web (especialmente porque invertí mucho esfuerzo al crear este conjunto de datos). Si descubro que una aplicación está raspando mi sitio web para descargar los datos, esto sería una infracción de los derechos de autor y podría demandar a la persona que creó el raspador.

2. Los datos son demasiado vagos.

Si http://www.unicode.org/ declara que la licencia cubre los datos en sí, sería muy difícil para esta organización hacer cumplir tales derechos de autor.

Imagine el siguiente método:

public char ToUpper(char c)
{
    string upper = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
    if (upper.Contains(c))
    {
        return c;
    }

    string lower = "abcdefghijklmnopqrstuvwxyz";
    if (lower.Contains(c))
    {
        return upper[lower.IndexOf(c)];
    }

    throw new OutOfRangeException();
}

¿Es esto una violación de los derechos de autor? ¿Realmente utilicé los datos de http://www.unicode.org/ y debería incluir la copia de la licencia en mi respuesta a continuación? ¿O tal vez solo escribí esas cartas yo mismo?

En otras palabras, si los datos en sí tenían licencia, ¿hasta dónde podría llegar la licencia?

3. Copyright y datos

Aquí hay algunas citas interesantes:

http://www.lib.umich.edu/copyright/facts-and-data : University of Michigan

La ley de derechos de autor no se aplica a hechos, datos o ideas. [...]

Sin embargo, los derechos de autor pueden proteger una recopilación de datos tal como está contenida en una base de datos o compilación, pero solo si cumple con ciertos requisitos. Simplemente trabajar realmente duro para recopilar [...] los datos no es suficiente. [...]

Para que una base de datos califique para la protección de los derechos de autor, el autor debe tomar decisiones sobre la selección, coordinación o disposición de los hechos o datos, y esas elecciones deben ser al menos un poco creativas. [...]

Es importante recordar que incluso si una base de datos o compilación está organizada con suficiente originalidad para calificar para la protección de derechos de autor, los hechos y datos dentro de esa base de datos aún son de dominio público.

http://www.ands.org.au/guides/copyright-and-data-awareness.html : Servicio Nacional de Datos de Australia

Una tabla o compilación, que consta de palabras, figuras o símbolos (o una combinación de estos) está protegida si es

  1. una obra literaria y

  2. tiene el grado de originalidad requerido.

[...] Los derechos de autor no se aplican a los hechos / información en sí, sino a la forma particular en que los hechos / información se presentan en el conjunto de datos o la base de datos.

Esos dos ejemplos, uno concerniente a EE. UU., El otro - Australia, muestra claramente que los datos en sí mismos, es decir, los símbolos unicode con sus respectivos números y atributos como "¿es esto un dígito?" o "¿es esta una letra mayúscula del alfabeto cirílico?" no está cubierto por los derechos de autor.

Los archivos de datos, por otro lado, pueden estar cubiertos por los derechos de autor, dependiendo de su originalidad. Por ejemplo, los archivos PDF que encuentre en http://www.unicode.org/ probablemente estarían cubiertos por derechos de autor. Si, por otro lado, se trata puramente de un CSV que asocia caracteres en minúsculas a mayúsculas o viceversa, el autor de dichos datos difícilmente podría hacer cumplir los derechos de autor sobre ellos.

Claramente, el ToUppermétodo que puse arriba no es una violación de http://www.unicode.org/ copyright. Tampoco el código utilizado por .NET Framework o Firefox, a menos que esos sistemas contengan algún lugar dentro de los archivos de datos que claramente, sin duda, se copian de http://www.unicode.org/ con, opcionalmente, algunos cambios menores.

Arseni Mourzenko
fuente
1
1. La licencia cubre una modificación de los archivos de datos, es dudoso que Microsoft los haya recreado desde cero, especialmente porque esos archivos son los que hacen el estándar Unicode.
Eric Grange
2. Ver EXPOSICIÓN 1 detalla cuáles son los archivos de fecha, no se ve vago en absoluto.
Eric Grange
1
3. Los datos pueden tener licencia, y ciertamente lo son (datos de mapeo fi, o datos de investigación, dcc.ac.uk/resources/how-guides/license-research-data )
Eric Grange
@Eric Grange: (1) dudoso o no, no hay pruebas formales de que Microsoft haya utilizado esos archivos de datos tal como están. (3) Estoy completamente de acuerdo, los datos en general se pueden licenciar. Es solo que en esos dos casos particulares que enumeré (es decir, nombres de países y el alfabeto inglés), tendrá dificultades para convencer al juez de que estos son sus datos y que están cubiertos por sus derechos de autor.
Arseni Mourzenko
Excelente respuesta, y lo votaría más si pudiera solo por el giro de "Ya no soy un abogado" (ya).
1

Estos archivos forman legalmente una base de datos, lo que significa que muchas jurisdicciones no se tratan como un trabajo con derechos de autor, sino que están sujetos a otros tipos de protección. En particular, dichas jurisdicciones considerarán el esfuerzo (cuantitativo y / o cualitativo) necesario para la compilación de tales bases de datos. Véase, por ejemplo, la Directiva europea de bases de datos .

Como ejemplo, no hay una decisión creativa involucrada en la definición de la relación entre letras mayúsculas y minúsculas. Por lo tanto, esa tabla en particular no está sujeta a derechos de autor en la UE, y dado que el Consorcio Unicode tampoco es europeo, tampoco está cubierto por las leyes de derecho de base de datos. (No existe un equivalente del tratado de Berna para los derechos de base de datos)

MSalters
fuente
La página de wikipedia que vinculó dice lo contrario: están protegidos por derechos de autor como colecciones ...
Eric Grange
1
No, hay una distinción explícita hecha. Según la wiki, "La protección de los derechos de autor no está disponible para las bases de datos que pretenden ser complete". Y de unicode.org, "Unicode proporciona un número único para el everypersonaje". Las colecciones están protegidas por derechos de autor cuando son una selección creativa. Por ejemplo, ASCII sería, ya que es una selección de 127 caracteres más útiles en inglés, al menos según sus creadores.
MSalters