¿Es aceptable subir contenido ofensivo a GitHub? [cerrado]

12

Desarrollé un verificador de contenido ofensivo para mi sitio web y quiero publicarlo en GitHub . Sin embargo, el código fuente contiene muchos contenidos ofensivos, racistas y desagradables.

La fuente está completamente documentada, pero quería su opinión sobre si es aceptable publicar dicho trabajo en GitHub o si dejar la serie de cadenas a la imaginación del lector.

SimonGoldstone.com
fuente
11
La pregunta clave es probablemente "¿es realmente ofensivo? ¿O es solo un 'dictonario'?" que entra en el Github TOS - §7 sugiere que pueden (pero no están obligados a) eliminarlo. Es posible que desee extraer las cadenas a otro archivo, que luego se codifica rot13 o algo así para evitar ofender al navegador causal.
1
Supongo que está bien, solo advierte a los posibles lectores en Readme, hay muchas palabras ofensivas en otros GitHub Repos. Además, su caso es de buena fe.
Jacktrades
55
¿Por qué no poner todas las palabras en un archivo de texto o base de datos y cargarlas en tiempo de ejecución? Luego ponga un pequeño descargo de responsabilidad al principio del archivo que el texto a continuación no es para los débiles de corazón. ¿Su código está limpio y puede usar diferentes archivos de texto para diferentes situaciones?
Ampt
@Sparticus gracias por tu comentario. Estoy de acuerdo y creo que ese es probablemente el mejor enfoque para mí.
SimonGoldstone.com
55
Una palabra por sí sola no es ofensiva. La intención detrás de esto lo hace ofensivo.
kaptan

Respuestas:

45

Tengo que estar en desacuerdo con la solución ROT-13. Ofuscar sus palabras prohibidas simplemente porque la vista de ellos podría ofender a alguien es una pérdida de tiempo.

Su diccionario de malas palabras / reglas de malas palabras debe provenir de un archivo separado de todos modos (que podría cargarse en tiempo de ejecución o incrustarse como recurso) . Ofuscar este archivo simplemente hace que sea más difícil para usted / otros desarrolladores / sus usuarios modificarlo o solucionar cualquier problema. Además, si vi un archivo llamado "banned_words.txt" en mi disco duro, esperaría que contenga una lista de palabras ofensivas.

BlueRaja - Danny Pflughoeft
fuente
Estoy de acuerdo. No quiero ofuscar las palabras.
SimonGoldstone.com
55
+1 @simon Estas listas ya aparecen: github.com/snipe/banbuilder
dcaswell
2
@simon No quise decir que tu proyecto no valía la pena, solo que github permite a las personas almacenar listas como tú quieras. La otra respuesta no tiene un sí o un no, solo quería confirmarle que la respuesta fue en realidad Sí.
dcaswell
1
"reinventar la rueda" es parte del aprendizaje ... es la mayor parte de lo que se enseña en la universidad.
WernerCD
2
A veces te encuentras con personas con ... cómo podemos decir ... sensibilidades delicadas que pueden tener alguna influencia sobre si la distribución del programa se mantiene o no. Si rotar el archivo significa que permanece, eso ayuda al OP a lograr su objetivo de tener su código activado y permanecer en GitHub. Eso no es una pérdida de tiempo en mi libro.
Blrfl
16

"Todos los problemas en informática pueden resolverse mediante otro nivel de indirección". ( por David Wheeler ).

Sus opciones no se limitan a cargarlo o no, si tiene en cuenta que puede codificar contenido para que no moleste a los lectores.

  • Como ejemplo, simplemente pasar a la siguiente letra (A a B, B a C, etc., con Z cambiando a A para completar la codificación) puede convertir palabras famosas de cuatro letras en Gvdl totalmente inofensivo . Todo lo que necesita para usarlo en su aplicación sería cambiarlo de nuevo en la dirección opuesta, a letras anteriores , con A cambiando a Z.

Como se señaló en los comentarios , se utiliza un enfoque como el anterior en el cifrado de sustitución de letras ROT13 , conocido por su uso "como un medio para ocultar ... materiales ofensivos de la mirada casual ..."

 

http://upload.wikimedia.org/wikipedia/commons/thumb/3/33/ROT13_table_with_example.svg/320px-ROT13_table_with_example.svg.png


En aras de la exhaustividad, considere adicionalmente ejecutar su corrector contra un diccionario codificado , para asegurarse de que la codificación elegida no convirtió accidentalmente una palabra ofensiva en otra.

Al codificar cosas como esa, tiene sentido verificar dos veces, porque uno no puede predecir de manera confiable las cosas. En uno de mis proyectos anteriores, tuvimos un corte de correo bastante grave cuando un corrector mal configurado comenzó a descubrir contenido ofensivo en secuencias aleatorias de caracteres (en el contenido sin codificar de los archivos ZIP).


En comparación con la transmisión de texto sin formato, Gvdl s, la codificación tiene un beneficio sustancial de evitar por completo los problemas legales y todos los riesgos y dependencias involucrados .

Solo piensa en ello. Digamos, los términos particulares de servicio en un repositorio particular permiten mi contenido, bien.

Pero, ¿qué pasa si deciden cambiar los TOS ? O, ¿qué pasa si decido cambiar a otro repositorio, teniendo términos incompatibles? ¿Que voy a hacer?

Tenga en cuenta que incluso estar en un repositorio "amigable", aquí y ahora, todavía no es completamente seguro.

¿Qué sucede si alguien no podrá descargar mi contenido debido a un filtro web extraño ? ¿Estoy dispuesto a responder a las quejas de los usuarios y explicar cómo solucionar el filtro? Su filtro ...

... Verá, preferiría pensarlo dos veces antes de decidir no codificar. E incluso si lo decido, me aseguraré de tener una muy, muy buena razón para eso.

mosquito
fuente
66
Rot13 es una especie de estándar de facto para eso. Doble rot13 es aún mejor. :-)
Blrfl
55
@Blrfl al igual que triple DES es mejor que DES, triple rot13 es el camino a seguir.
1
Creo que hay complementos para muchos editores que hacen que la edición de archivos rot13 no sea más difícil que la edición de cualquier otro archivo que esté en un formato especializado
JoelFan
2
@Simon no es tanto que la podredumbre 13 sea un obstáculo, sino una forma estándar de ocultar trivialmente el texto. Tenga en cuenta que algunos firewalls pueden estar configurados para bloquear ciertos patrones de caracteres, lo que hace que sea difícil acceder a su texto para la funcionalidad del programa. El problema probable no es la ofensiva, sino los otros obstáculos tecnológicos que pueden no darse cuenta de la diferencia entre "algo que desea descargar" y "algo que desea bloquear". Sí, pueden obtener la cremallera, pero no podrán clonar, bifurcar o empujar.
2
@ThomasEding Cifrado de desplazamiento César por una letra. El primer personaje es originalmente una 'F'.