Desarrollé un verificador de contenido ofensivo para mi sitio web y quiero publicarlo en GitHub . Sin embargo, el código fuente contiene muchos contenidos ofensivos, racistas y desagradables.
La fuente está completamente documentada, pero quería su opinión sobre si es aceptable publicar dicho trabajo en GitHub o si dejar la serie de cadenas a la imaginación del lector.
Respuestas:
Tengo que estar en desacuerdo con la solución ROT-13. Ofuscar sus palabras prohibidas simplemente porque la vista de ellos podría ofender a alguien es una pérdida de tiempo.
Su diccionario de malas palabras / reglas de malas palabras debe provenir de un archivo separado de todos modos (que podría cargarse en tiempo de ejecución o incrustarse como recurso) . Ofuscar este archivo simplemente hace que sea más difícil para usted / otros desarrolladores / sus usuarios modificarlo o solucionar cualquier problema. Además, si vi un archivo llamado "banned_words.txt" en mi disco duro, esperaría que contenga una lista de palabras ofensivas.
fuente
"Todos los problemas en informática pueden resolverse mediante otro nivel de indirección". ( por David Wheeler ).
Sus opciones no se limitan a cargarlo o no, si tiene en cuenta que puede codificar contenido para que no moleste a los lectores.
Como se señaló en los comentarios , se utiliza un enfoque como el anterior en el cifrado de sustitución de letras ROT13 , conocido por su uso "como un medio para ocultar ... materiales ofensivos de la mirada casual ..."
En aras de la exhaustividad, considere adicionalmente ejecutar su corrector contra un diccionario codificado , para asegurarse de que la codificación elegida no convirtió accidentalmente una palabra ofensiva en otra.
Al codificar cosas como esa, tiene sentido verificar dos veces, porque uno no puede predecir de manera confiable las cosas. En uno de mis proyectos anteriores, tuvimos un corte de correo bastante grave cuando un corrector mal configurado comenzó a descubrir contenido ofensivo en secuencias aleatorias de caracteres (en el contenido sin codificar de los archivos ZIP).
En comparación con la transmisión de texto sin formato, Gvdl s, la codificación tiene un beneficio sustancial de evitar por completo los problemas legales y todos los riesgos y dependencias involucrados .
Solo piensa en ello. Digamos, los términos particulares de servicio en un repositorio particular permiten mi contenido, bien.
Pero, ¿qué pasa si deciden cambiar los TOS ? O, ¿qué pasa si decido cambiar a otro repositorio, teniendo términos incompatibles? ¿Que voy a hacer?
Tenga en cuenta que incluso estar en un repositorio "amigable", aquí y ahora, todavía no es completamente seguro.
¿Qué sucede si alguien no podrá descargar mi contenido debido a un filtro web extraño ? ¿Estoy dispuesto a responder a las quejas de los usuarios y explicar cómo solucionar el filtro? Su filtro ...
... Verá, preferiría pensarlo dos veces antes de decidir no codificar. E incluso si lo decido, me aseguraré de tener una muy, muy buena razón para eso.
fuente