Cuando se trata de consultas de bases de datos, siempre intente utilizar consultas parametrizadas preparadas. Las bibliotecas mysqli
y lo PDO
admiten. Esto es infinitamente más seguro que usar funciones de escape como mysql_real_escape_string
.
Sí, mysql_real_escape_string
es efectivamente solo una función de escape de cadenas. No es una fórmula mágica. Todo lo que hará es escapar de los caracteres peligrosos para que sean seguros de usar en una sola cadena de consulta. Sin embargo, si no desinfecta sus entradas de antemano, será vulnerable a ciertos vectores de ataque.
Imagina el siguiente SQL:
$result = "SELECT fields FROM table WHERE id = ".mysql_real_escape_string($_POST['id']);
Debería poder ver que esto es vulnerable a la explotación.
Imagina que el id
parámetro contiene el vector de ataque común:
1 OR 1=1
No hay caracteres de riesgo para codificar, por lo que pasará directamente a través del filtro de escape. Dejándonos:
SELECT fields FROM table WHERE id= 1 OR 1=1
Que es un hermoso vector de inyección SQL y permitiría al atacante devolver todas las filas. O
1 or is_admin=1 order by id limit 1
que produce
SELECT fields FROM table WHERE id=1 or is_admin=1 order by id limit 1
Lo que permite al atacante devolver los datos del primer administrador en este ejemplo completamente ficticio.
Si bien estas funciones son útiles, deben usarse con cuidado. Debe asegurarse de que todas las entradas web estén validadas hasta cierto punto. En este caso, vemos que podemos ser explotados porque no verificamos que una variable que estábamos usando como número fuera en realidad numérica. En PHP debería utilizar ampliamente un conjunto de funciones para comprobar que las entradas sean enteros, flotantes, alfanuméricos, etc. Pero cuando se trata de SQL, preste más atención al valor de la declaración preparada. El código anterior habría sido seguro si fuera una declaración preparada, ya que las funciones de la base de datos habrían sabido que 1 OR 1=1
no es un literal válido.
En cuanto a htmlspecialchars()
. Ese es un campo minado en sí mismo.
Existe un problema real en PHP ya que tiene una selección completa de diferentes funciones de escape relacionadas con html y no hay una guía clara sobre exactamente qué funciones hacen qué.
En primer lugar, si está dentro de una etiqueta HTML, está en un verdadero problema. Mirar
echo '<img src= "' . htmlspecialchars($_GET['imagesrc']) . '" />';
Ya estamos dentro de una etiqueta HTML, por lo que no necesitamos <o> para hacer nada peligroso. Nuestro vector de ataque podría serjavascript:alert(document.cookie)
Ahora el HTML resultante parece
<img src= "javascript:alert(document.cookie)" />
El ataque llega directo.
Se pone peor. ¿Por qué? porque htmlspecialchars
(cuando se llama de esta manera) solo codifica comillas dobles y no simples. Entonces si tuviéramos
echo "<img src= '" . htmlspecialchars($_GET['imagesrc']) . ". />";
Nuestro malvado atacante ahora puede inyectar parámetros completamente nuevos
pic.png' onclick='location.href=xxx' onmouseover='...
Nos da
<img src='pic.png' onclick='location.href=xxx' onmouseover='...' />
En estos casos, no existe una fórmula mágica, solo tienes que corregir la entrada tú mismo. Si intentas filtrar los personajes malos, seguramente fallarás. Adopte un enfoque de lista blanca y deje pasar solo los caracteres que sean buenos. Mire la hoja de trucos de XSS para ver ejemplos sobre cómo diversos vectores pueden ser
Incluso si utiliza htmlspecialchars($string)
etiquetas fuera de HTML, sigue siendo vulnerable a los vectores de ataque de conjuntos de caracteres de varios bytes.
Lo más eficaz que puede ser es utilizar una combinación de mb_convert_encoding y htmlentities de la siguiente manera.
$str = mb_convert_encoding($str, 'UTF-8', 'UTF-8');
$str = htmlentities($str, ENT_QUOTES, 'UTF-8');
Incluso esto deja a IE6 vulnerable, debido a la forma en que maneja UTF. Sin embargo, puede recurrir a una codificación más limitada, como ISO-8859-1, hasta que el uso de IE6 disminuya.
Para un estudio más profundo de los problemas multibyte, consulte https://stackoverflow.com/a/12118602/1820
$result = "SELECT fields FROM table WHERE id = '".mysql_real_escape_string($_POST['id'])."'";
2. En el segundo caso (atributo que contiene la URL), no hay ningún uso parahtmlspecialchars
; en estos casos, debe codificar la entrada usando un esquema de codificación de URL, por ejemplo, usingrawurlencode
. De esa manera, un usuario no puede insertarjavascript:
et al.Take a whitelist approach and only let through the chars which are good.
una lista negra siempre perderá algo. +1Además de la excelente respuesta de Cheekysoft:
En realidad, no existe una fórmula mágica para prevenir la inyección de HTML (por ejemplo, secuencias de comandos entre sitios), pero es posible que pueda lograrlo más fácilmente si está utilizando una biblioteca o un sistema de plantillas para generar HTML. Lea la documentación para saber cómo escapar de las cosas de manera adecuada.
En HTML, las cosas deben escaparse de manera diferente según el contexto. Esto es especialmente cierto en el caso de cadenas que se colocan en Javascript.
fuente
Definitivamente estaría de acuerdo con las publicaciones anteriores, pero tengo una pequeña cosa que agregar en respuesta a la respuesta de Cheekysoft, específicamente:
Codifiqué una pequeña función rápida que puse en mi clase de base de datos que eliminará todo lo que no sea un número. Utiliza preg_replace, por lo que es probable que haya una función un poco más optimizada, pero funciona en un apuro ...
Entonces en lugar de usar
yo usaría
y ejecutaría la consulta de forma segura
Claro, eso simplemente impidió que mostrara la fila correcta, pero no creo que sea un gran problema para quien esté tratando de inyectar sql en su sitio;)
fuente
return preg_match('/^[0-9]+$/',$input) ? $input : 0;
Una pieza importante de este rompecabezas son los contextos. Alguien que envíe "1 OR 1 = 1" como ID no es un problema si cita todos los argumentos en su consulta:
Lo que resulta en:
que es ineficaz. Dado que está escapando de la cadena, la entrada no puede salir del contexto de la cadena. He probado esto hasta la versión 5.0.45 de MySQL, y el uso de un contexto de cadena para una columna de número entero no causa ningún problema.
fuente
Funciona bien, incluso mejor en sistemas de 64 bits. Sin embargo, tenga cuidado con las limitaciones de su sistema al abordar grandes números, pero para los identificadores de bases de datos esto funciona muy bien el 99% del tiempo.
También debería utilizar una única función / método para limpiar sus valores. Incluso si esta función es solo un contenedor para mysql_real_escape_string (). ¿Por qué? Porque un día, cuando se encuentra un exploit para su método preferido de limpieza de datos, solo tiene que actualizarlo en un lugar, en lugar de buscar y reemplazar en todo el sistema.
fuente
¿Por qué, oh POR QUÉ, no incluirías comillas alrededor de la entrada del usuario en tu declaración sql? parece bastante tonto no hacerlo! incluir comillas en su declaración SQL haría que "1 o 1 = 1" sea un intento infructuoso, ¿no?
así que ahora, dirá, "¿y si el usuario incluye una cita (o comillas dobles) en la entrada?"
bueno, solución fácil para eso: simplemente elimine las comillas ingresadas por el usuario. por ejemplo:
input =~ s/'//g;
. ahora, me parece que de todos modos, la entrada del usuario estaría asegurada ...fuente