Tengo una base de datos con 'libros' (cuentos para niños) y sería extremadamente informativo contar los recuentos de cada palabra en los libros.
Descubrí cómo obtener el recuento de palabras para cada palabra usando:
SELECT SUM
(
ROUND
(
(LENGTH(pageText) - LENGTH (REPLACE (pageText, "Word", "")))
/LENGTH("Word")
)
) FROM pages WHERE bookID = id;
Lo que funciona maravillosamente para contar las palabras. PERO requiere que revise cada libro, saque cada palabra y la ejecute a través de esa función (lo tengo guardado como un procedimiento almacenado).
Tengo una tabla que contiene cada palabra, sin duplicados.
Mi pregunta: ¿hay alguna manera de hacer algún tipo de "para cada" bucle en la tabla de palabras usando mi procedimiento almacenado?
es decir. pasar el procedimiento almacenado una identificación del libro y una palabra y registrar el resultado. Haciendo CADA palabra, por CADA libro. Por lo tanto, me ahorra MUCHO tiempo manual ... ¿Es esto algo que incluso debería estar haciendo desde el lado de la base de datos? ¿Debería intentarlo con PHP?
Sinceramente, cualquier aportación es muy apreciada.
fuente
count(explode(' ', $pageText))+1
. O algo más complejo para manejar múltiples espacios entre palabras, quizás involucrandopreg_replace('/\s+/', ' ', $pageText)
1+split(/\s+/, $pageText)
. El 1 se debe a que el conteo es de espacios, no de palabras.Respuestas:
Cree un segundo procedimiento que use dos cursores anidados.
Los cursores en los procedimientos almacenados le permiten hacer cosas muy distintas a las de SQL: iterar a través de un conjunto de resultados una fila a la vez, poner los valores de columna seleccionados en variables y hacer cosas con ellos.
Se usan mal fácilmente, ya que SQL, al ser declarativo en lugar de procesal, generalmente no debería necesitar operaciones de tipo "para cada", pero en este caso, parece una aplicación válida.
Una vez que los domine, los cursores son fáciles, pero requieren un enfoque estructurado en su código de soporte que no siempre es intuitivo.
Recientemente proporcioné un código "estándar" bastante estándar para trabajar con un cursor para llamar a un procedimiento almacenado en una respuesta en Desbordamiento de pila , y me prestaré mucho de esa respuesta, a continuación.
El uso de un cursor requiere un código estándar estándar para rodearlo.
Usted
SELECT
los valores que desea pasar, desde donde los obtenga (que podría ser una tabla temporal, una tabla base o una vista, y puede incluir llamadas a funciones almacenadas) y luego llame a su procedimiento existente con esos valores.Aquí hay un ejemplo sintácticamente válido del código necesario, con comentarios para explicar lo que está haciendo cada componente.
Este ejemplo usa 2 columnas para pasar 2 valores al procedimiento llamado.
Tenga en cuenta que hay eventos que suceden aquí están en un orden específico por una razón. Las variables deben declararse primero, los cursores deben declararse antes que sus manejadores continuos, y los bucles deben seguir todas esas cosas.
No puede hacer las cosas fuera de orden, por lo que cuando anida un cursor dentro de otro, debe restablecer el alcance del procedimiento anidando código adicional dentro de
BEGIN
...END
bloques dentro del cuerpo del procedimiento; por ejemplo, si necesitaras un segundo cursor dentro del ciclo, lo declararías dentro del ciclo, dentro de otroBEGIN
...END
bloque.fuente
BEGIN
/END
, y se cierran implícitamente cuando quedan fuera del alcance ... por lo que no es estrictamente necesario cerrar los cursores. Como práctica, lo considero innecesario y no lo incluyo, pero para completar, he agregado laCLOSE
declaración a la respuesta.