Abortar temprano en un pliegue

88

¿Cuál es la mejor manera de terminar un pliegue antes de tiempo? Como ejemplo simplificado, imagine que quiero resumir los números en un Iterable, pero si encuentro algo que no estoy esperando (digamos un número impar), es posible que desee terminar. Esta es una primera aproximación

def sumEvenNumbers(nums: Iterable[Int]): Option[Int] = {
  nums.foldLeft (Some(0): Option[Int]) {
    case (Some(s), n) if n % 2 == 0 => Some(s + n)
    case _ => None
  }
}

Sin embargo, esta solución es bastante fea (como en, si hiciera un .foreach y un retorno, sería mucho más limpio y claro) y lo peor de todo es que atraviesa todo el iterable incluso si encuentra un número no par .

Entonces, ¿cuál sería la mejor manera de escribir un pliegue como este, que termina antes? ¿Debería escribir esto de forma recursiva o hay una forma más aceptada?

Heptic
fuente
¿Quieres terminar y registrar la respuesta intermedia?
Brian Agnew
En este caso, no. Pero en un caso un poco más general, es posible que desee devolver un O que tiene un error o algo así
Heptic
Existe esta pregunta: stackoverflow.com/questions/1595427/…
ziggystar
Esta respuesta sobre la ruptura de bucles también puede resultar útil: stackoverflow.com/a/2742941/1307721
ejoubaud

Respuestas:

64

Mi primera opción suele ser utilizar la recursividad. Es solo moderadamente menos compacto, es potencialmente más rápido (ciertamente no más lento) y en una terminación anticipada puede hacer que la lógica sea más clara. En este caso, necesita defs anidadas, lo cual es un poco incómodo:

def sumEvenNumbers(nums: Iterable[Int]) = {
  def sumEven(it: Iterator[Int], n: Int): Option[Int] = {
    if (it.hasNext) {
      val x = it.next
      if ((x % 2) == 0) sumEven(it, n+x) else None
    }
    else Some(n)
  }
  sumEven(nums.iterator, 0)
}

Mi segunda opción sería usar return, ya que mantiene todo lo demás intacto y solo necesita envolver el pliegue en un defpara tener algo de lo que regresar; en este caso, ya tiene un método, así que:

def sumEvenNumbers(nums: Iterable[Int]): Option[Int] = {
  Some(nums.foldLeft(0){ (n,x) =>
    if ((n % 2) != 0) return None
    n+x
  })
}

que en este caso particular es mucho más compacto que la recursividad (aunque tuvimos especialmente mala suerte con la recursividad ya que tuvimos que hacer una transformación iterable / iterador). El flujo de control saltado es algo que se debe evitar cuando todo lo demás es igual, pero aquí no lo es. No está de más usarlo en los casos en que sea valioso.

Si estuviera haciendo esto a menudo y lo quisiera en medio de un método en algún lugar (por lo que no podría simplemente usar return), probablemente usaría el manejo de excepciones para generar un flujo de control no local. Después de todo, eso es en lo que es bueno, y el manejo de errores no es el único momento en que es útil. El único truco es evitar generar un seguimiento de pila (que es realmente lento), y eso es fácil porque el rasgo NoStackTracey su rasgo secundario ControlThrowableya lo hacen por usted. Scala ya usa esto internamente (de hecho, ¡así es como implementa el retorno desde dentro del pliegue!). Hagamos el nuestro (no se puede anidar, aunque se podría arreglar eso):

import scala.util.control.ControlThrowable
case class Returned[A](value: A) extends ControlThrowable {}
def shortcut[A](a: => A) = try { a } catch { case Returned(v) => v }

def sumEvenNumbers(nums: Iterable[Int]) = shortcut{
  Option(nums.foldLeft(0){ (n,x) =>
    if ((x % 2) != 0) throw Returned(None)
    n+x
  })
}

Aquí, por supuesto, usar returnes mejor, pero tenga en cuenta que puede poner en shortcutcualquier lugar, no solo envolver un método completo.

El siguiente en la fila para mí sería volver a implementar el pliegue (ya sea yo mismo o encontrar una biblioteca que lo haga) para que pueda indicar la terminación anticipada. Las dos formas naturales de hacer esto son no propagar el valor sino Optioncontener el valor, donde Nonesignifica terminación; o para utilizar una función de segundo indicador que señala la finalización. El pliegue perezoso de Scalaz mostrado por Kim Stebel ya cubre el primer caso, así que mostraré el segundo (con una implementación mutable):

def foldOrFail[A,B](it: Iterable[A])(zero: B)(fail: A => Boolean)(f: (B,A) => B): Option[B] = {
  val ii = it.iterator
  var b = zero
  while (ii.hasNext) {
    val x = ii.next
    if (fail(x)) return None
    b = f(b,x)
  }
  Some(b)
}

def sumEvenNumbers(nums: Iterable[Int]) = foldOrFail(nums)(0)(_ % 2 != 0)(_ + _)

(Si implementa la terminación por recursividad, retorno, pereza, etc., depende de usted).

Creo que cubre las principales variantes razonables; También hay algunas otras opciones, pero no estoy seguro de por qué se usarían en este caso. (en Iteratorsí mismo funcionaría bien si tuviera un findOrPrevious, pero no lo tiene, y el trabajo adicional que se necesita para hacerlo a mano lo convierte en una opción tonta para usar aquí).

Rex Kerr
fuente
El foldOrFailes exactamente lo que había llegado con la hora de pensar la cuestión. No hay razón para no usar un iterador mutable y un bucle while en la implementación IMO, cuando todo está bien encapsulado. Usar iteratorjunto con la recursividad no tiene sentido.
0__
@Rex Kerr, gracias por su respuesta, modifiqué una versión para mi propio uso que usa Either ... (Voy a publicarla como respuesta)
Core
Probablemente una de las desventajas de la solución basada en el retorno es que lleva un tiempo darse cuenta de a qué función se aplica: sumEvenNumberso del doblezop
Ivan Balashov
1
@IvanBalashov - Bueno, una vez se necesita un tiempo para aprender para qué sirven las reglas de Scala return(es decir, regresa del método explícito más interno en el que lo encuentras), pero después de eso no debería tomar mucho tiempo. La regla es bastante clara y defrevela dónde está el método de cierre.
Rex Kerr
1
Me gusta su foldOrFail pero personalmente hubiera hecho el tipo de retorno Bno Option[B]porque entonces se comporta como fold donde el tipo de retorno es el mismo que el tipo del acumulador cero. Simplemente reemplace todas las devoluciones de opciones con b. y pas en Ninguno como el cero. Después de todo, la pregunta quería un pliegue que pudiera terminar temprano, en lugar de fallar.
Karl
26

El escenario que describe (salir por alguna condición no deseada) parece un buen caso de uso para el takeWhilemétodo. Esencialmente filter, pero debería terminar al encontrar un elemento que no cumple con la condición.

Por ejemplo:

val list = List(2,4,6,8,6,4,2,5,3,2)
list.takeWhile(_ % 2 == 0) //result is List(2,4,6,8,6,4,2)

Esto también funcionará bien para Iterators / Iterables. La solución que sugiero para su "suma de números pares, pero romper en impares" es:

list.iterator.takeWhile(_ % 2 == 0).foldLeft(...)

Y solo para demostrar que no está perdiendo el tiempo una vez que llega a un número impar ...

scala> val list = List(2,4,5,6,8)
list: List[Int] = List(2, 4, 5, 6, 8)

scala> def condition(i: Int) = {
     |   println("processing " + i)
     |   i % 2 == 0
     | }
condition: (i: Int)Boolean

scala> list.iterator.takeWhile(condition _).sum
processing 2
processing 4
processing 5
res4: Int = 6
Dylan
fuente
Este era exactamente el tipo de simplicidad que estaba buscando, ¡gracias!
Tanner
14

Puede hacer lo que quiera con un estilo funcional utilizando la versión perezosa de foldRight en scalaz. Para obtener una explicación más detallada, consulte esta publicación de blog . Si bien esta solución usa un Stream, puede convertir un Iterableen un de manera Streameficiente con iterable.toStream.

import scalaz._
import Scalaz._

val str = Stream(2,1,2,2,2,2,2,2,2)
var i = 0 //only here for testing
val r = str.foldr(Some(0):Option[Int])((n,s) => {
  println(i)
  i+=1
  if (n % 2 == 0) s.map(n+) else None
})

Esto solo imprime

0
1

lo que muestra claramente que la función anónima solo se llama dos veces (es decir, hasta que encuentra el número impar). Eso se debe a la definición de foldr, cuya firma (en el caso de Stream) es def foldr[B](b: B)(f: (Int, => B) => B)(implicit r: scalaz.Foldable[Stream]): B. Tenga en cuenta que la función anónima toma un parámetro por nombre como segundo argumento, por lo que no es necesario evaluarlo.

Por cierto, todavía puede escribir esto con la solución de coincidencia de patrones del OP, pero encuentro que if / else y el mapa son más elegantes.

Kim Stebel
fuente
¿Qué pasa si pones printlnantes if- elseexpresión?
missingfaktor
@missingfaktor: luego imprime 0 y 1, pero no más
Kim Stebel
@missingfaktor: dado que mi punto es más fácil de hacer de esta manera, lo cambié en la respuesta
Kim Stebel
1
Tenga en cuenta que puede convertir cualquier iterable en una secuencia con toStream, por lo que esta respuesta es más general de lo que parece a primera vista.
Rex Kerr
2
Ya que estás usando Scalaz, ¿por qué no usar ‛0.some‛?
pedrofurla
7

Bueno, Scala permite devoluciones no locales. Hay diferentes opiniones sobre si este es un buen estilo o no.

scala> def sumEvenNumbers(nums: Iterable[Int]): Option[Int] = {
     |   nums.foldLeft (Some(0): Option[Int]) {
     |     case (None, _) => return None
     |     case (Some(s), n) if n % 2 == 0 => Some(s + n)
     |     case (Some(_), _) => None
     |   }
     | }
sumEvenNumbers: (nums: Iterable[Int])Option[Int]

scala> sumEvenNumbers(2 to 10)
res8: Option[Int] = None

scala> sumEvenNumbers(2 to 10 by 2)
res9: Option[Int] = Some(30)

EDITAR:

En este caso particular, como sugirió @Arjan, también puede hacer:

def sumEvenNumbers(nums: Iterable[Int]): Option[Int] = {
  nums.foldLeft (Some(0): Option[Int]) {
    case (Some(s), n) if n % 2 == 0 => Some(s + n)
    case _ => return None
  }
}
desaparecido faktor
fuente
2
en lugar de Some(0): Option[Int]simplemente escribir Option(0).
Luigi Plinge
1
@LuigiPlinge, sí. Simplemente copié y pegué el código de OP e hice solo las modificaciones necesarias para hacer un punto.
missingfaktor
5

Los gatos tienen un método llamado foldM que no cortocircuito (para Vector, List, Stream, ...).

Funciona de la siguiente manera:

def sumEvenNumbers(nums: Stream[Int]): Option[Long] = {
  import cats.implicits._
  nums.foldM(0L) {
    case (acc, c) if c % 2 == 0 => Some(acc + c)
    case _ => None
  }
}

Tan pronto como uno de los elementos de la colección no esté parejo, regresa.

Didac Montero
fuente
4

Puede usar foldMdesde cats lib (como lo sugiere @Didac) pero sugiero usar en Eitherlugar de Optionsi desea obtener la suma real.

bifoldMapse utiliza para extraer el resultado de Either.

import cats.implicits._

def sumEven(nums: Stream[Int]): Either[Int, Int] = {
    nums.foldM(0) {
      case (acc, n) if n % 2 == 0 => Either.right(acc + n)
      case (acc, n) => {
        println(s"Stopping on number: $n")
        Either.left(acc)
      }
    }
  }

ejemplos:

println("Result: " + sumEven(Stream(2, 2, 3, 11)).bifoldMap(identity, identity))
> Stopping on number: 3
> Result: 4

println("Result: " + sumEven(Stream(2, 7, 2, 3)).bifoldMap(identity, identity))
> Stopping on number: 7
> Result: 2
rozky
fuente
Vine aquí para publicar una respuesta similar, porque en mi opinión, esta es la forma más conveniente pero aún de FP de hacerlo. Me sorprende que nadie vote por esto. Entonces, toma mi +1. (Prefiero en (acc + n).asRightlugar de Either.right(acc + n)pero de todos modos)
abdolence
en lugar de bifoldMapsimplemente fold(L => C, R => C): Cfuncionará en Either[L, R], y luego usted no necesita unMonoid[C]
Ben Hutchison
1

@Rex Kerr, tu respuesta me ayudó, pero necesitaba modificarla para usar Either

  
  def foldOrFail [A, B, C, D] (map: B => O [D, C]) (fusionar: (A, C) => A) (inicial: A) (it: Iterable [B]): O [D, A] = {
    val ii = it.iterator
    var b = inicial
    while (ii.hasNext) {
      val x = ii. siguiente
      mapa (x) coincide {
        case Left (error) => return Left (error)
        caso Derecha (d) => b = fusionar (b, d)
      }
    }
    Derecha (b)
  }
Núcleo
fuente
1

Podría intentar usar una var temporal y usar takeWhile. Aquí hay una versión.

  var continue = true

  // sample stream of 2's and then a stream of 3's.

  val evenSum = (Stream.fill(10)(2) ++ Stream.fill(10)(3)).takeWhile(_ => continue)
    .foldLeft(Option[Int](0)){

    case (result,i) if i%2 != 0 =>
          continue = false;
          // return whatever is appropriate either the accumulated sum or None.
          result
    case (optionSum,i) => optionSum.map( _ + i)

  }

El evenSumdebe ser Some(20)en este caso.

gaviota1089
fuente
0

Una solución más hermosa sería usar span:

val (l, r) = numbers.span(_ % 2 == 0)
if(r.isEmpty) Some(l.sum)
else None

... pero atraviesa la lista dos veces si todos los números son pares

Arjan
fuente
2
Me gusta el pensamiento lateral ejemplificado por su solución, pero solo resuelve el ejemplo específico elegido en la pregunta en lugar de abordar la pregunta general de cómo terminar un pliegue antes de tiempo.
iainmcgin
Quería mostrar cómo hacer lo contrario, no terminar un pliegue antes, sino solo plegar (en este caso suma) sobre los valores que queremos plegar
Arjan
0

Solo por razones "académicas" (:

var headers = Source.fromFile(file).getLines().next().split(",")
var closeHeaderIdx = headers.takeWhile { s => !"Close".equals(s) }.foldLeft(0)((i, S) => i+1)

Toma dos veces, entonces debería, pero es una buena línea. Si no se encuentra "Cerrar", volverá

headers.size

Otro (mejor) es este:

var headers = Source.fromFile(file).getLines().next().split(",").toList
var closeHeaderIdx = headers.indexOf("Close")
ozma
fuente