Necesito hacer una división simple de una cadena, pero no parece haber una función para esto, y la forma manual que probé no pareció funcionar. ¿Cómo lo haría?
Aquí está mi solución realmente simple. Use la función gmatch para capturar cadenas que contengan al menos un carácter de cualquier cosa que no sea el separador deseado. El separador es ** cualquier * espacio en blanco (% s en Lua) por defecto:
function mysplit (inputstr, sep)if sep ==nilthen
sep ="%s"endlocal t={}for str in string.gmatch(inputstr,"([^"..sep.."]+)")do
table.insert(t, str)endreturn t
end
Wow, la primera respuesta en toda esta pregunta que realmente tiene una función que devuelve una tabla. Sin embargo, tenga en cuenta que t y yo necesitamos el modificador "local", ya que está sobrescribiendo globales. :)
cib
3
Como otros han señalado, puede simplificar esto usando table.insert (t, str) en lugar de t [i] = str y luego no necesita i = 1 o i = i +1
James Newton
2
No funciona si la cadena contiene valores vacíos, por ejemplo. 'foo,,bar'. Usted obtiene en {'foo','bar'}lugar de{'foo', '', 'bar'}
andras
55
Así es. La siguiente versión funcionará en ese caso: function split(inputstr, sep) sep=sep or '%s' local t={} for field,s in string.gmatch(inputstr, "([^"..sep.."]*)("..sep.."?)") do table.insert(t,field) if s=="" then return t end end end
Bart
33
Si está dividiendo una cadena en Lua, debe probar los métodos string.gmatch () o string.sub (). Use el método string.sub () si conoce el índice en el que desea dividir la cadena, o use string.gmatch () si analizará la cadena para encontrar la ubicación en la que dividir la cadena.
El patrón %Ses igual al que usted mencionó, como lo %Ses la negación de %s, como %Des la negación de %d. Además, %wes igual a [A-Za-z0-9_](es posible que se admitan otros caracteres según su entorno local).
Lars Gyrup Brink Nielsen
14
Así como string.gmatchencontrará patrones en una cadena, esta función encontrará las cosas entre patrones:
function string:split(pat)
pat = pat or'%s+'local st, g =1, self:gmatch("()("..pat..")")localfunction getter(segs, seps, sep, cap1,...)
st = sep and seps +#sep
return self:sub(segs,(seps or0)-1), cap1 or sep,...endreturnfunction()if st thenreturn getter(st, g())endendend
Por defecto, devuelve lo que esté separado por espacios en blanco.
+1. Nota para cualquier otro principiante de Lua: esto devuelve un iterador, y 'entre patrones' incluye el comienzo y el final de la cadena. (Como novato tuve que intentarlo para resolver estas cosas.)
Darius Bacon
12
Aquí está la función:
function split(pString, pPattern)local Table ={}-- NOTE: use {n = 0} in Lua-5.0local fpat ="(.-)".. pPattern
local last_end =1local s, e, cap = pString:find(fpat,1)while s doif s ~=1or cap ~=""then
table.insert(Table,cap)end
last_end = e+1
s, e, cap = pString:find(fpat, last_end)endif last_end <=#pString then
cap = pString:sub(last_end)
table.insert(Table, cap)endreturn Table
end
Este es mi favorito, ya que es muy corto y simple. No entiendo muy bien lo que sucede, ¿podría alguien explicarme?
hexagonest
2
Esto falla cuando se utiliza el punto como delimitador (o potencialmente cualquier otro personaje mágico de patrón)
TurboHz
6
Debido a que hay más de una forma de pelar un gato, este es mi enfoque:
Código :
#!/usr/bin/env lua
local content =[=[
Lorem ipsum dolor sit amet, consectetur adipisicing elit,
sed do eiusmod tempor incididunt ut labore et dolore magna
aliqua. Ut enim ad minim veniam, quis nostrud exercitation
ullamco laboris nisi ut aliquip ex ea commodo consequat.
]=]localfunction split(str, sep)local result ={}local regex =("([^%s]+)"):format(sep)for each in str:gmatch(regex)do
table.insert(result, each)endreturn result
endlocal lines = split(content,"\n")for _,line in ipairs(lines)do
print(line)end
Salida :
Lorem ipsum dolor sit amet, consectetur adipisicing elit,
sed do eiusmod tempor incididunt ut labore et dolore magna
aliqua. Ut enim ad minim veniam, quis nostrud exercitation
ullamco laboris nisi ut aliquip ex ea commodo consequat.
Explicacion :
La gmatchfunción funciona como un iterador, recupera todas las cadenas que coinciden regex. El regextoma todos los caracteres hasta que encuentra un separador.
function string:split(delimiter)local result ={}local from =1local delim_from, delim_to = string.find( self, delimiter, from )while delim_from do
table.insert( result, string.sub( self, from , delim_from-1))
from = delim_to +1
delim_from, delim_to = string.find( self, delimiter, from )end
table.insert( result, string.sub( self, from ))return result
end
delimiter = string.split(stringtodelimite,pattern)
Muchas de estas respuestas solo aceptan separadores de un solo carácter, o no tratan bien los casos límite (por ejemplo, separadores vacíos), por lo que pensé que proporcionaría una solución más definitiva.
Aquí hay dos funciones gsplity split, adaptadas del código en la extensión Scribunto MediaWiki , que se usa en wikis como Wikipedia. El código tiene licencia bajo la GPL v2 . Cambié los nombres de las variables y agregué comentarios para que el código sea un poco más fácil de entender, y también cambié el código para usar patrones de cadena Lua regulares en lugar de los patrones de Scribunto para cadenas Unicode. El código original tiene casos de prueba aquí .
-- gsplit: iterate over substrings in a string separated by a pattern-- -- Parameters:-- text (string) - the string to iterate over-- pattern (string) - the separator pattern-- plain (boolean) - if true (or truthy), pattern is interpreted as a plain-- string, not a Lua pattern-- -- Returns: iterator---- Usage:-- for substr in gsplit(text, pattern, plain) do-- doSomething(substr)-- endlocalfunction gsplit(text, pattern, plain)local splitStart, length =1,#text
returnfunction()if splitStart thenlocal sepStart, sepEnd = string.find(text, pattern, splitStart, plain)local ret
ifnot sepStart then
ret = string.sub(text, splitStart)
splitStart =nilelseif sepEnd < sepStart then-- Empty separator!
ret = string.sub(text, splitStart, sepStart)if sepStart < length then
splitStart = sepStart +1else
splitStart =nilendelse
ret = sepStart > splitStart and string.sub(text, splitStart, sepStart -1)or''
splitStart = sepEnd +1endreturn ret
endendend-- split: split a string into substrings separated by a pattern.-- -- Parameters:-- text (string) - the string to iterate over-- pattern (string) - the separator pattern-- plain (boolean) - if true (or truthy), pattern is interpreted as a plain-- string, not a Lua pattern-- -- Returns: table (a sequence table containing the substrings)localfunction split(text, pattern, plain)local ret ={}for match in gsplit(text, pattern, plain)do
table.insert(ret, match)endreturn ret
end
Algunos ejemplos de la splitfunción en uso:
localfunction printSequence(t)
print(unpack(t))end
printSequence(split('foo, bar,baz',',%s*'))-- foo bar baz
printSequence(split('foo, bar,baz',',%s*',true))-- foo, bar,baz
printSequence(split('foo',''))-- f o o
function str_split(str, sep)if sep ==nilthen
sep ='%s'endlocal res ={}local func =function(w)
table.insert(res, w)end
string.gsub(str,'[^'..sep..']+', func)return res
end
Usé los ejemplos anteriores para diseñar mi propia función. Pero la pieza que faltaba para mí era escapar automáticamente de los personajes mágicos.
Aquí está mi contribución:
function split(text, delim)-- returns an array of fields based on text and delimiter (one character only)local result ={}local magic ="().%+-*?[]^$"if delim ==nilthen
delim ="%s"elseif string.find(delim, magic,1,true)then-- escape magic
delim ="%"..delim
endlocal pattern ="[^"..delim.."]+"for w in string.gmatch(text, pattern)do
table.insert(result, w)endreturn result
end
Súper tarde a esta pregunta, pero en caso de que alguien quiera una versión que maneje la cantidad de divisiones que desea obtener .....
-- Split a string into a table using a delimiter and a limit
string.split =function(str, pat, limit)local t ={}local fpat ="(.-)".. pat
local last_end =1local s, e, cap = str:find(fpat,1)while s doif s ~=1or cap ~=""then
table.insert(t, cap)end
last_end = e+1
s, e, cap = str:find(fpat, last_end)if limit ~=niland limit <=#t thenbreakendendif last_end <=#str then
cap = str:sub(last_end)
table.insert(t, cap)endreturn t
end
Si programa en Lua, no tiene suerte aquí. Lua es EL único lenguaje de programación que resulta notoriamente infame porque sus autores nunca implementaron "la" función dividida en la biblioteca estándar, y en su lugar escribieron 16 pantallas llenas de explicaciones y excusas poco convincentes sobre por qué no lo hicieron y no lo harían, intercalado con numerosos ejemplos de medio trabajo que están prácticamente garantizados para trabajar para casi todos, pero que se rompen en su caso de esquina. Esto es solo el estado del arte de Lua, y todos los que programan en Lua simplemente terminan apretando los dientes e iterando sobre los personajes. Existen muchas soluciones que a veces son mejores, pero exactamente cero soluciones que son confiablemente mejores.
Respuestas:
Aquí está mi solución realmente simple. Use la función gmatch para capturar cadenas que contengan al menos un carácter de cualquier cosa que no sea el separador deseado. El separador es ** cualquier * espacio en blanco (% s en Lua) por defecto:
.
fuente
'foo,,bar'
. Usted obtiene en{'foo','bar'}
lugar de{'foo', '', 'bar'}
function split(inputstr, sep) sep=sep or '%s' local t={} for field,s in string.gmatch(inputstr, "([^"..sep.."]*)("..sep.."?)") do table.insert(t,field) if s=="" then return t end end end
Si está dividiendo una cadena en Lua, debe probar los métodos string.gmatch () o string.sub (). Use el método string.sub () si conoce el índice en el que desea dividir la cadena, o use string.gmatch () si analizará la cadena para encontrar la ubicación en la que dividir la cadena.
Ejemplo usando string.gmatch () del Manual de referencia de Lua 5.1 :
fuente
Si solo desea iterar sobre los tokens, esto es bastante bueno:
Salida:
Breve explicación: el patrón "[^% s] +" coincide con cada cadena no vacía entre caracteres de espacio.
fuente
%S
es igual al que usted mencionó, como lo%S
es la negación de%s
, como%D
es la negación de%d
. Además,%w
es igual a[A-Za-z0-9_]
(es posible que se admitan otros caracteres según su entorno local).Así como
string.gmatch
encontrará patrones en una cadena, esta función encontrará las cosas entre patrones:Por defecto, devuelve lo que esté separado por espacios en blanco.
fuente
Aquí está la función:
Llámalo como:
p.ej:
Para más información, visite aquí:
http://lua-users.org/wiki/SplitJoin
fuente
Me gusta esta solucion corta
fuente
Debido a que hay más de una forma de pelar un gato, este es mi enfoque:
Código :
Salida :
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Explicacion :
La
gmatch
función funciona como un iterador, recupera todas las cadenas que coincidenregex
. Elregex
toma todos los caracteres hasta que encuentra un separador.fuente
Puedes usar este método:
fuente
Muchas de estas respuestas solo aceptan separadores de un solo carácter, o no tratan bien los casos límite (por ejemplo, separadores vacíos), por lo que pensé que proporcionaría una solución más definitiva.
Aquí hay dos funciones
gsplit
ysplit
, adaptadas del código en la extensión Scribunto MediaWiki , que se usa en wikis como Wikipedia. El código tiene licencia bajo la GPL v2 . Cambié los nombres de las variables y agregué comentarios para que el código sea un poco más fácil de entender, y también cambié el código para usar patrones de cadena Lua regulares en lugar de los patrones de Scribunto para cadenas Unicode. El código original tiene casos de prueba aquí .Algunos ejemplos de la
split
función en uso:fuente
una forma no vista en otros
fuente
Simplemente sentado en un delimitador
fuente
Usé los ejemplos anteriores para diseñar mi propia función. Pero la pieza que faltaba para mí era escapar automáticamente de los personajes mágicos.
Aquí está mi contribución:
fuente
Podrías usar la biblioteca penlight . Esto tiene una función para dividir cadenas usando delimitador que genera la lista.
Ha implementado muchas de las funciones que podemos necesitar al programar y faltar en Lua.
Aquí está la muestra para usarlo.
fuente
Dependiendo del caso de uso, esto podría ser útil. Corta todo el texto a ambos lados de las banderas:
Salida:
fuente
Súper tarde a esta pregunta, pero en caso de que alguien quiera una versión que maneje la cantidad de divisiones que desea obtener .....
fuente
Si programa en Lua, no tiene suerte aquí. Lua es EL único lenguaje de programación que resulta notoriamente infame porque sus autores nunca implementaron "la" función dividida en la biblioteca estándar, y en su lugar escribieron 16 pantallas llenas de explicaciones y excusas poco convincentes sobre por qué no lo hicieron y no lo harían, intercalado con numerosos ejemplos de medio trabajo que están prácticamente garantizados para trabajar para casi todos, pero que se rompen en su caso de esquina. Esto es solo el estado del arte de Lua, y todos los que programan en Lua simplemente terminan apretando los dientes e iterando sobre los personajes. Existen muchas soluciones que a veces son mejores, pero exactamente cero soluciones que son confiablemente mejores.
fuente