Estaba tratando de contar palabras en un texto de esta manera:
function WordCount(str) {
var totalSoFar = 0;
for (var i = 0; i < WordCount.length; i++)
if (str(i) === " ") { // if a space is found in str
totalSoFar = +1; // add 1 to total so far
}
totalsoFar += 1; // add 1 to totalsoFar to account for extra space since 1 space = 2 words
}
console.log(WordCount("Random String"));
Creo que lo entendí bastante bien, excepto que creo que la if
afirmación es incorrecta. La parte que verifica si str(i)
contiene un espacio y agrega 1.
Editar:
Descubrí (gracias a Blender) que puedo hacer esto con mucho menos código:
function WordCount(str) {
return str.split(" ").length;
}
console.log(WordCount("hello world"));
javascript
Valerio Bozz
fuente
fuente
str.split(' ').length
sería un método más sencillo? jsfiddle.net/j08691/zUuzdstr.split(' ')
y luego contar los que no son cadenas de longitud 0?Respuestas:
Utilice corchetes, no paréntesis:
str[i] === " "
O bien
charAt
:str.charAt(i) === " "
También puedes hacerlo con
.split()
:return str.split(' ').length;
fuente
Pruébalos antes de reinventar las ruedas.
from Contar el número de palabras en una cadena usando JavaScript
function countWords(str) { return str.trim().split(/\s+/).length; }
de http://www.mediacollege.com/internet/javascript/text/count-words.html
function countWords(s){ s = s.replace(/(^\s*)|(\s*$)/gi,"");//exclude start and end white-space s = s.replace(/[ ]{2,}/gi," ");//2 or more space to 1 s = s.replace(/\n /,"\n"); // exclude newline with a start spacing return s.split(' ').filter(function(str){return str!="";}).length; //return s.split(' ').filter(String).length; - this can also be used }
de Use JavaScript para contar palabras en una cadena, SIN usar una expresión regular : este será el mejor enfoque
function WordCount(str) { return str.split(' ') .filter(function(n) { return n != '' }) .length; }
fuente
Una forma más de contar palabras en una cadena. Este código cuenta las palabras que contienen solo caracteres alfanuméricos y caracteres "_", "'", "-", "'".
function countWords(str) { var matches = str.match(/[\w\d\’\'-]+/gi); return matches ? matches.length : 0; }
fuente
’'-
para que "Miau de gato" no cuente como 3 palabras. Y "en el medio"’'
en una expresión regular. Úselo/[\w\d’'-]+/gi
para evitar las advertencias de escape no inútil deDespués de limpiar la cadena, puede hacer coincidir caracteres que no sean espacios en blanco o límites de palabras.
Aquí hay dos expresiones regulares simples para capturar palabras en una cadena:
/\S+/g
/\b[a-z\d]+\b/g
El siguiente ejemplo muestra cómo recuperar el recuento de palabras de una cadena, utilizando estos patrones de captura.
/*Redirect console output to HTML.*/document.body.innerHTML='';console.log=function(s){document.body.innerHTML+=s+'\n';}; /*String format.*/String.format||(String.format=function(f){return function(a){return f.replace(/{(\d+)}/g,function(m,n){return"undefined"!=typeof a[n]?a[n]:m})}([].slice.call(arguments,1))}); // ^ IGNORE CODE ABOVE ^ // ================= // Clean and match sub-strings in a string. function extractSubstr(str, regexp) { return str.replace(/[^\w\s]|_/g, '') .replace(/\s+/g, ' ') .toLowerCase().match(regexp) || []; } // Find words by searching for sequences of non-whitespace characters. function getWordsByNonWhiteSpace(str) { return extractSubstr(str, /\S+/g); } // Find words by searching for valid characters between word-boundaries. function getWordsByWordBoundaries(str) { return extractSubstr(str, /\b[a-z\d]+\b/g); } // Example of usage. var edisonQuote = "I have not failed. I've just found 10,000 ways that won't work."; var words1 = getWordsByNonWhiteSpace(edisonQuote); var words2 = getWordsByWordBoundaries(edisonQuote); console.log(String.format('"{0}" - Thomas Edison\n\nWord count via:\n', edisonQuote)); console.log(String.format(' - non-white-space: ({0}) [{1}]', words1.length, words1.join(', '))); console.log(String.format(' - word-boundaries: ({0}) [{1}]', words2.length, words2.join(', ')));
body { font-family: monospace; white-space: pre; font-size: 11px; }
Encontrar palabras únicas
También puede crear un mapeo de palabras para obtener recuentos únicos.
function cleanString(str) { return str.replace(/[^\w\s]|_/g, '') .replace(/\s+/g, ' ') .toLowerCase(); } function extractSubstr(str, regexp) { return cleanString(str).match(regexp) || []; } function getWordsByNonWhiteSpace(str) { return extractSubstr(str, /\S+/g); } function getWordsByWordBoundaries(str) { return extractSubstr(str, /\b[a-z\d]+\b/g); } function wordMap(str) { return getWordsByWordBoundaries(str).reduce(function(map, word) { map[word] = (map[word] || 0) + 1; return map; }, {}); } function mapToTuples(map) { return Object.keys(map).map(function(key) { return [ key, map[key] ]; }); } function mapToSortedTuples(map, sortFn, sortOrder) { return mapToTuples(map).sort(function(a, b) { return sortFn.call(undefined, a, b, sortOrder); }); } function countWords(str) { return getWordsByWordBoundaries(str).length; } function wordFrequency(str) { return mapToSortedTuples(wordMap(str), function(a, b, order) { if (b[1] > a[1]) { return order[1] * -1; } else if (a[1] > b[1]) { return order[1] * 1; } else { return order[0] * (a[0] < b[0] ? -1 : (a[0] > b[0] ? 1 : 0)); } }, [1, -1]); } function printTuples(tuples) { return tuples.map(function(tuple) { return padStr(tuple[0], ' ', 12, 1) + ' -> ' + tuple[1]; }).join('\n'); } function padStr(str, ch, width, dir) { return (width <= str.length ? str : padStr(dir < 0 ? ch + str : str + ch, ch, width, dir)).substr(0, width); } function toTable(data, headers) { return $('<table>').append($('<thead>').append($('<tr>').append(headers.map(function(header) { return $('<th>').html(header); })))).append($('<tbody>').append(data.map(function(row) { return $('<tr>').append(row.map(function(cell) { return $('<td>').html(cell); })); }))); } function addRowsBefore(table, data) { table.find('tbody').prepend(data.map(function(row) { return $('<tr>').append(row.map(function(cell) { return $('<td>').html(cell); })); })); return table; } $(function() { $('#countWordsBtn').on('click', function(e) { var str = $('#wordsTxtAra').val(); var wordFreq = wordFrequency(str); var wordCount = countWords(str); var uniqueWords = wordFreq.length; var summaryData = [ [ 'TOTAL', wordCount ], [ 'UNIQUE', uniqueWords ] ]; var table = toTable(wordFreq, ['Word', 'Frequency']); addRowsBefore(table, summaryData); $('#wordFreq').html(table); }); });
table { border-collapse: collapse; table-layout: fixed; width: 200px; font-family: monospace; } thead { border-bottom: #000 3px double;; } table, td, th { border: #000 1px solid; } td, th { padding: 2px; width: 100px; overflow: hidden; } textarea, input[type="button"], table { margin: 4px; padding: 2px; }
<script src="https://ajax.googleapis.com/ajax/libs/jquery/1.11.1/jquery.min.js"></script> <h1>Word Frequency</h1> <textarea id="wordsTxtAra" cols="60" rows="8">Four score and seven years ago our fathers brought forth on this continent, a new nation, conceived in Liberty, and dedicated to the proposition that all men are created equal. Now we are engaged in a great civil war, testing whether that nation, or any nation so conceived and so dedicated, can long endure. We are met on a great battle-field of that war. We have come to dedicate a portion of that field, as a final resting place for those who here gave their lives that that nation might live. It is altogether fitting and proper that we should do this. But, in a larger sense, we can not dedicate -- we can not consecrate -- we can not hallow -- this ground. The brave men, living and dead, who struggled here, have consecrated it, far above our poor power to add or detract. The world will little note, nor long remember what we say here, but it can never forget what they did here. It is for us the living, rather, to be dedicated here to the unfinished work which they who fought here have thus far so nobly advanced. It is rather for us to be here dedicated to the great task remaining before us -- that from these honored dead we take increased devotion to that cause for which they gave the last full measure of devotion -- that we here highly resolve that these dead shall not have died in vain -- that this nation, under God, shall have a new birth of freedom -- and that government of the people, by the people, for the people, shall not perish from the earth.</textarea><br /> <input type="button" id="countWordsBtn" value="Count Words" /> <div id="wordFreq"></div>
fuente
Creo que este método es más de lo que quieres.
var getWordCount = function(v){ var matches = v.match(/\S+/g) ; return matches?matches.length:0; }
fuente
String.prototype.match
devuelve una matriz, luego podemos verificar la longitud,Encuentro que este método es muy descriptivo
var str = 'one two three four five'; str.match(/\w+/g).length;
fuente
La forma más fácil que he encontrado hasta ahora es usar una expresión regular con split.
var calculate = function() { var string = document.getElementById('input').value; var length = string.split(/[^\s]+/).length - 1; document.getElementById('count').innerHTML = length; };
<textarea id="input">My super text that does 7 words.</textarea> <button onclick="calculate()">Calculate</button> <span id="count">7</span> words
fuente
La respuesta dada por @ 7-isnotbad es extremadamente cercana, pero no cuenta las líneas de una sola palabra. Aquí está la solución, que parece tener en cuenta todas las combinaciones posibles de palabras, espacios y nuevas líneas.
function countWords(s){ s = s.replace(/\n/g,' '); // newlines to space s = s.replace(/(^\s*)|(\s*$)/gi,''); // remove spaces from start + end s = s.replace(/[ ]{2,}/gi,' '); // 2 or more spaces to 1 return s.split(' ').length; }
fuente
Aquí está mi enfoque, que simplemente divide una cadena por espacios, luego for repite la matriz y aumenta el recuento si la matriz [i] coincide con un patrón de expresión regular dado.
function wordCount(str) { var stringArray = str.split(' '); var count = 0; for (var i = 0; i < stringArray.length; i++) { var word = stringArray[i]; if (/[A-Za-z]/.test(word)) { count++ } } return count }
Invocado así:
var str = "testing strings here's a string --.. ? // ... random characters ,,, end of string"; wordCount(str)
(se agregaron caracteres y espacios adicionales para mostrar la precisión de la función)
La cadena anterior devuelve 10, ¡lo cual es correcto!
fuente
[A-Za-z]
en absolutoEsto manejará todos los casos y es lo más eficiente posible. (No desea dividir ('') a menos que sepa de antemano que no hay espacios de mayor longitud que uno):
var quote = `Of all the talents bestowed upon men, none is so precious as the gift of oratory. He who enjoys it wields a power more durable than that of a great king. He is an independent force in the world. Abandoned by his party, betrayed by his friends, stripped of his offices, whoever can command this power is still formidable.`; function WordCount(text) { text = text.trim(); return text.length > 0 ? text.split(/\s+/).length : 0; } console.log(WordCount(quote));//59 console.log(WordCount('f'));//1 console.log(WordCount(' f '));//1 console.log(WordCount(' '));//0
fuente
Puede que haya una forma más eficaz de hacer esto, pero esto es lo que me ha funcionado.
function countWords(passedString){ passedString = passedString.replace(/(^\s*)|(\s*$)/gi, ''); passedString = passedString.replace(/\s\s+/g, ' '); passedString = passedString.replace(/,/g, ' '); passedString = passedString.replace(/;/g, ' '); passedString = passedString.replace(/\//g, ' '); passedString = passedString.replace(/\\/g, ' '); passedString = passedString.replace(/{/g, ' '); passedString = passedString.replace(/}/g, ' '); passedString = passedString.replace(/\n/g, ' '); passedString = passedString.replace(/\./g, ' '); passedString = passedString.replace(/[\{\}]/g, ' '); passedString = passedString.replace(/[\(\)]/g, ' '); passedString = passedString.replace(/[[\]]/g, ' '); passedString = passedString.replace(/[ ]{2,}/gi, ' '); var countWordsBySpaces = passedString.split(' ').length; return countWordsBySpaces;
}
es capaz de reconocer todo lo siguiente como palabras separadas:
abc,abc
= 2 palabras,abc/abc/abc
= 3 palabras (funciona con barras inclinadas hacia adelante y hacia atrás),abc.abc
= 2 palabras,abc[abc]abc
= 3 palabras,abc;abc
= 2 palabras,(algunas otras sugerencias que he intentado contar cada ejemplo anterior como solo 1 x palabra) también:
ignora todos los espacios en blanco iniciales y finales
cuenta una sola letra seguida de una nueva línea, como una palabra, que he encontrado que algunas de las sugerencias dadas en esta página no cuentan, por ejemplo:
a
a
a
a
a a
veces se cuenta como 0 x palabras, y otras funciones solo lo cuentan como 1 x palabra, en lugar de 5 x palabras)
Si alguien tiene alguna idea sobre cómo mejorarlo, o más limpio / más eficiente, ¡entonces agregue 2 centavos! Espero que esto ayude a alguien.
fuente
function countWords(str) { var regEx = /([^\u0000-\u007F]|\w)+/g; return str.match(regEx).length; }
Explicación:
/([^\u0000-\u007F]|\w)
coincide con caracteres de palabra, lo cual es genial,> regex hace el trabajo pesado por nosotros. (Este patrón se basa en la siguiente respuesta SO: https://stackoverflow.com/a/35743562/1806956 por @Landeeyo)+
coincide con la cadena completa de los caracteres de palabra especificados anteriormente, por lo que básicamente agrupamos los caracteres de palabra./g
significa que sigue buscando hasta el final.str.match(regEx)
devuelve una matriz de las palabras encontradas, por lo que contamos su longitud.fuente
Para aquellos que quieran usar Lodash pueden usar la
_.words
función:var str = "Random String"; var wordCount = _.size(_.words(str)); console.log(wordCount);
<script src="https://cdnjs.cloudflare.com/ajax/libs/lodash.js/4.17.11/lodash.min.js"></script>
fuente
La precisión también es importante.
Lo que hace la opción 3 es básicamente reemplazar todos los espacios en blanco, excepto cualquier, con ay
+1
luego evalúa esto para contar el1
que le dan el recuento de palabras.Es el método más preciso y rápido de los cuatro que he hecho aquí.
Tenga en cuenta que es más lento que
return str.split(" ").length;
Microsoft Word, pero es más preciso.Consulte las operaciones / sy el recuento de palabras devueltas a continuación.
Aquí hay un enlace para ejecutar esta prueba de banco. https://jsbench.me/ztk2t3q3w5/1
// This is the fastest at 111,037 ops/s ±2.86% fastest var str = "All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy."; function WordCount(str) { return str.split(" ").length; } console.log(WordCount(str)); // Returns 241 words. Not the same as Microsoft Word count, of by one. // This is the 2nd fastest at 46,835 ops/s ±1.76% 57.82% slower var str = "All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy."; function WordCount(str) { return str.split(/(?!\W)\S+/).length; } console.log(WordCount(str)); // Returns 241 words. Not the same as Microsoft Word count, of by one. // This is the 3rd fastest at 37,121 ops/s ±1.18% 66.57% slower var str = "All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy."; function countWords(str) { var str = str.replace(/\S+/g,"\+1"); return eval(str); } console.log(countWords(str)); // Returns 240 words. Same as Microsoft Word count. // This is the slowest at 89 ops/s 17,270 ops/s ±2.29% 84.45% slower var str = "All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy. All work and no play makes Jack a dull boy."; function countWords(str) { var str = str.replace(/(?!\W)\S+/g,"1").replace(/\s*/g,""); return str.lastIndexOf(""); } console.log(countWords(str)); // Returns 240 words. Same as Microsoft Word count.
fuente
Aquí hay una función que cuenta la cantidad de palabras en un código HTML:
$(this).val() .replace(/(( )|(<[^>]*>))+/g, '') // remove html spaces and tags .replace(/\s+/g, ' ') // merge multiple spaces into one .trim() // trim ending and beginning spaces (yes, this is needed) .match(/\s/g) // find all spaces by regex .length // get amount of matches
fuente
let leng = yourString.split(' ').filter(a => a.trim().length > 0).length
fuente
No estoy seguro de si esto se ha dicho anteriormente, o si es lo que se necesita aquí, pero ¿no podría hacer que la cadena sea una matriz y luego encontrar la longitud?
let randomString = "Random String"; let stringWords = randomString.split(' '); console.log(stringWords.length);
fuente
Creo que esta respuesta dará todas las soluciones para:
function NumberOf() { var string = "Write a piece of code in any language of your choice that computes the total number of characters, words and lines in a given text. \n This is second line. \n This is third line."; var length = string.length; //No of characters var words = string.match(/\w+/g).length; //No of words var lines = string.split(/\r\n|\r|\n/).length; // No of lines console.log('Number of characters:',length); console.log('Number of words:',words); console.log('Number of lines:',lines); } NumberOf();
string.length
string.match(/\w+/g).length
string.length(/\r\n|\r|\n/).length
Espero que esto pueda ayudar a aquellos que buscan estas 3 respuestas.
fuente
string
por otro. Es confuso. Me hizo pensar por un segundo questring.match()
es un método estático. Salud.function WordCount(str) { var totalSoFar = 0; for (var i = 1; i < str.length; i++) { if (str[i] === " ") { totalSoFar ++; } } return totalSoFar; } console.log(WordCount("hi my name is raj));
fuente
<textarea name="myMessage" onkeyup="wordcount(this.value)"></textarea> <script type="text/javascript"> var cnt; function wordcount(count) { var words = count.split(/\s/); cnt = words.length; var ele = document.getElementById('w_count'); ele.value = cnt; } document.write("<input type=text id=w_count size=4 readonly>"); </script>
fuente
Sé que es tarde, pero esta expresión regular debería resolver tu problema. Esto coincidirá y devolverá el número de palabras en su cadena. En lugar de la que marcó como una solución, que contaría espacio-espacio-palabra como 2 palabras, aunque en realidad es solo 1 palabra.
function countWords(str) { var matches = str.match(/\S+/g); return matches ? matches.length : 0; }
fuente
Tienes algunos errores en tu código.
function WordCount(str) { var totalSoFar = 0; for (var i = 0; i < str.length; i++) { if (str[i] === " ") { totalSoFar += 1; } } return totalSoFar + 1; // you need to return something. } console.log(WordCount("Random String"));
Hay otra forma sencilla de usar expresiones regulares:
(text.split(/\b/).length - 1) / 2
El valor exacto puede diferir alrededor de 1 palabra, pero también cuenta los bordes de las palabras sin espacios, por ejemplo, "palabra-palabra.palabra". Y no cuenta las palabras que no contienen letras o números.
fuente
function totalWordCount() { var str ="My life is happy" var totalSoFar = 0; for (var i = 0; i < str.length; i++) if (str[i] === " ") { totalSoFar = totalSoFar+1; } totalSoFar = totalSoFar+ 1; return totalSoFar } console.log(totalWordCount());
fuente