OK, no soy un estadístico (ni siquiera cerca). Soy un investigador de computación de alto rendimiento y quería algunos casos de prueba para matrices densas grandes (mayores de 5000x5000). Había preguntado aquí y en algunos otros lugares, pero nunca recibí respuesta de un estadístico. Estoy muy interesado en probar mis códigos en un problema de estadísticas. ¿Podría sugerir una aplicación en estadística donde uno necesita resolver para x donde es denso y cuadrado?
Le agradecería mucho que también me pudiera dar aplicaciones donde A no tiene estructura, es decir, sin simetría, sin definición positiva, etc. Pero eso no es del todo necesario. Basta una gran matriz densa con una buena aplicación.
Lo siento si esta pregunta parece abierta o vaga, pero no puedo imaginar un mejor lugar para hacerla.
fuente
Respuestas:
Puede encontrar útil el Java Matrix Benchmark . El Mercado de la matriz no parecen tener lo que quieres, aunque tiene muchos ejemplos.
fuente
Aquí es grande, aunque no estoy seguro de si es lo suficientemente denso para ti. De http://www.grouplens.org/node/73
fuente
No estoy seguro de que la aplicación que busca tenga sentido en un contexto estadístico. Lo que le interesa es un análisis de regresión lineal. es una matriz de mediciones en la que cada fila es una sola medición de variables. Me vienen a la mente dos posibles aplicaciones con posiblemente . 1) análisis de microarrays de ADN y 2) análisis de datos de resonancia magnética funcional. En cualquier caso, será difícil encontrar conjuntos de datos con personas (mediciones).A∈Rm×n m n n>5000 m>5000
Sin embargo, su requerimiento de restringe el sentido de dicho análisis de una manera principal. Después de que todas las estadísticas se trata de inferir algo subyacente, digamos, la verdad a partir de datos ruidosos , es decir, el modelo estadístico implícito en su pregunta es donde es una medida única, son los parámetros asumidos que intenta encontrar con su análisis y es alguna forma de ruido. Ahora usted dice que debe ser invertible, es decir, tiene que ser de rango completo, es decir, las mediciones no deben repetirse, es decir, solo tiene una única observación de ruido corrompido porm=n
fuente