Solo intento hacer una regresión lineal simple, pero este error me desconcierta por:
regr = LinearRegression()
regr.fit(df2.iloc[1:1000, 5].values, df2.iloc[1:1000, 2].values)
que produce:
ValueError: Found arrays with inconsistent numbers of samples: [ 1 999]
Estas selecciones deben tener las mismas dimensiones y deben ser matrices numerosas, entonces, ¿qué me estoy perdiendo?
scikit-learn
soleado
fuente
fuente
Parece que está utilizando pandas dataframe (del nombre df2).
También puede hacer lo siguiente:
NOTA: He eliminado los "valores" ya que eso convierte la serie pandas en numpy.ndarray y numpy.ndarray no tiene el atributo to_frame ().
fuente
Visto en el curso básico de aprendizaje profundo de Udacity:
fuente
Creo que el argumento "X" de regr.fit debe ser una matriz, por lo que lo siguiente debería funcionar.
fuente
Encontré este error porque convertí mis datos a
np.array
. Solucioné el problema convirtiendo mis datos en annp.matrix
y tomando la transposición.ValueError:
regr.fit(np.array(x_list), np.array(y_list))
Correcto:
regr.fit(np.transpose(np.matrix(x_list)), np.transpose(np.matrix(y_list)))
fuente
Intente poner sus características en una tupla como esta:
fuente
Enfrenté un problema similar. El problema en mi caso fue que el número de filas en X no era igual al número de filas en y.
es decir, el número de entradas en las columnas de características no era igual al número de entradas en la variable de destino ya que había eliminado algunas filas de las columnas de características.
fuente
Para analizar dos matrices (matriz1 y matriz2), deben cumplir los dos requisitos siguientes:
1) Deben ser un numpy.ndarray
Comprueba con
Si ese no es el caso, al menos uno de ellos realiza
2) Las dimensiones deben ser las siguientes:
N es el número de elementos que hay en la matriz. Para proporcionar array1 con el número correcto de ejes, realice:
fuente
Como se mencionó anteriormente, el argumento X debe ser una matriz o una matriz numérica con dimensiones conocidas. Entonces probablemente puedas usar esto:
Por lo tanto, su marco de datos se convertiría en una matriz con dimensiones conocidas y no necesitará remodelarlo
fuente
Algunos días me enfrenté al mismo problema. La razón fue matrices de diferentes tamaños.
fuente
durante la división de prueba de tren, es posible que haya cometido un error
El código anterior es correcto
Es posible que haya hecho lo siguiente, lo que está mal
fuente