Consulte también ¿Cómo usar LEA en valores que no son direcciones / punteros? : LEA es solo una instrucción shift-and-add. Probablemente se agregó a 8086 porque el hardware ya está allí para decodificar y calcular los modos de direccionamiento, no porque esté "destinado" solo para usarse con direcciones. Recuerde que los punteros son enteros en el ensamblaje.
Peter Cordes
Respuestas:
798
Como otros han señalado, la LEA (dirección efectiva de carga) a menudo se usa como un "truco" para hacer ciertos cálculos, pero ese no es su propósito principal. El conjunto de instrucciones x86 fue diseñado para admitir lenguajes de alto nivel como Pascal y C, donde las matrices, especialmente las matrices de ints o estructuras pequeñas, son comunes. Considere, por ejemplo, una estructura que representa las coordenadas (x, y):
struct Point
{
int xcoord;
int ycoord;
};
Ahora imagine una declaración como:
int y = points[i].ycoord;
donde points[]es una matriz de Point. Suponiendo que la base de la matriz ya está en EBX, y la variable ies en EAX, y xcoordy ycoordson cada uno de 32 bits (de modo ycoordestá en el desplazamiento de 4 bytes en la struct), esta declaración puede ser compilado para:
MOV EDX, [EBX + 8*EAX + 4] ; right side is "effective address"
que aterrizará yen EDX. El factor de escala de 8 se debe a que cada uno Pointtiene un tamaño de 8 bytes. Ahora considere la misma expresión utilizada con el operador "dirección de" y:
int *p = &points[i].ycoord;
En este caso, no desea el valor de ycoord, sino su dirección. Ahí es donde LEAentra (dirección efectiva de carga). En lugar de a MOV, el compilador puede generar
¿No habría sido más limpio extender las movinstrucciones y dejar los corchetes? MOV EDX, EBX + 8*EAX + 4
Natan Yellin
14
@imacake Al reemplazar LEA con un MOV especializado, se mantiene limpia la sintaxis: [] los corchetes son siempre el equivalente de desreferenciar un puntero en C. Sin corchetes, siempre se trata con el puntero mismo.
Natan Yellin el
139
Hacer matemáticas en una instrucción MOV (EBX + 8 * EAX + 4) no es válido. LEA ESI, [EBX + 8 * EAX + 4] es válido porque este es un modo de direccionamiento que admite x86. en.wikipedia.org/wiki/X86#Addressing_modes
Erik
30
@JonathanDickinson LEA es como una MOVfuente indirecta, excepto que solo hace la indirecta y no la MOV. En realidad, no lee de la dirección calculada, solo la calcula.
hobbs
24
Erik, el comentario del tour no es exacto. MOV eax, [ebx + 8 * ecx + 4] es válido. Sin embargo, MOV devuelve el contenido de la ubicación de memoria thst mientras que LEA devuelve la dirección
Olorin
562
Del "Zen de la Asamblea" de Abrash:
LEA, la única instrucción que realiza cálculos de direccionamiento de memoria pero que en realidad no aborda la memoria. LEAacepta un operando de direccionamiento de memoria estándar, pero no hace más que almacenar el desplazamiento de memoria calculado en el registro especificado, que puede ser cualquier registro de propósito general.
¿Qué nos da eso? Dos cosas que ADDno proporcionan:
la capacidad de realizar sumas con dos o tres operandos, y
la capacidad de almacenar el resultado en cualquier registro; no solo uno de los operandos fuente.
Y LEAno altera las banderas.
Ejemplos
LEA EAX, [ EAX + EBX + 1234567 ]calcula EAX + EBX + 1234567(eso son tres operandos)
LEA EAX, [ EBX + ECX ]calcula EBX + ECXsin anular ni con el resultado.
multiplicación por constante (por dos, tres, cinco o nueve), si la usa como LEA EAX, [ EBX + N * EBX ](N puede ser 1,2,4,8).
Otro caso de uso es útil en bucles: la diferencia entre LEA EAX, [ EAX + 1 ]y INC EAXes que este último cambia EFLAGSpero el primero no; Esto conserva el CMPestado.
@AbidRahmanK algunos ejemplos: LEA EAX, [ EAX + EBX + 1234567 ]calcula la suma de EAX, EBXy 1234567(eso es tres operandos). LEA EAX, [ EBX + ECX ]calcula EBX + ECXsin anular ni con el resultado. La tercera cosa que LEAse usa para (no enumerada por Frank) es la multiplicación por constante (por dos, tres, cinco o nueve), si la usa como LEA EAX, [ EBX + N * EBX ]( Npuede ser 1,2,4,8). Otro caso de uso es útil en bucles: la diferencia entre LEA EAX, [ EAX + 1 ]y INC EAXes que este último cambia EFLAGSpero el primero no; esto preserva el CMPestado
FrankH.
@FrankH. Todavía no entiendo, ¿entonces carga un puntero en otro lugar?
66
@ ripDaddy69 sí, algo así: si por "carga" quieres decir "realiza el cálculo de la dirección / la aritmética del puntero". No accede a la memoria (es decir, no "desreferencia" el puntero como se llamaría en términos de programación en C).
FrankH.
2
+1: Esto hace explícito qué tipos de 'trucos' LEAse pueden usar para ... (ver "LEA (dirección efectiva de carga) a menudo se usa como un" truco "para hacer ciertos cálculos" en la respuesta popular de IJ Kennedy arriba)
Assad Ebrahim
3
Hay una gran diferencia entre 2 operandos LEA que es rápido y 3 operandos LEA que es lento. El manual de Intel Optimization dice que la ruta rápida LEA es de ciclo único y la ruta lenta LEA toma tres ciclos. Además, en Skylake hay dos unidades funcionales de ruta rápida (puertos 1 y 5) y solo hay una unidad funcional de ruta lenta (puerto 1). La regla 33 de codificación del ensamblador / compilador del manual incluso advierte contra el uso de 3 operandos LEA.
Olsonista 01 de
110
Otra característica importante de la LEAinstrucción es que no altera los códigos de condición como CFy ZF, mientras calcula la dirección mediante instrucciones aritméticas como ADDo MULdoes. Esta característica disminuye el nivel de dependencia entre las instrucciones y, por lo tanto, deja espacio para una mayor optimización por parte del compilador o el planificador de hardware.
Sí, a leaveces es útil para el compilador (o el codificador humano) hacer cálculos matemáticos sin tropezar con un resultado distintivo. Pero leano es más rápido que add. La mayoría de las instrucciones x86 escriben banderas. Las implementaciones x86 de alto rendimiento tienen que cambiar el nombre de EFLAGS o evitar el riesgo de escritura después de la escritura para que el código normal se ejecute rápidamente, por lo que las instrucciones que evitan las escrituras del indicador no son mejores debido a eso. ( las cosas de marca parcial pueden crear problemas, vea la instrucción INC vs ADD 1: ¿Importa? )
Peter Cordes
2
@PeterCordes: Odio traer esto aquí pero, ¿estoy solo pensando que esta nueva etiqueta [x86-lea] es redundante e innecesaria?
Michael Petch
2
@ MichaelPetch: Sí, creo que es demasiado específico. Parece confundir a los principiantes que no entienden el lenguaje de máquina y que todo (incluidos los punteros) son solo bits / bytes / enteros, por lo que hay muchas preguntas al respecto con un gran número de votos. Pero tener una etiqueta para ello implica que hay espacio para un número abierto de preguntas futuras, cuando en realidad hay alrededor de 2 o 3 en total que no son solo duplicados. (¿qué es? ¿Cómo usarlo para multiplicar enteros? y cómo funciona internamente en AGU vs. ALU y con qué latencia / rendimiento. Y tal vez sea su propósito "previsto")
Peter Cordes
@PeterCordes: estoy de acuerdo, y en todo caso, todas estas publicaciones que se están editando son prácticamente un duplicado de algunas de las preguntas relacionadas con LEA existentes. En lugar de una etiqueta, cualquier duplicado debe identificarse y marcarse en mi humilde opinión.
Michael Petch
1
@EvanCarroll: espere a etiquetar todas las preguntas de LEA, si aún no ha terminado. Como se discutió anteriormente, creemos que x86-lea es demasiado específico para una etiqueta, y no hay mucho margen para futuras preguntas no duplicadas. Creo que sería mucho trabajo para realmente elegir un "mejor" Q & A como un objetivo de la duplicación de la mayor parte de ellos, sin embargo, o para realmente decidir cuáles de conseguir modificaciones a la fusión.
Peter Cordes
93
A pesar de todas las explicaciones, LEA es una operación aritmética:
LEA Rt, [Rs1+a*Rs2+b] => Rt = Rs1 + a*Rs2 + b
Es solo que su nombre es extremadamente estúpido para una operación shift + add. La razón de esto ya se explicó en las respuestas mejor calificadas (es decir, se diseñó para asignar directamente referencias de memoria de alto nivel).
Y que la aritmética la realiza el hardware de cálculo de direcciones.
Ben Voigt
30
@BenVoigt Solía decir eso, porque soy un viejo tipo :-) Tradicionalmente, las CPU x86 usaban las unidades de direccionamiento para esto, de acuerdo. Pero la "separación" se ha vuelto muy borrosa en estos días. Algunas CPU ya no tienen dedicadas AGU , otras han optado por no ejecutarse LEAen las AGU sino en las ALU enteras normales. Uno tiene que leer las especificaciones de la CPU muy de cerca en estos días para descubrir "dónde se ejecutan las cosas" ...
FrankH.
2
@FrankH .: las CPU fuera de servicio generalmente ejecutan LEA en ALU, mientras que algunas CPU en orden (como Atom) a veces lo ejecutan en una AGU (porque no pueden estar ocupadas manejando un acceso a la memoria).
Peter Cordes
3
No, el nombre no es estúpido. LEAle proporciona la dirección que surge de cualquier modo de direccionamiento relacionado con la memoria. No es un turno y agregar operación.
Kaz
3
FWIW hay muy pocas (si las hay) CPU x86 actuales que realizan la operación en la AGU. La mayoría o todos simplemente usan una ALU como cualquier otra operación aritmética.
BeeOnRope
77
Tal vez solo otra cosa sobre la instrucción LEA. También puede usar LEA para registros de multiplicación rápida por 3, 5 o 9.
+1 por el truco. Pero me gustaría hacer una pregunta (puede ser estúpida), ¿por qué no multiplicar directamente por tres como este LEA EAX, [EAX*3]?
Abid Rahman K
13
@Abid Rahman K: No existe un conjunto de instrucciones de CPU unde x86.
GJ.
50
@AbidRahmanK a pesar de que la sintaxis de intel asm hace que parezca una multiplicación, la instrucción lea solo puede codificar operaciones de cambio. El código de operación tiene 2 bits para describir el cambio, por lo tanto, puede multiplicar solo por 1,2,4 u 8.
ithkuil
66
@Koray Tugay: Puede usar Mayúsculas como shlinstrucción para multiplicar registros por 2,4,8,16 ... es más rápido y más corto. Pero para multiplicar con números diferentes de potencias de 2 usamos normalmente una mulinstrucción que es más pretenciosa y más lenta.
GJ.
8
@GJ. aunque no existe tal codificación, algunos ensambladores aceptan esto como un acceso directo, por ejemplo, fasm. Entonces, por ejemplo, lea eax,[eax*3]se traduciría al equivalente de lea eax,[eax+eax*2].
Ruslan
59
leaes una abreviatura de "dirección efectiva de carga". Carga la dirección de la referencia de ubicación del operando de origen al operando de destino. Por ejemplo, podría usarlo para:
lea ebx, [ebx+eax*8]
para mover elementos de ebxpuntero eaxmás lejos (en una matriz de 64 bits / elemento) con una sola instrucción. Básicamente, se beneficia de modos de direccionamiento complejos compatibles con la arquitectura x86 para manipular punteros de manera eficiente.
La razón más importante que utiliza LEAsobre un MOVes si necesita realizar operaciones aritméticas en los registros que está utilizando para calcular la dirección. Efectivamente, puede realizar lo que equivale a la aritmética del puntero en varios de los registros en combinación de manera efectiva para "gratis".
Lo que es realmente confuso al respecto es que normalmente escribes una LEAletra como una MOVpero no estás desreferenciando la memoria. En otras palabras:
MOV EAX, [ESP+4]
Esto moverá el contenido de lo que ESP+4apunta a EAX.
LEA EAX, [EBX*8]
Esto moverá la dirección efectiva EBX * 8a EAX, no lo que se encuentra en esa ubicación. Como puede ver, también, es posible multiplicar por factores de dos (escala) mientras que a MOVse limita a sumar / restar.
Perdón a todos. @ big.heart me engañó dándome una respuesta a esto hace tres horas, haciendo que aparezca como "nuevo" en mi búsqueda de preguntas de la Asamblea.
David Hoelzer
1
¿Por qué la sintaxis usa corchetes cuando no hace direccionamiento de memoria?
golopot
3
@ q4w56 Esta es una de esas cosas donde la respuesta es: "Así es como se hace". Creo que es una de las razones por las que las personas tienen dificultades para descubrir qué LEAhace.
David Hoelzer
2
@ q4w56: es una instrucción shift + add que utiliza la sintaxis de operandos de memoria y la codificación de código de máquina. En algunas CPU incluso puede usar el hardware AGU, pero eso es un detalle histórico. El hecho aún relevante es que el hardware del decodificador ya existe para decodificar este tipo de shift + add, y LEA nos permite usarlo para aritmética en lugar de direccionamiento de memoria. (O para cálculos de dirección si una entrada es realmente un puntero).
Peter Cordes
20
El 8086 tiene una gran familia de instrucciones que aceptan un operando de registro y una dirección efectiva, realizan algunos cálculos para calcular la parte desplazada de esa dirección efectiva y realizan algunas operaciones que involucran el registro y la memoria a la que se refiere la dirección calculada. Era bastante simple hacer que una de las instrucciones de esa familia se comportara como anteriormente, excepto para saltarse esa operación de memoria real. Esto, las instrucciones:
mov ax,[bx+si+5]
lea ax,[bx+si+5]
se implementaron casi de forma idéntica internamente. La diferencia es un paso omitido. Ambas instrucciones funcionan algo así como:
temp = fetched immediate operand (5)
temp += bx
temp += si
address_out = temp (skipped for LEA)
trigger 16-bit read (skipped for LEA)
temp = data_in (skipped for LEA)
ax = temp
En cuanto a por qué Intel pensó que valía la pena incluir esta instrucción, no estoy exactamente seguro, pero el hecho de que su implementación fuera barata habría sido un factor importante. Otro factor habría sido el hecho de que el ensamblador de Intel permitió que se definieran símbolos en relación con el registro de BP. Si fnordse definió como un símbolo relativo a BP (por ejemplo, BP + 8), se podría decir:
mov ax,fnord ; Equivalent to "mov ax,[BP+8]"
Si uno quisiera usar algo como stosw para almacenar datos en una dirección relativa a BP, poder decir
mov ax,0 ; Data to store
mov cx,16 ; Number of words
lea di,fnord
rep movs fnord ; Address is ignored EXCEPT to note that it's an SS-relative word ptr
fue más conveniente que:
mov ax,0 ; Data to store
mov cx,16 ; Number of words
mov di,bp
add di,offset fnord (i.e. 8)
rep movs fnord ; Address is ignored EXCEPT to note that it's an SS-relative word ptr
Tenga en cuenta que si olvida el "desplazamiento" mundial, el contenido de la ubicación [BP + 8], en lugar del valor 8, se agregará a DI. Ups
Como se mencionó en las respuestas existentes, LEAtiene las ventajas de realizar aritmética de direccionamiento de memoria sin acceder a la memoria, guardando el resultado aritmético en un registro diferente en lugar de la forma simple de agregar instrucción. El beneficio real de rendimiento subyacente es que el procesador moderno tiene una unidad LEA ALU y un puerto separados para la generación efectiva de direcciones (incluidas LEAy otras direcciones de referencia de memoria), esto significa que la operación aritmética en LEAy otra operación aritmética normal en ALU podría realizarse en paralelo en uno núcleo.
Otro punto importante que no se menciona en otras respuestas es que la LEA REG, [MemoryAddress]instrucción es PIC (código independiente de la posición) que codifica la dirección relativa de la PC en esta instrucción para referencia MemoryAddress. Esto es diferente de lo MOV REG, MemoryAddressque codifica la dirección virtual relativa y requiere reubicación / parcheo en los sistemas operativos modernos (como ASLR es una característica común). Por LEAlo tanto, se puede utilizar para convertir ese tipo de PIC a PIC.
La parte de "LEA ALU separada" es mayormente falsa. Las CPU modernas se ejecutan leaen una o más de las mismas ALU que ejecutan otras instrucciones aritméticas (pero generalmente menos que otras aritméticas). Por ejemplo, la CPU Haswell mencionada puede ejecutar addo la submayoría de las operaciones aritméticas básicas en cuatro ALU diferentes , pero solo puede ejecutarse leaen una (compleja lea) o dos (simple lea). Más importante aún, esas leaALU de dos capacidades son simplemente dos de las cuatro que pueden ejecutar otras instrucciones, por lo que no existe un beneficio de paralelismo como se afirma.
BeeOnRope
El artículo que vinculó (correctamente) muestra que LEA está en el mismo puerto que una ALU entera (add / sub / boolean) y la unidad MUL entera en Haswell. (Y las ALU vectoriales que incluyen FP ADD / MUL / FMA). La unidad LEA de solo simple está en el puerto 5, que también ejecuta ADD / SUB / lo que sea, y baraja de vectores, y otras cosas. La única razón por la que no estoy votando es porque usted señala el uso de LEA relativo a RIP (solo para x86-64).
Peter Cordes
8
La instrucción LEA se puede utilizar para evitar cálculos de direcciones efectivas que requieren mucho tiempo por parte de la CPU. Si una dirección se usa repetidamente, es más efectivo almacenarla en un registro en lugar de calcular la dirección efectiva cada vez que se usa.
No necesariamente en x86 moderno. La mayoría de los modos de direccionamiento tienen el mismo costo, con algunas advertencias. Por [esi]lo tanto, rara vez es más barato que decir [esi + 4200]y rara vez es más barato que [esi + ecx*8 + 4200].
BeeOnRope
@BeeOnRope [esi]no es más barato que [esi + ecx*8 + 4200]. ¿Pero por qué molestarse en comparar? No son equivalentes. Si desea que el primero designe la misma ubicación de memoria que el segundo, necesita instrucciones adicionales: debe agregar al esivalor de ecxmultiplicado por 8. Uh, ¡la multiplicación va a golpear los indicadores de su CPU! Luego debe agregar el 4200. Estas instrucciones adicionales se suman al tamaño del código (ocupando espacio en la memoria caché de instrucciones, ciclos para buscar).
Kaz
2
@Kaz: creo que te perdiste mi punto (o de lo contrario me perdí el punto del OP) Tengo entendido que el OP dice que si va a usar algo como [esi + 4200]repetidamente en una secuencia de instrucciones, entonces es mejor cargar primero la dirección efectiva en un registro y usarla. Por ejemplo, en lugar de escribir add eax, [esi + 4200]; add ebx, [esi + 4200]; add ecx, [esi + 4200], debería preferir lea edi, [esi + 4200]; add eax, [edi]; add ebx, [edi]; add ecx, [edi], que rara vez es más rápido. Al menos esa es la interpretación clara de esta respuesta.
BeeOnRope
Entonces, la razón por la que estaba comparando [esi]y [esi + 4200](o [esi + ecx*8 + 4200]es que esta es la simplificación que propone el OP (según tengo entendido): que N instrucciones con la misma dirección compleja se transforman en N instrucciones con direccionamiento simple (un reg), más uno lea, ya abordar complejo es "lento" de hecho, es más lento incluso en x86 moderna, pero sólo en cuanto a la latencia que parece poco probable que la materia para obtener instrucciones consecutivos con la misma dirección..
BeeOnRope
1
Quizás alivie un poco la presión de registro, sí, pero lo contrario puede ser el caso: si los registros con los que generó la dirección efectiva están activos, necesita otro registro para guardar el resultado, por lealo que aumenta la presión en ese caso. En general, almacenar productos intermedios es una causa de presión de registro, no una solución, pero creo que en la mayoría de las situaciones es un lavado. @Kaz
BeeOnRope
7
La instrucción LEA (Dirección efectiva de carga) es una forma de obtener la dirección que surge de cualquiera de los modos de direccionamiento de memoria del procesador Intel.
Es decir, si tenemos un movimiento de datos como este:
MOV EAX, <MEM-OPERAND>
mueve el contenido de la ubicación de memoria designada al registro de destino.
Si reemplazamos el MOV by LEA, la dirección de la ubicación de la memoria se calcula exactamente de la misma manera mediante la <MEM-OPERAND>expresión de direccionamiento. Pero en lugar del contenido de la ubicación de la memoria, obtenemos la ubicación en sí misma en el destino.
LEAno es una instrucción aritmética específica; es una forma de interceptar la dirección efectiva que surge de cualquiera de los modos de direccionamiento de memoria del procesador.
Por ejemplo, podemos usar LEAsolo una dirección directa simple. No hay aritmética involucrada en absoluto:
MOV EAX, GLOBALVAR ; fetch the value of GLOBALVAR into EAX
LEA EAX, GLOBALVAR ; fetch the address of GLOBALVAR into EAX.
Esto es valido; podemos probarlo en el indicador de Linux:
$ as
LEA 0, %eax
$ objdump -d a.out
a.out: file format elf64-x86-64
Disassembly of section .text:
0000000000000000 <.text>:
0: 8d 04 25 00 00 00 00 lea 0x0,%eax
Aquí, no hay adición de un valor escalado, ni desplazamiento. Zero se traslada a EAX. Podríamos hacer eso usando MOV con un operando inmediato también.
Esta es la razón por la cual las personas que piensan que los corchetes LEAson superfluos están gravemente equivocados; los corchetes no son LEAsintaxis pero son parte del modo de direccionamiento.
LEA es real a nivel de hardware. La instrucción generada codifica el modo de direccionamiento real y el procesador lo lleva a cabo hasta el punto de calcular la dirección. Luego mueve esa dirección al destino en lugar de generar una referencia de memoria. (Dado que el cálculo de la dirección de un modo de direccionamiento en cualquier otra instrucción no tiene efecto en los indicadores de la CPU, LEAno tiene ningún efecto en los indicadores de la CPU).
Contraste con cargar el valor de la dirección cero:
No hay ninguna razón para LEAexcluir esta posibilidad, solo porque hay una alternativa más corta; solo se combina de forma ortogonal con los modos de direccionamiento disponibles.
// compute parity of permutation from lexicographic index
int parity (int p)
{
assert (p >= 0);
int r = p, k = 1, d = 2;
while (p >= k) {
p /= d;
d += (k << 2) + 6; // only one lea instruction
k += 2;
r ^= p;
}
return r & 1;
}
Con -O (optimizar) como opción del compilador, gcc encontrará la instrucción lea para la línea de código indicada.
Parece que muchas respuestas ya están completas, me gustaría agregar un código de ejemplo más para mostrar cómo las instrucciones lea y move funcionan de manera diferente cuando tienen el mismo formato de expresión.
Para acortar la historia, las instrucciones lea y mov pueden usarse con los paréntesis que encierran el operando src de las instrucciones. Cuando están encerrados con () , la expresión en () se calcula de la misma manera; sin embargo, dos instrucciones interpretarán el valor calculado en el operando src de una manera diferente.
Si la expresión se usa con lea o mov, el valor de src se calcula de la siguiente manera.
D (Rb, Ri, S) => (Reg [Rb] + S * Reg [Ri] + D)
Sin embargo, cuando se usa con la instrucción mov, intenta acceder al valor apuntado por la dirección generada por la expresión anterior y almacenarlo en el destino.
En contraste, cuando la instrucción lea se ejecuta con la expresión anterior, carga el valor generado tal como está en el destino.
El siguiente código ejecuta la instrucción lea y la instrucción mov con el mismo parámetro. Sin embargo, para detectar la diferencia, agregué un controlador de señal a nivel de usuario para detectar la falla de segmentación causada por acceder a una dirección incorrecta como resultado de la instrucción mov.
Código de ejemplo
#define _GNU_SOURCE 1 /* To pick up REG_RIP */
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <stdint.h>
#include <signal.h>
uint32_t
register_handler (uint32_t event, void (*handler)(int, siginfo_t*, void*))
{
uint32_t ret = 0;
struct sigaction act;
memset(&act, 0, sizeof(act));
act.sa_sigaction = handler;
act.sa_flags = SA_SIGINFO;
ret = sigaction(event, &act, NULL);
return ret;
}
void
segfault_handler (int signum, siginfo_t *info, void *priv)
{
ucontext_t *context = (ucontext_t *)(priv);
uint64_t rip = (uint64_t)(context->uc_mcontext.gregs[REG_RIP]);
uint64_t faulty_addr = (uint64_t)(info->si_addr);
printf("inst at 0x%lx tries to access memory at %ld, but failed\n",
rip,faulty_addr);
exit(1);
}
int
main(void)
{
int result_of_lea = 0;
register_handler(SIGSEGV, segfault_handler);
//initialize registers %eax = 1, %ebx = 2
// the compiler will emit something like
// mov $1, %eax
// mov $2, %ebx
// because of the input operands
asm("lea 4(%%rbx, %%rax, 8), %%edx \t\n"
:"=d" (result_of_lea) // output in EDX
: "a"(1), "b"(2) // inputs in EAX and EBX
: // no clobbers
);
//lea 4(rbx, rax, 8),%edx == lea (rbx + 8*rax + 4),%edx == lea(14),%edx
printf("Result of lea instruction: %d\n", result_of_lea);
asm volatile ("mov 4(%%rbx, %%rax, 8), %%edx"
:
: "a"(1), "b"(2)
: "edx" // if it didn't segfault, it would write EDX
);
}
Resultado de ejecución
Result of lea instruction: 14
inst at 0x4007b5 tries to access memory at 14, but failed
Romper su asm en línea en declaraciones separadas no es seguro, y sus listas de clobbers están incompletas. El bloque basic-asm le dice al compilador que no tiene clobbers, pero en realidad modifica varios registros. Además, puede usar =dpara decirle al compilador que el resultado está en EDX, guardando a mov. También omitió una declaración de clobber temprano en la salida. Esto demuestra lo que está tratando de demostrar, pero también es un mal ejemplo engañoso de asm en línea que se romperá si se usa en otros contextos. Eso es algo malo para una respuesta de desbordamiento de pila.
Peter Cordes
Si no desea escribir %%en todos esos nombres de registro en Asm extendido, use restricciones de entrada. como asm("lea 4(%%ebx, %%eax, 8), %%edx" : "=d"(result_of_lea) : "a"(1), "b"(2));. Dejar que el compilador init se registre significa que tampoco tiene que declarar clobbers. Estás complicando demasiado las cosas haciendo xor-zeroing antes de que mov-inmediatamente sobrescriba también todo el registro.
Peter Cordes
@ PeterCordes Gracias, Peter, ¿quieres que elimine esta respuesta o la modifique después de tus comentarios?
Jaehyuk Lee
1
Si arregla el asm en línea, no está haciendo ningún daño y quizás sea un buen ejemplo concreto para principiantes que no entendieron las otras respuestas. No es necesario eliminar, y es una solución fácil como la que mostré en mi último comentario. Creo que valdría la pena un voto positivo si el mal ejemplo de asm en línea se fijara en un "buen" ejemplo. (No voté en contra)
Peter Cordes
1
¿Dónde dice alguien que mov 4(%ebx, %eax, 8), %edxno es válido? De todos modos, sí, porque movtendría sentido escribir "a"(1ULL)para decirle al compilador que tiene un valor de 64 bits y, por lo tanto, debe asegurarse de que se extienda para llenar todo el registro. En la práctica, seguirá utilizándose mov $1, %eax, porque escribir EAX cero se extiende a RAX, a menos que tenga una situación extraña de código circundante donde el compilador sabía que RAX = 0xff00000001o algo así. Para lea, todavía está utilizando el tamaño de operando de 32 bits, por lo que cualquier bit alto perdido en los registros de entrada no tiene ningún efecto en el resultado de 32 bits.
Peter Cordes
4
LEA: solo una instrucción "aritmética".
MOV transfiere datos entre operandos pero lea solo está calculando
LEA obviamente mueve datos; Tiene un operando de destino. LEA no siempre calcula; calcula si se calcula la dirección efectiva expresada en el operando de origen. LEA EAX, GLOBALVAR no calcula; solo mueve la dirección de GLOBALVAR a EAX.
Kaz
@Kaz gracias por sus comentarios. mi fuente era "LEA (dirección efectiva de carga) es esencialmente una instrucción aritmética: no realiza ningún acceso real a la memoria, pero se usa comúnmente para calcular direcciones (aunque puede calcular enteros de propósito general con ella)". formulario libro Eldad-Eilam página 149
el contador
@Kaz: Es por eso que LEA es redundante cuando la dirección ya es una constante de tiempo de enlace; utilizar mov eax, offset GLOBALVARen su lugar. Usted puede utilizar LEA, pero es un poco más grande que el tamaño del código mov r32, imm32y se ejecuta en un menor número de puertos, ya que todavía pasa por el proceso de dirección de cálculo . lea reg, symbolsolo es útil en 64 bits para un LEA relativo a RIP, cuando necesita PIC y / o direcciones fuera de los 32 bits bajos. En el código de 32 o 16 bits, hay cero ventajas. LEA es una instrucción aritmética que expone la capacidad de la CPU para decodificar / calcular modos de direccionamiento.
Peter Cordes
@Kaz: por el mismo argumento, se podría decir que imul eax, edx, 1no se calcula: simplemente copia edx a eax. Pero en realidad ejecuta sus datos a través del multiplicador con latencia de 3 ciclos. O eso rorx eax, edx, 0solo copia (gira por cero).
Peter Cordes
@PeterCordes Mi punto es que tanto LEA EAX, GLOBALVAL como MOV EAX, GLOBALVAR simplemente toman la dirección de un operando inmediato. No hay un multiplicador de 1, o un desplazamiento de 0 aplicado podría ser así a nivel de hardware, pero no se ve en el lenguaje ensamblador o el conjunto de instrucciones.
Kaz
1
Todas las instrucciones normales de "cálculo", como agregar multiplicación, excluir o establecer los indicadores de estado como cero, firmar. Si utiliza una dirección complicada, AX xor:= mem[0x333 +BX + 8*CX] los indicadores se configuran de acuerdo con la operación xor.
Ahora es posible que desee utilizar la dirección varias veces. Cargar tales direcciones en un registro nunca tiene la intención de establecer indicadores de estado y afortunadamente no lo hace. La frase "cargar dirección efectiva" hace que el programador se dé cuenta de eso. De ahí proviene la expresión extraña.
Está claro que una vez que el procesador es capaz de usar la dirección complicada para procesar su contenido, es capaz de calcularlo para otros fines. De hecho, se puede utilizar para realizar una transformación x <- 3*x+1en una sola instrucción. Esta es una regla general en la programación de ensamblaje: use las instrucciones, sin embargo, sacudirá su bote.
Lo único que cuenta es si la transformación particular encarnada por la instrucción es útil para usted.
Línea de fondo
MOV, X| T| AX'| R| BX|
y
LEA, AX'| [BX]
tienen el mismo efecto en AX pero no en los indicadores de estado. (Esta es la notación ciasdis ).
"Esta es una regla general en la programación de ensamblajes: use las instrucciones de cualquier forma que oscile su bote". Yo personalmente no daría ese consejo, debido a cosas como call lbllbl: pop raxtécnicamente "trabajar" como una forma de obtener el valor de rip, pero harás que la predicción de rama sea muy infeliz. Use las instrucciones como desee, pero no se sorprenda si hace algo complicado y tiene consecuencias que no previó
The6P4C
@ The6P4C Esa es una advertencia útil. Sin embargo, si no hay otra alternativa para hacer que la predicción de la rama sea infeliz, hay que ir por ella. Hay otra regla general en la programación de ensamblaje. Puede haber formas alternativas de hacer algo y debe elegir sabiamente entre las alternativas. Hay cientos de formas de obtener el contenido del registro BL en el registro AL. Si no es necesario preservar el resto de RAX, LEA puede ser una opción. No afectar las banderas puede ser una buena idea en algunos de los miles de tipos de procesadores x86. Groetjes Albert
Albert van der Horst
-1
Perdóname si alguien ya lo mencionó, pero en los días de x86 cuando la segmentación de la memoria aún era relevante, es posible que no obtengas los mismos resultados de estas dos instrucciones:
La "dirección efectiva" es solo la parte "desplazada" de un seg:offpar. LEA no se ve afectada por la base del segmento; ambas instrucciones (ineficientemente) se colocarán 0x1234en AX. Desafortunadamente, x86 no tiene una manera fácil de calcular una dirección lineal completa (efectiva + base de segmento) en un registro o par de registros.
Respuestas:
Como otros han señalado, la LEA (dirección efectiva de carga) a menudo se usa como un "truco" para hacer ciertos cálculos, pero ese no es su propósito principal. El conjunto de instrucciones x86 fue diseñado para admitir lenguajes de alto nivel como Pascal y C, donde las matrices, especialmente las matrices de ints o estructuras pequeñas, son comunes. Considere, por ejemplo, una estructura que representa las coordenadas (x, y):
Ahora imagine una declaración como:
donde
points[]
es una matriz dePoint
. Suponiendo que la base de la matriz ya está enEBX
, y la variablei
es enEAX
, yxcoord
yycoord
son cada uno de 32 bits (de modoycoord
está en el desplazamiento de 4 bytes en la struct), esta declaración puede ser compilado para:que aterrizará
y
enEDX
. El factor de escala de 8 se debe a que cada unoPoint
tiene un tamaño de 8 bytes. Ahora considere la misma expresión utilizada con el operador "dirección de" y:En este caso, no desea el valor de
ycoord
, sino su dirección. Ahí es dondeLEA
entra (dirección efectiva de carga). En lugar de aMOV
, el compilador puede generarque cargará la dirección en
ESI
.fuente
mov
instrucciones y dejar los corchetes?MOV EDX, EBX + 8*EAX + 4
MOV
fuente indirecta, excepto que solo hace la indirecta y no laMOV
. En realidad, no lee de la dirección calculada, solo la calcula.Del "Zen de la Asamblea" de Abrash:
Y
LEA
no altera las banderas.Ejemplos
LEA EAX, [ EAX + EBX + 1234567 ]
calculaEAX + EBX + 1234567
(eso son tres operandos)LEA EAX, [ EBX + ECX ]
calculaEBX + ECX
sin anular ni con el resultado.LEA EAX, [ EBX + N * EBX ]
(N puede ser 1,2,4,8).Otro caso de uso es útil en bucles: la diferencia entre
LEA EAX, [ EAX + 1 ]
yINC EAX
es que este último cambiaEFLAGS
pero el primero no; Esto conserva elCMP
estado.fuente
LEA EAX, [ EAX + EBX + 1234567 ]
calcula la suma deEAX
,EBX
y1234567
(eso es tres operandos).LEA EAX, [ EBX + ECX ]
calculaEBX + ECX
sin anular ni con el resultado. La tercera cosa queLEA
se usa para (no enumerada por Frank) es la multiplicación por constante (por dos, tres, cinco o nueve), si la usa comoLEA EAX, [ EBX + N * EBX ]
(N
puede ser 1,2,4,8). Otro caso de uso es útil en bucles: la diferencia entreLEA EAX, [ EAX + 1 ]
yINC EAX
es que este último cambiaEFLAGS
pero el primero no; esto preserva elCMP
estadoLEA
se pueden usar para ... (ver "LEA (dirección efectiva de carga) a menudo se usa como un" truco "para hacer ciertos cálculos" en la respuesta popular de IJ Kennedy arriba)Otra característica importante de la
LEA
instrucción es que no altera los códigos de condición comoCF
yZF
, mientras calcula la dirección mediante instrucciones aritméticas comoADD
oMUL
does. Esta característica disminuye el nivel de dependencia entre las instrucciones y, por lo tanto, deja espacio para una mayor optimización por parte del compilador o el planificador de hardware.fuente
lea
veces es útil para el compilador (o el codificador humano) hacer cálculos matemáticos sin tropezar con un resultado distintivo. Perolea
no es más rápido queadd
. La mayoría de las instrucciones x86 escriben banderas. Las implementaciones x86 de alto rendimiento tienen que cambiar el nombre de EFLAGS o evitar el riesgo de escritura después de la escritura para que el código normal se ejecute rápidamente, por lo que las instrucciones que evitan las escrituras del indicador no son mejores debido a eso. ( las cosas de marca parcial pueden crear problemas, vea la instrucción INC vs ADD 1: ¿Importa? )A pesar de todas las explicaciones, LEA es una operación aritmética:
Es solo que su nombre es extremadamente estúpido para una operación shift + add. La razón de esto ya se explicó en las respuestas mejor calificadas (es decir, se diseñó para asignar directamente referencias de memoria de alto nivel).
fuente
LEA
en las AGU sino en las ALU enteras normales. Uno tiene que leer las especificaciones de la CPU muy de cerca en estos días para descubrir "dónde se ejecutan las cosas" ...LEA
le proporciona la dirección que surge de cualquier modo de direccionamiento relacionado con la memoria. No es un turno y agregar operación.Tal vez solo otra cosa sobre la instrucción LEA. También puede usar LEA para registros de multiplicación rápida por 3, 5 o 9.
fuente
LEA EAX, [EAX*3]
?shl
instrucción para multiplicar registros por 2,4,8,16 ... es más rápido y más corto. Pero para multiplicar con números diferentes de potencias de 2 usamos normalmente unamul
instrucción que es más pretenciosa y más lenta.lea eax,[eax*3]
se traduciría al equivalente delea eax,[eax+eax*2]
.lea
es una abreviatura de "dirección efectiva de carga". Carga la dirección de la referencia de ubicación del operando de origen al operando de destino. Por ejemplo, podría usarlo para:para mover elementos de
ebx
punteroeax
más lejos (en una matriz de 64 bits / elemento) con una sola instrucción. Básicamente, se beneficia de modos de direccionamiento complejos compatibles con la arquitectura x86 para manipular punteros de manera eficiente.fuente
La razón más importante que utiliza
LEA
sobre unMOV
es si necesita realizar operaciones aritméticas en los registros que está utilizando para calcular la dirección. Efectivamente, puede realizar lo que equivale a la aritmética del puntero en varios de los registros en combinación de manera efectiva para "gratis".Lo que es realmente confuso al respecto es que normalmente escribes una
LEA
letra como unaMOV
pero no estás desreferenciando la memoria. En otras palabras:MOV EAX, [ESP+4]
Esto moverá el contenido de lo que
ESP+4
apunta aEAX
.LEA EAX, [EBX*8]
Esto moverá la dirección efectiva
EBX * 8
a EAX, no lo que se encuentra en esa ubicación. Como puede ver, también, es posible multiplicar por factores de dos (escala) mientras que aMOV
se limita a sumar / restar.fuente
LEA
hace.El 8086 tiene una gran familia de instrucciones que aceptan un operando de registro y una dirección efectiva, realizan algunos cálculos para calcular la parte desplazada de esa dirección efectiva y realizan algunas operaciones que involucran el registro y la memoria a la que se refiere la dirección calculada. Era bastante simple hacer que una de las instrucciones de esa familia se comportara como anteriormente, excepto para saltarse esa operación de memoria real. Esto, las instrucciones:
se implementaron casi de forma idéntica internamente. La diferencia es un paso omitido. Ambas instrucciones funcionan algo así como:
En cuanto a por qué Intel pensó que valía la pena incluir esta instrucción, no estoy exactamente seguro, pero el hecho de que su implementación fuera barata habría sido un factor importante. Otro factor habría sido el hecho de que el ensamblador de Intel permitió que se definieran símbolos en relación con el registro de BP. Si
fnord
se definió como un símbolo relativo a BP (por ejemplo, BP + 8), se podría decir:Si uno quisiera usar algo como stosw para almacenar datos en una dirección relativa a BP, poder decir
fue más conveniente que:
Tenga en cuenta que si olvida el "desplazamiento" mundial, el contenido de la ubicación [BP + 8], en lugar del valor 8, se agregará a DI. Ups
fuente
Como se mencionó en las respuestas existentes,
LEA
tiene las ventajas de realizar aritmética de direccionamiento de memoria sin acceder a la memoria, guardando el resultado aritmético en un registro diferente en lugar de la forma simple de agregar instrucción. El beneficio real de rendimiento subyacente es que el procesador moderno tiene una unidad LEA ALU y un puerto separados para la generación efectiva de direcciones (incluidasLEA
y otras direcciones de referencia de memoria), esto significa que la operación aritmética enLEA
y otra operación aritmética normal en ALU podría realizarse en paralelo en uno núcleo.Consulte este artículo de la arquitectura Haswell para obtener algunos detalles sobre la unidad LEA: http://www.realworldtech.com/haswell-cpu/4/
Otro punto importante que no se menciona en otras respuestas es que la
LEA REG, [MemoryAddress]
instrucción es PIC (código independiente de la posición) que codifica la dirección relativa de la PC en esta instrucción para referenciaMemoryAddress
. Esto es diferente de loMOV REG, MemoryAddress
que codifica la dirección virtual relativa y requiere reubicación / parcheo en los sistemas operativos modernos (como ASLR es una característica común). PorLEA
lo tanto, se puede utilizar para convertir ese tipo de PIC a PIC.fuente
lea
en una o más de las mismas ALU que ejecutan otras instrucciones aritméticas (pero generalmente menos que otras aritméticas). Por ejemplo, la CPU Haswell mencionada puede ejecutaradd
o lasub
mayoría de las operaciones aritméticas básicas en cuatro ALU diferentes , pero solo puede ejecutarselea
en una (complejalea
) o dos (simplelea
). Más importante aún, esaslea
ALU de dos capacidades son simplemente dos de las cuatro que pueden ejecutar otras instrucciones, por lo que no existe un beneficio de paralelismo como se afirma.La instrucción LEA se puede utilizar para evitar cálculos de direcciones efectivas que requieren mucho tiempo por parte de la CPU. Si una dirección se usa repetidamente, es más efectivo almacenarla en un registro en lugar de calcular la dirección efectiva cada vez que se usa.
fuente
[esi]
lo tanto, rara vez es más barato que decir[esi + 4200]
y rara vez es más barato que[esi + ecx*8 + 4200]
.[esi]
no es más barato que[esi + ecx*8 + 4200]
. ¿Pero por qué molestarse en comparar? No son equivalentes. Si desea que el primero designe la misma ubicación de memoria que el segundo, necesita instrucciones adicionales: debe agregar alesi
valor deecx
multiplicado por 8. Uh, ¡la multiplicación va a golpear los indicadores de su CPU! Luego debe agregar el 4200. Estas instrucciones adicionales se suman al tamaño del código (ocupando espacio en la memoria caché de instrucciones, ciclos para buscar).[esi + 4200]
repetidamente en una secuencia de instrucciones, entonces es mejor cargar primero la dirección efectiva en un registro y usarla. Por ejemplo, en lugar de escribiradd eax, [esi + 4200]; add ebx, [esi + 4200]; add ecx, [esi + 4200]
, debería preferirlea edi, [esi + 4200]; add eax, [edi]; add ebx, [edi]; add ecx, [edi]
, que rara vez es más rápido. Al menos esa es la interpretación clara de esta respuesta.[esi]
y[esi + 4200]
(o[esi + ecx*8 + 4200]
es que esta es la simplificación que propone el OP (según tengo entendido): que N instrucciones con la misma dirección compleja se transforman en N instrucciones con direccionamiento simple (un reg), más unolea
, ya abordar complejo es "lento" de hecho, es más lento incluso en x86 moderna, pero sólo en cuanto a la latencia que parece poco probable que la materia para obtener instrucciones consecutivos con la misma dirección..lea
lo que aumenta la presión en ese caso. En general, almacenar productos intermedios es una causa de presión de registro, no una solución, pero creo que en la mayoría de las situaciones es un lavado. @KazLa instrucción LEA (Dirección efectiva de carga) es una forma de obtener la dirección que surge de cualquiera de los modos de direccionamiento de memoria del procesador Intel.
Es decir, si tenemos un movimiento de datos como este:
mueve el contenido de la ubicación de memoria designada al registro de destino.
Si reemplazamos el
MOV
byLEA
, la dirección de la ubicación de la memoria se calcula exactamente de la misma manera mediante la<MEM-OPERAND>
expresión de direccionamiento. Pero en lugar del contenido de la ubicación de la memoria, obtenemos la ubicación en sí misma en el destino.LEA
no es una instrucción aritmética específica; es una forma de interceptar la dirección efectiva que surge de cualquiera de los modos de direccionamiento de memoria del procesador.Por ejemplo, podemos usar
LEA
solo una dirección directa simple. No hay aritmética involucrada en absoluto:Esto es valido; podemos probarlo en el indicador de Linux:
Aquí, no hay adición de un valor escalado, ni desplazamiento. Zero se traslada a EAX. Podríamos hacer eso usando MOV con un operando inmediato también.
Esta es la razón por la cual las personas que piensan que los corchetes
LEA
son superfluos están gravemente equivocados; los corchetes no sonLEA
sintaxis pero son parte del modo de direccionamiento.LEA es real a nivel de hardware. La instrucción generada codifica el modo de direccionamiento real y el procesador lo lleva a cabo hasta el punto de calcular la dirección. Luego mueve esa dirección al destino en lugar de generar una referencia de memoria. (Dado que el cálculo de la dirección de un modo de direccionamiento en cualquier otra instrucción no tiene efecto en los indicadores de la CPU,
LEA
no tiene ningún efecto en los indicadores de la CPU).Contraste con cargar el valor de la dirección cero:
Es una codificación muy similar, ¿ves? Solo el
8d
deLEA
ha cambiado a8b
.Por supuesto, esta
LEA
codificación es más larga que mover un cero inmediato aEAX
:No hay ninguna razón para
LEA
excluir esta posibilidad, solo porque hay una alternativa más corta; solo se combina de forma ortogonal con los modos de direccionamiento disponibles.fuente
Aquí hay un ejemplo.
Con -O (optimizar) como opción del compilador, gcc encontrará la instrucción lea para la línea de código indicada.
fuente
Parece que muchas respuestas ya están completas, me gustaría agregar un código de ejemplo más para mostrar cómo las instrucciones lea y move funcionan de manera diferente cuando tienen el mismo formato de expresión.
Para acortar la historia, las instrucciones lea y mov pueden usarse con los paréntesis que encierran el operando src de las instrucciones. Cuando están encerrados con () , la expresión en () se calcula de la misma manera; sin embargo, dos instrucciones interpretarán el valor calculado en el operando src de una manera diferente.
Si la expresión se usa con lea o mov, el valor de src se calcula de la siguiente manera.
Sin embargo, cuando se usa con la instrucción mov, intenta acceder al valor apuntado por la dirección generada por la expresión anterior y almacenarlo en el destino.
En contraste, cuando la instrucción lea se ejecuta con la expresión anterior, carga el valor generado tal como está en el destino.
El siguiente código ejecuta la instrucción lea y la instrucción mov con el mismo parámetro. Sin embargo, para detectar la diferencia, agregué un controlador de señal a nivel de usuario para detectar la falla de segmentación causada por acceder a una dirección incorrecta como resultado de la instrucción mov.
Código de ejemplo
Resultado de ejecución
fuente
=d
para decirle al compilador que el resultado está en EDX, guardando amov
. También omitió una declaración de clobber temprano en la salida. Esto demuestra lo que está tratando de demostrar, pero también es un mal ejemplo engañoso de asm en línea que se romperá si se usa en otros contextos. Eso es algo malo para una respuesta de desbordamiento de pila.%%
en todos esos nombres de registro en Asm extendido, use restricciones de entrada. comoasm("lea 4(%%ebx, %%eax, 8), %%edx" : "=d"(result_of_lea) : "a"(1), "b"(2));
. Dejar que el compilador init se registre significa que tampoco tiene que declarar clobbers. Estás complicando demasiado las cosas haciendo xor-zeroing antes de que mov-inmediatamente sobrescriba también todo el registro.mov 4(%ebx, %eax, 8), %edx
no es válido? De todos modos, sí, porquemov
tendría sentido escribir"a"(1ULL)
para decirle al compilador que tiene un valor de 64 bits y, por lo tanto, debe asegurarse de que se extienda para llenar todo el registro. En la práctica, seguirá utilizándosemov $1, %eax
, porque escribir EAX cero se extiende a RAX, a menos que tenga una situación extraña de código circundante donde el compilador sabía que RAX =0xff00000001
o algo así. Paralea
, todavía está utilizando el tamaño de operando de 32 bits, por lo que cualquier bit alto perdido en los registros de entrada no tiene ningún efecto en el resultado de 32 bits.LEA: solo una instrucción "aritmética".
MOV transfiere datos entre operandos pero lea solo está calculando
fuente
mov eax, offset GLOBALVAR
en su lugar. Usted puede utilizar LEA, pero es un poco más grande que el tamaño del códigomov r32, imm32
y se ejecuta en un menor número de puertos, ya que todavía pasa por el proceso de dirección de cálculo .lea reg, symbol
solo es útil en 64 bits para un LEA relativo a RIP, cuando necesita PIC y / o direcciones fuera de los 32 bits bajos. En el código de 32 o 16 bits, hay cero ventajas. LEA es una instrucción aritmética que expone la capacidad de la CPU para decodificar / calcular modos de direccionamiento.imul eax, edx, 1
no se calcula: simplemente copia edx a eax. Pero en realidad ejecuta sus datos a través del multiplicador con latencia de 3 ciclos. O esororx eax, edx, 0
solo copia (gira por cero).Todas las instrucciones normales de "cálculo", como agregar multiplicación, excluir o establecer los indicadores de estado como cero, firmar. Si utiliza una dirección complicada,
AX xor:= mem[0x333 +BX + 8*CX]
los indicadores se configuran de acuerdo con la operación xor.Ahora es posible que desee utilizar la dirección varias veces. Cargar tales direcciones en un registro nunca tiene la intención de establecer indicadores de estado y afortunadamente no lo hace. La frase "cargar dirección efectiva" hace que el programador se dé cuenta de eso. De ahí proviene la expresión extraña.
Está claro que una vez que el procesador es capaz de usar la dirección complicada para procesar su contenido, es capaz de calcularlo para otros fines. De hecho, se puede utilizar para realizar una transformación
x <- 3*x+1
en una sola instrucción. Esta es una regla general en la programación de ensamblaje: use las instrucciones, sin embargo, sacudirá su bote. Lo único que cuenta es si la transformación particular encarnada por la instrucción es útil para usted.Línea de fondo
y
tienen el mismo efecto en AX pero no en los indicadores de estado. (Esta es la notación ciasdis ).
fuente
call lbl
lbl: pop rax
técnicamente "trabajar" como una forma de obtener el valor derip
, pero harás que la predicción de rama sea muy infeliz. Use las instrucciones como desee, pero no se sorprenda si hace algo complicado y tiene consecuencias que no previóPerdóname si alguien ya lo mencionó, pero en los días de x86 cuando la segmentación de la memoria aún era relevante, es posible que no obtengas los mismos resultados de estas dos instrucciones:
y
fuente
seg:off
par. LEA no se ve afectada por la base del segmento; ambas instrucciones (ineficientemente) se colocarán0x1234
en AX. Desafortunadamente, x86 no tiene una manera fácil de calcular una dirección lineal completa (efectiva + base de segmento) en un registro o par de registros.