Справочник по командам и архитектуре Pentium. Часть 1
🕛 18.05.2009, 15:47
В литературе при описании команд микропроцессоров часто встречаются досадные ошибки. Стараясь избежать таких ошибок, автор выверял описание команд по нескольким источникам [3,5,6,8,9,10]. Часть команд была проверена программным путем. Список регистров микропроцессора Pentium
Регистры общего назначения
EAX = (16+AX=(AH+AL))
EBX = (16+BX=(BH+BL))
ECX = (16+CX=(CH+CL))
EDX = (16+DX=(DH+DL))
ESI = (16+SI)
EDI = (16+DI)
EBP = (16+BP)
ESP = (16+SP)
Регистры EAX,EBX,EDX,ECX называют рабочими регистрами. Регистры EDI, ESI - индексные регистры, играют особую роль в строковых операциях. Регистр EBP обычно используется для адресации в стеке параметров и локальных переменных. Регистр ESP - указатель стека, автоматически модифицируется командами PUSH, POP, RET, CALL. Явно используется реже.
Регистр флагов
Содержит 32 бита. Вот используемые значения битов.
0-й бит, флаг переноса (CF), устанавливается в 1 если был перенос из старшего бита.
1-й бит, 1.
2-й бит, флаг четности. Устанавливается в 1, если младший байт результата содержит четное число единиц.
3-й бит, 0.
4-й бит, флаг вспомогательного переноса (AF). Устанавливается в 1, если произошел перенос из третьего бита в четвертый.
5-й бит, 0.
6-й бит, флаг нуля (ZF). Устанавливается в единицу, если результат операции ноль.
7-й бит, флаг знака (SF). Равен старшему биту результата.
8-й бит, флаг ловушки (TF). Установка в единицу этого флага приводит к тому, что после каждой команды вызывается INT 3. Используется отладчиками в реальном режиме.
9-й бит, флаг прерываний (IF). Сброс этого флага в 0 приводит к тому, что микропроцессор перестает воспринимать прерывания.
10-й бит, флаг направления (DF). Данный флаг учитывается в строковых операциях. Если флаг равен 1, то в строковых операциях адрес автоматически уменьшается.
11-й бит, флаг переполнения (OF). Устанавливается в единицу, если результат операции над числом со знаком вышел за допустимые пределы.
12,13-й биты, уровень привилегий ввода-вывода (IOPL).
14-бит, флаг вложенной задачи (NT).
15-й бит, 0.
16-й бит, флаг возобновления (RF). Используется совместно с регистрами точек отладочного останова.
17-й бит, в защищенном режиме включает режим виртуального режима 8086 (VM).
18-й бит, флаг контроля выравнивания (AC). При равенстве этого флага 1 и при обращении к невыровненному операнду вызывает исключение 17.
19-й бит, виртуальная версия флага IF (VIF). Работает в защищенном режиме.
20-й бит, виртуальный запрос прерывания (VIP).
21-й бит, флаг доступности команды идентификации.
22-31 -й, 0.
Сегментные регистры
CS - сегмент кода, DS - сегмент данных, SS - сегмент стека, ES,GS,FS - дополнительные регистры. Сегментные регистры 16-битны.
Управляющие регистры
Регистр CR0.
0-й бит, разрешение защиты (PE). Переводит процессор в защищенный режим.
1-й бит, мониторинг сопроцессора (MP). Вызывает исключение 7 по каждой команде WAIT.
2-й бит, эмуляция сопроцессора (EM). Вызывает исключение 7 по каждой команде сопроцессора.
3-й бит, бит переключения задач (TS). Позволяет определить, относится данный контекст сопроцессора к текущей задаче или нет. Вызывает исключение 7 при выполнении следующей команды сопроцессора.
4-й бит, индикатор поддержки инструкций сопроцессора (ET).
5-й бит, разрешение стандартного механизма сообщений об ошибке сопроцессора (NE).
5-15-й бит, не используются.
16-й бит, разрешение защиты от записи на уровне привилегий супервизора (WP).
17-й бит, не используется.
18-й бит, разрешение контроля выравнивания (AM).
19-28-й бит, не используются.
29-й бит, запрет сквозной записи кэша и циклов аннулирования (NW).
30-й бит, запрет заполнения кэша (CD).
31-й бит, включение механизма страничной переадресации.
Регистр CR1 пока не используется.
Регистр CR2 хранит 32-битный линейный адрес, по которому был получен последний отказ страницы памяти.
Регистр CR3 - в старших 20 битах хранится физический базовый адрес таблицы каталога страниц.
Остальные биты.
3-й бит, кэширование страниц со сквозной записью (PWT).
4-й бит, запрет кэширование страницы (PCD).
Регистр CR4
0-й бит, разрешение использования виртуального флага прерываний в режиме V8086 (VME).
1-й бит, разрешение использования виртуального флага прерываний в защищенном режиме (PVI).
2-й бит, превращение инструкции RDTSC в привилегированную (TSD).
3-й бит, разрешение точек останова по обращению к портам ввода-вывода (DE).
4-й бит, включает режим адресации с 4-мегабайтными страницами (PSE).
5-й бит, включает 36-битное физическое адресное пространство (PAE).
6-й бит, разрешение исключения MC (MCE).
7-й бит, разрешение глобальной страницы (PGE).
8-й бит, разрешает выполнение команды RDPMC (PMC).
9-й бит, разрешает команды быстрого сохранения/восстановления состояния сопроцессора (FSR).
Системные адресные регистры
GDTR - 6-байтный регистр, в котором содержится линейный адрес глобальной дескрипторной таблицы.
IDTR - 6-байтный регистр, содержащий 32-битный линейный адрес таблицы дескрипторов обработчиков прерываний.
LDTR - 10-байтный регистр, содержащий 16-битный селектор (индекс) для GDT и 8-байтный дескриптор.
TR - 10-байтный регистр, содержащий 16-битный селектор для GDT и весь 8-байтный дескриптор из GDT, описывающий TSS текущей задачи.
Регистры отладки
DR0…DR3 - хранят 32-битные линейные адреса точек останова.
DR6 (равносильно DR4) - отражает состояние контрольных точек.
DR7 (равносильно DR5) - управляет установкой контрольных точек.
Команды пересылки данных
MOV dest,src Пересылка данных в регистр из регистра, памяти или непосредственного операнда. Пересылка данных в память из регистра или непосредственного операнда. Например, MOV AX,10; MOV EBX,ESI; MOV AL, BYTE PTR MEM.
XCHG r/m,r Обмен данными между регистрами или регистром и памятью. Команда «память - память» в микропроцессоре Intel не предусмотрена.
BSWAP reg32 Перестановка байт из порядка «младший - старший» в порядок «старший - младший». Разряды 7-0 обмениваются с разрядами 31-24, а разряды 15-8 с разрядами 23-16. Команда появилась в 486-м микропроцессоре.
MOVSXB r,r/m Пересылка байта с его расширением до слова или двойного слова с дублированием знакового бита: MOVSXB AX,BL; MOVSXB EAX,byte ptr mem. Команда появилась с 386-ого процессора.
MOVSXW r,r/m Пересылка слова с расширением до двойного слова с дублированием знакового бита: MOVSXW EAX,WORD PTR MEM. Команда появилась с 386-ого процессора.
MOVZXB r,r/m Пересылка байта с его расширением до слова или двойного слова с дублированием нулевого бита: MOVSXB AX,BL; MOVSXB EAX,byte ptr mem. Команда появилась с 386-ого процессора.
MOVZXW r,r/m Пересылка слова с расширением до двойного слова с дублированием нулевого бита: MOVZXW EAX,WORD PTR MEM. Команда появилась с 386-ого процессора.
XLAT Загрузить в AL байт из таблицы в сегменте данных, на начало которой указывает EBX (BX), при этом начальное значение AL играет роль смещения.
LEA r,m Загрузка эффективного адреса. Например, LEA EAX,MEM; LEA EAX,[EBX]. Данная команда обладает магическими свойствами, позволяющими эффективно выполнять арифметические действия. Например, команда LEA EAX,[EAX*8] умножает содержимое EAX на 8, LEA EAX,[EAX][EAX*4] на 5. Команда LEA ECX,[EAX][ESI+5] эквивалента 3(!) командам MOV ECX,EAX/ADD ECX,ESI/ADD ECX,5.
LDS r,m Загрузить пару DS:reg из памяти. Причем вначале идет слово (или двойное слово), а в DS - последующее слово.
LES r,m Аналогично предыдущему, но для пары ES:reg.
LFS r,m Аналогично предыдущему, но для пары FS:reg.
LGS r,m Аналогично предыдущему, но для пары GS:reg.
LSS r,m Аналогично предыдущему, но для пары SS:reg.
SETcc r/m Проверяет условие «cc», если выполняется, то первый бит байта устанавливается в 1, в противном случае в 0. Условия аналогичны в условных переходах (je, jc). Например, SETE AL. Команда появилась с 386-ого микропроцессора.
LAHF Загрузить флаги в AH (устарела).
SAHF Сохранить AH в регистре флагов (устарела).
Команды ввода-вывода
IN AL(AX,EAX),
Port
IN AL(AX,EAX),
DX Ввод в аккумулятор из порта ввода-вывода. Порт адресуется непосредственно или через регистр DX.
OUT port,AL
(AX,EAX)
OUT DX,AL
(AX,EAX) Вывод в порт ввода-вывода. Порт адресуется непосредственно или через регистр DX.
[REP] INSB
[REP] INSW
[REP] INSD Выводит данные из порта, адресуемого регистром DX в ячейку памяти ES:[EDI/DI]. После ввода байта, слова или двойного слова производится коррекция EDI/DI на 1, 2,4. При наличии префикса REP-процесс продолжается, пока содержимое CX не станет равным 0.
[REP] OUTSB
[REP] OUTSW
[REP] OUTSD Выводит данные из ячейки памяти, определяемой регистрами DS:[ESI/SI], в выходной порт, адрес которого находится в регистре DX. После вывода байта, слова, двойного слова производится коррекция указателя ESI/SI на 1, 2, 4.
Инструкции работы со стеком
PUSH r/m Поместить в стек слово или двойное слово. Поскольку при включении в стек слова нарушается выравнивание стека по границам двойных слов, рекомендуется в любом случае помещать в стек двойное слово.
PUSH const Поместить в стек непосредственный 32-битный операнд.
PUSHA Поместить в стек регистры EAX, EBX, ECX, EDX, ESI, EDI, EBP, ESP. Команда появилась с 386-ого процессора.
POP reg/mem Извлечь из стека слово или двойное слово.
POPA Извлечение из стека данных в регистры EAX, EBX, ECX, EDX, ESI, EDI, EBP, ESP. Команда появилась, начиная с 386-ого процессора.
PUSHF Помещение в стек регистра флагов.
POPF Извлечь данных в регистр флагов.
Инструкции целочисленной арифметики.
ADD dest,src Сложение двух операндов. Первый операнд может быть регистром или ячейкой памяти, второй - регистром, ячейкой памяти, константой. Невозможно только, когда оба операнда являются ячейками памяти.
XADD dest,src Данная операция производит в начале обмен операндами, а затем выполняет операцию ADD. Начиная 486-ого.
ADC dest,src Сложение с учетом флага переноса - в младший бит добавляется бит (флаг) переноса.
INC r/m Инкремент операнда.
SUB dest,src Вычитание двух операндов. Остальное аналогично сложению (команда ADD).
SBB dest,src Вычитание с учетом бита переноса. Из младшего бита вычитается бит (флаг) переноса.
DEC r/m Декремент операнда.
CMP r/m,r/m Вычитание без изменения операндов (сравнение).
CMPXCHG r,m,a Сравнение с обменом. Воспринимает три операнда (регистр - операнд - источник, ячейка памяти - операнд - получатель, аккумулятор, т.е. AL,AX или EAX) Если значения в операнде-получателе и аккумуляторе равны, операнд-получатель заменяется операндом-источником, исходное значение операнда-получателя загружается в аккумулятор. Начиная с 486-ого.
CMPXCHG8B r,m,a Сравнение и обмен восьми байт. Начиная с Pentium.
NEG r/m Изменение знака операнда.
AAA Коррекция после ASCII-сложения. Коррекция результата двоичного сложения двух неупакованных десятичных чисел. Например, AX содержит число 9H. Пара команд ADD AL,8/AAA приводит к тому, что в AX будет содержаться 0107, т.е. ASCII-число 17.
AAS Коррекция после ASCII-вычитания. Например:
MOV AX,205H ;загрузить ASCII 25
SUB AL,8 ;двоичное вычитание
AAS ;теперь AX содержит 107H, т.е. 17.
AAM Коррекция после ASCII-умножения. Для этой команды предполагается, что в регистре AX находится результат двоичного умножения двух десятичных цифр (диапазон от 0 до 81). После выполнения команды образуется двухбайтное произведение в регистре AX в ASII-формате.
AAD Коррекция перед ASCII-делением. Предполагается, что младшая цифра находится в AL, а старшая - в AH.
DAA Коррекция после BCD-сложения.
DAS Коррекция после BCD-вычитания.
MUL r/m Умножение AL(AX,EAX) на целое беззнаковое число. Результат, соответственно, будет содержаться в AX, DX:AX, EDX:EAX.
IMUL r/m Знаковое умножение (аналогично MUL). Все операнды считаются знаковыми. Команда IMUL имеет также двухоперандный и трехоперандный вид.
Двухоперандный вид IMUL r,src r<-r*src. Трехоперандный вид IMUL dst,src,imm dst<-src*imm.
DIV r/m (src) Беззнаковое деление. Аналогично беззнаковому умножению. Осуществляет деление аккумулятора и его расширения (AH:AL, DX:AX, EDX:EAX) на делитель src. Частное помещается в аккумуляторе, а остаток - в расширении аккумулятора.
IDIV r/m Знаковое деление. Аналогично беззнаковому.
CBW Расширение байта (AL) в слово с копированием знакового бита.
CWD Расширение слова (AX) в двойное слово (DX:AX) с копированием знакового бита.
CWDE Расширение слова (AX) в двойное слово (EAX) с копированием знакового бита.
CDQ Преобразование двойного слова (EAX) в учетверенное слово (EDX:EAX).
Логические операции.
AND dest,src Логическая операция «AND». Обнуление бит dest, которые равны нулю у src.
TEST dest,src Аналогична «AND», но не меняет dest. Используется для проверки ненулевых бит.
OR dest,src Логическая «ИЛИ». В dest устанавливаются биты, отличные от нуля в src.
XOR dest,src Исключающее «ИЛИ».
NOT dest Переключение всех бит (инверсия).
Сдвиговые операции. Начиная с 386-ого микропроцессора, непосредственный операнд src может быть не только 1, но произвольным числом. В ранних версиях для количества сдвигов использовался регистр CL.
RCL/RCR dest,src Циклический сдвиг влево/вправо через бит переноса CF. Src может быть либо CL, либо непосредственный операнд.
ROL/ROR dest,src Аналогично командам RCL/RCR, но по другому, работает с флагом CF. Флаг не участвует в цикле, но в него попадает бит, перешедший с начала на конец или наоборот.
SAL/SAR dest,src Сдвиг влево/право. Называется еще арифметическим сдвигом. При сдвиге вправо дублируется старший бит. При сдвиге влево младший бит заполняется нулем. Ушедший бит помещается в CF.
SHL/SHR dest,src Логический сдвиг влево/вправо. Сдвиг вправо отличается от SAR тем, что и старший бит заполняется нулем.
SHLD/SHRD dest,src,count Трехоперандные команды сдвига влево/вправо. Первым операндом, как обычно, может быть либо регистр, либо ячейка памяти, вторым операндом должен быть регистр общего назначения, третьим - регистр CL или непосредственный операнд. Суть операции заключается в том, что dest и src в начале объединяются, а потом производится сдвиг на количество бит count. Результат снова помещается в dest.
Строковые операции
REP Префикс, означающий повтор строковой операции до обнуления ECX. Префикс имеет также разновидности REPZ (REPE) - выполнять, пока не нуль (ZF=1), REPNZ (REPNE) - выполнять, пока нуль.
MOVS dest,src Команда передает байт, слово или двойное слово из цепочки, адресуемой DS:[ESI], в цепочку dest, адресуемую ES[EDI]. При этом EDI и ESI автоматически корректируются согласно значению флага DF. Допускается явная спецификация MOVSB (byte), MOVSW (word), MOVSD (word). Dest и src можно явно не указывать.
LODS src Команда загрузки цепочки в аккумулятор. Имеет разновидности LODSB, LODSW, LODSD. При выполнении команды байт, слово, двойное слово загружается соответственно в AL,AX,EAX. При этом ESI автоматически изменяется на 1 в зависимости от значения флага DF. Префикс REP не используется.
STOS dest Команда, обратная LODS, т.е. передает байт, слово или двойное слово из аккумулятора в цепочку и автоматически корректирует EDI.
SCAS dest Команда сканирования цепочки. Команда вычитает элемент цепочки dst из содержимого аккумулятора (AL\AX\EAX) и модифицирует флаги. Префикс REPNE позволяет найти в цепочке нужный элемент.
CMPS dest,src Команда сравнения цепочек. Данная команда производит вычитание байта, слова или двойного слова цепочки dst из соответствующего элемента цепочки src. В зависимости от результата вычитания модифицируются флаги. Регистры EDI и ESI автоматически продвигаются на следующий элемент. При использовании префикса REPE команда означает - сравнивать, пока не будет, достигнут конец цепочки или пока элементы не будут равны. При использовании префикса REPNE команда означает - сравнивать, пока не достигнут конец цепочки или пока элементы будут равны.
Команды управления флагами
CLC Сброс флага переноса.
CMC Инверсия флага переноса.
STC Установка флага переноса.
CLD Сброс флага направления.
STD Установка флага направления.
CLI Запрет маскируемых аппаратных прерываний.
STI Разрешение маскируемых аппаратных прерываний.
CTS Сброс флага переключения задач.
Команды передачи управления
JMP target Имеет пять форм, различающихся расстоянием назначения от текущего адреса, и способом задания целевого адреса. При работе в Windows используется в основном внутрисегментный переход (NEAR) в пределах 32-битного сегмента. Адрес перехода может задаваться непосредственно (в программе это метка) или косвенно, т.е. содержаться в ячейке памяти или регистре (JMP [EAX]). Другой тип перехода - короткий переход (SHORT), занимает всего 2 байта. Диапазон смещения, в пределах которого происходит переход: -128 … 127. Использование такого перехода весьма ограниченно. Межсегментный переход может иметь следующий вид: JMP FWORD PTR L, L - указатель на структуру, содержащую 48 битный адрес, в начале которого 32-й адрес смещения, затем 16-й селектор (сегмента, шлюза вызова, сегмента состояния задачи). Возможен также и такой вид межсегментного перехода: JMP FWORD ES:[EDI].
Условные переходы JA/JNBE - перейти, если выше.
JAE/JNB - перейти, если выше или равно.
JB/JNAE - перейти, если ниже.
JBE/JNA - перейти, если ниже.
JC - перейти, если перенос.
JE/JZ - перейти, если нуль.
JG/JNLE - перейти, если больше.
JGE/JNL - перейти, если больше или равно.
JL/JNGE - перейти если меньше.
JLE/JNG - перейти, если меньше или равно.
JNC - перейти, если нет переноса.
JNE/JNZ - перейти, если меньше или равно.
JNO - перейти, если нет переполнения.
JNP/JPO - перейти, если нет паритета.
JNS - перейти, если нет знака.
JO - перейти, если есть переполнения.
JP/JPE - перейти, если есть паритет.
JS - перейти, если есть знак.
JCXZ - переход, если CX=0.
JECXZ - переход, если ECX=0.
В плоской модели команды условного перехода осуществляют переход в пределах 32-битного регистра.
Команды управления циклом. Все команды этой группы уменьшают содержимое регистра ECX. LOOP - переход, если содержимое ECX не равно нулю.
LOOPE(LOOPZ) - переход, если содержимое ECX не равно нулю и флаг ZF=1.
LOOPNE(LOOPNZ) - переход, если содержимое ECX не равно нулю и флаг ZF=0.
CALL target Передает управление процедуре (метке) с сохранением в стеке адреса, следующей за CALL-командой. В плоской модели адрес возврата представляет собой 32-битное смещение. Межсегментный вызов предполагает сохранение в стеке селектора и смещения, т.е. 48-битной величины (16 бит - селектор и 32 бита - смещение).
RET [N] Возврат из процедуры. Необязательный параметр N предполагает, что команда также автоматически чистит стек (освобождает N байт). Команда имеет разновидности, которые выбираются ассемблером автоматически, в зависимости от того, является процедура ближней или дальней. Можно, однако, и явно указать тип возврата (RETN или RETF). В случае плоской модели по умолчанию берется RETN с четырехбайтным адресом возврата.
Команды поддержки языков высокого уровня
ENTER par1,par2 Подготовка стека при входе в процедуру (см. главу 1.2.).
LEAVE Приведение стека в исходное состояние.
BOUND REG16,MEM16 или
BOUND REG32,MEM32 Предполагается, что регистр содержит текущий индекс массива, а второй операнда определяет в памяти два слова или два двойных слова. Первое считается минимальным значением индекса, а второе - максимальным. Если текущий индекс оказывается вне границ, то генерируется команда INT 5. Используется для контроля нахождения индекса в заданных рамках, что является важным средством отладки.
Команды прерываний
INT n Двухбайтная команда. В начале в стек помещается содержимое регистра флагов, затем полный адрес возврата. Кроме того, сбрасывается флаг TF. После этого осуществляется косвенный переход через n-й элемент дескрипторной таблицы прерываний. Однобайтная команда INT 3 называется прерыванием контрольного останова и используется в программах-отладчиках.
INTO Равносильна команде INT 4, если флажок переполнения OF=1, если OF=0 - команда не производит никакого действия.
IRET Команда возврата из прерываний. Извлекает из стека сохраненные в нем адрес возврата и регистр флажков. Бит уровня привилегий будет модифицироваться только в том случае, если текущий уровень привилегий равен 0.
Команды синхронизации процессора
HLT Останавливает процессор. Из такого останова процессор может быть выведен внешним прерыванием.
LOCK Представляет собой префикс блокировки шины. Он заставляет процессор сформировать сигнал LOCK# на время выполнения находящейся за префиксом команды. Этот сигнал блокирует запросы шины другими процессорами в мультипроцессорной системе.
NOP Холостая команда. Не производит никаких действий.
WAIT(FWAIT) Синхронизация с сопроцессором. Большинство команд сопроцессора автоматически вырабатывают эту команду.
Команды обработки цепочки бит. Эти команды появились в 386-м процессоре
BSF(BSR) dest,src Dest - 16-битный или 32-битный регистр. Src - регистр или ячейка памяти. При выполнении команды BSF операнд src просматривается с младших, а в команде BSR - со старших бит. Номер первого встречного бита, находящегося в состоянии 1, помещается в регистр dest, флажок ZF сбрасывается в 0. Если src содержит 0, то ZF=1, а содержимое dest не определено.
BT dest,src Тестирование бита с номером из src в dest и перенос его во флаг CF.
BTC dest,src Проверка и инвертирование бита из src в dest.
BTR dest,src Проверка и сброс бита из src в dest.
BTS dest,src Проверка и установка бита из src в dest.
Команды управления защитой
LGDT src Загрузка GDTR из памяти. Src указывает на 6-байтную величину.
SGDT dest Сохранить GDTR в памяти.
LIDT src Загрузить IDTR из памяти.
SIDT dest Сохранить IDTR в памяти.
LLDT src Загрузить LDTR из памяти (16 бит).
SLDT dest Сохранить LDTR в регистре или памяти (16 бит).
LMSW src Загрузка MSW.
SMSW dest Сохранить MSW в регистре или памяти (16 бит).
LTR src Загрузка регистра задачи из регистра или памяти (16 бит).
STR dest Сохранение регистра задачи в регистре или памяти (16 бит).
LAR dest,src Загрузка старшего байта dest байтом прав доступа дескриптора src.
LSL dest,src Загрузка dest лимитом сегмента, дескриптор которого задан src.
ARPL r/m,r Выравнивание RPL в селекторе до наибольшего числа из текущего уровня и заданного операндом.
VERR seg Верификация чтения: установка ZF=1, если задаче позволено чтение в сегменте SEG.
VERW seg Верификация чтения: установка ZF=1, если задаче позволена запись в сегменте SEG.
Команды обмена с управляющими регистрами
MOV CRn,src Загрузка управляющего регистра CRn.
MOV dest,CRn Чтение управляющего регистра CRn.
MOV DRn,src Загрузка регистра отладки DRn.
MOV dest,DRn Чтение регистра отладки DRn.
MOV TRn,src Загрузка регистра тестирования TRn.
MOV dest,TRn Чтение регистра тестирования TRn.
RDTSC Чтение счетчика тактов.
Команды идентификации и управления архитектурой
CPUID Получение информации о процессоре. Требует параметр в регистре EAX.
EAX=0, процессор в регистрах EBX,EDX,ECX возвращает символьную строку, специфичную для производителя. Процессоры AMD возвращают строку “AuthenticAMD”, процессоры Intel - “GenuineIntel”.
EAX=1, в младшем слове регистра EAX возвращает код идентификации.
EAX=2, в регистрах EAX, EBX, ECX, EDX возвращаются параметры конфигурации процессора.
RDMSR r/m Чтение модельно-специфического регистра в ECX.
WRMSR r/m Запись ECX в модельно-специфический регистр.
Команды управления кэшированием
Внутренний кэш появился в процессоре, начиная с 486-ого. Процессоры 486 и Pentium имеют внутренний кэш первого уровня, Pentium Pro и Pentium II имеют уже и вторичный кэш.
INVD Аннулирование данных в первичном КЭШе без обратной записи.
WBINVD Обратная запись модифицированных строк и аннулирование кэш-памяти.
INVLPG r/m Аннулирование элемента таблицы трансляции TLB (TLB - буфер ассоциативной трансляции таблиц каталогов и страниц памяти).
Команды арифметического сопроцессора. Описание работы арифметического сопроцессора см. [1,5]. Здесь мы коснемся основных положений работы арифметического сопроцессора.
1. Арифметический сопроцессор работает со своим набором команд и своим набором регистров. Однако выборку команд сопроцессора осуществляет процессор.
2. Арифметический сопроцессор выполняет операции со следующими типами данных: целое слово (16 бит), короткое целое (32 бита), длинное слово (64 бита), упакованное десятичное число (80 бит), короткое вещественное число (32 бита), длинное вещественное число (64 бита), расширенное вещественное число (80 бит).
3. При выполнении операции сопроцессором, процессор ждет завершения этой операции. Другими словами, перед каждой командой сопроцессора ассемблером автоматически генерируется команда, проверяющая, занят сопроцессор или нет. Если сопроцессор занят, процессор переводится в состояние ожидания. Иногда программисту требуется в ручную ставить команду ожидания (WAIT) после команды сопроцессора.
4. Сопроцессор имеет восемь 80-битных рабочих регистров, представляющих собой стековую кольцевую структуру. Регистры называются R0,R1, … R7, но доступ к ним напрямую невозможен. Каждый регистр может занимать любое положение в стеке. Название стековых (относительных) регистров - ST(0), ST(1), ST(2), ST(3), ST(4), ST(5), ST(6), ST(7). Кроме того, имеется еще регистр состояния, по флагам которого можно, в частности, судить о результате выполненной операции. Регистр управления содержит в себе биты, влияющие на выполнение команд сопроцессора.
5. Регистр тэгов содержит 16 бит, описывающих содержание регистров сопроцессора: по два бита на каждый рабочий регистр. Тэг говорит о содержимом регистре данных. Вот значение тэгов: 00 - действительное ненулевое число, 01 - истинный нуль, 10 - специальные числа, 11 - отсутствие данных.
6. При вычислении с помощью команд сопроцессора большую роль играют исключения или особые ситуации. Типичной особой ситуацией является деление на 0. Биты особых ситуаций хранятся в регистре состояний. Учет особых ситуаций необходим для получения правильных результатов.
7. Список особых ситуаций.
a. Неточный результат (округление).
b. Недействительная операция.
c. Деление на ноль.
d. Антипереполнение (слишком маленький результат).
e. Переполнение (слишком большой результат).
f. Денормализованный операнд.
8. Регистр состояния.
0-й бит, флаг недопустимой операции.
1-й бит, флаг денормализованной операции.
2-й бит, флаг деления на ноль.
3-й бит, флаг переполнения.
4-й бит, флаг антипереполнения.
5-й бит, флаг неточного результата.
6-й бит, ошибка стека.
7-й бит, общий флаг ошибки.
8,9,10-й, флаги условий.
11,12,13-й, число, показывающее, какой регистр является вершиной.
14-й бит, условный флаг.
15 -й бит, флаг занятости. 9. Регистр управления. 0-й бит, маска недействительной операции. 1-й бит, маска денормализованного операнда. 2-й бит, маска деления на ноль. 3-й бит, маска переполнения. 4-й бит, маска антипереполнения. 5-й бит, маска неточного результата. 6,7-й бит, резерв. 8-9-й биты, управление точностью. 10,11 -й биты, управление округлением. 12 -й, управление бесконечностью. 13,14,15 -й, резерв.
Команды передачи данных
FLD src Загрузить вещественное число в ST(0) (вершину стека) из области памяти. Область памяти может быть 32-, 64-, 80-битная.
FILD src Загрузить целое число в ST(0) из памяти. Область памяти может быть 16-, 32-, 64-битной.
FBLD src Загрузить BCD-число в ST(0) из 80-битной области памяти.
FLDZ Загрузить 0 в ST(0).
FLD1 Загрузить 0 в ST(0).
FLDPI Загрузить PI в ST(0).
FLDL2T Загрузить LOG2(10) в ST(0).
FLDTL2E Загрузить LOG2(e) в ST(0).
FLDLG2 Загрузить LG(2) в ST(0).
FLDLN2 Загрузить LN(2) в ST(0).
FST dest Запись вещественного числа из ST(0) в память. Область памяти 32-, 64- или 80-битная.
FSTP dest Запись вещественного числа из ST(0) в память. Область памяти 32-, 64- или 80-битная. При этом происходит выталкивание вершины из стека.
FBST dest Запись BCD-числа в память. Область памяти 80-битная.
FBSTP dest Запись BCD-числа в память. Область памяти 80-битная. При этом происходит выталкивание вершины из стека.
FXCH st(i) Обмен значениями вершины стека и регистра i.
Команды сравнения данных
FCOM Сравнение вещественных чисел ST(0) и ST(1). Флаги устанавливаются, как при операции ST(0)-ST(1).
FCOM src Сравнение ST(0) с операндом в памяти. Операнд может быть 32- или 64-битным.
FCOMP src Сравнение вещественного числа в ST(0) с операндом с выталкиванием ST(0) из стека. Операнд может быть регистром и областью памяти.
FCOMPP Сравнение ST(0) и ST(1) с двойным выталкиванием из стека.
FICOM src Сравнение целых чисел в ST(0) с операндом. Операнд может быть 16- или 32-битным.
FICOMP src Сравнение целых чисел в ST(0) с операндом. Операнд может быть 16- или 32-битной областью памяти или регистром. При выполнении операции происходит выталкивание ST(0) из стека.
FTST Проверка ST(0) на нуль.
FUCOM ST(i) Сравнение ST(0) с ST(i) без учета порядков.
FUCOMP ST(i) Сравнение ST(0) с ST(i) без учета порядков. При выполнении операции происходит выталкивание из стека.
FUCOMPP ST(i) Сравнение ST(0) с ST(i) без учета порядков. При выполнении операции происходит двойное выталкивание из стека.
FXAM Анализ содержимого вершины стека. Результат помещается в биты C3-C0.
000 - неподдерживаемый формат.
001 - не число.
010 - нормализованное число.
011 - бесконечность.
100 - нуль.
101 - пустой операнд.
110 - денормализованное число.
Арифметические команды
FADD src
FADD ST(i),ST Сложение вещественных чисел.
ST(0) <- ST(0)+src, src - 32- или 64-битное число
ST(i)<- ST(i)+ST(0)
FADDP ST(i),ST Сложение вещественных чисел, ST(i)<-ST(i)+ST(0). При выполнении операции происходит выталкивание стека.
FIADD src Сложение целых чисел. ST(0)<-ST(0)+src, src - 16- или 32-битное число.
FSUB src
FSUB ST(i),ST Вычитание вещественных чисел.
ST(0) <- ST(0)-src, src - 32- или 64-битное число.
ST(i)<- ST(i)-ST(0).
FSUBP ST(i),ST Вычитание вещественных чисел, ST(i)<-ST(i)-ST(0). При выполнении операции происходит выталкивание стека.
FSUBR ST(i),ST Обратное вычитание вещественных чисел. ST(0)<-ST(i)-ST(0)
FSUBRP ST(i),ST Обратное вычитание вещественных чисел. ST(0)<-ST(i)-ST(0). При выполнении операции происходит выталкивание стека.
FISUB src Вычитание целых чисел. ST(0)<-ST(0)-src, src - 16- или 32-битное число.
FISUBR src Вычитание целых чисел. ST(0)<-ST(0)-src, src - 16- или 32-битное число. При выполнении операции происходит выталкивание из стека.
FMUL
FMUL ST(i)
FMUL ST(i),ST Умножение двух операндов.
В первом случае ST(0)<-ST(0)*ST(1).
Во втором случае ST(0)<-ST(i)*ST(0).
В третьем случае ST(i)<-ST(i)*ST(0).
FMULP ST(i),ST(0) ST(i)<-ST(i)*ST(0) умножение и выталкивание из стека.
FIMUL src Умножение ST(0) на целое число. ST(0)<-ST(0)*src. Операнд может быть 16- и 32-битным числом.
FDIV
FDIV ST(i)
FDIV ST(i),SY ST(0)<-ST(0)/ST(1)
ST(0)<-ST(0)/ST(i)
ST(i)<-ST(0)/ST(i)
FDIVP ST(i),ST Деление с выталкиванием из стека. ST(i)<-ST(0)/ST(i).
FIDIV src Деление целых чисел. ST(0)<-ST(i)/src. Делитель может быть 16- и 32-битным числом.
FDIVR ST(i),ST Обратное деление вещественных чисел. ST(0)<-ST(i)/ST(0)
FDIVRP ST(i),ST Обратное деление вещественных чисел и выталкивание из стека. ST(0)<-ST(i)/ST(0)
FIDIVR src Обратное деление целых чисел. ST(0)<-src/ST(0).
FSQRT Извлечь корень из ST(0) и поместить обратно.
FSCALE Масштабирование. ST(0)<-ST(0)*2^ST(1)
FXTRACT Выделение мантиссы и порядка из числа ST(0). В ST(0) помещается порядок, в ST(1) - мантисса.
FPREM Нахождение остатка от деления. ST(0)<-ST(0)MODST(1).
FPREM1 Нахождение остатка от деления в стандарте IEEE.
FRNDINT Округление до ближайшего целого числа, находящегося в ST(0). ST(0)<-int(ST(0))
FABS Нахождение абсолютного значения. ST(0)<-ABS(ST(0))
FCSH Изменение знака ST(0)<- -ST(o)
Трансцендентные функции
FCOS Вычисление косинуса. ST(0)<-COS(ST(0)). Содержимое в ST(0) интерпретируется как угол в радианах.
FPTAN Частичный тангенс. Содержимое в ST(0) интерпретируется как угол в радианах. Значение тангенса возвращается на место аргумента, а затем в стек включается 1.
FPATAN Вычисление арктангенса. Вычисляется функция
Arctg(ST(1)/ST(0)). После вычисления функции происходит выталкивание из стека, после чего значение функции помещается в вершину.
FSIN Вычисление синуса. ST(0)<-SIN(ST(0)). Содержимое в ST(0) интерпретируется как угол в радианах.
FSINCOS Вычисление синуса и косинуса. ST(0)<-SIN(ST(0)) и ST(1)<-COS(ST(0))
F2XM1 Вычисление 2^X-1. ST(0) <- 2^ST(0)-1.
FYL2X Вычисление Y*LOG2(X). ST(0) = Y, ST(1) = X. Происходит выталкивание из стека, и только потом в вершину стека помещается результат вычисления.
FYL2XP1 Вычисление Y*LOG2(X). ST(0) = Y, ST(1) = X. Происходит выталкивание из стека, и только потом в вершину стека помещается результат вычисления.
Команды управления сопроцессором
FINIT Инициализация сопроцессора.
FSTSW AX Запись слова состояния в AX.
FSTSW dest Запись слова состояния в dest.
FLDCW src Загрузка управляющего слова (16 бит) из dest.
FSTCW dest Сохранение управляющего слова в dest.
FCLEX Сброс исключений.
FSTENV dest Сохранение состояния оборудования (SR, CR, TAGW, FIP, FDP) в памяти.
FLDENV src Загрузка состояния оборудования из памяти.
FSAVE dest Сохранение состояния оборудования и файла регистров в памяти.
FRSTOR src Загрузка состояния оборудования и файла регистров в памяти.
FINCSTP Инкремент указателя стека.
FDECSTP Декремент указателя стека.
FFREE ST(i) Освобождение регистра - пометка ST(i) как свободного.
FNOP Холостая операция сопроцессора.
WAIT (FWAIT) Ожидание процессором завершение текущей операции сопроцессором.
Расширение MMX. Расширение MMX ориентировано в основном на использование в мультимедийных приложениях. Основная идея MMX заключается в одновременной обработке нескольких элементов данных за одну инструкцию. Расширение MMX появилось в процессорах модификации Pentium P54C и присутствует во всех последних модификациях этого процессора. Расширение MMX использует новые типы упакованных данных: упакованные байты (восемь байт), упакованные слова (четыре слова), упакованные двойные слова (два двойных слова), учетверенное слово. Расширение MMX включает восемь регистров общего пользования (MM0-MM7). Размер регистров составляет 64 бита. Физически эти регистры пользуются младшими битами рабочих регистров сопроцессора. Команды MMX «портят» регистр состояния и регистр тэгов. По этой причине совместное использование команд MMX и команд сопроцессора может вызвать определенные трудности. Другими словами, перед каждым использованием команд MMX Вам придется сохранять контекст сопроцессора, а это может весьма замедлить работу программы. Важно отметить также, что команды MMX работают непосредственно с регистрами сопроцессора, а не с указателями на элементы стека.