WinDbg 文档翻译----44

运算符	含义
+	正数
-	负数
not	如果参数为零返回 1；任何非零参数返回 0。
hi	高 16 位
low	低 16 位
by	指定地址处的低位字节
$pby	除了限制为物理内存地址之外，和by一样。
wo	指定地址处的低位字
$pwo	除了限制为物理内存地址之外，和wo一样。
dwo	指定地址处的双字。
$pdwo	除了限制为物理内存地址之外，和dwo一样。
qwo	指定地址处的四字节。
$pqwo	除了限制为物理内存地址之外，和qwo一样。
poi	指定地址处的指针大小的数据。指针大小或者是 32 位或者是 64 位。在内核调试模式，大小基于目标计算机上的处理器。在 Intel Itanium 计算机上用户模式调试下，大小或者是 32 位或者是 64 位，依赖于目标应用程序。所以，如果你想得到指针大小的数据最好使用 poi 运算符。
$ppoi	除了限制为物理内存地址之外，和poi一样。

可以使用下表中列出的二元运算符。每个单元格中的运算符优先级从上往下依次降低。同一格的各个运算符优先级相同，以从左往右的方式计算。

操作符	含义
* / mod (或 %)	乘法整数除法模数（余数）
+ -	加法减法
<< >> >>>	左移位逻辑右移位算术右移位
= (或 ==) < > <= >= !=	等于小于大于小于等于大于等于不等于
and (或&)	按位与
xor (或^)	按位异或（不同于 OR）
or (或\|)	按位或

比较运算符 <, >, =, == 和 != 计算后如果为真则得到 1，如果为假则得到 0。单个等于号(=)和双等于号(==)相同；在 MASM 表达式中不会产生副作用，也不会赋值。

非法操作（例如除零）会返回给调试器命令窗口一个"Operand error"。

MASM 表达式中的非数值运算符

下表列出了可在 MASM 表达式中使用的其它运算符。

操作符	含义
$fnsucc(FnAddress, RetVal, Flag)	将RetVal作为位于FnAddress处的函数地返回值。如果返回值是一个成功码，$fnsucc 返回 TRUE，否则返回 FALSE。如果返回值类型是 BOOL、 bool、 HANDLE、 HRESULT 或者 NTSTATUS，$fnsucc 可以正确理解指定的返回值是否一个成功码。如果返回值类型是一个指针，所有 NULL 以外的值都是成功码。对于其它返回值类型，根据 Flag 值来定义成功与否，如果 Flag 是 0，那么一个非零 RetVal 值表示成功；如果 Flag 是 1，则 RetVal 值为 0 表示成功。
$iment (Address)	返回加载模块列表中映像入口点地址。Address 指定 PE 映像基地址。通过查找 Address 指定映像的 PE 头中的映像入口点找到入口点。该函数既可以用在模块列表中已有的模块上，也可以通过bu命令设置未确定的断点。
$scmp("String1", "String2")	计算后得到 -1、0 或者 1；就像 C 函数中的 strcmp。
$sicmp("String1", "String2")	计算后得到 -1、0 或者 1；就像 Win32 函数 stricmp。
$spat("String", "Pattern")	根据 String 是否匹配 Pattern 计算得到 TRUE 或 FALSE。Pattern 可以包含多种通配符和特定符（specifiers）；详细请看字符串通配符语法。
$vvalid(Address, Length)	判断一段起始地址为 Address 长度为 Length字节的内存范围是否有效。如果这段内存有效，$vvalid 计算得到 1；否则，$vvalid 计算得到 0。

MASM 表达式中的寄存器和伪寄存器

MASM 表达式中可以使用寄存器和伪寄存器。所有寄存器和伪寄存器可以包含单个at符号( @) 的前缀。使用该前缀可以使调试器存取这些值更快。该记号对于大多数 x86 通用寄存器不需要。对于其它寄存器和伪寄存器实际上也不是必须的，但强烈建议使用。对于少数通用寄存器如果忽略该前缀，调试器首先会尝试解释该文本为十六进制数值，然后解释为符号，最后才把它解释为寄存器。

你也能用一个点号（.）表示当前指令指针。该点号不能带 @ 前缀，不能用作 r 命令的第一个参数。该点号和 $ip 伪寄存器含义相同。

详细请看寄存器语法和伪寄存器语法。

MASM 表达式中的源代码行数

MASM 表达式中可以使用源代码文件和行数表达式。必须用重音符号（`）把它们括住。详细请看源码行语法。

C++ 数值和运算符

C++ 表达式解析器支持所有 C++ 表达式语法形式。包括所有数据类型(包括指针，浮点数，数组)以及 C++ 所有一元和二元运算符。

C++ 表达式中的数值

除非另有说明，C++ 表达式中的数值被当作十进制来解析。添加 0x 前缀指定十六进制整数。添加 0（零）指定八进制整数。

调试器使用的缺省基数不影响 C++ 表达式的输入。不能直接输入二进制数值（除非在 C++ 表达式中嵌套 MASM 表达式）。

能够以 xxxxxxxx`xxxxxxxx 格式输入 64 位十六进制数值(可以忽略重音符号（`）)。两种格式值相同。

整型值后可以使用 L、U 和 I64 后缀。合成数的实际大小依据使用的后缀和输入的数值；详细请看 C++ 语言参考。

C++ 表达式求值后的输出结果保留 C++ 表达式规则指定的数据类型。然而，如果表达式被用作某个命令的参数，总是会产生强制类型转换。例如，在命令参数中作为地址时你不需要把整型值强制转换为指针。如果表达式的值不能被合法地强制转换为整型或者指针，则会导致语法错误。

某些输出中会用到 0n（十进制）前缀，虽然在输入 C++ 表达式时不允许使用该前缀。

C++ 表达式中的字符和字符串

输入字符时用单引号（'）括住。可以使用标准的 C++ 转义字符。

输入字符串时用双引号（"）括住。可以在字符串中使用转义字符序列 \" 。然而，字符串对于表达式求值器无意义。

C++ 表达式中的符号

在 C++ 表达式中，每个符号都根据它的类型来解析。根据引用符号的不同，可以被解析为整数、数据结构、函数指针或者其它的数据类型。在 C++ 表达式中使用一个没有 C++ 数据类型与之对应的符号（例如一个没有修饰的模块名）会导致语法错误。

如果会混淆，可以在符号前添加模块名和感叹号（!）前缀，或者单独一个感叹号前缀。关于符号识别，详细请看符号语法和符号匹配。

只有以模块名和感叹号为前缀的符号名中才能使用重音符号（`）或者撇号（'）。

当模板名用 < 和 > 分隔符时，分隔符之间可以有空格。

C++ 表达式中的运算符

总是可以用圆括号来掩盖优先级规则。

如果 C++ 表达式的某一部分被圆括号括住并且在表达式前添加两个at符号(@@)，该部分将根据 MASM 表达式规则来解析。在两个 @ 记号之间以及和左圆括号之间不能有空格。该表达式的最终值将以 ULONG64 类型传递给 C++ 表达式求解器。也可以通过使用 @@c++( ... ) 或者 @@masm( ... ) 指定表达式求解器。

数据类型按C++语言的常规方法来指定。可以识别表示数组（[ ]），指针成员（->），UDT（译注：用户定义类型，User defined types）成员（.），以及所有的类成员(::)。支持所有算术运算符，包括赋值运算符和带副作用的运算符。但是，不允许使用 new、delete 和 throw 运算符，当然，也不能调用函数。

支持指针运算，也可以正确计算偏移。注意不能给函数指针加上某个偏移值 (如果需要这样做，首先把它强制转换为指向字符的指针)。

和在 C++ 中一样，使用带非法数据类型的运算符将导致语法错误。调试器中的 C++ 表达式解析器比大多数 C++ 编译器使用的规则要稍微宽松一些，但所有的主要规则都支持。例如，非整型数移位操作是被禁止的。

下表列出了所有可用的运算符。各个单元格中的运算符优先级从上往下依次降低。同一格中的各个运算符优先级相同，以从左往右的方式解析。和 C++ 一样，如果表达式的值已经可以确定，则终止继续求值过程；这个规则允许有效地使用如 ?? myPtr && *myPtr 样子的表达式。

操作符	含义
Expression // Comment	注释，忽略后面的所有文本
Class :: Member Class ::~Member :: Name	类成员类成员（析构函数）全局的
Structure . Field Pointer -> Field Name [integer] LValue ++ LValue -- dynamic_cast <type>(Value) static_cast <type>(Value) reinterpret_cast <type>(Value) const_cast <type>(Value)	结构成员被引用结构的成员数组下标加一（计算后）减一（计算后）类型强制转换（总会执行）类型强制转换（总会执行）类型强制转换（总会执行）类型强制转换（总会执行）
(type) Value sizeof value sizeof( type ) ++ LValue -- LValue ~ Value ! Value - Value + Value & LValue * Value	类型强制转换（总会执行）表达式大小数据类型大小加一（计算前）减一（计算前）按位反逻辑非一元运算符，负数一元运算符，正数数据类型的地址解引用，取值
Structure . * Pointer Pointer -> * Pointer	指向结构成员的指针指向被引用结构的成员的指针
Value * Value Value / Value Value % Value	乘法除法求余
Value + Value Value - Value	加法减法
Value << Value Value >> Value	左移位右移位
Value < Value Value <= Value Value > Value Value >= Value	小于（比较）小于等于（比较）大于（比较）大于等于（比较）
Value == Value Value != Value	等于（比较）不等于（比较）
Value & Value	按位与
Value ^ Value	按位异或（不同于 OR）
Value \| Value	按位或
Value && Value	逻辑与
Value \|\| Value	逻辑或
LValue = Value LValue = Value* LValue /= Value LValue %= Value LValue += Value LValue -= Value LValue <<= Value LValue >>= Value LValue &= Value LValue \|= Value LValue ^= Value	赋值乘之后赋值除之后赋值求余之后赋值加之后赋值减之后赋值左移位之后赋值右移位之后赋值与之后赋值或之后赋值异或之后赋值
Value ? Value : Value	三元条件运算符
Value , Value	逗号运算符。计算所有值，保留最右边的值

C++ 表达式中的寄存器和伪寄存器

C++ 表达式中可以使用寄存器和伪寄存。它们必须带一个 at符号(@) 前缀。

表达式求解器会自动执行正确的强制类型转换。实际的寄存器和整型值伪寄存器被强制转换为 ULONG64。所有地址被强制转换为 PUCHAR，$thread 被强制转换为 ETHREAD*，$proc 被强制转换为 EPROCESS*，$teb 被强制转换为 TEB*，$peb 被强制转换为 PEB*。

不能使用赋值运算符或者带副作用的运算符修改寄存器或者伪寄存器。必须使用 r (Registers)命令修改它们的值。

详细请看寄存器语法和伪寄存器语法。

C++表达式中的宏

在C++表达式中可以使用宏。必须在宏前面加上数字符号(#)。

可以使用下表中的宏。这些宏的作用和Microsoft Windows中定义的同名宏有相同的定义。(Windows的宏在Winnt.h中定义。)

宏	返回值
#CONTAINING_RECORD(Address, Type, Field)	给定该结构的类型和它包含的一个字段的地址，返回该结构实例的基地址。
#FIELD_OFFSET(Type, Field)	返回一个已知的结构类型中某个命名字段的字节偏移。
#RTL_CONTAINS_FIELD (Struct, Size, Field)	指出是否给定的字节大小包含了需要的字段。
#RTL_FIELD_SIZE(Type, Field)	返回已知类型的结构中某个字段的大小，不需要给出该字段的类型。
#RTL_NUMBER_OF(Array)	返回一个静态分配的数组的元素个数。
#RTL_SIZEOF_THROUGH_FIELD(Type, Field)	返回已知类型的结构中，从基地址到包含指定字段的位置的大小。

MASM 表达式 vs. C++ 表达式

MASM 表达式求值和 C++ 表达式求值之间最重要的区别有如下几种：

在 MASM 表达式中，任何符号的数值都是它的内存地址。在 C++ 表达式中，变量的数值就是它的实际值，不是地址。数据结构没有数值；它们必须声明为实际结构再使用。函数名或者任何其它入口点的值是内存地址，当作为函数指针。没有 C++ 数据类型与之对应的符号（例如没有修饰的模块名）会导致语法错误。
MASM 表达式求解器把所有的数值当做 ULONG64 处理。C++ 表达式求解器把数值强制转换为 ULONG64，而且保留所有数据类型的类型信息。
MASM 表达式求解器允许任何运算符操作任何数值。如果某个运算符使用了不恰当的数据类型，C++ 表达式求解器将产生错误。
在 MASM 表达式求解器中，所有算术运算都是按字面意义操作。在 C++ 表达式求解器中，指针运算会计算正确的偏移比例，执行不相符的操作会被禁止。
MASM 表达式中既可以用双下划线（__）也可以用双冒号（::）来标志类的成员。C++ 表达式求解器仅能识别双冒号语法。但调试器输出总是使用双冒号。
在 MASM 表达式中，建议你在大多数通用寄存器前添加 @ 前缀。如果忽略该前缀，寄存器名可能被解析为十六进制数值或者符号。在 C++ 表达式中，所有寄存器都需要使用该前缀。
MASM 表达式中可以包含源代码行数的引用，用重音符号（`）标志它们。C++ 表达式中不能引用源代码行数。

表达式示例

本节包含了一些在各种命令中使用 MASM 和 C++ 表达式的示例。

在这份帮助文档的其它所有章节中，示例都使用了 MASM 表达式语法（除非另有说明）。C++ 表达式语法对于管理结构和变量非常有用，但它不是很适合解析调试命令的参数。

当为了常用目的使用调试命令或者扩展命令时，应该设置 MASM 表达式语法为缺省语法。如果某个参数需要使用 C++ 表达式语法，那么用 @@( ) 语法。

条件断点

可以用比较运算符来创建条件断点。下面的例子使用 MASM 表达式语法。因为当前的缺省基数是 16，所以数值 20 使用了 0n 前缀表示十进制数：

0:000> bp MyFunction+0x43 "j ( poi(MyVar)>0n20 ) ''; 'gc' "

在本例中，MyVar 是 C 源代码中的整数。因为 MASM 解析器把所有符号当做地址，所以需要 poi 运算符取 MyVar 的值。

条件表达式

下面的命令如果 eax 大于 ebx 打印出 ecx 的值，如果 eax 小于 ebx 打印出 7，如果 eax 等于 ebx 打印出 3。使用 MASM 表达式求解器，所以单个等于号(=)当做比较运算符使用，而不是赋值运算符：

0:000> ? ecx*(eax>ebx) + 7*(eax<ebx) + 3*(eax=ebx)

在 C++ 语法中，指示寄存器需要用 @ 记号，比较运算符是双等于号(==)，需要把 BOOL 显式强制转化为 int。所以，在 C++ 语法中，这条命令变成：

0:000> ?? @ecx*(int)(@eax>@ebx) + 7*(int)(@eax<@ebx) + 3*(int)(@eax==@ebx)

C++ 表达式示例

如果 myInt 类型是 ULONG32，而且用 MASM 表达式求解器，那么下面两条命名都将显示 myInt 的值：

0:000> ?? myInt
0:000> dd myInt L1

然而，下面的命令将显示 myInt 的地址。

0:000> ? myInt

混合表达式示例

C++ 表达式中不能使用源代码行数表达式。下面的例子在 C++ 表达式中使用 @@( ) 语法嵌入了一个 MASM 表达式。本例把MyPtr 的值设置为Myfile.c 文件的第43行代码所在的地址。

0:000> ?? MyPtr = @@( `myfile.c:43` )

下面的命令将 MASM 设置为缺省的表达式求解器，然后，把 Expression1 和 Expression3 做为 MASM 表达式求解，把 Expression2 做为 C++ 表达式求解：

0:000> .expr /s masm
0:000> bp Expression1 + @@( Expression2 ) + Expression3

如果 myInt 是 ULONG64 类型，而且知道在内存中紧跟着它的是另外一个 ULONG64 类型，可以用下面任一条命令在该位置设置一个存取断点。(注意用了指针运算)

0:000> ba r8 @@( &myInt + 1 )
0:000> ba r8 myInt + 8

结构体

C++ 表达式求解器把伪寄存器强制转换为正确的类型。例如，$teb 被强制转换为 TEB*。所以下面的命令将显示进程 ID：

kd> ?? @$teb->ClientId.UniqueProcess

符号扩展

当一个 32 位整数为负数时，它的最高位等于一。强制转换为 64 位数值时，有两种可能性：最高位全设为零，保留无符号整数和十六进制数值，或者最高位全设为一，保留带符号数值。后面一种被称为符号扩展。

在 MASM 表达式中、C++ 表达式中以及显示数值时，调试器遵循不同的规则实现符号扩展。

MASM 表达式中的符号扩展

在某种情况下，MASM 表达式求解器会把数值自动进行符号扩展。符号扩展只影响 0x80000000 和 0xFFFFFFFF 之间的数，包括－换句话说，就是最高位等于 1 的32 位数。

所以，当调试器把 0x12345678 转换为 64 位数时总是保持 0x00000000`12345678。另一方面，当 0x890ABCDE 被转换为 64 位值时可能保持 0x00000000`890ABCDE 或者可能被扩展为 0xFFFFFFFF`890ABCDE。

0x80000000 和 0xFFFFFFFF 之间的数是否会被符号扩展，根据下面的标准：

用户模式下常数永远不会被符号扩展。内核模式下，除非在低字节前包含重音符号( ` )，否则常数将被符号扩展。例如，内核模式下十六进制数值 EEAA1122 和 00000000EEAA1122 将被符号扩展，但 00000000`EEAA1122 和 0`EEAA1122 不会。
两种模式下 32 位寄存器都将被符号扩展。
伪寄存器总是作为 64 位值存储。所以计算时不会有符号扩展的问题。当伪寄存器是一个带符号值时，表达式根据C++标准进行求值。
表达式中的单个数值和寄存器可能会被符号扩展，但表达式计算被扩展期间不会有其它的计算操作。你可以使用下面的语法给一个数值或者寄存器的最高位加上掩码操作。

( 0x0`FFFFFFFF & expression )

C++ 表达式中的符号扩展

调试器使用下面的规则计算一个 C++ 表达式：

寄存器和伪寄存器永远不会被符号扩展
所有其它数值都被以 C++的方式按类型转换为正确的值。

符号扩展数和 64 位数的显示

不同于 32 位和 16 位寄存器，在调试器内部所有数值都被当做 64 位值存储。然而，当数值满足一定条件时，在命令输出中它将被当做 32 位数显示。

调试器显示数值的算法如下：

如果某个数的高 32 位都为零 (换句话说，如果该数处在 0x00000000`00000000 到 0x00000000`FFFFFFFF 范围)，那么它被当做 32 位数显示。
如果某个数的高 32 位都为一，而且低 32 位中的最高位也为一 (换句话说，如果该数处在 0xFFFFFFFF`80000000 到 0xFFFFFFFF`FFFFFFFF 范围)，那么调试器假定它是一个被符号扩展的 32 位数，当做 32 位数显示。
如果不是上面两种情况 (换句话说，如果该数处在 0x00000001`00000000 到 0xFFFFFFFF`7FFFFFFF 范围)那么它被当做 64 位数显示。

这些规则会产生一个结果，当一个数被显示为 0x80000000 到 0xFFFFFFFF 之间的 32 位数值时，你不能确定它的最高 32 位全部是一还是零。要区别这两种情况你需要在这个数上执行一个额外的计算操作（例如屏蔽最高的一位或多位然后显示结果）。

posted on 2008-06-04 14:39 NetRoc 阅读(1080) 评论(0) 编辑收藏引用

只有注册用户登录后才能发表评论。

NetRoc's Blog

WinDbg 文档翻译----44

调试器命令

语法规则

数值表达式语法

MASM数值和运算符

MASM 表达式中的数值

MASM 表达式中的符号

MASM 表达式中的数值运算符

MASM 表达式中的非数值运算符

MASM 表达式中的寄存器和伪寄存器

MASM 表达式中的源代码行数

C++ 数值和运算符

C++ 表达式中的数值

C++ 表达式中的字符和字符串

C++ 表达式中的符号

C++ 表达式中的运算符

C++ 表达式中的寄存器和伪寄存器

C++表达式中的宏

MASM 表达式 vs. C++ 表达式

表达式示例

条件断点

条件表达式

C++ 表达式示例

混合表达式示例

结构体

符号扩展

MASM 表达式中的符号扩展

C++ 表达式中的符号扩展

符号扩展数和 64 位数的显示

导航

统计

常用链接

留言簿(7)

随笔档案(99)

文章分类(35)

文章档案(32)

Friends

Mirror

搜索

最新评论

阅读排行榜

评论排行榜