nm 命令显示关于指定 file 中符号的信息,文件可以是对象文件、可执行文件或对象文件库。如果文件没有包含符号信息,nm 命令报告该情况,但不把它解释为出错条件。 nm 命令缺省情况下报告十进制符号表示法下的数字值。
$nm myprogrammer 08049f28 d _dynamic 08049ff4 d _global_offset_table_ 080484dc r _io_stdin_used w _jv_registerclasses 08049f18 d __ctor_end__ 08049f14 d __ctor_list__ 08049f20 d __dtor_end__ 08049f1c d __dtor_list__ 080485e0 r __frame_end__ 08049f24 d __jcr_end__ 08049f24 d __jcr_list__ 0804a014 a __bss_start 0804a00c d __data_start 08048490 t __do_global_ctors_aux 08048360 t __do_global_dtors_aux 0804a010 d __dso_handle w __gmon_start__ 08048482 t __i686.get_pc_thunk.bx 08049f14 d __init_array_end 08049f14 d __init_array_start 08048480 t __libc_csu_fini 08048410 t __libc_csu_init u __libc_start_main@@glibc_2.0 0804a014 a _edata 0804a01c a _end 080484bc t _fini 080484d8 r _fp_hw 080482b4 t _init 08048330 t _start 0804a014 b completed.6086 0804a00c w data_start 0804a018 b dtor_idx.6088 080483c0 t frame_dummy 080483e4 t main u printf@@glibc_2.0
这些包含可执行代码的段称为正文段。同样地,数据段包含了不可执行的信息或数据。另一种类型的段,称为 bss 段,它包含以符号数据开头的块。对于 nm 命令列出的每个符号,它们的值使用十六进制来表示(缺省行为),并且在该符号前面加上了一个表示符号类型的编码字符。
可以将目标文件中所包含的不同的部分划分为段。段可以包含可执行代码、符号名称、初始数据值和许多其他类型的数据。有关这些类型的数据的详细信息,可以阅读 unix 中 nm 的 man 页面,其中按照该命令输出中的字符编码分别对每种类型进行了描述。
1. 选项说明
- -a或–debug-syms:显示所有的符号,包括debugger-only symbols。
- -b:等同于–format=bsd,用来兼容mips的nm。
- -c或–demangle:将低级符号名解析(demangle)成用户级名字。这样可以使得c 函数名具有可读性。
- –no-demangle:默认的选项,不需要将低级符号名解析成用户级名。
- -d或–dynamic:显示动态符号。该任选项仅对于动态目标(例如特定类型的共享库)有意义。
- -f format:使用format格式输出。format可以选取bsd、sysv或posix,该选项在gnu的nm中有用。默认为bsd。
- -g或–extern-only:仅显示外部符号。
- -n、-v或–numeric-sort:按符号对应地址的顺序排序,而非按符号名的字符顺序。
- -p或–no-sort:按目标文件中遇到的符号顺序显示,不排序。
- -p或–portability:使用posix.2标准输出格式代替默认的输出格式。等同于使用任选项-f posix。
- -s或–print-armap:当列出库中成员的符号时,包含索引。索引的内容包含:哪些模块包含哪些名字的映射。
- -r或–reverse-sort:反转排序的顺序(例如,升序变为降序)。
- –size-sort:按大小排列符号顺序。该大小是按照一个符号的值与它下一个符号的值进行计算的。
- –target=bfdname:指定一个目标代码的格式,而非使用系统的默认格式。
- -u或–undefined-only:仅显示没有定义的符号(那些外部符号)。
- –defined-only:仅显示定义的符号。
- -l或–line-numbers:对每个符号,使用调试信息来试图找到文件名和行号。
- -v或–version:显示nm的版本号。
- –help:显示nm的选项。
2. 符号说明
对于每一个符号来说,其类型如果是小写的,则表明该符号是local的;大写则表明该符号是global(external)的。
- a 该符号的值是绝对的,在以后的链接过程中,不允许进行改变。这样的符号值,常常出现在中断向量表中,例如用符号来表示各个中断向量函数在中断向量表中的位置。
- b 该符号的值出现在非初始化数据段(bss)中。例如,在一个文件中定义全局static int test。则该符号test的类型为b,位于bss section中。其值表示该符号在bss段中的偏移。一般而言,bss段分配于ram中。
- c 该符号为common。common symbol是未初始话数据段。该符号没有包含于一个普通section中。只有在链接过程中才进行分配。符号的值表示该符号需要的字节数。例如在一个c文件中,定义int test,并且该符号在别的地方会被引用,则该符号类型即为c。否则其类型为b。
-
- d 该符号位于初始化数据段中。一般来说,分配到data section中。
- 例如:定义全局int baud_table[5] = {9600, 19200, 38400, 57600, 115200},会分配到初始化数据段中。
- g 该符号也位于初始化数据段中。主要用于small object提高访问small data object的一种方式。
- i 该符号是对另一个符号的间接引用。
- n 该符号是一个debugging符号。
-
- r 该符号位于只读数据区。
-
- 例如定义全局const int test[] = {123, 123};则test就是一个只读数据区的符号。
- 值得注意的是,如果在一个函数中定义const char *test = “abc”, const char test_int = 3。使用nm都不会得到符号信息,但是字符串”abc”分配于只读存储器中,test在rodata section中,大小为4。
- s 符号位于非初始化数据区,用于small object。
- t 该符号位于代码区text section。
-
- u 该符号在当前文件中是未定义的,即该符号的定义在别的文件中。
- 例如,当前文件调用另一个文件中定义的函数,在这个被调用的函数在当前就是未定义的;但是在定义它的文件中类型是t。但是对于全局变量来说,在定义它的文件中,其符号类型为c,在使用它的文件中,其类型为u。
- v 该符号是一个weak object。
- w the symbol is a weak symbol that has not been specifically tagged as a weak object symbol.
- ? 该符号类型没有定义
库或对象名 如果您指定了 -a 选项,则 nm 命令只报告与该文件有关的或者库或者对象名。
3. 示例
- 寻找特殊标识
有时会碰到一个编译了但没有链接的代码,那是因为它缺失了标识符;这种情况,可以用nm和objdump、readelf命令来查看程序的符号表;所有这些命令做的工作基本一样;
比如连接器报错有未定义的标识符;大多数情况下,会发生在库的缺失或企图链接一个错误版本的库的时候;浏览目标代码来寻找一个特殊标识符的引用:
nm -uca *.o | grep foo
-u选项限制了每个目标文件中未定义标识符的输出。-a选项用于显示每个标识符的文件名信息;对于c 代码,常用的还有-c选项,它也为解码这些标识符;
注解
objdump、readld命令可以完成同样的任务。等效命令为: $objdump -t $readelf -s
-
列出 a.out 对象文件的静态和外部符:
$nm -e a.out
-
以十六进制显示符号大小和值并且按值排序符号:
$nm -xv a.out
-
显示 libc.a 中所有 64 位对象符号,忽略所有 32 位对象:
$nm -x64 /usr/lib/libc.a