Linux下有时候我们需要知道一个进程在做什么,比如说程序不正常的时候,他到底在干吗?最直接的方法就是打印出他所有线程的调用栈,这样我们从栈再配合程序代码就知道程序在干吗了。
Linux下这个工具叫做pstack. 使用方法是

# pstack
Usage: pstack

当然这个被调查的程序需要有符号信息。 比较雷人的是 这个程序竟然是个shell脚本,核心实现是gdb的 thread apply all bt, 我们可以观摩下他的实现,这个我们做类似的程序提供了一个很好的思路:

[root@=i ~]# cat `which pstack`
#!/bin/sh

if test $# -ne 1; then
echo “Usage: `basename $0 .sh` ” 1>&2
exit 1
fi

if test ! -r /proc/$1; then
echo “Process $1 not found.” 1>&2
exit 1
fi

# GDB doesn’t allow “thread apply all bt” when the process isn’t
# threaded; need to peek at the process to determine if that or the
# simpler “bt” should be used.

backtrace=”bt”
if test -d /proc/$1/task ; then
# Newer kernel; has a task/ directory.
if test `/bin/ls /proc/$1/task | /usr/bin/wc -l` -gt 1 2>/dev/null ; then
backtrace=”thread apply all bt”
fi
elif test -f /proc/$1/maps ; then
# Older kernel; go by it loading libpthread.
if /bin/grep -e libpthread /proc/$1/maps > /dev/null 2>&1 ; then
backtrace=”thread apply all bt”
fi
fi

GDB=${GDB:-/usr/bin/gdb}

if $GDB -nx –quiet –batch –readnever > /dev/null 2>&1; then
readnever=–readnever
else
readnever=
fi

# Run GDB, strip out unwanted noise.
$GDB –quiet $readnever -nx /proc/$1/exe $1 <&1 |
$backtrace
EOF
/bin/sed -n \
-e ‘s/^(gdb) //’ \
-e ‘/^#/p’ \
-e ‘/^Thread/p’

实例分析:

[root@bdkyr xuekun]# top -M

top - 15:29:23 up 47 days, 23:05,  2 users,  load average: 1.07, 1.02, 1.00
Tasks: 567 total,   3 running, 564 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.8%us,  6.8%sy,  0.0%ni, 89.4%id,  2.8%wa,  0.0%hi,  0.2%si,  0.0%st
Mem:    31.307G total,   30.954G used,  361.109M free,  335.348M buffers
Swap:   15.625G total,   27.543M used,   15.598G free,   14.647G cached

PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
 7354 root      20   0 7026m 6.6g  824 R 99.8 20.9  60578:29 fio     
5342 root      20   0     0    0    0 R 63.3  0.0  42633:42 fct0-worker

[root@bdkyr xuekun]# pstack 7354
#0  0x0000003fdb800667 in io_submit () from /lib64/libaio.so.1
#1  0x000000000044b9f9 in fio_libaio_commit ()
#2  0x000000000040a9b5 in td_io_commit ()
#3  0x000000000040b491 in td_io_queue ()
#4  0x0000000000441ca2 in thread_main ()
#5  0x0000000000442f1e in run_threads ()
#6  0x000000000044334d in fio_backend ()
#7  0x00000031cf81ecdd in __libc_start_main () from /lib64/libc.so.6
#8  0x00000000004096a9 in _start ()

打出了进程7354 调用过程,日常开发调试的时候,不妨一试,希望给您带去帮助!