以下文章列表是之前对 Python JIT 研究过程的一个汇总。最终发现 Python JIT 其实就是在 Python 运行时的某个环节执行另外一个程序生成的机器代码,这些机器代码以补丁的形式出现在 Python 的运行时。
- PythonJIT 如何执行
- PythonJIT 反向推断 patch 的生成过程
- PythonJIT-copy-and-patch 的处理的详细过程
- PythonJIT 中的机器代码是如何生成的
- 如何在 Ubuntu2404 上编译 PythonJIT
尝试动手写一个程序执行机器代码
动手写一个简单的加法运算,并返回结果。
// add.c
int add(int a, int b) {
return a + b;
}
将 add.c 编译为中间目标文件,然后通过 objdump 将机器码和汇编代码打印出来,然后通过一系列的 shell 命令进行 parse 解析,得到一个逗号分隔的十六进制代码集合。
gcc -c add.c -o add.o
objdump -d add.o | \
grep -P '^\s+[\da-f]+:'| \
cut -f2 -d: | \
cut -f1-6 -d' ' | \
tr -s " " | \
sed 's/ $/,/g' | \
sed 's/ /, 0x/g' | \
sed 's/^\t/0x/g'
申请可执行内存,执行机器代码
将输出内容拷贝到如下程序的 addbytes 数组中。由于机器不支持匿名可执行内存 MAPANONYMOUS,我不得不打开一个文件描述符 open("/dev/zero", O_RDWR);
,然后赋值给 fd,作为 mmap 的参数。
// main.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/mman.h>
#include <unistd.h>
#include <fcntl.h>
// 以下是从 add.o 中提取的字节码
unsigned char add_bytes[] = {
0xf3, 0x0f, 0x1e, 0xfa,
0x55,
0x48, 0x89, 0xe5,
0x89, 0x7d, 0xfc,
0x89, 0x75, 0xf8,
0x8b, 0x55, 0xfc,
0x8b, 0x45, 0xf8,
0x01, 0xd0,
0x5d,
0xc3,
};
void execute_bytecode(unsigned char *code, size_t size) {
// 为字节码分配可执行内存
int fd = open("/dev/zero", O_RDWR);
if (fd == -1) {
perror("open fail");
exit(EXIT_FAILURE);
}
void *mem = mmap(NULL, size, PROT_READ | PROT_WRITE | PROT_EXEC,
MAP_SHARED, fd, 0);
if (mem == MAP_FAILED) {
perror("mmap fail");
exit(EXIT_FAILURE);
}
// 将字节码拷贝到分配的内存中
memcpy(mem, code, size);
int (*add)(int, int) = mem;
printf("result: %d\n", add(1, 2));
// 释放分配的内存
munmap(mem, size);
}
int main() {
execute_bytecode(add_bytes, sizeof(add_bytes));
return 0;
}
编译 main.c,并执行中间目标程序,得到预期的结果。
gcc -o main main.c
./main
# result: 3
总结
创建一块可执行的内存,将机器码拷贝到这块内存上,然后将这块内存强转为我们需要的函数,执行后释放内存即可。