Python 内核中最常见的数据结构就是 PyObject,它也是最重要的数据结构,Python 数据类型最底层的数据结构,int、string、float、boolean、list、set、hash 等都是基于这个数据结构来扩展的。PyObject 是定长对象,PyVarObject 是变长对象。

/* Nothing is actually declared to be a PyObject, but every pointer to
 * a Python object can be cast to a PyObject*.  This is inheritance built
 * by hand.  Similarly every pointer to a variable-size Python object can,
 * in addition, be cast to PyVarObject*.
 */
typedef struct _object {
    _PyObject_HEAD_EXTRA
    Py_ssize_t ob_refcnt;
    PyTypeObject *ob_type;
} PyObject;

typedef struct {
    PyObject ob_base;
    Py_ssize_t ob_size; /* Number of items in variable part */
} PyVarObject;

这篇文章主要是为了引入 PyObject,至于 Python 数据结构的底层实现不做详解解析,后面会针对每一种数据结构做详细的分析。

PyObject 的数据结构可以在内核源码Include/cpython/object.h中找到。

PyObject 是一个双向链表结构,_PyObject_HEAD_EXTRA定义了 next 和 prev 指针。ob_refcnt 为引用计数器,调用一次引用计数器加一,使用完计数器减一,为 0 后所占用的内存块会被释放。

/* PyTypeObject structure is defined in cpython/object.h.
   In Py_LIMITED_API, PyTypeObject is an opaque structure. */
typedef struct _typeobject PyTypeObject;

// If this structure is modified, Doc/includes/typestruct.h should be updated
// as well.
struct _typeobject {
    PyObject_VAR_HEAD
    const char *tp_name; /* For printing, in format "<module>.<name>" */
    Py_ssize_t tp_basicsize, tp_itemsize; /* For allocation */ 
    ... 
};

/* PyObject_VAR_HEAD defines the initial segment of all variable-size
 * container objects.  These end with a declaration of an array with 1
 * element, but enough space is malloc'ed so that the array actually
 * has room for ob_size elements.  Note that ob_size is an element count,
 * not necessarily a byte count.
 */
#define PyObject_VAR_HEAD      PyVarObject ob_base;

_typeobject中的PyObject_VAR_HEAD是一个变长对象,相比 PyObject 多了一个 ob_size,表示变长部分的元素个数。

还有些字段对于不同的数据类型有其不同的作用,这里不展开分析。

编程语言离不开算法和数据结构,数据结构尤为重要,好的数据结构设计让我们的开发工作事半功倍,好的数据结构可以让算法的实现变得简单,也可以让算法的效率变得更高。Python 内核中的数据结构设计的非常好,这也是 Python 能够快速发展的一个重要原因。

本人热衷于编程语言底层实现原理。通过一些空闲时间阅读源码,记录自己的所学及心得。你的关注和鼓励是对我持续输出分享的动力,感谢,共同进步。

公众号


推荐阅读: