首页 > 数据库 > PHP的灵魂HashTable结构解读
2019
09-05

PHP的灵魂HashTable结构解读

说 HashTable 是PHP的灵魂,一点也不为过。在Zend引擎中,比如变量表、常量表、函数表、数组,以及资源管理、线程安全等,其实现都有HashTable的身影。HashTable 是一种查找性能极高的数据结构,理想情况下其算法复杂度是O(1)。


PHP 源码信息


PHP 版本:php-5.6.17

头文件: Zend/zend_hash.h,

源文件: Zend/zend_hash.c

注意:说明中使用了伪代码形式,只有代码块中的代码才可以执行


PHP HashTable 概述


有两部分组成,Bucket 和 HashTable,而且均为结构体(struct)。

Bucket 是存储数据的单元,用于保存具体的数据内容;HashTable 用于保存整个哈希表需要的基本信息。

二者关系可以简单理解为:HashTable = Array(); HashTable['arBuckets'] = [Bucket1, Bucket2, Bucket3, …]。

HashTable 的目的就是通过索引把每个Bucket元素分散到唯一的位置。

PHP 内核通过HashTable 结构管理Bucket 数组。

相比普通HashTable,PHP的HashTable同时维护一个双向链表。在HashTable.arBuckets 存储的是包含多个Bucket指针的向量,每个指针又指向一个双向链表(多个bucket组成)。

HashTable 源码展示

在Zend/zend_hash.h的line 55~83 中定义了结构体 Bucket 和 HashTable。注意 Bucket 和 HashTable 是别名,分别对应结构体 bucket 和 _hashtable。

typedef struct bucket {     ulong h;                        /* Used for numeric indexing */     uint nKeyLength;     void *pData;     void *pDataPtr;     struct bucket *pListNext;     struct bucket *pListLast;     struct bucket *pNext;     struct bucket *pLast;     const char *arKey; } Bucket; typedef struct _hashtable {     uint nTableSize;     uint nTableMask;     uint nNumOfElements;     ulong nNextFreeElement;     Bucket *pInternalPointer;   /* Used for element traversal */     Bucket *pListHead;     Bucket *pListTail;     Bucket **arBuckets;     dtor_func_t pDestructor;     zend_bool persistent;     unsigned char nApplyCount;     zend_bool bApplyProtection; #if ZEND_DEBUG     int inconsistent; #endif } HashTable;

Bucket 解析说明

先分析一下Bucket 结构体成员变量的作用:

说明

一. pData 和 pDataPtr 的关系,

pData 指向的是保存数据的内存块地址,一般通过malloc等分配;

pDataPtr 如果是指针数据,此值会指向真正的value,同时pData 会指向该值

疑问 内存块地址,不也是指针吗?和pDataPtr什么区别??


二. h 成员保存的是HashTable key 哈希后的值,而非HashTable中的索引值,为什么?

索引值和HashTable的容量有关系,如果HashTable扩容,那么这些索引还得重新进行哈希,再进行索引映射

数字索引直接就可以作为哈希表的索引,数字也无需进行哈希处理


HashTable 解析说明

扫码芷若 获取免费视频学习资料

编程学习

查 看2019高级编程视频教程免费获取