深度图解 Redis Hash(散列表)实现原理|头条焦点
1. 是什么
Redis Hash(散列表)是一种 field-value pairs(键值对)集合类型,类似于 Python 中的字典、Java 中的 HashMap。一个 field 对应一个 value,你可以通过 field 在 O(1) 时间复杂度查 field 找关联的 field,也可以通过 field 来更新或者删除这个键值对。
Redis 的散列表 dict 由数组 + 链表构成,数组的每个元素占用的槽位叫做哈希桶,当出现散列冲突的时候就会在这个桶下挂一个链表,用“拉链法”解决散列冲突的问题。
(资料图片仅供参考)
简单地说就是将一个 key 经过散列计算均匀的映射到散列表上。
图 2-18
2. 修炼心法
Hash 数据类型底层存储数据结构实际上有两种。
dict 结构。 在 7.0 版本之前使用 ziplist,之后被 listpack 代替。通常情况下使用 dict 数据结构存储数据,每个 field-value pairs
构成一个 dictEntry 节点来保存。
只有同时满足以下两个条件的时候,才会使用 listpack(7.0 版本之前使用 ziplist)数据结构来代替 dict 存储, 把 key-value 键值对按照 field 在前 value 在后,紧密相连的方式放到一次把每个键值对放到列表的表尾。
每个键值对中的 field 和 value 的字符串字节大小都小于hash-max-listpack-value
配置的值(默认 64)。 field-value pairs 键值对数量小于 hash-max-listpack-entries
配置的值(默认 512)。 每次向散列表写数据的时候,都会调用 t_hash.c
中的hashTypeConvertListpack()
函数来判断是否需要转换底层数据结构。
当插入和修改的数据不满足以上两个条件时,就把散列表底层存储结构转换成 dict
结构。需要注意的是,不能由 dict 退化成 listpack。
虽然使用了 listpack 就无法实现 O(1) 时间复杂度操作数据,但是使用 listpack 能大大减少内存占用,而且数据量比较小,性能并不是有太大差异。
为了对上层屏蔽散列表底层使用了不同数据结构存储,所以抽象了一个 hashTypeIterator 迭代器来实现散列表的查询。
Hashes 数据类型使用 listpack 作为存储数据时的情况,如图 2-19 所示。
图 2-19
listpack 数据结构在之前的已经介绍过, 接下来带你揭秘 dict 到底长啥样。
Redis 数据库就是一个全局散列表。正常情况下,我只会使用 ht_table[0]
散列表,图 2-20 是一个没有进行 rehash 状态下的字典。
图 2-20
dict 字典在源代码 dict.h
中使用 dict 结构体表示。
structdict{dictType*type;//真正存储数据的地方,分别存放两个指针dictEntry**ht_table[2];unsignedlonght_used[2];longrehashidx;int16_tpauserehash;signedcharht_size_exp[2];};
dictType *type
,存放函数的结构体,定义了一些函数指针,可以通过设置自定义函数,实现 dict 的 key 和 value 存放任何类型的数据。 重点看 dictEntry **ht_table[2]
,存放了两个 dictEntry 的二级指针,指针分别指向了一个 dictEntry 指针的数组。 ht_used[2]
,记录每个散列表使用了多少槽位(比如数组长度 32,使用了 12)。 rehashidx
,用于标记是否正在执行 rehash 操作,-1 表示没有进行 rehash。如果正在执行 rehash,那么其值表示当前 rehash 操作执行的 ht_table[0] 散列表 dictEntry 数组的索引。 pauserehash
表示 rehash 的状态,大于 0 时表示 rehash 暂停了,小于 0 表示出错了。 继续看 dictEntry,数组中每个元素都是 dictEntry 类型,就是这玩意存放了键值对,表示字典的一个节点。
typedefstructdictEntry{void*key;union{void*val;uint64_tu64;int64_ts64;doubled;}v;structdictEntry*next;}dictEntry;
*key
指针指向键值对中的键,实际上指向一个 SDS 实例。 v
是一个 union 联合体,表示键值对中的值,同一时刻只有一个字段有值,用联合体的目是节省内存。 *val
如果值是非数字类型,那就使用这个指针存储。 uint64_t u64
,值是无符号整数的时候使用这个字段存储。 int64_t s64
,值是有符号整数时,使用该字段存储。 double d
,值是浮点数是,使用该字段存储。 *next
指向下一个节点指针,当散列表数据增加,可能会出现不同的 key 得到的哈希值相等,也就是说多个 key 对应在一个哈希桶里面,这就是哈希冲突。Redis 使用拉链法,也就是用链表将数据串起来。 MySQL:“为啥 ht_table[2] 存放了两个指向散列表的指针?用一个散列表不就够了么。”
默认使用 ht_table [0]
进行读写数据,当散列表的数据越来越多的时候,哈希冲突严重会出现哈希桶的链表比较长,导致查询性能下降。
我为了唯快不破想了一个法子,当散列表保存的键值对太多或者太少的时候,需要通过 rehash(重新散列)对散列表进行扩容或者缩容。
扩容和缩容
为了高性能,减少哈希冲突,我会创建一个大小等于 ht_used[0] * 2
的散列表 ht_table[1]
,也就是每次扩容时根据散列表 ht_table [0]
已使用空间扩大一倍创建一个新散列表ht_table [1]
。反之,如果是缩容操作,就根据ht_table [0]
已使用空间缩小一倍创建一个新的散列表。
重新计算键值对的哈希值,得到这个键值对在新散列表 ht_table [1]
的桶位置,将键值对迁移到新的散列表上。
所有键值对迁移完成后,修改指针,释放空间。具体是把 ht_table[0]
指针指向扩容后的散列表,回收原来小的散列表内存空间,ht_table[1]
指针指向NULL
,为下次扩容或者缩容做准备。
当前没有执行MySQL:“什么时候会触发扩容?”
BGSAVE
或者 BGREWRITEAOF
命令,同时负载因子大于等于 1。也就是当前没有 RDB 子进程和 AOF 重写子进程在工作,毕竟这俩操作还是比较容易对性能造成影响的,就不扩容火上浇油了。 正在执行 BGSAVE
或者 BGREWRITEAOF
命令,负载因子大于等于 5。(这时候哈希冲突太严重了,再不触发扩容,查询效率太慢了)。 负载因子 = 散列表存储 dictEntry 节点数量 / 散列表桶个数
。完美情况下,每个哈希桶存储一个 dictEntry 节点,这时候负载因子 = 1。
MySQL:“需要迁移数据量很大,rehash 操作岂不是会长时间阻塞主线程?”
为了防止阻塞主线程造成性能问题,我并不是一次性把全部的 key 迁移,而是分多次,将迁移操作分散到每次请求中,避免集中式 rehash 造成长时间阻塞,这个方式叫渐进式 rehash。
在执行渐进式 rehash 期间,dict 会同时使用 ht_table[0]
和 ht_table[1]
两个散列表,rehash 具体步骤如下。
rehashidx
设置成 0,表示 rehash 开始执行。 在 rehash 期间,服务端每次处理客户端对 dict 散列表执行添加、查找、删除或者更新操作时,除了执行指定操作以外,还会检查当前 dict 是否处于 rehash 状态,是的话就把散列表 ht_table[0]
上索引位置为 rehashidx
的桶的链表的所有键值对 rehash 到散列表 ht_table[1]
上,这个哈希桶的数据迁移完成,就把 rehashidx
的值加 1,表示下一次要迁移的桶所在位置。 当所有的键值对迁移完成后,将 rehashidx
设置成 -1,表示 rehash 操作已完成。 MySQL:“rehash 过程中,字典的删除、查找、更新和添加操作,要从两个 ht_table 都搞一遍么?”
删除、修改和查找可能会在两个散列表进行,第一个散列表没找到就到第二个散列表进行查找。但是增加操作只会在新的散列表上进行。
MySQL:“如果请求比较少,岂不是会很长时间都要使用两个散列表。”
好问题,在 Redis Server 初始化时,会注册一个时间事件,定时执行 serverCron
函数,其中包含 rehash 操作用于辅助迁移,避免这个问题。
serverCron
函数除了做 rehash 以外,主要处理如下工作。
是不是很贴心,既能保证性能,又能避免内存浪费。好了,今天散列表底层数据结构实现原理就到这里。后面我将给大家分享如何使用 Hash 实现购物车功能。
标签:
推荐文章
- 华声制药网简介
- 人机对话技术升级 之江实验室获2021年度浙江省科技进步二等奖
- 研究人员最新发现 单个细胞可同时处理成百上千个信号
- 陆军第73集团军某旅 创新升级模拟训练器材
- 长期暴露在光照下性能退化 科学家发现钙钛矿太阳能电池最大缺陷
- 宁夏启动双百科技支撑行动 构建高水平产业创新体系
- 陆军炮兵防空兵学院 毕业学员综合战术演习现地备课工作圆满完成
- 国内首颗以茶叶冠名遥感卫星 安溪铁观音一号发射成功
- 区域特色产业转型升级 四川屏山以“3+”模式推进科技创新工作
- 激发创新动能促进产业发展 无锡滨湖走出产业转型“绿色”路
- 绥化全域低风险!黑龙江绥化北林区一地调整为低风险
- 走访抗美援朝纪念馆:长津湖的寒冷,与战斗一样残酷
- 节后第一天北京白天晴或多云利于出行 夜间起秋雨或再上线
- 走近网瘾少年们:他们沉迷网络的病根何在?
- “双减”后首个长假:亲子游、研学游需求集中释放
- 获2021年诺奖的蛋白,结构由中国学者率先解析
- 他从一窍不通的“门外汉”,到重装空投“兵专家”
- 升旗、巡岛、护航标、写日志,他们一生守护一座岛
- 中国故事丨“沉浸式”盘点今年的教育好声音!
- 农业农村部:确保秋粮丰收到手、明年夏季粮油播种
- “双减”出台两个月,组合拳如何直击减负难点?
- 《山海情》里“凌教授”的巨菌草丰收啦
- 且看新疆展新颜
- 天山脚下,触摸丝路发展新脉动
- 160万骑手疑似“被个体户”?平台不能当甩手掌柜
- 网游新政下,未成年人防沉迷的“主战场”在哪?
- “辱华车贴”商家及客服被行拘,处罚要不放过每一环
- 沙害是自然界的恶魔,而他是荒沙碱滩的征服者
- 面对婚姻,“互联网世代”的年轻人在忧虑什么?
- IP类城市缘何吸引力强?玩法创新带动游客年轻化
- 国庆主题花坛持续展摆至重阳节
- 都市小资还是潮流乐享?花草茶市场呈爆发性增长
- 从1.3万元降到700元,起诉书揭秘心脏支架“玄机”
- 北京国庆7天接待游客超861万人次 冬奥线路受青睐
- 陈毅元帅长子忆父亲叮嘱:你们自己学习要好,就可以做很多事儿
- 报告显示:这个国庆假期,粤川浙桂赣旅游热度最高
- 中国科技人才大数据:广东总量第一,“北上”这类人才多
- 嘉陵江出现有记录以来最强秋汛
- 全国模范法官周淑琴:为乡村群众点燃法治明灯
- 线上教学模式被盯上,网络付费刷课形成灰色产业链
- 云南保山:170公里边境线,4000余人日夜值守
- 警方查处故宫周边各类违法人员12人
- 农业农村部:确保秋粮丰收到手、明年夏季粮油播种
- 受南海热带低压影响 海南海口三港预计停运将持续到10日白天
- 多地网友投诉遭遇旅游消费骗局,呼吁有关部门严查乱象
- 神经科学“罗塞塔石碑”来了:迄今为止最完整的大脑细胞图谱
- 汾河新绛段发生决口
- 陕西支援14省份采暖季保供用煤3900万吨
- 这场红色故事“云比拼”,穿越时空为我们指引方向
- 受琼州海峡封航影响 10月7日、8日进出海南岛旅客列车停运
- 辽宁省工信厅发布10月8日电力缺口橙色预警
- 广州10月8日至20日对所有从省外来(返)穗人员实施核酸检测
- 假期怎么过得这么快?国庆5.15亿人次出游,你咋过的?
- 国庆假期全国道路交通总体安全平稳有序
- 哈尔滨市南岗区爱达88小区将调整为低风险地区
- 新疆霍尔果斯市2例无症状感染者新冠病毒均为德尔塔变异株
- 百闻不如一见——北京大学留学生参访新疆
- 看,生机勃勃的中国
- 国庆假期中国预计发送旅客4.03亿人次
- 新疆兵团可克达拉市:195名密接者已全部隔离医学观察
- 山西平遥消防4天29次救援:拖着腿走路也要完成任务
- 国庆假期北京接待游客861.1万人次
- 冷空气自西向东影响中国大部地区 气温将下降4℃至6℃
- 新疆哈密市巴里坤县发生4.3级地震 震源深度9千米
- 国庆假期中国国内旅游出游5.15亿人次
- 公安部交管局:国庆假期日均出动警力18万余人次,5位交警辅警牺牲
- 受南海热带低压影响广东将暂别高温天气
- “数说”杭州无障碍改造:触摸城市“爱的厚度”
- 新疆霍尔果斯无症状感染者新冠病毒属德尔塔变异株 未发现高度同源的基因组序列
- 新疆伊犁州:妥善做好滞留旅客安置返回工作
- 国庆假期广西累计接待游客逾3611万人次 实现旅游消费272.41亿元
- 2021年MAGIC3上海市青少年三对三超级篮球赛落幕
- 新疆兵团第四师可克达拉市1名无症状感染者为餐饮从业人员
- 哥伦比亚遇上广州:洋茶人“云上”喫茶 传播中国茶“味道”
- 厦门同安区四区域调整为低风险 全市无中高风险地区
- 直径2米“面气球”亮相 山西首届“寿阳味道”美食大赛启幕
- 世界第一埋深高速公路隧道大峡谷隧道出口端斜井掘进完成
- 浙南沿海村村发展有妙招 搭乘共富快车打造“海上花园”
- 新疆霍尔果斯两例无症状感染者新冠病毒均属德尔塔变异株
- 南沙港铁路国庆假期不停工 力争今年年底开通
- 添加陌生人为好友 内蒙古两女子被骗126万
- 中国国庆假期出行热:数字改变“关键小事”
- 水能载物亦能“生金” 浙江遂昌山村以水为媒奔共富
- 铁路人国庆雨中巡查排险记:一身雨衣、一把铁锹保安全畅通
- 铁路迎返程高峰 西安局集团公司加开79趟高铁列车
- 受热带低压影响 琼州海峡北岸等待过海车辆排长龙
- 哈尔滨市学校有序恢复线下教学
- 哈尔滨一地风险等级调整为低风险
- 从进“培训班”到看《长津湖》
- 安徽黄山国庆假期迎客12万余人 旅游市场稳步复苏
- 山西解除持续近90小时的暴雨四级应急响应
- 科学拦峰错峰削峰 嘉陵江洪水过境重庆中心城区“有惊无险”
- 粤高速大湾区路段假期车流集中 跨珠江口通道尤甚
- 千年街区“非遗”风催热国庆假期本地游
X 关闭
资讯
X 关闭