*Redis 常见问题

*为什么Redis不同于其他的键值存储数据库?

有两个主要原因:

  • Redis 在键值数据库中有不同的演变路径,值可以包含更复杂的数据类型,并在这些数据类型上定义原子操作。Redis数据类型与基本数据结构密切相关,并直接向程序员公开,无需额外的抽象层。
  • Redis是一个基于内存的,能够持久化到硬盘的数据库,因此它代表了一种不同的权衡,即在数据集不能大于内存的限制下实现非常高的写入和读取速度。内存数据库另一个优点是,内存数据库相对于硬盘数据库非常容易操作复杂数据结构,因此Redis的可以做很多事情,内部复杂性低。与此同时两钟磁盘存储格式(RDB和AOF)不需要支持随机访问,因此他们是紧凑的,而且总是以追加形式生成(甚至AOF日志轮换也是一个追加操作,因为新版本是由内存中的副本生成)。比起基于磁盘的数据存储, Redis 用来处理重要数据时需要确保数据集及时落盘刷新。

*Redis内存使用情况?

举几个例子(所有数据基于64位实例)

  • 一个空实例大约占用3M内存
  • 100万简单字符串键值对大约占用85M内存
  • 100万哈希表键值对,每个对象有5个属性,大约占用160M内存

为了测试你的用例,使用redis-benchmark工具生成随机数据集,使用INFO memory命令检查使用内存空间。

存储相同的键,64位系统比32位系统使用更多的内存,键值很小情况下更明显。这是因为64位系统指针占用8字节。但是64位系统优点是可以配置更多内存(校对注:32位操作系统支持的内存最多为2的32次方,就是4G),因此为了运行大型Redis服务器,64位系统尤佳。另一种方案是使用分片。

*为什么 Redis 将其整个数据集保存在内存中?

过去为了允许数据集超过RAM大小,Redis开发人员尝试使用虚拟内存和其他系统,但是我们能做好一件事就非常不容易了:数据由内存提供,磁盘用于存储。所以现在没有计划为Redis创建磁盘后端,毕竟Redis大部分特性都是基于其当前架构设计的。

你的关心的并不是所需的总内存,而是你需要划分你的数据集到多个Redis实例上,请阅读分区页面获取更多信息。

*可以将 Redis 与基于磁盘的数据库一起使用吗?

是的,一个通用的设计方案是,在非常频繁的写小的数据时采用Redis(并且你需要使用Redis数据结构给你的问题建立高效模型),以及将大数据存储到SQL数据库或者最终一致性磁盘数据库中。同样,有时使用 Redis 是为了在内存中获取存储在磁盘数据库中的相同数据的子集的另一个副本。这可能看起来类似于缓存,但实际上是一种更高级的模型,因为通常 Redis 数据集会与磁盘上的 DB 数据集一起更新,而不是在缓存未命中时刷新。

*如何减少 Redis 的整体内存使用量?

如果可以,请使用Redis 32位实例。另外,还要善于使用哈希表,列表,有序集合和整数集,因为在特殊情况下Redis使用这些数据类型可以更紧凑存储一些元素。可以在内存优化页面获取更多信息。

*Redis内存不足时会发生什么?

Redis要么被Linux内核OOM杀掉,抛出错误崩溃,要么开始变得卡顿。随着现代操作系统malloc方法通常都不返回NULL,而是服务器开始交换,因此Redis性能降低,因此你可能会观察到一些错误现象。

INFO命令返回Redis使用内存总量,因此你可以编写脚本监控Redis服务器内存临界值。

Redis内置保护措施允许用户在配置文件中使用maxmemory选项,设置Redis最大占用内存。如果达到此限制,Redis将开始返回错误给写命令(但是将继续接受只读命令),或者当最大内存限制达到时也可以配置为键淘汰,在这种情况下Redis作为缓存使用。

请参考文档描述Redis作为LRU缓存使用

*在Linux系统中,即使我有很多空闲内存,后台保存失败报fork()错误!

精简回答:echo 1 > /proc/sys/vm/overcommit_memory

详细回答:

Redis后台保存模式依赖现代操作系统的写时拷贝技术。Redis fork(创建一个子进程)是父进程精确拷贝。子进程存储数据到磁盘并且最终退出。从理论上讲,子进程应该和父进程使用同样多内存,作为父进程副本,但是得益于多数现代操作系统实现的写时复制技术,父进程和子进程共享内存页。内存页在父进程或子进程改变时将被复制。当子进程保存时,理论上所有页面都可能改变,Linux无法提前告知子进程需要多少内存,因此如果overcommit_memory设置为0,fork将会失败除非有足够的空闲RAM真正复制父进程内存页.结果是,如果你有3G Redis数据集,只有2G可用内存将会失败。

overcommit_memory设置为1,意味着Linux 使用更乐观方式fork,这确实是你所期望的Redis。

理解虚拟机内存 ”是红帽经典文章,可以了解Linux虚拟内存怎么工作,overcommitmemory和overcommitratio的替代品。这篇文章校正了proc(5)用户手册对overcommit_memory1和2配置正确含义。

*Redis磁盘快照是不是原子操作?

是的,当服务器不在执行命令时,Redis后台保存进程总是被创建,因此每个命令在RAM中是原子的,并且在磁盘快照过程也是原子的。

*Redis是单线程的,我怎么利用多CPU/核?

CPU基本不可能成为的Redis的瓶颈,因为通常Redis受限于内存或网络。例如使用Pipelining,Redis运行在普通的Linux系统上,每秒可以处理50万请求,所以如果你的应用程序主要使用O(N) 或者 O(log(N)命令,几乎不会使用太多的CPU。

然而为了最大限度利用CPU,你可以在一台机器上启动多个Redis实例,并把它们设置为不同服务器。某些时候单个机器是不够的,所以如果你想使用多个CPU,你可以提前考虑使用分片。

关于使用多Redis实例,你可以在Partitioning page找到更多的信息

*单个Redis实例最多可以存储多少键?哈希表、列表、集合和有序集合最大可以包含多少元素?

Redis最大可以处理232键,实践测试每个实例最少可以处理2.5亿键。

每个哈希表、列表、集合和有序集合可以容纳232元素。

换句话说,Redis极限容量就是系统可用内存。

*为什么从实例与主实例拥有不同数量键?

如果你使用有生存周期的键,这就是正常现象。这就导致主从实例键的数量不一致原因。

  • 主实例在第一次与从实例同步时生成RDB文件。
  • RDB文件不包含已经过期的键,但是已经过期的键仍然在内存中。
  • 尽管这些键从逻辑上说已经过期失效,但是还在Redis主实例内存中,他们并不被识别为存在的,当增量或访问这些键时这些键会被回收。尽管从逻辑上说这些键不是数据集一部分,但是INFO和DBSIZE命令结果包含这些信息。
  • 当从实例读取主实例生成的RDB文件时,过期键不会被载入。

为很多键设置过期属性,通常为用户提供了在从实例上存储更少键,但是实际上实例内容没有逻辑区别。

*Redis实际含义是什么?

Redis是远程数据字典服务器(REmote DIctionary Server)。

*为什么启动Redis项目?

最初启动Redis,是为了扩大LLOOGG。但是当 Salvatore 完成了基本服务端工作后,他决定把这个想法分享给其他人,然后Redis转变成开源项目。

*Redis 如何发音?

Redis (/ˈrɛd-ɪs/) 的发音类似于单词“red”加单词“kiss”但没有“k”。