Redis学习02–数据类型介绍

8月 16th, 2012
Redis中的数据类型

  1. Redis中支持的数据类型:
    1. string;
    2. list;
    3. set;
    4. sorted set;
    5. hash;
  2. Redis中的Key:
    1. redis本质上一个key-value数据库,它的key是字符串类型,但是key中不能包括边界字符,由于key不是binary safe的字符串,所以像”my key”和”mykey\n”这样包含空格和换行的key是不允许的(之后的版本是可以包含任字符的);
    2. 在redis内部并不限制使用binary字符,这是redis协议限制的,”\r\n”在协议格式中会作为特殊字符;redis 1.2以后的协议中部分命令已经开始使用新的协议格式了(比如MSET),推荐把包含边界字符当成非法的key,免得被bug纠缠;
    3. key的一个格式约定,object-type:id:field;比如user:1000:password,blog:xxidxx:title;key的长度最好不要太长,首先占内存啊,而且查找时候相对短key也更慢,不过也不推荐过短的key,可读性不好;
    4. 与key相关的命令:
      1. exists key:测试指定key是否存在,返回1表示存在,0不存在;
      2. del key1 key2 ….keyN:删除给定key,返回删除key的数目,0表示给定key都不存在;
      3. type key:返回给定key的value类型;返回none表示不存在key,string字符类型,list链表类型,set无序集合类型;
      4. keys pattern:返回匹配指定模式的所有key;
        1. keys *:获得所有的keys;
        2. key t*:获得t开头的keys;
        3. key t[ab]x:获得以t开头x结尾中间是a或者b的keys;
        4. key t?x:获得以t开头x结尾中间之后一个字符的keys;
      5. randomkey:返回从当前数据库中随机选择的一个key,如果当前数据库是空的,返回空串;
      6. rename oldkey newkey:原子的重命名一个key,如果newkey存在,将会被覆盖,返回1表示成功,0失败;可能是oldkey不存在或者和newkey相同;
      7. renamenx oldkey newkey:同上,但是如果newkey存在返回失败;
      8. dbsize:返回当前数据库的key数量;
      9. expire key seconds:为key指定过期时间,单位是秒;返回1成功,0表示key已经设置过过期时间或者不存在;
      10. ttl key:返回设置过过期时间的key的剩余过期秒数,-1表示key不存在或者没有设置过过期时间;
      11. select db-index:通过索引选择数据库,默认连接的数据库所有是0,默认数据库数是16个;返回1表示成功,0失败;
      12. move key db-index:将key从当前数据库移动到指定数据库,返回1成功,0如果key不存在,或者已经在指定数据库中;
      13. flushdb:删除当前数据库中所有key,此方法不会失败,慎用;
      14. flushall:删除所有数据库中的所有key,此方法不会失败,更加慎用;
  3. string类型:
    1. string是redis最基本的类型,而且string类型是二进制安全的,即redis的string可以包含任何数据;比如jpg图片或者序列化的对象;
    2. 从内部实现来看其实string可以看作byte数组,最大上限是1G字节,string类型的定义为:struct sdshdr {long len; long free; char buf[]; };
      1. buf是个char数组用于存贮实际的字符串内容,其实char和高级语言中的byte是等价的,都是一个字节;
      2. len是buf数组的长度;
      3. free是数组中剩余可用字节数;
    3. string类型可以被部分命令按int处理,比如incr等命令;
    4. redis的其它类型像list, set, sorted set, hash它们包含的元素与都只能是string类型;
    5. 如果只用string类型,redis就可以被看作加上持久化特性的memcached,当然redis对string类型的操作比memcached多很多;
    6. 与string相关的操作:
      1. set key value:设置key对应的值为string类型的value,返回1表示成功,0失败;
      2. setnx key value:同上,如果key已经存在,返回0;nx是not exist的意思;
      3. get key:获取key对应的string值,如果key不存在返回nil;
      4. getset key value:原子的设置key的值,并返回key的旧值;如果key不存在返回nil;
      5. mget key1 key2 … keyN:一次获取多个key的值,如果对应key不存在,则对应返回nil;
      6. mset key1 value1 … keyN valueN:一次设置多个key的值,成功返回1表示所有的值都设置了,失败返回0表示没有任何值被设置;
      7. msetnx key1 value1 … keyN valueN:同上,但是不会覆盖已经存在的key;
      8. incr key:对key的值做加加操作,并返回新的值;注意incr一个不是int的value会返回错误,incr一个不存在的key,则设置key为1;
      9. decr key:同上,但是做的是减减操作,decr一个不存在key,则设置key为-1;
      10. incrby key integer:同incr,加指定值,key不存在时候会设置key,并认为原来的value是0;
      11. decrby key integer:同decr,减指定值;decrby完全是为了可读性,我们完全可以通过incrby一个负值来实现同样效果,反之一样;
      12. substr key start end:返回截取过的key的字符串值,注意并不修改key的值,下标是从0开始的(redis在2.0版本以后不包括2.0,使用的方法是getrange参数相同);
      13. append key value:给指定key的字符串值追加value,返回新字符串值的长度;
  4. list类型:
    1. redis的list类型其实就是一个每个子元素都是string类型的双向链表,所以[lr]push和[lr]pop命令的算法时间复杂度都是O(1),另外list会记录链表的长度,所以llen操作也是O(1);
    2. list插入的元素,默认是按照时间的逆序排列的,最新的数据都是插入到头部,可以通过lrange list 0 -1/sort list by nosort查看;
    3. 链表的最大长度是(2的32次方-1),我们可以通过push,pop操作从链表的头部或者尾部添加删除元素;这使得list既可以用作栈,也可以用作队列;
    4. list的pop操作还有阻塞版本的,当我们[lr]pop一个list对象时,如果list是空,或者不存在,会立即返回nil,但是阻塞版本的b[lr]pop则可以阻塞,当然可以加超时时间,超时后也会返回nil;
    5. 为什么要阻塞版本的pop呢:主要是为了避免轮询;举个简单的例子如果我们用list来实现一个工作队列,执行任务的thread可以调用阻塞版本的pop去获取任务这样就可以避免轮询去检查是否有任务存在,当任务来时候工作线程可以立即返回,也可以避免轮询带来的延迟;
    6. 与list相关的操作:
      1. lpush key string:在key对应list的头部添加字符串元素,返回1表示成功,0表示key存在且不是list类型;
      2. rpush key string:同上,在尾部添加;
      3. llen key:返回key对应list的长度,key不存在返回0,如果key对应类型不是list返回错误;
      4. lrange key start end:返回指定区间内的元素,下标从0开始,负值表示从后面计算,-1表示倒数第一个元素,key不存在返回空列表;
      5. ltrim key start end:截取list,保留指定区间内元素,成功返回1,key不存在返回错误;
      6. lset key index value:设置list中指定下标的元素值,成功返回1,key或者下标不存在返回错误;
      7. lrem key count value:从key对应list中删除count个和value相同的元素,count为0时候删除全部;
      8. lpop key:从list的头部删除元素,并返回删除元素,如果key对应list不存在或者是空返回nil,如果key对应值不是list返回错误;
      9. rpop:同上,但是从尾部删除;
      10. blpop key1…keyN timeout:从左到右扫描返回对第一个非空list进行lpop操作并返回;
        1. 比如blpop list1 list2 list3 0,如果list1不存在list2,list3都是非空则对list2做lpop并返回从list2中删除的元素;如果所有的list都是空或不存在,则会阻塞timeout秒,timeout为0表示一直阻塞;
        2. 当阻塞时,如果有client对key1…keyN中的任意key进行push操作,则第一在这个key上被阻塞的client会立即返回;如果超时发生,则返回nil;有点像unix的select或者poll
      11. brpop:同blpop,一个是从头部删除一个是从尾部删除;
      12. rpoplpush srckey destkey:从srckey对应list的尾部移除元素并添加到destkey对应list的头部,最后返回被移除的元素值,整个操作是原子的.如果srckey是空或者不存在返回nil;
  5. set类型:
    1. redis的set是string类型的无序集合,set元素最大可以包含(2的32次方-1)个元素;
    2. set的是通过hash table实现的,所以添加,删除,查找的复杂度都是O(1);hash table会随着添加或者删除自动的调整大小,需要注意的是调整hash table大小时候需要同步(获取写锁)会阻塞其他读写操作,可能不久后就会改用跳表(skip list)来实现;
    3. 跳表已经在sorted set中使用了,关于set集合类型除了基本的添加删除操作,其它有用的操作还包含集合的取并集(union),交集(intersection),差集(difference);通过这些操作可以很容易的实现sns中的好友推荐和blog的tag功能;
    4. 与set相关的操作:
      1. sadd key member:添加一个string元素到key对应的set集合中,成功返回1,如果元素以及在集合中返回0,key对应的set不存在返回错误;
      2. srem key member:从key对应set中移除给定元素,成功返回1,如果member在集合中不存在或者key不存在返回0,如果key对应的不是set类型的值返回错误;
      3. spop key:删除并返回key对应set中随机的一个元素,如果set是空或者key不存在返回nil;
      4. srandmember key:同spop,随机取set中的一个元素,但是不删除元素;
      5. smove srckey dstkey member:从srckey对应set中移除member并添加到dstkey对应set中,整个操作是原子的;成功返回1,如果member在srckey中不存在返回0,如果key不是set类型返回错误;
      6. scard key:返回set的元素个数,如果set是空或者key不存在返回0;
      7. sismember key member:判断member是否在set中,存在返回1,0表示不存在或者key不存在;
      8. sinter key1 key2…keyN:返回所有给定key的交集;
      9. sinterstore dstkey key1…keyN:同sinter,但是会同时将交集存到dstkey下;
      10. sunion key1 key2…keyN:返回所有给定key的并集;
      11. sunionstore dstkey key1…keyN:同sunion,并同时保存并集到dstkey下;
      12. sdiff key1 key2…keyN:返回所有给定key的差集;
      13. sdiffstore dstkey key1…keyN:同sdiff,并同时保存差集到dstkey下;
      14. smembers key:返回key对应set的所有元素,结果是无序的;
  6. sorted set类型:
    1. 和set一样sorted set也是string类型元素的集合,不同的是每个元素都会关联一个double类型的score;
    2. sorted set的实现是skip list和hash table的混合体当元素被添加到集合中时,一个元素到score的映射被添加到hash table中,所以给定一个元素获取score的开销是O(1),另一个score到元素的映射被添加到skip list并按照score排序,所以就可以有序的获取集合中的元素;添加,删除操作开销都是O(log(N))和skip list的开销一致,redis的skip list实现用的是双向链表,这样就可以逆序从尾部取元素;
    3. sorted set最经常的使用方式应该是作为索引来使用,我们可以把要排序的字段作为score存储,对象的id当元素存储;
    4. 与sorted set相关的操作:
      1. zadd key score member:添加元素到集合,元素在集合中存在则更新对应score;
      2. zrem key member:删除指定元素,1表示成功,如果元素不存在返回0;
      3. zincrby key incr member:增加对应member的score值,然后移动元素并保持skip list保持有序,返回更新后的score值;
      4. zrank key member:返回指定元素在集合中的排名(下标),集合中元素是按score从小到大排序的;
      5. zrevrank key member:同上,但是集合中元素是按score从大到小排序;
      6. zrange key start end:类似lrange操作从集合中去指定区间的元素;返回的是有序结果;
      7. zrevrange key start end:同上,返回结果是按score逆序的;
      8. zrangebyscore key min max:返回集合中score在给定区间的元素;
      9. zcount key min max:返回集合中score在给定区间的数量;
      10. zcard key:返回集合中元素个数;
      11. zscore key element:返回给定元素对应的score;
      12. zremrangebyrank key min max:删除集合中排名在给定区间的元素;
      13. zremrangebyscore key min max:删除集合中score在给定区间的元素;
  7. hash类型:
    1. redis的hash是一个string类型的field和value的映射表,它的添加,删除操作平均都是O(1),hash特别适合用于存储对象;
    2. 相较于将对象的每个字段存成单个string类型,将一个对象存储在hash类型中会占用更少的内存,并且可以更方便的存取整个对象,省内存的原因是新建一个hash对象时开始是用zipmap(又称为small hash)来存储的;
    3. zipmap其实并不是hash table,但是zipmap相比正常的hash实现可以节省不少hash本身需要的一些元数据存储开销,尽管zipmap的添加,删除,查找都是O(n),但是由于一般对象的field数量都不太多,所以使用zipmap也是很快的,也就是说添加删除平均还是O(1);
    4. 如果field或者value的大小超出一定限制后,redis会在内部自动将zipmap替换成正常的hash实现,这个限制可以在配置文件中指定;
      1. hash-max-zipmap-entries 64 #配置字段最多64个
      2. hash-max-zipmap-value 512 #配置value最大为512字节
    5. 与hash相关的操作:
      1. hset key field value:设置hash field为指定值,如果key不存在,则先创建;
      2. hget key field:获取指定的hash field;
      3. hmget key filed1….fieldN:获取全部指定的hash filed;
      4. hmset key filed1 value1 … filedN valueN:同时设置hash的多个field;
      5. hincrby key field integer:将指定的hash filed 加上给定值;
      6. hexists key field:测试指定field是否存在;
      7. hdel key field:删除指定的hash field;
      8. hlen key:返回指定hash的field数量;
      9. hkeys key:返回hash的所有field;
      10. hvals key:返回hash的所有value;
      11. hgetall:返回hash的所有filed和value;
标签:
目前还没有任何评论.