TS把若干个物理硬盘、目录(通过storeage.config描述),视为一个大的逻辑盘。并把这个逻辑盘,切分为若干个逻辑卷(通过volume.config描述)。
当一个请求过来,这个请求的URL等信息,将被计算出一个md5值,而key则是这个md5值的一个函数:key = fun(md5)。TS需要为每一个请求,关联到一个逻辑卷,以便从这个逻辑卷访问Cache内容。这个过程,就是通过key查找Volume的过程。为了确保高效,key=>Volume的映射保存在一张hash_table中:通过对key取模,映射到hash_table的某个slot,并从这个slot中取出Volume的序号。因此,查找的速度为O(1)。
当一个请求过来,这个请求的URL等信息,将被计算出一个md5值,而key则是这个md5值的一个函数:key = fun(md5)。TS需要为每一个请求,关联到一个逻辑卷,以便从这个逻辑卷访问Cache内容。这个过程,就是通过key查找Volume的过程。为了确保高效,key=>Volume的映射保存在一张hash_table中:通过对key取模,映射到hash_table的某个slot,并从这个slot中取出Volume的序号。因此,查找的速度为O(1)。

本文探讨了TS系统中通过URL计算Key,然后利用哈希表快速查找Volume的过程。为了优化IO访问速度和平衡负载,哈希表的设计需满足Volume大小成比例映射、slots随机分布及物理硬盘变化时的重新均衡。文中详细解释了如何通过Volume的大小计算slot数,使用Volume的md5作为随机数种子分散slots,以及在物理硬盘变化时如何影响Volume的映射关系。

3728

被折叠的 条评论
为什么被折叠?



