发布日期:2023-03-31来源:武汉北大青鸟武汉校区作者:admin
没有人用赛车运干草,也没有人在赛道上开拖拉机。每种交通工具都有自己的特性,使用范围和价位。面对不同的工作应该选用正确的工具。数据存储也遵循同样的原则。我们应该选择不同的存储类型满足不同的存储需求。
分层存储的必要性
每个企业都有数量庞大的信息需要处理,其中大部分后都要存起来。现在,客户读取历史记录胃口在无限量膨胀,公司因为数据读取和业务需要对信息量的需求也在不断增加,因此,需要存储的数据只会越来越多。而且会持续以指数级速度增长。《科学》杂志近期刊登了一篇由Hilbert和Lopez撰写的报道(见2011年4月1日出版的《科学》60-65页),报道称2007年球电子数据的存储量是276EB(1EB等于10亿GB)。思科公司的一份题为“思科视野中的网络指标:球移动数据流量新预测,2010-2015”的白皮书指出,不久的将来,移动通信数据量每月就将达到几EB。到2015年,视频数据量将占这些数据总量的66%,而且,按照我们现在的使用模式,很多视频数据将被多次重复存储。
如果思科公司所说的增长速度将保持平稳,那么到2022年,每月产生的移动信息量就将超过2007年年球的数据存储总量。当然,其中会包括像“跳舞的小孩”这样的视频,但与之相对应地,存储库里也会保存银行数据,加密健康记录和销售网点数据库等非常重要的信息。如果调出一个“跳舞的小孩”视频要花15秒,没多少人会介意。但对于文件读取请求而言,15秒的反应时间对客户来说会像是一个世纪那么漫长,长此以往,公司会被 “慢”死掉。有些信息就是要能即用即取,而其他数据则可以放在相对更慢更便宜的存储区。你可以把它想成温度,保存快重要的数据为“热”,保存慢不重要的数据为“冷”。
“如果你是一条航线,有人想预定一趟航班,那么让对方快速查到航班时刻表并完成预定操作会让客户心情愉悦。”希捷公司产品营销经理Teresa Worth说。 “航班预定一旦成功,航空公司也收到了机票费,那接下来航线数据就可以从 “热”转为“温”了。如果客户想换航班,查询座位号或其他信息,客户肯定还是希望速度够快,但这时就不再是那么“热”了,因为航空公司和该客户的交易已经完成。航班飞过后,数据就可以变“冷”或近线存储了。当然数据仍需保持在可以被查询的状态,因为客户也许想在年末查询当年的飞行里程,并确定他们的这次飞行拿到了积分,但这时候让他们稍微等等也没有什么大问题了”
就像做饭一样,温度就是一切。或许还是跟做饭一样,热的材料受关注,但做饭用到多的还是那些冷的,放在冰箱冷藏和冷冻室里的材料。热存储一般都存在容量较低的驱动器中,而冷存储驱动器通常存储的数据则要多出好几倍。这就形成了某种动态的平衡,你必须在设计分层存储时考虑到这个因素。T一个公司分层存储时采用了何种方法对公司的经营收益会产生重要影响,甚至关乎着公司的存亡。
分层模型更新
分层存储这个想法已经出现几十年了,但因为存储技术的不断发展,这个想法的细节也在因此不停的更改。更改集中在中间层和存储架构上。
这里说的中间层是指选用的存储媒介。磁盘存储,也就是硬盘驱动器以前既被用于交易型存储(热)也被用于近线存储(温),而磁带则主要被用来归档(冷)这三种存储的具体含义如下:
交易型存储。指用于高速和大量商务交易的数据。交易型数据常常和产生利润的业务直接挂钩,对公司生计有着决定性的作用。
近线存储。以上述航班的例子为例,近线数据就是指那些从即时读取降级成快速读取的信息。它就像是放在档案柜的卷宗,而不再是摆在桌子上的棘手文件。你仍然能快速方便的找到它,但得稍微多花点时间。虽然时间成本增加了,但换回来的是存储媒介成本的大幅下降。
归档存储。不久,你的档案柜存满了。这时,企业常常会找出老的文件,把它们装箱然后放到像地下室或仓库这样的冷存储室里。这就是归档。如果方法得当,所有的数据将仍然被有序存放,但很明显,想找到具体某个箱子查找到其内容会花更长的时间。随着每GB磁盘存储价格的下降,磁盘在不断入侵并占领磁带的市场,结果就是近线和归档存储之间的界限越来越模糊了,但磁带在企业归档市场中,尤其是在备份/故障恢复应用方面仍然处于统治地位。这说明,在基于磁盘的系统当中,磁带库也能被虚拟化和使用。
随着固态磁盘驱动器的普及,很多人正在注意到金字塔尖还有一个新的存储层:Tier 0。
“Tier 0是专属于SSD的,它涉及到的工作任务重,占空比、耐久力和性能稳定性更大” 希捷公司产品营销经理Teresa Worth 说。 “ Tier 0上的信息都是和交易及IOPS相关的。更快地完成交易能让公司挣更多钱,或者提升顾客的满意度,进而增加公司的竞争力。”
如果想完整的解释存储架构,可能需要有一篇专门的文章。小企业用直连方式和网络连接(DAS和NAS) 这两种存储可能就能很好的运作起来,这两种存储一般会分别选择eSATA 或 USB 3.0再加以太网,我们知道这些就够了。但是这些连接的性能和可扩展性都受到了某种程度的限制,因此不适用于较大的存储。而事实上,在上世纪90年代及本世纪初几年里,存储区域网(SANs)的光纤通道技术已经标准化了。光纤通道的成功在很大程度上是源于对协议的宽容性。IP, iSCSI, ATM和其它协议都能在该网络中运行,效率也都一样。
现在,作为一种网络技术,光纤通道能产生的更大传输速度是8 Gb/s 或16 Gb/s,但驱动器接口的更大速度则为4 Gb/s。对于企业来说,这样的带宽够用了,但以太网的潜在带宽是10 Gb/s,而且以太网有价格优势和更广泛的使用范围,因此光纤通道将很快面临压力。过去高速以太网的致命弱点是它的高价位以及由此对系统资源产生的影响,但网络适配器中出现了TCP卸载引擎,它与更强有力的CPU结合后,高成本的问题已经基本得到了解决。这项技术加速了光纤通道在架构和存储驱动器两个层面的衰落,为以太网的iSCSI扫清了障碍,近,因此受益的又变成了串行并列SCSI(SAS)。和光纤通道一样,驱动连接器和存储网络互联都在用SAS,SAS因此变成了现在高性能分层存储的佳解决方案。(武汉北大青鸟)
Copyright (c) 2006-2023 武汉宏鹏教育咨询有限公司 版权所有 All Rights Reserved.