智能互联网时代,数据正在以几何级的数量爆炸增长,如何存储并管理这些海量数据,是很多企业面临的一个难题。如果采用传统通用型服务器存储策略,这意味着要建设庞大的数据中心系统,导致存储成本极速攀升。
对于那些云服务提供商而言,大量不断增长的数据例如图片等都属于不经常访问,但却又无法删除的,即使客户很久不会访问这些信息,但依然不能随意删除,并且不允许停机归档,也无法实现洪峰数据控制。对于这些不常访问的"冷"数据,如果我们能把他们迁移到一个专为冷数据而设计的低成本存储层中,将能大幅降低费用。
哪些数据需要冷存储?
冷存储主要用于那些备份、灾难恢复、存档、社交媒体等应用领域。这些数据都有一个共通的特性,较低的访问频率,并且需要最大限度的降低其存储成本,同时要求随时可访问。例如用户在社交媒体上存储的大量图片信息,以及法律电子取证要求已存档的数据必须在特定的时间范围内可用。因此,这就要求云服务提供商以及企业必须确保数据的完整性,以及及时的访问权限。
备份对于企业而言至关重要,因为需要备份的数据通常是企业有效运营所需要的信息,如果这些信息无法在特定时间范围回复,将严重影响企业业务。
存档对于企业运营以及提高工作效率必不可少,通常,企业并不需要快速访问已经存档的数据。但检索已经存档的数据可能要花费大量的时间,并且随着企业业务的增长,数据量持续增加,同时这些数据要存储长达几十年甚至更长的时间,这会给存储带来极大的压力。
灾难恢复,热备用暂难恢复服务在云中提供了专业的备用基础设施和数据,这意味着在发生灾难时,可以立即切换到云中。通过冷存储服务,可以消除企业在灾难中数据保护的某些流程,降低成本和复杂性。同时,企业需要快速的重构数据文件,还原应用程序,以最快的速度恢复系统正常运行。
社交媒体,智能互联网时代,大量的社交数据产生,用户通常查看新发布的照片,而对于那些旧的数据,则鲜有人问之。对于照片、视频等这些非结构化数据通常会占用大量存储空间,并且增长速度远远超过其他类型的数据。如果将这些旧的数据迁移到冷存储中,可以大幅降低运营成本。同时提供社交媒体服务的企业必须保护这些数据的隐私安全。
我们需要什么样的冷存储?
对于大部分创业公司而言,通常在公司创立初期,很难将业务细分的非常明确,大部分都会选用通用服务器来做存储,但随着业务的不断扩张,就会考虑将很多计算型节点分离出来。对于那些重要的数据希望在运行的更快的SSD 或PCIE SSD上,而对那些历史数据、日志则希望不要太占用现有服务器存储资源。因此,业务需要进行分层。
如何进行分层?在要确保性能不能有大幅损失的同时降低存储费用,特别是对于那些图片存储,对于一些云服务提供商而言,这一点尤其重要。因为根据其业务类型,就要求及时客户很久没有访问这些数据,也不能随意删除。另外一点非常重要的则是,其业务没有明显的周期性,不像其他行业,如金融等,每天固定时间开市闭市,可以进行数据维护;也没有周期性的数据洪峰,无法做出数据洪峰控制。
如何满足上述需求?联想的冷存储产品不失为一个理想的选择。
联想4U60盘位、双节点的冷存储业务服务器SD600,每节点拥有2个2.5寸系统盘插槽,可以通过更换连接两节点间EXPB槽位的DB卡,实现服务器在HA (High Availability)、Zoning以及 Single Node (JBOD)三种模式下的工作方式。
通过采用联想SD600可以顺利的帮助企业将计算分析业务与数据存储业务分离,当存储服务器的硬件资源主要用于数据存储,数据块为大块数据时,相信SD600将是您最优的选择。因为对并发进程较少的业务来说,每个进程的性能更依赖于CPU的主频。不难看出,存储业务对cores间的进程切换需求很低,对单core的主频性能要求较高。那么经过优化过的Avago磁盘主控芯片,与高频E3 CPU的搭配,将会更好的为您提供数据存储业务。
可灵活选配的联想冷存储
联想SD600 在HA 模式下,当对数据的实时可用能力有较高要求时,可以通过增加一张HA DB card来实现两个节点间的高可用。同时,因为需要用到SAS接口的双通道,需要存储池内的60块盘都是SAS磁盘。当需要降低归档服务器、文件服务器、图片服务器等温冷数据服务器的成本时,可以选用Zoning和Single Node模式。Zoning模式即划分给每个节点30块磁盘做存储池,将SD600变为4U2N服务器使用。Single Node模式可以有效降低互联网公司的图片存储、日志归档、音视频存储业务的硬件建设成本。此外,该模式下一个节点将带起60块SATA硬盘。目前联想推广的最佳实践案例包含6T 7.2k 企业级硬盘/8T 5.9k 企业级云盘。
此外,联想SD600在可靠性和兼容性方面实现了最佳平衡,可以满足RHEL、SUSE、windows、Ubuntu各种业务需求。其采用双排9风扇交叉风向设计,具备了更好的散热效果,满足服务器45℃高温下连续工作的要求,更适合苛刻的数据中心环境。与E5通用服务器相比,联想SD600的TCO至少降低了10%,耗电量降低了8%。同时,仅从数据的存取角度来看,1颗高主频能超线程到8 Thread的E3-1231 v3在相同内存与网络环境的情况下,在客户实际的使用中发现,相比2颗E5-2609 v3数据传输速度会提高10-20%。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。