全闪存阵列厂商Kaminario开展业务比Pure Storage早一年时间,但无论是在销售、规模还是资金方面都有一些落后于Pure Storage。不过,Kaminario已经开始阐述一些会大大加快其发展的技术愿景。
我们不清楚Kaminario从K2纵向扩展和横向扩展阵列(基于k模块)的收入有多少,IDC告诉我们:"Kaminario的收入规模要大于Violin,但是我们不能公开这个数字。"Kaminario仍然是一家私人公司,不希望公开这个数据。Violin在全闪存阵列市场逐渐落后,产品和服务的年运营最新收入似乎大约是每年4000万美元。
IDC把Kaminario列在"其他"类别下,这个类别在2016年第一季度的收入规模是3.684亿美元。而这个类别下收入最低的厂商Oracle是340万美元,其实是富士通780万美元,华为160万美元,NetApp是3.284亿美元,Pure是3.411亿美元。据分析,Kaminario的收入比Violin多1000万美元,可能接近5000万美元。
非易失性存储领域正在发生技术创新的复兴,这给Kaminario提供了一个机会,给自己一个独特的技术愿景,显著改善客户的全闪存阵列体验。
Kaminario首席技术官Shachar Fienbli认为有5个非易失性内存趋势将推动存储的未来:
• 3D NAND
• 非易失性(存储)内存 - 3D XPoint, ReRAM
• NVMe
• NVMe Fabric
• NVMe网络机架
他还对这些变化将如何带来影响做出了一些假设:
3D NAND仍然占据主导地位。NAND密度成本将继续下去。在相同的制程工艺基础上增加更多层,这将大幅度增加错误检查和纠错能力,意味着耐用性会下降。Fienbllit断言,NAND将仍然是占据主导的存储介质,并将是在数据中心内取代HDD的商品曲线。
3D XPoint、ReRAM可能还有其他类似技术将改善NVM性能,但是NVM价格将比闪存更加接近DRAM。而且,3D XPoint DIMM接近1微秒的性能要远快于闪存,但是仍然和DRAM有一些差距。所以这些新的NVM技术太贵不足以取代NAND,无法被广泛采用,至少在5年内还不会取代NAND。
NVMe远比SCSI更有效,将很快取代SATA作为直连的方式。言下之意它对全闪存阵列的好处比较少,因为这些系统已经聚集了多个SSD的性能。控制器是瓶颈,因此减少从磁盘到控制器的延迟并不是很有吸引力。
NVMe Fabrics扩展了本地NVMe接口相比框架的效率。Shachar Fienbli认为ROCE RDMA over 100GbitE相比其他选择会胜出,尤其是RDMA over Fibre Channel,但是客户采用率将相对较低。
他认为NVMe机架即将到来。这是配置了NVMe SSD和RDMA网络接入的机架(机箱)。这是一个有趣的机会,进一步改善存储与计算的解耦。
Kaminario的NVMe over Fabrics机架方案
NVMe在短期内不会带来性能上的变革,因为使用英特尔2015的型号从直连SATA SSD到NVMe SSD访问的延迟从C110微秒缩短到大约95微秒。
未来NVMe PCIe x4 Gen 3的延迟大约是20微秒。Fienblit表示,如果我们去掉数据服务和数据缩减的话,NVMe SSD会带来3-4倍的性能提升。NVMe Fabrics可以降低外部存储阵列的访问延迟。闪存介质仍然是一个延迟瓶颈,直到/除非它被3D XPoint取代。
新兴的高性能技术太昂贵无法步入主流,它将作为利基的、Tier 0应用进入市场,也不会给核心的全闪存阵列市场带来突破性影响。
Kaminario打算做的是:
• 利用NAND的优点,继续使用最有成本效益的SSD,同时利用自身耐用性优化的能力
• 使用3D XPoint取代DRAM,用于缓存MetaData和Data,用于实现更高的性价比
• 部署NVMe框架作为外部接入
• 利用NVMe、NVMeF、NVMe Network Shelves
Shachar Fienbli说,这将会带来"全闪存阵列可扩展性、成本效益和敏捷性方面的突破进展"。
Fienblit设想,全闪存阵列配置内部的100Gbit以太网背板或者框架,连接多个计算节点到多个存储节点,实现全方位的存储与计算的解耦。而且两者都可以独立扩展,没有限制。存储和计算可以全局共享。性能和容量在任何扩展路径下都是均衡的,不需要迁移数据。
也许一些计算资源可以呈现给外部,用于运行那些需要接近于存储的应用。
这是我们从厂商那里看到NVMe over Fabrics以及XPoint最清晰和最详细的路径。
好文章,需要你的鼓励
机器人和自动化工具已成为云环境中最大的安全威胁,网络犯罪分子率先应用自动化决策来窃取凭证和执行恶意活动。自动化攻击显著缩短了攻击者驻留时间,从传统的数天减少到5分钟内即可完成数据泄露。随着大语言模型的发展,"黑客机器人"将变得更加先进。企业面临AI快速采用压力,但多数组织错误地关注模型本身而非基础设施安全。解决方案是将AI工作负载视为普通云工作负载,应用运行时安全最佳实践。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
面对心理健康专业人士短缺问题,谷歌、麦肯锡和加拿大重大挑战组织联合发布《心理健康与AI现场指南》,提出利用AI辅助任务分担模式。该指南构建了包含项目适应、人员选择、培训、分配、干预和完成六个阶段的任务分担模型,AI可在候选人筛选、培训定制、客户匹配、预约调度和治疗建议等环节发挥作用。该方法通过将部分治疗任务分配给经过培训的非专业人员,并运用AI进行管理支持,有望缓解治疗服务供需失衡问题。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。