对于专业人员,这个问题呈现为“入门者的存储101”。但是存储技术文献总是在谈论块数据和文件数据,却并没有明确的解释二者的关键区别和关联。
任何两台通过网络进行通信的设备都必须就其通信方式达成一致。标准协议就作为通信的具体实现方式。这样的网络协议有很多。 一般来说,存储设备和子系统都作为归档系统的附属,用来读写数据。归档系统就是所谓的文件系统或者数据库系统。例如说Windows 2000和NT的NTFS文件系统、DOS的FAT文件系统、多种Unix文件系统(UFS)、Veritas文件系统(VxFS)、Oracle数据库、Informix数据库、Sybase数据库。
归档系统做两件事情:第一,向终端用户呈现数据和应用。数据一般是以一种层次样式的目录或者文件夹的方式组织。在我的新书当中我称之为数据表示。而归档系统所做的二件事,就是组织数据在存储当中的存放方式。这些归档系统必须将数据分散于存储容器中,并保证所有的数据都能以合理的性能访问到。通过索引数据存放位置(块存储地址)能够做到,这里面值得是数据结构。今天,这些实际上都是逻辑块地址,因为磁盘驱动器能够保存自己内部的块地址转换表。
因此,归档系统发送命令给存储,写数据到指定块和从指定块检索。这就是通常所说的块级别存储。这种存储功能是主从关系,并非客户服务器。 通过使用用户级数据表示接口(文件级存储)来请求数据也是可行的。通过利用数据的文件名、目录位置、URL或者其他信息能够做到。这是一种客户服务器通信模式。服务器接收到归档请求,然后查找数据存储位置并使用存储级功能检索,但服务器并非以块的形式返回文件给客户端,而是以字节的形式。文件级协议无法解析块命令,同样,块协议也不能传送文件访问请求和响应。
这里面令人疑惑的一件事情是,归档和存储是紧密集成,缺一不可的。但当去理解二者的流量是如何通过网络传送的,两者的线路又不相关。换句话说,二者的流量能够共存于同一网络但却使用不同的存储应用协议。
好文章,需要你的鼓励
近期有观点认为,大规模使用生成式AI和大语言模型会增强人类左脑的逻辑分析能力,同时削弱右脑的创造力,导致人类社会逐渐成为左脑主导的群体。但研究表明,左右脑功能分工理论缺乏科学依据,大脑两半球在创造性和逻辑性任务中都会协同工作。此外,AI不仅能辅助逻辑思维,同样可用于诗歌创作、图像生成等创意任务。
这项由圣母大学和IBM研究院联合开展的研究,开发出了名为DeepEvolve的AI科学助手系统,能够像人类科学家一样进行深度文献研究并将创新想法转化为可执行的算法程序。该系统突破了传统AI要么只能改进算法但缺乏创新、要么只能提出想法但无法实现的局限,在化学、生物学、数学等九个科学领域的测试中都实现了显著的算法性能提升,为AI辅助科学发现开辟了新的道路。
微软全球AI巡展在迪拜举行,宣布启动Microsoft Elevate UAE项目,计划为超过25万名学生和教育工作者以及5.5万名联邦政府员工提供AI技能培训。该项目是微软152亿美元投资计划的一部分,旨在加强AI基础设施建设,培养本地人才能力。微软还将与G42和JAHIZ平台合作,为联邦公务员提供技术培训,支持阿联酋成为AI领域的区域和全球领导者。
卡内基梅隆大学研究团队通过3331次大规模实验,系统揭示了代码训练如何提升AI推理能力。研究发现,代码的结构特性比语义内容更重要,适当的抽象形式(如伪代码)可以达到与原始代码相同的效果。不同编程语言产生差异化影响:低抽象语言有利于数学推理,Python更适合自然语言任务。这些发现为AI训练数据的科学化设计提供了重要指导。