
随着新一代信息技术演化,新基建的重要意义不仅频繁出现在国家战略规划中,也在引领数字经济发展朝向下一个风口迈进。云计算作为新基建领域不可缺少的底层技术,正在逐渐成为支撑各行业数字化转型升级的核心。那么云计算等“新基建”如何助力企业高效运维管理?如何实现对老旧机房升级更新?老旧机房又是如何实现二次利用?本期智汇华云,为大家进行一一解答。
如今,云计算和虚拟化技术正在向构建新一代数据中心发展,以虚拟化技术为关键基础,实现管理以及业务的集中,对数据中心资源进行动态调整和分配,重点满足企业关键应用向云迁移,以及对于资源高性能、高可靠、安全性和高可适应性上的要求,同时提高基础架构的自动化管理水平,确保满足基础设施快速适应业务的商业敏捷诉求,同时进一步减少企业的IT整体投入。比如在传统的数据中心,存在巨额投资采购的数量庞大的服务器和SAN存储设备,如何纳入到私有云的升级计划之中,是一个不可回避的问题。如果全部通过购置新的虚拟化系统替代现有系统,又会花费额外的费用,过去十多年的IT投资也将付之东流。
用户现状
客户现有的是一个传统数据中心,中心业务的硬件是有不同品牌的X86服务器和SAN存储构成,架构也是烟囱式的,建设初期的硬件成本和运维成本都比较高,服务器都使用单机虚拟化运行状态 ,没有横向扩容的能力,而且也存在单点故障,客户建设目标是把多台服务器做为一个虚拟化集群,并且利用现有的FC-SAN存储做为虚拟化底层的存储资源。既解决了服务器单点故障和横向扩容的能力,又利旧现有FC-SAN存储,保护现有硬件投资。
方案概述
方案中采用安超虚拟化平台软件(ArcherOS Stack)作为介于硬件和业务负载之间的云操作系统层,采用X86和ARM双栈支持的虚拟化技术,实现对通用服务器物理资源的抽象,将CPU、内存、I/O等服务器物理资源转化为一组可统一管理、调度和分配的逻辑资源,并基于这些逻辑资源在单个物理服务器上构建多个同时运行、相互隔离的虚拟机执行环境,实现更高的资源利用率,同时满足应用更加灵活的资源动态分配需求。提供热迁移、热升级等高可用特性,实现更低的运营成本、更高的灵活性和更快速的业务响应速度。
ArcherOS Stack支持对接FC-SAN设备,保护客户现有投资。用户无需对LUN、RAID等存储概念对象进行单独管理和设置,只需要对虚拟机/虚拟磁盘进行设置就可以使用存储的各项功能,降低了用户使用门槛。ArcherOS Stack通过共享存储虚拟化组件,实现了以下特点:

与硬件无关,只要是Linux支持的SAN存储都可适配
与自研的计算虚拟化组件(ArCOM)完全集成
统一所有设备到同一软件栈
支持精简置备,按写入有效数据容量分配实际空间
安超虚拟化平台还支持以下功能
1. 安超虚拟化平台软件支持USB透传功能
同一集群,支持任意USB端口与任意云主机的解挂与挂载等,支持USB密钥透传至虚拟机,灵活便捷的支撑需要依赖加密狗等USB设备的业务系统运行,当业务虚拟机跨主机迁移时,USB设备无需重新插拔配置,也能正常被识别。
2. 支持GPU虚拟机功能
采用GPU直通技术为虚拟机提供显卡支持,实现3D加速或科学计算等场景,GPU工作流实际跑在数据中心而非用户本地环境,搭配ArcherOS Stack平台,降低运营成本。
3. 支持IPV4和IPV6双栈网络
无论用户侧请求或目标地址处于 IPv4 还是 IPv6 网络,双栈网络都能轻松访问,两种协议互不影响,帮助用户打通 IPv6 孤岛和 IPv4 局域网限制,解决IPv4资源枯竭难题。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。