2024年6月22日,华为开发者大会2024-确定运维性论坛在东莞松山湖成功举办,本次论坛邀请上百名全球开发者到现场,会上围绕数字化转型带来的生产力转移展开讨论,明确需要确定性运维变革来助力数转,通过AI能力构建来助力变革。感谢来自学术界和企业的大咖们分享最新实践成果与方法,发布《确定性运维白皮书稳定可靠篇2.0》,与千行万业持续共创。
华为云SRE部部长安宇开场致辞:“AI已经成为生产力助推器,加快大模型与小模型组合,实现更高效的运维能力,助力企业云上质量提升。华为云维享会邀请学术界和业界大咖分享创新经验,以确定性运维体系及实践能力,帮助企业结合AI能力,在安全可靠、资源高效、业务敏捷、智能运营持续探索和实践。”
华为云SRE部部长安宇致辞
大模型与智能运维的双向奔赴
中山大学教授、博士生导师陈鹏飞分享:“大模型赋能智能运维,在大模型智能运维场景下,基于大模型的故障恢复,通过历史故障处理结果不断提高语言模型自动处理异常的能力,建立多种AIOps知识库基座模型,应对不同的运维场景,使模型可以快速接入不同系统和应用场景,识别故障根因以及故障恢复手段。通过大小模型的结合,结合系统运行状态进行概括、溯源、推理根因,输出故障状态摘要和根因诊断结果,最终实现故障检测能力和运维效率提升。”
在智能运维赋能大模型的实践,通过多智能体协作的智能运维,结合一站式AI开发、管理和应用解决方案,创建AI模型,实现大模型可观测和根因定位,通过对大模型的数据进行实时监控和分析,快速发现问题并进行定位和解决,从而提高系统的稳定性和可靠性。利用AI模型对大模型进行预测和优化,基于确定性运维实践,从基本运维能力迈向确定性运维能力,大模型驱动操作系统不断优化,进一步提升系统的性能和效率。
中山大学教授、博士生导师陈鹏飞
All Intelligence 华为云AI变革实战
华为云数字化平台首席产品经理王萌萌分享:“华为云的AI变革实践,结合确定性运维能力实践经验,基于AI能力构筑智能化应用,融入作业实现全流程、跨域协同。首先,通过AI辅助运维解决方案和重大故障快速恢复,使能事件工单处理效率提升;其次,AIOps使能应用运维,构建智能化可观测性平台;再次,AI辅助客服工单作业场景从“人”到“AI+人”,全面提效;最后,AI辅助线索管理智能定级与分发,识别高价值线索,提升拓展效率。AI变革在运维领域正在发挥更重要的作用,AI应用有效提高企业系统的稳定性和可靠性,降低系统故障风险和损失,从而提高生产效率和服务质量,增强企业的竞争力。”
华为云数字化平台首席产品经理王萌萌
沃尔沃中国:高可用助力车主节智慧分流新纪元
沃尔沃汽车销售(上海)有限公司CED总监李晓刚分享:“沃尔沃车主节活动,正在进行全面的2C转型,为了主动应对10倍+负载挑战,技术平台面临业务转型,架构优化的双重挑战。沃尔沃采用确定性的方法论,建立了成体系的保障模型,基于历史业务流量,建立全链路的压力模型,通过数学模型确定压力传递系统和压力峰值。在面对车主节应用并发,基于确定性运维实践经验,开展高可用架构优化,打造确定性的处置能力,来提高服务化架构能力,支撑车主节平稳度过。此外,沃尔沃还将大模型和小模型综合加持,结合AI创新实践,从数字化迈向全面智能化。”
沃尔沃汽车销售(上海)有限公司CED总监李晓刚
泊松工业软件一站式智能运维 实现高度确定性运维
深圳泊松软件技术有限公司COO张德强分享:“泊松工业软件使用华为AppStage构建一站式确定性运维体系,通过自动化的变更管理,显著提高运维效率。利用人工智能技术,我们对故障进行智能化管理,从而降低业务故障的恢复时间。同时,通过一站式故障演练平台,达成确定性恢复,实现一站式智能运维支撑业务快速发展。展望未来,泊松与华为云共同规划构建运维大模型,利用大语言模型的自然语言理解能力、推理规划能力和任务执行能力,实现一站式智能运维,实现高度确定性运维。”
深圳泊松软件技术有限公司COO张德强
赛盒科技云上安全与运维实践 提升云上系统的安全可靠
深圳赛盒科技有限公司CEO崔浩军分享:“赛盒科技携手华为云,打造跨境电商安全可靠解决方案,实现整体架构松耦合,核心数据与网络清晰可见,提升赛盒ERP业务发展,构建安全可信的云平台和体系化安全方案,提升全球化运营。同时,助力赛盒构建一站式安全体系,为赛盒数据安全保驾护航,提升全球化运营。华为云协助赛盒运维体系变革,基于确定性运维解决方案,通过故障恢复可信建设、变更高效可信建设等实践,在质量、安全和运维效率得到大幅提升,提升了赛盒云上系统的高可用性和安全可靠性。”
深圳赛盒科技有限公司CEO崔浩军
确定性运维AI创新 加速企业数转变革
华为云运维使能中心总监林华鼎分享:“企业数字化转型过程中生产力发生转移,传统的运维模式需做变革以助力数转成功,确定性运维成为变革的不二选择。维享会作为华为云联合业界精英们构建的经验交流分享会,不断共创、总结、分享,助力千行万业达成数转目标。2024年上半年,维享会支撑建筑、航运、家电、零售、车联网等企业在运维体系、高可用架构、故障快恢、混沌演练等方面做能力建设,取得显著的成果。通过13场活动、3本刊物和100+次点对点交流,与业界分享能力,从国内走向全球,帮助产业贡献专业价值。未来我们共同面向AI实践,基于AI原生应用引擎共创,使能确定性运维AI创新,通过深度整合AI技术与运维场景,为企业提供一种全新的、高效的运维方式,覆盖千行万业业务特性,加速实现智能化的运维决策,未来和更多企业一起拥抱AI,加速行业升级。”
华为云运维使能中心总监林华鼎
联合共创:《确定性运维白皮书稳定可靠篇2.0》正式发布
会上正式发布《确定性运维白皮书稳定可靠篇2.0》,白皮书解读稳定可靠“1+N”能力,“1”套标准化运维体系, “N”个专项能力,在1.0基础上阐述如何“走向确定性运维之路”,企业可参考开展,从管理体系和技术体系分别展开。白皮书由华为云维享会会员共创,共创嘉宾云智慧总裁殷晋和金山办公运维总监曾华山现场分享共创感悟,感谢海尔科技、美图、金山办公、云智慧、金蝶软件、百联、极米科技、趣丸科技、迷你玩、人福医药、SRE社区等企业和大咖们的专业支持。
白皮书发布
华为云期待和更多开发者一起,以维享会为平台,结合AI技术创新,共同探索安全可靠、资源高效、业务敏捷、智能运营的数字化转型能力,为数字时代注入持续动力,共同构建确定性的运维世界。
点击下载:《确定性运维白皮书— —稳定可靠篇2.0》
好文章,需要你的鼓励
在Meta Connect大会上,Meta展示了新一代Ray-Ban智能眼镜的硬件实力,配备神经腕带支持手势控制,电池续航翻倍,摄像头性能提升。然而AI演示却频频失败,包括Live AI烹饪指导、WhatsApp通话和实时翻译功能都出现问题。尽管Meta在智能眼镜硬件方面表现出色,但AI软件仍远未达到扎克伯格提出的"超级智能"目标。文章建议Meta考虑开放AI生态,允许用户选择其他AI服务商,这可能帮助Meta在AI硬件市场获得优势。
DeepSeek-AI团队通过强化学习技术开发出DeepSeek-R1系列推理模型,无需人工标注即可自主学习复杂推理。该模型在数学、编程等领域表现卓越,在AIME 2024中达到79.8%准确率,编程能力超越96%人类选手。研究团队还通过知识蒸馏技术将推理能力传递给小模型,使7B参数模型也能超越GPT-4o。这项突破为AI推理能力发展开辟新路径。
英伟达同意以50亿美元收购英特尔股份,双方将合作开发多代数据中心和PC产品。英伟达将以每股23.28美元的价格收购约4%的英特尔股份,成为其最大股东之一。两家公司将通过NVLink接口整合各自架构,实现CPU和GPU间的高速数据传输。英特尔将为英伟达AI平台定制x86处理器,并开发集成RTX GPU的x86系统级芯片,用于消费级PC市场。
微软研究院推出rStar-Math系统,通过创新的"深度思考"训练方法,让小型AI模型在数学推理能力上达到甚至超越OpenAI o1水平。该系统采用代码验证、过程偏好模型和四轮自进化训练,将70亿参数模型的数学能力从58.8%提升至90.0%,在美国数学奥林匹克竞赛中达到前20%水平,证明了精巧方法比模型规模更重要,为AI发展开辟了新路径。