今天媒体服务发生着天翻地覆的变化,从传统的纸质媒体,到广播电视,从PC互联网时代的图文、VOD下载,到移动互联网的短视频、直播盛行;逐渐兴起的互动视频和云游戏,以及VR/AR、全息影像、Metaverse正在走入现实。目前根据中国网络视听节目服务协会发布了《2021中国网络视听发展研究报告》显示,截至2020年12月,网络视听用户规模达9.4亿。
而过去要生成这样一副高清影像,需要专业的服务器的强大算力进行本地渲染,通过作图软件实现本地合成,再通过网络传输,最终到了用户手里要经过一个漫长的过程。
而今天仅仅几秒钟,通过华为云的之间渲染,结合5G的高速上行带宽,基于AI算法,实现异地的实时的生成数字画像,并实时打印。这仅仅是华为云结合5G、AI的一个简单的媒体服务应用。
那么让我们再展望一下,当云原生、AI、5G这样的能力赋能在包括高清视频、影视制作、VR等媒体服务的时候,其背后的价值可以想象有多么大。
上云迷之困惑:我是上云了,为啥心里还在打鼓?
业务上云成为企业的必然选择,但是在实际上云过程中,大量的企业也面临越来越多的困惑。为什么已经上云了,已经是云服务了,但是成本并没有降低?为什么我的开发流程还是这么长?为什么质量和稳定性还是不可靠?
“云计算、AI等技术带来了先进的生产力,要解决前面这些困惑,解决制约媒体产业发展的关键问题,加速上云成为必然选择,其中云原生成为唯一的路径和方式。” 华为云媒体服务产品部总经理薛浩在接受至顶网采访时分享了自己的观点。
华为云媒体服务产品部总经理薛浩
云原生让媒体服务实现真正价值
基于云原生的技术将极大提升媒体行业生产和分发效率,薛浩分享了云原生媒体服务为媒体行业带来的三方面价值优势:
Born in Cloud, 天生为云,在云上生产处理、分发和应用具有极大的优势;
Grow with Cloud,随云成长,能够充分利用云的高效率,DeveOps持续迭代创新的优势;
Benefit from Cloud,天然继承云的在线化、弹性算力、AI智能以及高SLA保障等特点,能够真正受益于云。
除了技术优势,“云原生实际上聚集了很多行业伙伴和客户,大家都在这个环节下来共同创造、推动业务,以前大家在线下买一个软件再去升级效率要高很多,成本也低很多,通过云原生技术和理念来推动整个行业快速发展。
友好的开发平台,让开发者释放云原生价值
面向媒体应用,华为云希望实现云原生的应用创新,让开发更为敏捷,也希望以云为基础底座,把各种数字化能力串接起来助力开发者有更佳的体验保障和更好的智能融入。
华为希望基于自身实践,融合了在算力、媒体、通信、AI以及端边云协同等技术积累,把一些优秀的应用例如云会议、云游戏等,以服务化的方式,向业界开放共享,共同创新。
“面向开发者的RTC和直播业务,华为云基于大量的SBK和优化,实现开发环节更简单,同时结合华为云开发者生态和华为HMS生态“双生态”优势,实现在媒体应用开发整个环节做到更高效和流畅。”薛浩分享了华为云针对开发者的友好环境这样谈到。
基于云原生的理念和技术,华为云将持续投入基础技术的研究,加强数字内容建模、实时渲染、云上虚拟制作等关键根技术能力研发,帮助伙伴实现更高效的云制作,助力电影制作企业实现全产业链“上云”,实现异地协同的 “云上”制作。
“比如在拍摄阶段,华为云能够提供虚拟拍摄/3D拍摄服务,利用建模、实时定位,运动跟踪、实时抠像/渲染合成等技术,突破人类/物理限制,随时随地都可以进行优质内容生产;通过极速上传,实时渲染/转码,大幅缩短制作周期;提供云制作服务,云上进行剪辑、制作、合成等工作;包括对媒资内容进行全在线化管理,通过云桌面实现媒体生产工具的全在线化,远程多人可同时编辑操作;华为云还提供云发行服务,一键发布到多渠道,传输即发行。”薛浩分享到。
写在最后,我们看到高质量、快速迭代、实时互动的媒体服务已经成为今天新媒体时代的立足根本,而包括云原生、5G、AI等技术已经成为媒体服务不可或缺的支撑力量。华为云也根据媒体服务发展趋势从音视频服务升级到云原生的媒体服务,基于华为云全球基础设施,利用云原生技术,重构媒体网络,打好媒体基石,不断实现让所有媒体能力,都跑在云上的愿景,帮助业界提升媒体生产和分发效率,从而实现技术、文化、商业有效的结合,助力媒体服务的升级与发展,并最终赋能千行百业,来推动整个数字经济的高质量发展。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。