近年来,VR直播凭借独特的沉浸感和优越的互动性,受到了很多直播观众的欢迎。
10月27日,抖音上线了「手机VR全景直播」功能,通过软件与硬件的结合,使VR直播创作者无需复杂流程和购置昂贵设备,仅用1台iPhone手机和1个鱼眼镜头,即可随时随地开启直播。这大幅降低了普通用户VR开播的门槛。

*抖音与斯莫格SmallRig联名推出了手机VR开播的硬件设备
全新方式,手机也能VR开播
全民开播的时代,VR直播原有的开播条件将不少直播创作者挡在门外。一方面,VR直播需要专门的摄影器材、作为监视器的电脑、专业打光的设备和网络稳定的直播间环境,开播成本较为高昂;另一方面,VR直播对灯光和环境的要求,也限制了移动和户外等场景的直播;同时,VR直播需要专业的运营支持,开播流程也相对复杂,人力成本和学习成本较高。
基于此,抖音与知名硬件厂商斯莫格SmallRig深度合作,联名推出了手机VR开播的硬件设备,iPhone手机搭配鱼眼镜头及配件,即可轻松开播。这套手机方案,采用了200°高清鱼眼镜头,超广视角让更多画面信息尽收眼底,带来沉浸式的直播体验。而M卡口的设计,也更方便主播快速安装镜头。

*传统的VR直播场景
为了保证手机VR全景直播的画质及效果,抖音也从采集侧和传输侧进行了技术优化,一方面,手机摄像头+鱼眼镜头的组合模式,可以实现180度视场角全景画面的采集,通过自动检测和标定技术,保障在镜头安装精度不足的时候,也能够采集到清晰的全景画面; 另一方面,抖音端还首次上线了3k×3k高分辨率直播推流,配合云端超分辨率等AI技术,即便是手机直播,也能达到接近专业VR相机的画质体验。此外,手机鱼眼开播还支持了VR美颜等功能,同时兼容平面直播中的大部分玩法,为用户带来更加丰富的功能体验。
VR直播,激活场景想象力
2022年4月,抖音集团旗下的XR品牌PICO上线了VR直播,凭借其独有的沉浸体验和有趣的互动玩法,吸引了大量VR一体机用户成为VR直播间的常客。而随着抖音端同步开播的启动,VR主播不仅能与PICO VR一体机用户完成隔空互动,也能够在抖音上获得更多用户的观看。
经过长期的生态建设,PICO VR直播的内容类型也日臻丰富。其中,既有联合20多家政务媒体发起的「VR看中国」系列直播,也有和各地级市法院抖音号联合发起的「VR直播庭审」,还有PICO官方打造的微恐系列VR直播「夏日试胆大会」等等。期间,用户不仅能在VR直播中直击“村BA”总决赛现场,单场观看人数超230万,也能从第一视角体验到法院庭审现场真实的环境和氛围,还能与虚拟主播一起体验到“密室逃脱”般的紧张和刺激。

*PICO 视频对贵州“村BA”总决赛进行了VR全景直播
PICO VR直播以其全新的形式和体裁,不仅给用户带来了身临其境般的视听体验,让大众看到VR直播在文旅直播、科普宣传、内容种草等不同场景下的独特优势,也让博主们获得了相较于传统2D直播更高、甚至高10倍的看播数据。目前,很多职业主播、直播MCN机构都已加入VR直播的行业。
而随着抖音「手机VR全景直播」功能的开通、硬件技术的普惠,VR直播创作者的数量势必会大幅增加,更多具备潜力的VR直播场景也将迎来爆发。比如,三农领域已经有VR主播开始利用全景摄像头来直播养猪的日常;文旅领域也有主播曾尝试过景区和商圈的带逛;电商领域,VR直播清晰的摄像头和VR视角优秀的立体感,将有助于美容、服饰、汽车等产品的销售等等。
总结
PICO在VR直播领域的耕耘已久。除了职业主播和专业公会带来的直播内容外,梅西中国行VR直播、李玟6DoF虚拟演唱会,这些PICO用户耳熟能详的大型活动,早已为VR直播积攒了大批受众。而直播创作工具的破局和个人、机构直播创作者的加入,可以激发更多丰富、成熟、新鲜、好玩的直播内容类型,这将为VR直播吸引来更多的关注和用户。而“更好内容+更多用户”的增长飞轮一旦形成,VR直播也将正式迈入跨越式发展的快车道。
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。