作者:昆腾监控与安全解决方案副总裁 Wayne Arvidson
对于2016年安防监控行业面对着怎样的挑战,昆腾有着怎样的预测?
1. 更加智能、更加清晰的摄像头、更大范围的主流应用意味着更多数据需要管理
先进的视频监控已不再专属于国家安全。大学、市政、学校和商业企业都在采用具有更多传感器、更广的全景以及更高分辨率的摄像头。此外,这些企事业结构希望通过摄像头本身内置监控功能,比如:数据压缩、流媒体、存储、分析等等,获得更大的价值。高清摄像头的商业化意味着价格将持续降低,更多企业机构将从模拟和标清摄像头转向高清摄像头。2016年,高清摄像头将大幅增加,我们将看到摄像头数量达到峰值,从而导致需要管理的视频数据呈指数激增。
2. 为了更好地执法,可穿戴摄像头已普遍使用,存储挑战也随之出现
2015年部署了大量可穿戴摄像头的试点项目。2016年,随着有关部门意识到证据和公共安全的价值,我们将看到更多可穿戴摄像头的普及,素材保留时间也将更长。由于更多分析功能融入摄像头本身,如果没有良好的数据存储策略,网络视频录制质量将受到影响。目前,许多执法部门和机构仍然苦于管理这些海量的新数据集。执法部门必须更好地了解并部署正确的存储基础架构,才能支持可穿戴摄像头的海量部署。2016年,政府和执法机构的IT管理者将进一步分析如何管理可穿戴摄像头生成的与日俱增的数据,这将成为持续性的工作。
3. 监控分析和商业智能将联手
2016年,执法和私营部门将进一步明确,视频监控信息不仅对于安全有用,对于支持未来的业务决策也大有用处。明年,我们将看到更多企业成功利用视频监控数据赚钱的例子。从零售到货运和物流,更多公司将发现其视频数据背后隐藏的财富,从而紧缩供应链,并保持货架充足供货。要想把不同文件类型的海量数据集整合到一个通用分析引擎中,需要经过深思熟虑,部署有针对性的存储基础架构。
4. 分层存储是最佳的选择
2016年发展趋势提高了对更多视频数据存储的需求,并且需要保留更长时间。曾经安装独立系统,并作为一个单独的业务线来运营的安全经理,将需要与其数据库首席管理员合作,以应对整个企业所需要的越来越多的视频应用。管理这些新的视频数据可能成本很高,会很快耗尽网络性能。企业IT部门必须做好准备,通过可支持数据的轻松访问,整体拥有成本最低的架构,来满足不断变化的视频需求。由于传统方案面临支持越来越多的、拍摄更高分辨率画面的摄像头,以及进行更加复杂的分析,为了进一步的可持续发展,带有磁带、磁盘和云存储组合的分层存储将日益成为最合适的解决方案。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。