云存储公司Box首席执行官Aaron Levie在近日举行的Boxworks 2017大会上公布了在AI方面的更新。
- 近日,Box推出的Box Skills可以让应用开发者采用来自微软、Google和IBM的人工智能,运用到他们的云文件中。
- Box首席执行官Aaron Levie表示,就像PC给我们带来的影响一样,AI也将给我们的技术生活带来巨大转变——当数字化生活越来越普及的当下让机器为我们做更多的事情。
- 他认为真正的机会在于利用诞生于硅谷的尖端人工智能技术,并且让开发者随时可以使用。
- 他还说,他以平常心看待竞争对手Dropbox,因为两家厂商瞄准的是不同的市场。
无论你走在硅谷的何处,都能感受到时下最热门的技术就是“人工智能”,人工智能已经成为Google新款Pixel手机、Amazon Echo智能音箱、微软Office和众多技术初创公司的最大卖点。
作为年收入27.5亿美元的云文件公司Box的首席执行官,Aaron Levie坦言,当谈到AI的时候,人们多少有些厌倦了这个被热炒的词。不过,在该公司的Boxworks大会上,Levie宣布Box将发力人工智能,推出新的功能和能力。
这次发布在AI方面的升级,让Box客户可以选择来自Google、微软和IBM的AI服务,然后用于自动分类和标记云中的语音、视频和图像文件。拿医院举例,Box可以使其更轻松地构建一个系统,任何X射线信息都会根据联邦法律被自动标记和保护起来,并锁定到只能被得到允许的医生查看。
“最终,计算机将会代表我们做一些事情,”Levie表示。
他将人工智能的崛起与PC在80年代掀起的革命做类比——这一变化可能会改变我们与技术交互的方式,为那些具有投资AI远见的人带来巨大机会。
“我们还处于刚开始探索我们能在这个领域做些什么,”Levie说。
Box Skills让你可以对你的企业文件运用微软、IBM或者Google的AI技术。在这个例子中,Box会自动生产一个视频脚本,对其进行标记,然后识别每个演员,以及这个演员出现在视频的哪个片段中。
这时候就需要Box了,Levie说。Box将把AI作为自己的优势之一。随着在云中保存的数据量越来越大,组织这些数据也变得越来越困难。当企业寻求以一种更智能的方式来应对这种增长的时候,Levie希望这时候Box可以发挥作用。
“目前机器学习和AI用于这个问题的例子还比较少。在企业中,这是一个难题。”
Levie表示,按照这些方式,人工智能将开发发挥独有的作用,但是对大多数人来说使用人工智能还是一件很难的事情。像AWS、微软Azure和Google Cloud这样的平台,将提供越来越智能的服务来构建软件,但是你必须变得更加资深以利用这个优势。大多数公司在这个过程中可能需要一些帮助。
“在这方面我们将发挥作用,”Levie说。
Box是一家上市公司,并且华尔街显然认为Box有望不断成长——在撰写本文的时候,分析师普遍认为Box的目标价格将增长至每股24美元,高于目前的每股20美元。
Dropbox CEO Drew Houston
Box是一家拥有差异化技术的细分领域领导者,瞄准了移动设备和云计算市场,摩根大通在Boxworks大会后的分析报告中将Box股价评为“中性”。摩根大通表示,尽管Box有经营亏损的历史,但是Box的技术使其能够很好地应对Dropbox、微软和Google等云存储公司。
而且在云协同方面,Levie说他是以平常心看待Dropbox——最大的竞争对手,预计将在今年底IPO。
最近Dropbox重新设计公司标识,印证了Levie关于两家公司实际上是瞄准不同客户的说法。他说,虽然两家公司仍然在小企业领域是竞争关系,但是他相信Dropbox已经开始专注于高端用户和创意专业人士。Levie则着眼于大型企业。
“我们有非常不同的战略,我们面向的市场略有不同。”
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。