前不久,亚马逊刚刚被 DropBox 抛弃。

一开始,他们的关系看似坚不可摧。作为一家成长迅猛的云存储初创公司,DropBox 大部分基础设施的需求都依赖于亚马逊云服务,正因为如此 Dropbox 的的工程师才能专注于研发自己的产品,而无需将大量资金投入到构建基础设施上。
但如今 DropBox 却决定恢复单身。上周,该公司发表了一篇博客称,它将建立自己的基础设施堆栈,并从 AWS 转移出大部分业务。
难道这表明随着公司的成长,构建自己的云将更加实惠高效吗?如果是这样,那自建基础设施比公有云效率更高的分界点在哪儿呢?
Dropbox 基础设施副总裁阿希尔·古普塔通过两项事实认识到公司应该走出公有云。首先是规模和增长。 Dropbox 拥有 5 亿用户,存储了 500 千兆的数据。“极少有其他公司能达到我们目前运行的规模,”古普塔说。
其次,古普塔希望拥有对基础设施的从起始端到终端把控,以便能更好地控制产品的性能、可靠性以及用户体验。“优化堆栈以及根据使用情况定制基础设施是我们在市场中脱颖而出的关键因素,也是我们提供给用户的核心价值。”古普塔说。
并不是每家公司都有 Dropbox 这么大的运作规模。大多数企业也不会看到按自己的需求定制基础设施将会带来的巨大好处,古普塔说。 Dropbox 花了两年半的时间,投入部分人力来弄清楚基础设施应该如何定制,而其他工作人员则在管理他们的数据中心。
“定制化需要大量的前期工作,”古普塔说。要获得投资回报需要等很长一段时间,所以你需要有充足的资金来投资团队,并且与供应商建立关系。古普塔承认,公共云非常擅长提供基础设施服务,足以满足大部分工作负载。 Dropbox 仍然会使用某些AWS 服务,但主要存储平台将转移到到内部运行。
福雷斯特研究公司的副总裁理查德·菲谢拉说,不幸的是,并没有一条通用法则明确规定何时在自己的数据中心运行将比在公有云上更便捷高效。不过一般来说,公有云可以高效地运行大多数工作负载。“除非你的规模超过了公有云几个百分点,但这不太可能,”菲谢拉谈到自建云时说。即使你的规模大到自建云也可盈利,但公有云还有其他的优势。云供应商可以为你提供存储即服务,不需要管理任何基础设施硬件。
这并不意味着公有云就没有缺点。公共云服务商也会针对使用和移动数据收取菲谢拉所说的“过路费”。将数据上传到云通常不会收取费用,但下载数据却有可能产生网络带宽费用。基础设施即服务( IaaS )云计算同样也适用于对资源有变量需求的变量工作负载。企业内部云因工作负载稳定性强而保证了数据更高效地运行,不过像亚马逊和谷歌这样的云服务上也开始为长期客户提供折扣,所以即使是稳定优质的公有云工作负荷也不一定要价不菲。
其他抛弃公有云的公司中,有成功也又有失败。 Zynga 也许是最知名的一个例子。这家移动应用公司在 AWS 上搭建了自己的游戏,使得他们在能够如病毒传播般迅速壮大。于是,他们决定建立自己的 Z- 云,为公司提供必要的基础计算资源。在超出 Z-云可处理的“峰值”能力后,它仍然需要使用 AWS 云。最后,随着 Zynga 应用程序市场上失宠,它最终还是回归了 AWS 云。
Dropbox 有信心自己是在放长线钓大鱼,这些投资终将获得回报。不过,作为逐渐意识到自建基础设施更行之有效的庞大云用户中的一员, Dropbox 能否被委以重任?还是终将让 Zynga 的案例再次上演?我们拭目以待。
好文章,需要你的鼓励
谷歌地图将集成Gemini人工智能技术,旨在将其升级为一个"全知型副驾驶"助手。这一整合将大幅提升地图服务的智能化水平,为用户提供更加个性化和全面的导航体验。通过AI技术的加持,谷歌地图有望在路线规划、地点推荐和实时信息服务等方面实现重大突破。
这项由圣母大学和IBM研究院联合开展的研究,开发出了名为DeepEvolve的AI科学助手系统,能够像人类科学家一样进行深度文献研究并将创新想法转化为可执行的算法程序。该系统突破了传统AI要么只能改进算法但缺乏创新、要么只能提出想法但无法实现的局限,在化学、生物学、数学等九个科学领域的测试中都实现了显著的算法性能提升,为AI辅助科学发现开辟了新的道路。
微软研究人员发布新的仿真环境来测试AI智能体,研究显示当前智能体模型容易受到操纵。该名为"Magentic Marketplace"的合成平台让客户智能体与商家智能体进行交互实验。测试包括GPT-4o、GPT-5和Gemini-2.5-Flash等模型,发现智能体在面临过多选择时效率下降,且在协作方面表现不佳。研究揭示了AI智能体在无监督环境下的性能问题。
卡内基梅隆大学研究团队通过3331次大规模实验,系统揭示了代码训练如何提升AI推理能力。研究发现,代码的结构特性比语义内容更重要,适当的抽象形式(如伪代码)可以达到与原始代码相同的效果。不同编程语言产生差异化影响:低抽象语言有利于数学推理,Python更适合自然语言任务。这些发现为AI训练数据的科学化设计提供了重要指导。