这家由前谷歌公司和雅虎公司的工程师们联合创办的企业利用Apache Spark打造了一个类似于Google Docs的、便于理解的用户界面。
Adatao,一家专注于大数据的创业企业,在由Andreessen Horowitz、Lightspeed Venture Partners和Bloomberg Beta联合发起的A轮融资中筹得1300万美元。ADatao公司的联合创始人兼首席执行官hristopher Nguyen表示,作为交易的一部分,Andreessen Horowitz公司的Peter Levine将会加入这家创业企业的董事会,同时Marc Andreessen将会担任公司的顾问。Nguyen在此之前,曾在Google Apps担任工程部总监。
Nguyen解释道,尽管很多新兴公司——例如Metanautix以及AppDynamics——专注于从公司运营中的大量数据发现问题,但Adatao公司与众不同。Adatao公司采用了Apache Spark技术,打造一个类似于GoogleDocs的、便于理解的用户界面。
Adatao软件采用了Spark内存数据处理架构,这是Adatao团队集体决定的。因为相比MapReduce来说,这一方案从整体上来说,在数据处理方面更加迅速。
Nguyen说:“我在谷歌学到的一件事情就是速度是非常重要的”,他表示,“五秒钟与五分钟的差别不是60倍,两者之间的差别是无穷大。”
在Adatao的界面上,用户可以查到任何同Adatao有关系的数据,并且和他或者她的数据库专家配合,这些专家可以使用机器学习算法来找出数据中可能隐藏的关联性和因果关系。该界面还允许多用户同时查看数据集,这会让Google Docs的用户感觉非常熟悉。
为了降低数据库程序员的工作难度,Adatao的API允许他们使用通用语言——例如Python, SQL, Scala and Java等进行数据查询,并且将通常非常复杂的统计运算代码——例如R和SAS简化成单行格式。
Adatao公司位于加利福尼亚州的Sunnyvale,这家公司提供的自然语言查询功能让用户可以通过键入文字命令,让系统进行数据分析,例如对比两组数据等等。
现在,企业用户需要事先在内部安装Adatao的相关软件,但Adatao正在同有兴趣在自己的云平台上运行Adatao产品的公司商谈合作。最近推出的Databricks Cloud就已经将Adatao作为自己的一个合作伙伴,在自己服务的基础上为客户提供服务。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。