独立测试显示,OpenAI 的 o3 模型得分约 10%,远低于内部报告的25%上限。公开版与内测版存在差异,后续版本预计将更加强大,提醒业界对 AI 基准测试结果保持谨慎。
从本周五起,Copilot 将记住用户会话和偏好信息(如宠物名、早餐口味及沟通风格),并试验个性化动画展示,同时支持在部分网站上预订票务、餐厅等服务,朝全面个人助理迈进。
本文概述了脑机接口及神经形态计算的最新进展,探讨人机融合实现超智能交互与虚拟现实的前景,同时警示相关伦理与安全挑战。
本文介绍了Google Photos测试的超HDR转换工具,可将普通照片转换为更鲜艳真实的HDR图像,适用于社交媒体,但可能伴随文件体积和画质损失。
OpenAI 最新推出的 o3 和 o4-mini 推理 AI 模型虽然在编程和数学等任务上表现出色,但幻觉率却远高于以往模型,引发了对准确性的严重担忧,亟待进一步研究。
该项目利用自主研发的 TrustCSI AI Pentest 工具,通过 AI 自动化渗透测试,降低安全测试门槛,减少了专业人才依赖和成本支出,同时有效提升漏洞检测准确度,保障 IT 资产安全。
谷歌推出 Gemini 2.5 Flash 预览版,支持动态思维和自定义推理预算,开发者可优化成本与延迟,助力改进 Gemini 应用体验。
Hammerspace为AI等领域提供跨平台非结构化数据访问解决方案,近期获1亿美元战略投资,助力企业迅速整合数据资源。
Exaforce 创立于 2023 年,其自主 SOC 平台利用多模态 AI 引擎整合语义、统计及行为模型,实现自动化日志分析与威胁检测,显著降低人工操作,同时提升安全响应效率。
本文比较了谷歌“铁木” TPU Pod 与传统HPC系统(如“El Capitan”和“Aurora”)在性能和成本上的表现。文章指出,尽管设计目标不同,但美国能源部通过优惠合作,实现了更优的性价比,而谷歌的比较存在误导。
斯坦福大学推出 AI4MH 项目,聚焦利用生成式 AI 改革心理健康诊断与治疗,探讨现有体系不足及未来发展。
在期末之际,OpenAI和谷歌向学生免费提供AI工具:前者短期内开放ChatGPT Plus,后者长期提供Google One AI Premium套件,助力高校数字化转型。
Together AI 最新升级其微调平台,支持浏览器零代码操作、直接偏好优化、续接先前训练任务并调整消息权重,同时新定价更低廉,旨在简化AI模型持续迭代。
当前安全运维面临超负荷和误报问题,Agentic AI 可自主学习、决策并提供透明操作,助力缓解分析师压力与提升安全效率。
OpenAI 推出新监控系统,针对 o3 与 o4-mini 模型中涉及生物化学风险的提示进行检测,通过红队实验实现 98.7% 的风险拒答率,进一步防止恶意攻击。
微软团队推出名为 BitNet b1.58 2B4T 的 2 亿参数 1 位模型,通过将权重量化为 -1、0、1,实现了内存和运算效率的显著提升,并能在 CPU(如苹果 M2)上运行,但目前仅支持特定硬件。
404-GEN 成为首个与 Unity 整合的去中心化 3D 模型生成平台,通过 Gaussian Splat 技术和 Bittensor 网络,实现实时、高质量的 3D 场景再现,降低独立开发者和创作者的技术门槛。