北京,2023 年 11 月 10 日——领先的监测与数据分析平台 Adjust 今日发布了年度《移动应用增长报告》。该报告引入了新的增长指数得分指标,并对全球应用表现进行了深度分析。报告中不仅包含了对成熟市场的重要洞见,还覆盖了拥有丰富用户获取(UA)潜力的新兴市场。根据Adjust 数据显示,亚太地区(APAC)为移动营销人员带来的即时价值最高,而印度则是在全球范围内开展移动游戏用户获取推广的最佳市场之一。
Adjust 营销副总裁 Lou Hong 表示:"为推动新一波的全球营销增长浪潮,Adjust 不断努力研发解决方案。在帮助客户投放高效且可监测的推广活动的同时,从容应对竞争日趋白热化的移动应用生态。此次推出的 Adjust 增长指数得分能为营销人员和开发者在全球范围内找到新的增长点。要想打造成功的推广活动并实现规模化拓展,就必须了解哪些应用类别和地区的增长潜力最高。"
Adjust 增长指数得分
Adjust 增长指数得分旨在评估应用在不同地区、国家和市场中的表现、潜力以及营销能力。增长指数得分是基于 2023 上半年 Adjust 平台上 2500 余款应用及其表现数据,其中包含安装量、单次安装有效成本(eCPI)和用户终身价值(LTV)三个关键指标。这三个指标之间的关系不仅能描绘出应用增长轨迹,还对评估推广活动价值具有关键意义。
全球增长机遇
北美地区在移动应用市场仍居霸主地位,预计到 2027 年市场价值将达到 2730 亿美金。然而,得益于移动基础设施的提升和智能手机价格的下降,亚太地区的应用市场出现了爆炸性增长。2022 年,该地区的移动网络用户量达到了 12.9 亿,远超 2015 年的 7 亿人。
此外,Adjust 的报告还显示,在经历了几年的动荡后,许多应用类别正在恢复元气并再度崛起。该报告通过分析多个领先市场、地区和应用类别的表现寻找到了宝贵的UA增长机遇,关键看点包括:
- 亚太地区是移动应用增长最快的地区,增长指数得分 43.3,紧随其后的是欧洲(35.9)和北美(30)。
- 印度是增长指数得分最高的国家(31.2),这主要得益于智能手机和移动流量套餐价格的下降。
- 移动游戏是增长指数得分最高的应用类别。从全球层面来看,动作、超休闲、体育、角色扮演和休闲类游戏的表现均名列前茅。
- 旅游和购物应用在众多市场中的表现超过了很多应用类别,可见新冠疫情过后,人们对旅游的兴趣十分强烈。购物类应用的增长指数得分位居全球第二。
Adjust 此次发布的《移动应用增长报告》中还包含移动应用增长地图和排行榜,以轻松、直观且有趣的方式呈现了关键的移动增长数据。要了解更多详情并下载《移动应用增长报告》,请关注官方微信公众号“AdjustGmbH”。
关于 Adjust
Adjust 是 AppLovin(纳斯达克代码:APP)旗下公司,旨在帮助海量应用实现从移动端到联网电视等多平台的监测和业务增长,深受全球营销者的信赖。无论是快速增长的数字品牌还是试水应用领域的实体公司,Adjust 都能为其应用营销旅程保驾护航。Adjust 强大的监测和数据分析套件能深入洞察营销表现、汲取关键洞见并提供多种必备工具,进而帮助营销者获得卓越的营销效果。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。