【笔记】State-Of-Ai 报告信息
May 5, 2025笔记ai
【笔记】State-Of-Ai 报告信息
一、State-Of-Ai Web Dev 2025 报告摘要
2025.stateofai.dev
是面向 Web 开发者的一次 ai 使用和问题情况统计,完整报告:https://2025.stateofai.dev/en-US/models/。其访问组织之前也有state-of-js
、state-of-css
等典型统计系列。
在这篇
state-of-ai
统计中,受访者人数规模在5000 - 10000
左右,国家主要集中在美欧、中国受访者只有 25 人,因此实际情况和国内会有偏差。
个人概括下这份报告的主要信息:Web 开发者对 AI 应用持有积极的态度,乐于使用并看好其发展。开发者使用 ai 的主要场景在代码生成,目前使用主要问题在幻觉和不确定,另外生成的代码质量和上下文限制也影响了其效果,以至于较大占比的生成代码需要重构。
1.1 Model Providers 模型提供商情况
首先,毫不奇怪,OpenAI 的 ChatGPT 仍然受益于其先发优势和巨大的市场份额,使其成为最常用(91.2%
)和最受欢迎(53.1%
)的模型提供商。
虽然它在使用方面确实领先很大,但在积极情绪(个人觉得这个指标可以理解为好评情况、受欢迎度)方面,第二的 Claude 并没有落后太多,为45.9%
。
因为国内受访者很少,所以像国内常用的千问、豆包等模型统计占比很少。
Model Providers Pain Points 模型提供者的痛点
幻觉和不准确是迄今为止受访者报告的 AI 模型的最大痛点,这是有道理的,因为如果这些工具的输出不可靠,它们就会失去所有效用。
缺乏处理更大上下文和将数据保存在内存中的能力也是一个大问题,尤其是在处理大型真实代码库时。
1.2 IDE 和编辑器情况
Cursor 在认知度上处于领先地位,82.2%
的受访者使用过或听说过它,而第二的 Zed 只有54.1%
。
当看到关于 Cursor 的随意评论时,似乎主要问题实际上是它的价格,这表明市场可能有更便宜的替代品的空间。
IDE 使用痛点
上下文和内存限制是目前阻止 Web 开发人员使用专用 IDE 进行编码的主要原因,其次是太多的侵入性建议以及与 AI IDE 相关的高成本。
1.3 Coding Assistants 编码助理使用情况
虽然看到 GitHub Copilot 在使用量和积极情绪排名中名列前茅并不奇怪,但值得注意的是,Supermaven 的积极情绪排名第二,尽管就使用量而言仅排名第四。这种差异通常是一颗新星的标志,它可能会在未来一年掀起波澜。
Coding Assistants Pain Points 编码助手痛点
幻觉和不准确再次被证明是更广泛采用的一大障碍。
就像 IDE 一样,具有有限上下文窗口的编码助手也是一个主要问题。
1.4 Code Generation 代码生成情况
凭借 Vercel 的实力,v0 迅速确立了自己在这个新兴行业领域的领导者地位。但是 StackBlitz 的 Bolt 也不甘落后,当然值得关注。
Code Generation Pain Points 代码生成痛点
代码生成工具似乎生成了质量差的代码,这些代码通常不能按预期工作,或者根本不能工作。
1.5 Other Tools 其他工具
使用 ai 工具时的编程语言
主要还是 js/ts 和 python。
图像生成模型
主要是 DALL·E 和 MJ。
AI 封装库/SDK
希望浏览器支持 API 情况
人工智能模型很可能在未来融入我们的网络浏览器——如果发生这种情况,像即时翻译或总结内容这样的事情可能只是一个 API 调用。
1.6 Usage 用法
正如开发人员调查所预期的那样,代码生成被列为最常见的人工智能用法。另一方面,尽管图像生成是生成人工智能的原始用例,但只有38%
的受访者表示使用它。
代码生成占比情况
大多数人还没有完全进行氛围编码(vibe coding),大多数受访者(69%
)通过 AI 生成的代码不到25%
——只有一小部分(8%
)生成了超过75%
的代码。
AI 代码重构情况
即使使用 AI 生成代码,绝大多数(76%
)的开发人员表示他们必须重构至少一半的输出代码才能准备好使用。
重构的首要原因是表面问题,如易读性差、变量重命名和过度重复。许多受访者还使用自由形式的“其他答案”字段来声明生成的代码通常无法按预期工作。
使用 AI 生成代码频率情况
46%
的受访者每天多次或更多次使用人工智能生成代码。
与代码生成相比,人工智能用于其他任务(研究、总结、翻译等)的频率相对较低——考虑到编码仍然是我们花费最多时间的事情,这是有道理的。
使用 AI 生成代码的场景情况
最常见的生成代码类型被证明是辅助函数,其次是前端组件,它们都相当独立,使它们成为代码生成的良好候选者。
许多人还使用人工智能为现有代码添加留档或注释,这是一个意想不到的用例。
使用 AI 生成代码的消费支出情况
大多数受访者目前没有在人工智能工具和服务上花费任何自己的钱。
受访者所在公司在 AI 工具上的支出情况遵循马蹄形模式,公司不会在人工智能上花费任何费用——除非他们花费超过 5000 美元!这种定价模式是否对人工智能公司来说是可持续的还有待观察。
AI 各工具应用的使用痛点
在 AI 痛点方面,整体代码质量差排名第一。
觉得这些 ai 或工具缺少的功能
今天的模型缺少的主要东西是将整个代码库保存在内存中的能力,如果 AI 工具旨在帮助我们维护应用程序,而不仅仅是对它们进行原型设计,那么这一点将被证明是关键。
另外,尽管调查强调了各种痛点,但受访者总体上对 2025 年人工智能用于 Web 开发的状态非常积极。
1.7 Resources 信息资源
播客:
视频创作者:
二、Vercel State-Of-Ai 2024 报告信息
是 Vercel 对于 V0 使用者的调研报告,完整报告:https://vercel.com/state-of-ai。
个人概括下这份报告的主要信息:V0 的使用者看好 AI 的潜力和未来发展,并未接下来的技术进步做准备、如提前准备模型切换能力。虽然目前 OpenAI 是领先的提供商,但开发人员正在积极测试替代方案。AI 应用的重点正在转向面向客户的功能,专注于现实世界的价值,当前模型准确性和成本等挑战仍然是关键问题。开发者成功需要仔细评估、战略规划和灵活实施以适应变化。
2.1 模型使用情况
OpenAI 正在引领模型采用,但竞争正在迎头赶上。虽然 OpenAI 仍然是88%
采用率的主要选择,但开发人员与多个提供商保持关系——平均两个。随着提供商竞相完成,开发人员的忠诚度在六个月内受到65%
更换提供商的考验。
2.2 应用和价值创造情况
虽然这个市场还很年轻,有很多未开发的机会,但急功近利的时代已经结束了。用户现在对人工智能的期望更高。询问更深入的问题,关于人工智能如何增强用户体验的各个方面,并使其成为产品开发的核心,而不仅仅是一个附加组件。
- 聊天机器人(44%)和产品功能(79%)之间的差距揭示了向更深层次的人工智能集成的转变
- 矢量数据库采用(70%)标志着 AI 基础设施的成熟
- 网站个性化(24%)仍未得到充分开发,这暗示着未来的机会
2.3 开发实践和效率情况
今天的团队通过智能技术选择而不是巨额预算来构建高需求的人工智能系统。AI 团队以精益预算构建强大的系统,每月花费不到 1,000 美元。他们通过使用 RAG、智能数据采购和云平台跳过昂贵的培训,无需繁重的基础设施即可交付快速、可靠的模型。
- 团队通过智能架构和增强生成而不是定制模型训练来优化成本
- 每周模型更新正在成为标准,这表明 Vercel 等提供商支持的快速迭代实践
- 大多数团队将手动测试与基于经验的发布配对,但是度量驱动的评估正在出现
手动测试仍然很常见,但指标驱动的评估表明质保越来越复杂。
团队将公共数据集、网络抓取和客户数据与 RAG 定制相结合,以提供精确的输出,而无需定制模型培训的开销。
2.4 优先级和组织结构
人工智能发展进入务实阶段。构建成功的 AI 功能并不一定需要专门的部门。专注于高影响力的用例,同时保持团队结构精简。机会在于发现人工智能在哪里增加了真正的价值,并有效地利用可用资源。
许多人将有意义的技术预算(超过 15%)用于人工智能,但不打算发展专门的人工智能团队。他们正在寻找方法,通过赋予现有团队更好的工具和明确的目标来构建复杂的人工智能功能。
- 团队选择精益集成而不是专业部门
- 现有产品团队推动人工智能创新
- 正在平衡构建新功能和扩展现有功能之间的优先级
2.5 信仰和观点
人工智能市场在炒作和实际影响之间找到了最佳位置。团队认为当前的人工智能工具被夸大了,但他们预计人工智能将在 12 个月内对他们的行业产生重大影响。他们对未来感到兴奋,但立足于现在。
- 团队相信人工智能的未来,同时对当前工具保持现实
- 开源和微调被证明是有用的,但还没有改变游戏规则
- 每个人都在为明年的重大进步做准备,用现在有效的东西建造,但为即将到来的东西设计
巨大的变化就在前方,即使我们还没有到那一步。要意识到当前的限制和挑战,同时对人工智能的变革潜力保持乐观。
Author
My name is Micheal Wayne and this is my blog.
I am a front-end software engineer.
Contact: michealwayne@163.com