专注AIGC技术的专业社区,关注大语言模型(LLM)的发展和应用落地,聚焦LLM及AI技术的市场研究和开发者生态,欢迎关注!AI Agent到底靠什么变强?Agent的能力不只取决于底层大模型,还取决于围绕它的整个系统架构,也就是所谓的Harness ...
为了打破这一局限,Perplexity 近日发布了一项名为“搜索即代码”(Search as Code, 简称 SaC)的全新架构。该技术不再让模型调用现成的、整体式的搜索 API,而是允许 AI 模型以 Python 代码 的形式,动态构建并运行自定义的搜索工作流程。
作者 | 卢阳开源地址:https://github.com/officecli/officedex大家已经很熟悉 Vibe Coding 的工作方式了,但 Vibe Officing 鲜有人提及。本文将站在资深研发的视角,从技术层面探讨现在市面上 ...
原因并不是培训体系发生了革命性的变化,而是因为大家已经习惯直接询问 Claude。新人不需要知道数据库应该如何查询。他们甚至不需要知道应该向谁请教。在 Anthropic 内部,当有人问「数据库怎么查」的时候,经常得到的回答是:「打开 Claude,让 Claude 去查数据库。」很多原本需要资深工程师掌握的隐性知识,开始被转移到 Agent 身上。在 Boris 看来,这或许才是最重要的变化。
知乎 on MSN
为什么coding agent大多数都基于Nodejs?
Python 有硬伤,在 3.15 之前无法 lazy import,导致启动时要初始化一堆对象,冷启动太慢。 同时 JS 可以在 TUI 中写 React,复杂界面效率高一大截。
AI辅助编程已经不再是“可选项”,而是现代企业提升竞争力的“必选项”。通过数商云AI Coding工具集成服务,企业可以快速构建一套安全、规范、高效的智能研发流水线,从而在激烈的市场竞争中保持技术领先优势。
硅谷最近兴起了一种“Tokenmaxxing”(Token刷榜)文化。
作为一个完全用 AI 写出来的编程工具,Claude Code 官方仓库里的用户反馈几乎每天都在刷新。近期就有用户称,自 2 月更新后,Claude Code 在复杂工程任务中的表现明显退化,已经“无法被信任用于复杂工程工作”。该 issue ...
4 天on MSN
Search as code:搜索架构革新,开启智能体时代搜索新范式
当大语言模型从简单的对话工具进化为具备任务执行能力的智能体时,传统搜索引擎的生存空间正被逐步压缩。谷歌与百度等老牌搜索引擎的界面已发生根本性转变——AI生成的摘要内容占据首屏,传统链接列表退居次席。这种表面变化背后,是搜索服务对象的彻底迁移:过去为人类设计的关键词匹配模式,正在被智能体对结构化数据的需求所取代。
关注微信公众号,回复”PDF“获取独家算法资料。
最近在写一本《Harness Engineering 实战》。第七章是验证层,原本只是想引几篇 Anthropic 和 METR 的论文带过去。结果跑实验跑出了几个反直觉的数字,干脆停下来把整章重新梳理了一遍。 我用 DeepSeek 改 5 个 Python bug,每个跑 3 次。 15 次结果都是"任务完成 "。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果