🧠 一、 通用大模型 (Foundation Models)
#
核心底座,提供文本理解、逻辑推理及多模态处理能力。
| 导航名称 |
简介 |
官方文档链接 |
| OpenAI ChatGPT |
行业标杆,GPT-5.2 系列及推理模型 API 文档。 |
官方文档 |
| Google Gemini |
Google 强力多模态模型,支持 Gemini 3 Flash/Pro。 |
Google AI Studio |
| Anthropic Claude |
被誉为最有人味的 AI,Claude 4.6 及 Cowork 代理系统。 |
开发者文档 |
| DeepSeek (深度求索) |
国产之光,开源 V3/R1 系列,极高性价比。 |
开放平台 |
| Meta Llama |
全球最流行的开源大模型系列,Llama 4 最新技术栈。 |
Llama 官网 |
💻 二、 AI 编程与开发者工具 (AI for Developers)
#
赋能工程效率,从“写代码”进化到“说代码”。
| 导航名称 |
简介 |
官方文档链接 |
| Claude Code |
2026 必工具: Anthropic 推出的原生命令行(CLI)智能体,能常驻终端自主进行代码分析、执行测试并提交代码。 |
立即查看 |
| Cursor |
AI 原生 IDE 领跑者,支持全项目索引与自动重构。 |
使用指南 |
| Trae (字节跳动) |
2026 现象级 AI IDE,深度适配中文及本土 API。 |
官方文档 |
| Hugging Face |
AI 界的 GitHub,托管数百万模型、数据集和 Demo。 |
技术文档 |
| LangChain |
构建 LLM 应用的编排框架,支持复杂的链式调用。 |
官方文档 |
| Vercel AI SDK |
前端开发者的 AI 集成神器,流式响应支持。 |
SDK 文档 |
🎨 三、 多模态生成 (Multimodal AI)
#
图像、视频、音频及 3D 内容的生成与编辑。
| 导航名称 |
简介 |
官方文档链接 |
| Midjourney |
顶尖图像生成工具,支持 Discord 及 Web 端操作。 |
帮助手册 |
| Runway Gen-4 |
视频生成领域领军者,支持电影级长视频生成。 |
创作指南 |
| Suno / Udio |
AI 音乐生成新高度,支持全长高保真歌曲创作。 |
官方社区 |
| ElevenLabs |
全球领先的 AI 配音与语音克隆技术。 |
API 参考 |
🤖 四、 智能体与自动化 (Agents & Automation)
#
Agentic AI:从对话到执行,AI 开始替你工作。
| 导航名称 |
简介 |
官方文档链接 |
| Claude Cowork |
Anthropic 推出的桌面级 AI 代理,可操控电脑。 |
产品详情 |
| Microsoft Copilot |
深度集成 Office 365 与 Windows 的生产力助手。 |
采用指南 |
| Zapier Central |
结合 AI 逻辑的自动化流,连接 6000+ 应用。 |
自动化文档 |
| Manus AI |
全才型 AI 数字化员工,支持端到端任务处理。 |
官方说明 |
📚 五、 知识库与研究工具 (Knowledge & Research)
#
基于 RAG(检索增强生成)技术的知识管理。
| 导航名称 |
简介 |
官方文档链接 |
| NotebookLM |
Google AI 笔记神器,支持上传文档生成播客与摘要。 |
使用说明 |
| Perplexity AI |
AI 搜索领域的颠覆者,提供实时引用的搜索体验。 |
开发者平台 |
| Notion AI |
将 AI 深度嵌入工作笔记、文档与项目管理系统。 |
帮助中心 |
🤖 六、 Agent 专区 (Agentic AI & Computer Use)
#
从“对话”进化到“执行”:AI 正在学习像人类一样操作软件与处理复杂任务。
| 导航名称 |
简介 |
官方文档链接 |
| Claude Computer Use |
Anthropic 提供的突破性 API,允许 AI 直接操作电脑屏幕、点击按键。 |
技术文档 |
| OpenAI Operator |
OpenAI 推出的全能 AI 代理,支持自动预订、调研及复杂的浏览器跨端操作。 |
官方介绍 |
| Manus AI |
全才型 AI 数字化员工,主打“端到端”交付,从需求到结果一站式完成。 |
产品主页 |
| Microsoft Magentic-One |
微软开源的高性能多智能体系统,支持多个 Agent 协同处理通用任务。 |
GitHub Repo |
| AutoGPT (Forge) |
最早的自主智能体框架之一,2026 版大幅提升了任务成功率与容错。 |
使用文档 |
| CrewAI |
专注于“角色扮演”的多 Agent 协同框架,适合构建 AI 虚拟团队。 |
官方文档 |
| LangGraph |
LangChain 旗下的循环图框架,是目前构建高度受控 Agent 的主流选型。 |
开发指南 |
| Skyvern |
基于 AI 的浏览器自动化工具,利用视觉能力自动填写复杂的政府/企业表单。 |
开源主页 |
| MultiOn |
个人 AI 浏览器代理,能够理解网页上下文并执行购买、购票等动作。 |
API 参考 |
🏗️ 七、 垂直领域 Agent (Vertical AI Agents)
#
行业专家级 AI:深度集成行业数据与私有工作流,解决特定领域的复杂问题。
⚖️ 1. 法律、金融与合规 (Legal & Finance)
#
| 导航名称 |
简介 |
官方文档链接 |
| Harvey AI |
顶尖法律大模型 Agent,处理尽职调查、合同起草及法规分析。 |
官方主页 |
| BloombergGPT |
专为金融界设计的 Agent,深度集成彭博终端实时行情数据。 |
技术说明 |
| CRIF Risk Agent |
2026 金融风控标配,处理理赔防诈、受益人穿透及信用评估。 |
行业方案 |
🩺 2. 医疗与生命科学 (Healthcare)
#
| 导航名称 |
简介 |
官方文档链接 |
| Suki AI |
医生专属数字助手,自动生成临床文档与电子病历(EHR)录入。 |
产品主页 |
| Hippocratic AI |
安全性优先的医疗 Agent,支持患者术后随访与药物咨询。 |
官方文档 |
| Ambience Health |
实时捕捉门诊对话,并自动转化成结构化医学报告。 |
技术中心 |
📣 3. 市场营销与电商 (Marketing & Sales)
#
| 导航名称 |
简介 |
官方文档链接 |
| Lindy.ai |
无代码营销 Agent,可自动处理销售线索跟进、会议预约与邮件营销。 |
功能指南 |
| 云智科技 (YunZhi) |
2026 国内领先营销智能体,实现“决策-创造-触达”全闭环自动化。 |
官方网站 |
| Jasper Business |
企业级内容营销 Agent,支持品牌语调一致性的多平台内容分发。 |
开发者平台 |
🛠️ 4. 软件工程与基础设施 (DevOps & Testing)
#
| 导航名称 |
简介 |
官方文档链接 |
| Cognition (Devin) |
全球首位 AI 软件工程师,能独立完成从架构设计到 Bug 修复的全流程。 |
产品主页 |
| Tessl |
2026 兴起的“AI 原生软件工程”平台,专注于 AI 自动代码迁移与演进。 |
官方文档 |
| GitHub Copilot Workspace |
整个仓库级别的 Agent,直接将 Issue 转化为可运行的 Pull Request。 |
使用文档 |
🎮 5. 游戏与娱乐 (Gaming & Meta-Universe)
#
| 导航名称 |
简介 |
官方文档链接 |
| Inworld AI |
为游戏 NPC 注入灵魂,支持实时语音交互、情感反馈与长期记忆。 |
开发指南 |
| Convai |
专注于虚拟现实与数字人的实时语音 Agent,低延迟交互方案。 |
API 文档 |
| Secta AI |
批量生成专业级商务人像与视频,深度适配个人品牌形象管理。 |
产品链接 |
📊 八、 2026 AI Agent 实测报告 (Hands-on Benchmarks)
#
基于 2026 年 Q1 季度真实生产环境测试,评估 Agent 的任务完成率与可靠性。
🧪 1. 软件工程 Agent (Coding Agents)
#
测试标准:独立修复 GitHub 真实 Issue,包含代码理解、修改、测试及 PR 提交。
| 工具名称 |
任务完成率 (Success Rate) |
综合评价 |
实测点评 |
| Cognition Devin |
82% |
⭐⭐⭐⭐⭐ |
2026 编码领域的天花板,能处理多仓库依赖的复杂 Bug。 |
| GitHub Copilot Workspace |
75% |
⭐⭐⭐⭐ |
与 GitHub 生态无缝集成,速度极快,但处理超大规模架构时偶有幻觉。 |
| Tessl |
78% |
⭐⭐⭐⭐ |
专注旧代码迁移,自动将 Java 转换为 Swift/SwiftUI 的表现令人惊艳。 |
🕸️ 2. 浏览器与电脑操作 Agent (Computer Use)
#
测试标准:跨多个网站完成复杂预订(机票+酒店+签证材料),处理动态弹窗与验证码。
| 工具名称 |
导航精度 (Action Accuracy) |
容错能力 |
实测点评 |
| Claude Computer Use |
89% |
⭐⭐⭐⭐⭐ |
视觉识别极准,支持精准的像素级点击,但 API 调用成本较高。 |
| OpenAI Operator |
91% |
⭐⭐⭐⭐⭐ |
浏览器操作极其流畅,特别是处理带有 CAPTCHA(验证码)的页面有特效。 |
| MultiOn |
84% |
⭐⭐⭐⭐ |
消费类任务(购物、订票)响应极快,UI 交互最简洁。 |
🏢 3. 全才型数字员工 (All-in-one Agents)
#
测试标准:端到端交付一份包含“市场调研+PPT制作+邮件分发”的完整周报。
| 工具名称 |
逻辑链路完整性 |
交付质量 |
实测点评 |
| Manus AI |
95% |
⭐⭐⭐⭐⭐ |
交付物几乎不需要人工二次修改,能够自主调用数十种第三方工具。 |
| Lindy.ai |
88% |
⭐⭐⭐⭐ |
擅长工作流编排,但在处理高难度的非结构化数据调研时略逊于 Manus。 |
| Zapier Central |
80% |
⭐⭐⭐ |
胜在生态连接多,更偏向于高级自动化,而非自主决策。 |
🔍 4. 深度研究与搜索 Agent (Research Agents)
#
测试标准:针对特定技术领域生成 5000 字以上的深度研报,要求引文 100% 真实。
| 工具名称 |
事实准确率 (Factual Accuracy) |
深度 (Depth) |
实测点评 |
| Perplexity Pro |
98% |
⭐⭐⭐⭐ |
速度最快,引文标注最清晰,适合快速事实核查。 |
| Grok-3 (X.ai) |
94% |
⭐⭐⭐⭐⭐ |
依托 X 平台的实时数据流,在时政、科技趋势分析上有绝对优势。 |
| NotebookLM |
99% |
⭐⭐⭐⭐⭐ |
RAG(检索增强生成)的天花板,只要你提供信源,它绝不胡编乱造。 |
指标说明:⭐ (入门级) -> ⭐⭐⭐⭐⭐ (专家级);数据来源:2026 Q1 Open-Agent-Eval 开源项目实测。
🔓 九、 开源 AI Agent 生态 (Open Source AI Agent Ecosystem)
#
社区驱动的框架与工具,助力构建透明、可定制的智能体系统。
🏗️ 9.1 编排与多智能体框架 (Orchestration & Multi-Agent)
#
| 项目名称 |
核心特性 |
文档/仓库链接 |
| Microsoft AutoGen |
微软出品,支持多个智能体之间进行事件驱动型对话。 |
GitHub 仓库 |
| CrewAI |
基于“角色扮演”的多智能体协同框架,适合处理真实业务流程。 |
官方文档 |
| LangGraph (OSS) |
LangChain 旗下的循环图框架,支持构建带状态、可控的复杂 Agent。 |
项目主页 |
| Pydantic AI |
类型安全、面向生产环境的 Python 智能体开发框架。 |
开发指南 |
🖥️ 9.2 本地运行与私有化部署 (Local & Self-Hosted)
#
| 项目名称 |
核心特性 |
文档/仓库链接 |
| Ollama |
在本地(macOS/Linux/Win)极简运行 Llama 4、DeepSeek R1 等大模型。 |
官网链接 |
| Open WebUI |
功能强大的开源本地 UI,支持多模型切换、RAG 和自定义插件。 |
GitHub 仓库 |
| LocalGPT |
100% 本地运行的私有化 RAG 系统,确保数据不外流。 |
项目主页 |
| Dify (开源版) |
零代码/低代码 LLM 应用开发平台,支持工作流编排与 RAG。 |
Dify 官网 |
🖱️ 9.3 开源浏览器与操作系统 Agent
#
| 项目名称 |
核心特性 |
文档/仓库链接 |
| OpenHands (原 OpenDevin) |
Devin 的开源替代方案,专注于自主完成软件工程任务。 |
GitHub 仓库 |
| LaVague |
大动作模型 (LAM) 框架,让 AI 能够自主操作浏览器自动化。 |
官方文档 |
| Self-Operating Computer |
让多模态模型直接接管并操作你的 Mac 或 Windows 电脑。 |
项目仓库 |
🧠 9.4 智能体记忆与工具集成 (Memory & Tooling)
#
| 项目名称 |
核心特性 |
文档/仓库链接 |
| Mem0 (OSS) |
为 AI 助手和智能体提供持久化、个性化的长期记忆层。 |
GitHub 仓库 |
| Phidata |
快速构建具备记忆、知识库和工具调用能力的 AI 助手。 |
官方文档 |
| ToolBench |
提供指令微调方案,让智能体掌握超过 16,000 个 API 的调用。 |
项目主页 |
Last Updated: 2026-03-30