AI 全景图

从基础模型到面向用户的终端产品,AI 生态可拆解为五个层次。 理解每一层的职责与边界,有助于你在选型、集成与构建时做出更清晰的判断。

01
Foundation Models

基础模型

由海量语料预训练而成的大参数模型,是整个 AI 应用栈的能力底座。 包含纯语言模型(LLM)与支持图像、音频等多模态输入的模型。

GPT-4o / o3

OpenAI 旗舰系列,多模态,强推理,广泛用于对话与 API 集成。

Claude 3.x / 4

Anthropic 出品,长上下文、强指令遵循,注重安全对齐。

Gemini 2.x

Google DeepMind,原生多模态,深度集成 Google 生态。

Llama 3.x

Meta 开源基座,社区微调生态活跃,可本地部署。

Mistral / Mixtral

欧洲开源模型,MoE 架构,推理效率高,支持本地运行。

Qwen / DeepSeek

阿里 / 深度求索出品,中文能力突出,部分完全开源。

02
Inference & Deployment

推理与部署

决定模型以何种方式运行起来:云端 API 托管、本地私有化部署、量化压缩加速 以及批推理与流式输出等工程实践。

OpenAI API

标准 REST 接口,已成行业事实标准,兼容众多三方服务。

Ollama

一行命令本地运行 LLM,提供 OpenAI 兼容接口,适合开发调试。

vLLM

高吞吐量推理服务框架,PagedAttention 显著提升 GPU 利用率。

llama.cpp

C++ 量化推理内核,CPU/Apple Silicon 可用,边缘部署首选。

LM Studio

桌面 GUI,封装本地模型下载与推理,适合非工程背景用户。

Replicate / Together AI

云端按需推理平台,无需维护 GPU,适合快速原型与低流量场景。

03
Tool Calling & Context

工具调用与上下文扩展

赋予模型「感知外部世界」的能力:通过 Function Calling 调用 API、 通过 RAG 检索私有知识、通过 MCP 统一接入内部系统, 突破上下文窗口与知识截止的双重限制。

Function Calling

模型结构化输出工具调用请求,由宿主程序执行并将结果回注上下文。

MCP(Model Context Protocol)

Anthropic 主导的开放协议,将数据库、文件系统、内部 API 统一暴露为工具。

RAG(检索增强生成)

将私有文档向量化存储,运行时检索相关片段注入 prompt,减少幻觉。

向量数据库

Pinecone、Weaviate、Chroma、pgvector 等,为语义检索提供高效存储与索引。

Embeddings

将文本映射为高维向量,是语义搜索、聚类与相似度计算的基础表示层。

Structured Output

JSON Schema / Instructor 约束模型输出格式,便于下游程序解析与验证。

04
Agents & Orchestration

智能体与编排

让模型从单轮问答升级为「自主规划—调用工具—循环执行」的 Agent, 并通过多 Agent 协作框架处理更复杂的长程任务。

LangChain / LangGraph

Python 生态最流行的 Agent 框架,LangGraph 引入有向图支持复杂流程控制。

AutoGen

Microsoft 出品,多 Agent 对话协作框架,适合自动化代码生成与评审流程。

CrewAI

角色化多 Agent 编排,定义 Crew + Task,适合业务流程自动化。

OpenAI Agents SDK

官方轻量 Agent 框架,内置 handoff、guardrails 与 tracing 支持。

Cursor / Windsurf Agent

IDE 内置 Agent,结合 SKILL 与 Rules 在编码上下文中自主规划与执行。

n8n / Dify

低代码 AI 工作流平台,以可视化节点串联模型调用与业务系统。

05
End-User Applications

终端应用

面向最终用户的产品形态:通用助手、编程副驾、垂直行业解决方案…… 每款产品都是对底层四层能力的特定组合与封装。

ChatGPT

OpenAI 旗舰对话产品,集成 GPTs、插件与代码解释器,用户基数最大。

Claude.ai

Anthropic 官方界面,Projects 功能支持长期上下文与文件库管理。

GitHub Copilot

代码补全与 Chat,深度集成 IDE,企业级代码 AI 助手标杆产品。

Perplexity

AI 搜索引擎,实时联网检索并附来源引用,重塑信息获取方式。

NotebookLM

Google 出品,基于用户上传文档的深度问答与播客生成,知识工作利器。

垂直行业应用

法律、医疗、金融、教育等领域的专属 AI 产品,深度融合行业数据与流程。


进入工具与资源(总览)