> For the complete documentation index, see [llms.txt](https://mana.gitbook.io/manadia/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://mana.gitbook.io/manadia/cn/3.-ai-yuan-sheng-suan-li-xie-tong-wang-luo.md).

# 3. AI 原生算力协同网络

AI 原生算力协同网络是 manadia 的底层定位，也是整份白皮书的技术基础。该网络负责接入、抽象、调度、监控和优化 AI 任务，使分散的算力、模型和执行资源可以被统一组织。

#### 3.1 多源算力接入

manadia 采用算力资源抽象层 (Compute Abstraction Layer) 屏蔽底层硬件差异，将 GPU 集群、IDC 算力、私有算力、云实例、模型 API 服务统一封装为标准算力单元 (Compute Unit)。系统内置节点信用评分机制，从在线率、稳定性、延迟、成功率、安全等级、历史表现六个维度自动打分，低信用节点将被动态降级或剔除，保障网络整体服务质量 (QoS)。

AI 算力协同网络架构：

<img src="/files/QbIbpIwLEWg73WeqOUHZ" alt="" height="401" width="602">

manadia 支持多源 AI 计算资源接入，包括：

* GPU 集群
* IDC 算力资源
* 企业私有算力
* 个人高性能设备
* 云算力实例
* 模型 API 服务
* 本地模型推理节点
* 专用行业模型服务

这些资源具有不同的性能、价格、并发能力、地域分布、稳定性和安全等级。manadia 需要将其抽象为统一的资源描述对象，使调度层能够理解每个资源适合执行什么任务。

一个算力资源在 manadia 网络中至少应具备以下元数据：

| <p>ComputeResource {</p><p>  resource\_id</p><p>  provider\_type</p><p>  hardware\_profile</p><p>  model\_capability</p><p>  region</p><p>  latency\_profile</p><p>  concurrency\_limit</p><p>  cost\_profile</p><p>  uptime\_score</p><p>  trust\_level</p><p>}</p> |
| -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |

该结构使系统可以在任务调度时进行更精细的判断。例如，低延迟交易信号任务需要优先选择响应时间稳定的资源；大规模离线训练任务可以选择成本更低但实时性较弱的资源；涉及敏感数据的任务则需要选择可信等级更高的执行环境。

#### 3.2 AI 工作负载 (AI Workload) 抽象

传统算力调度通常关注 CPU、GPU、内存、带宽等硬件指标。AI 原生调度还必须关注任务本身的语义和执行结构。manadia 将 AI workload 拆分为多个可观察环节：

* Model Inference：模型推理
* Token Processing：Token 处理
* Context Assembly：上下文构建
* Data Retrieval：数据检索
* Tool Calling：工具调用
* Memory Access：记忆读取
* Agent Planning：Agent 规划
* Strategy Execution：策略执行
* Trace Logging：链路记录
* Evaluation：结果评估

这种抽象可以让系统不再简单地问“哪个节点有空”，而是进一步判断“这个任务需要什么能力”。例如，一次市场预测任务可能需要实时行情数据、低延迟推理、风险模型、交易工具和审计记录；一次内容生成任务则更关注上下文窗口、输出质量和成本。

manadia 将 AI 工作负载 (AI Workload) 抽象为可编排、可追踪、可计费的标准化任务单元，支持任务优先级调度、成本上限约束、超时控制、失败重试与多级降级。系统可完整解析一次 AI 任务的全生命周期：从请求接入、上下文组装、模型路由、工具调用、策略执行、结果返回，到链路日志落盘与费用结算，实现全流程可观测、可复盘、可审计。

#### 3.3 动态模型路由

动态模型路由是 manadia 算力协同网络的重要能力。它的目标是在不同模型、不同 API、不同算力节点之间选择最合适的执行路径。

模型路由需要考虑多个维度：

* 任务类型
* 模型能力
* 上下文长度
* 响应延迟
* 调用成本
* 输出稳定性
* 当前负载
* 失败率
* 可用区域
* 安全与可信等级

一个简化的路由逻辑可以表示为：

| <p>route(task):</p><p>  classify task\_type</p><p>  estimate quality\_requirement</p><p>  estimate latency\_limit</p><p>  estimate cost\_limit</p><p>  filter available models</p><p>  score candidates by capability, latency, cost, reliability, trust</p><p>  select primary route</p><p>  prepare fallback route</p><p>  execute request</p><p>  log trace and metrics</p> |
| ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ |

对于 manadia 而言，模型路由不仅服务外部开发者，也服务内部可信任 AI 预测模型。预测模型在不同任务中可能需要不同模型能力：事件理解需要语言模型，市场状态识别需要时序模型，异常检测需要统计模型，策略选择需要 Agent 推理，多模型路由可以让系统更灵活地组合能力。

#### 3.4 智能代理运行时

AI Agent 是 manadia 网络的重要执行单元。与单次模型调用不同，Agent 需要在多个步骤中持续读取上下文、调用工具、处理数据、做出决策并记录结果。因此，manadia 需要 Agent Runtime 来管理 Agent 的运行生命周期。

一个 Agent Runtime 可以包含以下模块：

* Session Manager：管理会话状态和任务上下文
* Prompt Context：构建模型输入上下文
* Tool Registry：管理可调用工具
* MCP Connector：连接外部工具和服务
* Memory Layer：保存短期与长期记忆
* Action Executor：执行工具调用和策略动作
* Evaluator：评估中间结果和最终输出
* Trace Logger：记录完整执行链路

| <p>Agent Runtime</p><p>├── Session Manager</p><p>│   ├── 会话状态</p><p>│   ├── 任务上下文</p><p>│   └── 执行历史</p><p>│</p><p>├── Prompt Context Builder</p><p>│   ├── 系统提示词</p><p>│   ├── 历史记录</p><p>│   ├── 实时数据片段</p><p>│   └── 工具描述</p><p>│</p><p>├── Tool Registry</p><p>│   ├── 可用工具列表</p><p>│   ├── 工具权限</p><p>│   ├── 工具调用记录</p><p>│   └── 工具结果缓存</p><p>│</p><p>├── Action Executor</p><p>│   ├── 工具调用执行</p><p>│   ├── 参数校验</p><p>│   ├── 错误处理</p><p>│   └── 重试逻辑</p><p>│</p><p>├── Memory Layer</p><p>│   ├── 短期上下文（Session）</p><p>│   ├── 长期记忆（数据库）</p><p>│   ├── 用户偏好</p><p>│   └── 学习反馈</p><p>│</p><p>├── Evaluator</p><p>│   ├── 中间步骤评估</p><p>│   ├── 最终结果评估</p><p>│   └── 质量评分</p><p>│</p><p>└── Trace Logger</p><p>    ├── 每步执行记录</p><p>    ├── 模型调用日志</p><p>    ├── 工具调用日志</p><p>    ├── 数据源访问日志</p><p>    └── 完整回放能力</p> |
| ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ |

在可信任 AI 预测模型中，Agent Runtime 的作用尤其重要。预测 Agent 需要持续读取市场数据、判断市场状态、选择策略、调整参数、调用执行模块、记录仓位变化，并将执行结果反馈给模型评估系统。

Agent Runtime 采用沙箱隔离执行，确保多代理并行运行互不干扰；内置短期记忆与长期记忆分层存储，支持对话上下文、决策历史、工具返回结果的持久化与检索。系统提供权限最小化机制，严格限制代理对钱包、签名、交易等高敏感工具的调用权限，所有操作均留痕可审。

#### 3.5 Tool 与 MCP 调用

未来 AI 系统的能力很大程度来自工具调用。模型本身提供推理能力，工具提供行动能力。manadia 网络中的 Agent 可以调用多种工具：

* 行情工具
* 链上数据工具
* 钱包与签名工具
* 交易执行工具
* 数据库工具
* 搜索工具
* 风控工具
* 审计工具
* 企业 API
* MCP 服务

工具调用需要被纳入统一追踪。一次 Agent 执行失败，可能不是模型能力问题，而是数据源超时、工具返回异常、权限不足、参数错误或外部 API 不可用。Agent Trace 能够帮助开发者和用户定位问题。

#### 3.6 算力监控与消费分析

AI 应用要进入真实业务，必须理解自己的运行成本和性能状态。manadia 的 AI Consumption Analytics 负责记录和分析以下指标：

* 请求次数
* Token 消耗
* 模型调用成本
* 平均响应时间
* P95/P99 延迟
* 成功率
* 失败率
* 重试次数
* fallback 次数
* 工具调用次数
* 单任务成本
* 单用户成本
* 单模型性能表现

这些指标可以反向优化模型路由策略。例如，当某个模型在特定任务上成本较高但质量提升有限时，系统可以降低其路由权重；当某个节点在高峰期延迟上升时，调度层可以自动切换路径。

#### 3.7 高并发与容错

AI 任务的负载具有明显峰值特征。市场波动、热点事件、预测市场结算、企业批量任务和用户集中访问，都可能导致瞬时请求增加。manadia 通过以下机制提升高并发稳定性：

* 请求队列
* 任务优先级
* 缓存策略
* 批处理
* 负载均衡
* 节点健康检查
* 超时重试
* 多模型 fallback
* 熔断机制
* 区域路由

对于可信任 AI 预测模型，高并发能力并不只是用户体验问题，也会影响策略执行。市场剧烈波动时，数据更新频率、模型推理频率和策略执行频率都会上升，底层网络必须保持稳定。

manadia 采用多级流量控制架构：入口层限流、调度层排队、执行层熔断、资源层过载保护。支持多区域容灾与异地多活，高峰期自动扩容算力节点，异常时触发策略降级与多模型备用路由，确保预测模型、预言机、支付系统等高关键链路在极端流量下仍保持 99.9% 以上可用性。