SomnifexNote

SkillHive 能力空间的设计与实现

以 SkillHive 为例，讨论 AI Skill 管理系统的设计思路，包括私人 Skill、模板、群组协作、全局 Skill、版本记录、权限检查和审计机制。在此基础上，进一步分析企业环境中的 Skill 生命周期、元数据管理、授权边界、质量控制、责任分工和数据治理逻辑，并说明相关设计在软件分层、事务处理、状态管理和管理员决策中的影响。

2026-07-30

基于能力空间的企业级多模型路由网关设计

本文讨论一套面向企业应用的多模型路由网关方案。系统沿用现有模型接口，在网关内部完成请求规范化、上下文整理、能力需求识别、模型选择、供应商适配、结果校验和故障回退。路由器不直接预测模型名称，而是判断任务需要的基础能力及难度，再结合模型能力画像、接口支持、成本、延迟和合规限制完成选模。文章同时说明了上下文管理、能力维度设计、模型评测、轻量路由模型选型、训练数据构造、策略引擎和数据闭环等关键环节，并列出仍需通过企业内部数据验证的问题。

2026-07-23

AI4S 实践：构建可解释的零样本涂层腐蚀评级框架 ZRF-EK

通用视觉语言模型（VLM）在垂直科学领域的落地，往往面临领域知识缺失、不可解释以及黑盒微调成本过高的限制。基于我们团队近期被 Corrosion Science 接收的一项合作研究，本文从计算机算法设计的视角，拆解了用于海洋工程有机涂层腐蚀评估的零样本推理框架（ZRF-EK）。面对规模有限、机制复杂的科学实验数据，该框架没有选择对大模型进行直接微调，而是将图像识别结果与电化学阻抗谱转化为结构化证据，通过跨模态信息对齐与引导式因果推理，约束大模型在设定的专业上下文中输出符合国家标准的评级结果。本文记录了这一“重证据组织、轻端到端训练”的 AI4S 落地模式及其工程限制。

2026-07-12

LLM开发基础3-从需求到提交：一次开发任务的 Agent 流程

以一个 Tauri 桌面应用的数据库管理页面开发为案例，走通 Agent 从需求接收、项目理解、计划、执行、验证到人工审查的全流程。每个阶段讨论了 Agent 能做什么、容易在哪出错、需要开发者做什么。厘清 vibe coding 的适用边界：原型和 CRUD 可以 vibe，支付、权限、加密、数据库迁移、复杂并发和不可回滚操作必须走严谨工程。开发者角色从执行者变为定义目标、设置约束、审查输出和控制风险的决策者。

2026-06-08

LLM开发基础2-Agent 中间层：上下文、工具和权限

深入拆解开发 Agent 中间层的四个核心机制。上下文管理通过关键词检索、向量检索、结构化检索和混合检索解决模型能看到什么的问题，上下文组装和压缩决定信息呈现质量。工具调用通过 JSON Schema 定义、参数校验、超时处理、失败重试和审计日志让模型获得行动能力。MCP 协议标准化了工具接入但缺失权限模型。数据库连接需要默认只读、行数限制、脱敏、审批和凭据隔离等多层安全约束。权限和沙箱配置取决于项目风险等级，没有通用正确配置。

2026-06-08

LLM开发基础1-开发者眼中的大模型三层：模型、Agent 和应用

用一个三层框架帮助工程师理解大模型在软件开发中的应用。基模型层是发动机，只生成文本不执行 IO。中间层是传动系统，管理上下文、工具调用、协议和权限。应用层是驾驶舱，封装为 IDE 插件、CLI Agent 等产品形态。文章逐一梳理了 GPT-5.5、Claude Opus 4.8、Gemini 3.1、Qwen3.7-Max、Kimi K2.6、GLM-5.1 和 DeepSeek-V4 的官方信息，并讨论了跨层误解的常见来源和诊断方法。

2026-06-08

以任务、状态与验证为核心的多Agent系统架构

本文指出直接套用人类分工设计 Agent 架构的局限性，提出以任务图、共享状态、调度策略、独立验证为核心的四层架构，给出多 Agent 拆分的工程判据，为构建稳定高效的 Agent 系统提供工程化思路。

2026-04-16

OpenClaw 间接提示词注入风险分析

分析OpenClaw等自治型代理面临的间接提示词注入隐患。由于推理层难以隔离外部不可信数据与系统级指令，攻击者可利用隐蔽文本诱导代理越权调用执行工具或污染持久化状态。防御策略需脱离单一的模型对齐，在架构层面重构信任边界。系统应综合部署输入数据封装、高危操作人工验证、容器化环境隔离、最小化细粒度权限分配与强制记录审计日志，以此限制控制流失陷后的基础破坏域。

2026-03-09

KimiCheckpointEngine技术文章学习笔记

Moonshot AI 提出的 Checkpoint Engine，通过系统级优化实现了大规模模型在训练与推理之间的高效参数更新。它解决了参数规模庞大、通信开销高和计算资源竞争的问题，将权重更新延迟从分钟级缩短至 20 秒以内。其核心机制包括 Host→Device 高效复制、广播与 P2P 分发、分片式更新、计算与通信重叠，以及低精度支持。这一方案不仅提升了模型迭代速度和推理服务稳定性，也为未来超大规模模型的在线迭代与实时部署提供了坚实的技术基础。

2025-09-16

社团课程设计-LLM：从“魔法”到“得力助手”的正确使用指南

本社团课程专为零基础新生设计，旨在揭开大模型的神秘面纱。我们将从核心原理出发，让你理解AI并非无所不能的“神”，而是一个有“脾气”的强大工具。课程将系统教授上下文管理、提示词工程（R-T-F-E公式）等实用技巧，并展示AI在编码、创意领域的应用。最终，你将学会如何根据任务需求，在众多开源与闭源模型中做出明智选择，成为一名高效、理性的AI使用者，真正将AI融入学习与工作流。

2025-08-12

12 3 4