文章封面

DeepSeek 的 DSA 机制


DeepSeek 的 DSA 机制 一、什么是 DSA(DeepSeek Sparse Attention)机制 通俗版 DSA 是 DeepSeek 在其模型 V3.2-Exp 中引入的一种稀疏注意力机制。它目的在于减少处理长文本时的计算量和内存消耗,同时尽量保持原模型的性能。也就是说,不再对所有
文章封面

通用 AI Agent(智能体) 的完整框架


通用 AI Agent(智能体) 的完整框架 一、整体结构总览(框架图) ┌────────────────────────────────────────────┐ │ 用户接口层 │ │(输入指令 / 提供上下文 / 接收结果)
文章封面

Cherry Studio API 调用指南(本地部署版)


Cherry Studio API 调用指南(本地部署版) Cherry Studio 提供了一个兼容 OpenAI 标准的本地 API 接口。你可以用 requests 或任何 OpenAI 客户端来调用它。调用流程和 OpenAI 几乎一致,只是地址和模型名称不同。 1. 启动和基础信息 本地服
文章封面

AI CLI 工具概念介绍


AI CLI 工具概念介绍 1. 什么是 AI CLI 工具 AI CLI 工具,就是一个 在命令行里使用 AI 功能的小程序。 它把 AI 模型的能力(比如对话、写代码、翻译、生成文本)封装成命令行命令,你只需要输入一行指令,就能得到结果。 可以理解为: 普通 CLI 工具:帮你管理文件、安装依赖
文章封面

nanobanana提示词整理


nanobanana图片变3D模型 提示词: 1.请把照片的角色用nanobanana模型重画,突出主体,去掉背景等无关元素,100%完整还原人物形象,保持面部特征、表情不变,保持穿着装饰不变 2.请把重绘后的照片用 nanobanana 模型变成一个角色手办。在手办后面,放置一个印有角色形象的包装
文章封面

AI 的底层算法模型架构


AI 的底层算法/模型架构 一、神经网络基本架构 这些是最早的深度学习基石: 感知机 (Perceptron):最简单的神经元模型,只能做线性分类。 多层感知机 (MLP / Feedforward Neural Network):堆叠多层感知机,可以逼近任意函数。
文章封面

什么是MCP(Model Context Protocol)


1. MCP 的基础定义与背景 什么是 Model Context Protocol(MCP)?谁开发的?背景如何? MCP 是 Anthropic 于 2024 年 11 月 25 日推出的一项开放标准,用于规范大型语言模型(LLMs)与外部工具、数据源之间的双向通信 (维基百科, Anthrop

避免 AI 错误固化的提问技巧


避免 AI 错误固化的提问技巧 一、避免直接引用错误内容 不要在问题中反复提到它刚才的错误结论。 原因:AI 会把你引用的内容当成“事实”强化记忆,导致推理继续基于错误。 替代:换用更抽象或重新描述的方式重提问题。 ❌ “你刚才说法国首都是柏林,这不对,重新查。” ✅ “法国的首都在哪?请基于最新资

入门RAG(检索增强生成)


入门 RAG(检索增强生成)可以按照以下步骤进行: 1. 理解 RAG 的基本概念 RAG 是结合 检索(Retrieval) 和 生成(Generation) 的方法,提升大语言模型的准确性和知识覆盖度。 其核心思想是:先从外部知识库中检索相关信息,再将检索结果与输入结合,最后用生成式模型回答问题