当前位置: 首页 > article >正文

Late:本地优先的编程智能体

如果能在5GB 显存上使用本地Qwen3.5-35B-A3B编排代码库通过llama.cpp达到约 25-30 tokens/sec65k 上下文其余层卸载到系统内存你觉得如何更妙的是两个并行的 agent 实例可以舒适地以约 15-20 t/s 运行原生支持思考模式和非思考模式模型包括Gemma 4或者可以指向高算力的云端端点来处理复杂的架构任务。如果这听起来好得难以置信请继续阅读。运行本地 LLM 通常感觉像是从高级云订阅降级但真正的限制不仅仅是模型质量而是系统设计。上下文窗口是有限的仅仅增加 token 容量并不能消除控制模型所见内容的需求。在实践中更大的上下文在不被主动管理的情况下往往会引入更多噪声、更多漂移和更弱的推理能力。本地编码 agent 需要的不是更大的单体聊天循环而是更好的执行架构一个将规划与实现分离的轻量级终端环境。主编排器应该像一个首席架构师那样运作。它应该检查代码库构建具体的实施计划将工作分解为原子任务并将这些任务分派给具有紧密限定、隔离上下文的短命子 agent。每个编码子 agent 应该执行一个有界的更改返回结果的紧凑摘要然后终止。这使得规划器的上下文保持干净防止编辑历史膨胀并避免了当每个操作都被迫通过一个不断扩大的对话时出现的逐渐退化。结果是系统表现得不像一个困惑的聊天机器人而更像一个有纪律的工程团队具有清晰的任务边界和快速的反馈循环。这就是 Late 背后的理念。Late 是一个确定性的编码 agent 编排器旨在使本地 LLM 适用于严肃的代理式软件开发。它不是将整个仓库倾倒到单个上下文窗口中并希望模型保持一致而是映射代码库维护高级控制面板并生成临时的执行 agent 来执行精确的、完全匹配的代码编辑。通过镜像真实工程组织的结构Late减少了 token 膨胀限制了上下文污染并提高了长时间运行编码工作流下的可靠性。在亲自动手使用 Late 之前值得了解其内部架构和区别于其他编码 agent 的设计决策。1、Late 到底是什么从高层次来看Late 是一个用 Go 编写的本地优先终端编码 agent。它期望一个 OpenAI 兼容的端点并且设计上刻意简单安装二进制文件设置OPENAI_BASE_URL运行late这意味着 Late 不试图拥有推理层。你可以将它指向本地的 llama.cpp 服务器或另一个 OpenAI 兼容的服务栈或者在需要更多算力处理特定任务时指向云端点。例如Qwen3.5–35B-A3B 是一个稀疏 MoE 模型拥有 35B 总参数和 3B 激活参数兼容包括 OpenAI 兼容框架在内的流行服务栈。Late 的设计理念更接近即时上下文获取规划器在编写实现计划之前收集所需内容子 agent 只在需要时获取额外上下文没有永久性检索管道膨胀主线程上下文窗口保持隔离因此实现噪声不会在稍后毒害架构决策因为 agent 在保持轻量级标识符并在运行时获取详细上下文而不是将所有内容预先加载到一个巨大的 prompt 中时往往工作得更好。如果你让编排模型匹配真实工程师的工作方式较小的本地模型在真实开发中就变得更为可用。这是一个更强、更有用的主张。Late 有两个根本不同的 agent 角色一个规划编排器一个或多个编码子 agent2、规划器契约internal/assets/prompts/instruction-planning.md中的规划提示非常明确。规划器被描述为首席架构师和规划 Agent。它被指示调查代码库理解结构和约束然后编写逐步的实现计划。它还被指示必须在执行前使用write_implementation_plan必须使用spawn_subagent进行所有直接文件修改。它被明确禁止自行编辑文件。1. Capabilities Restrictions CRITICAL: You are an ARCHITECT, not a CODER. YOU CAN: Read files, search the codebase, list directories, and analyze project structure. YOU MUST: Use write_implementation_plan to record your design before any execution. YOU MUST: Use spawn_subagent (type coder) for ALL direct file modifications. CRITICAL TOOL RULE: You MUST invoke the spawn_subagent tool MULTIPLE TIMES—exactly once for EVERY individual step in your Implementation Plan. You are strictly forbidden from passing multiple steps or the entire plan into a single spawn_subagent call. YOU CANNOT: Edit files, create files (other than the plan), or run destructive bash commands. Note: Direct file-editing tools (like write_file or target_edit) are physically removed from your toolset. You MUST delegate all coding to subagents. Even for requests to implement, add, update, or edit, you MUST follow the plan - subagent pipeline. Direct edits are only for subagents. ...internal/assets/prompts/instruction-coding.md中的编码提示同样狭窄。编码子 agent 获得主规划器没有的文件修改工具。它应该读取文件使用write_file或target_edit优先使用原生编辑工具而非 bash 黑客技巧并在出现歧义时立即停止。它不应自行发挥解释而应清晰地向主 agent 报告。Goal Your goal is defined by the main agent. You are typically asked to write code, refactor functions, or fix bugs in specific files. Capabilities You have access to the same tools as the main agent, IN ADDITION you also have access to file-modifying tools (write_file, target_edit) that are withheld from the main agent. You should use read_file to understand the context. You should use write_file or target_edit to modify code as instructed. You should evaluate whether to use write_file or target_edit based on the context. You must prefer native tools (e.g. write_file and target_edit) over bash commands (e.g. echo and sed). ...在cmd/late/main.go中Late 使用规划系统提示启动根编排器注册规划安全的工具连接 TUI 集成然后有条件地注册spawn_subagent。子 agent 运行器创建一个具有新会话的子编排器传递目标和选定的上下文文件执行它并仅将紧凑的最终结果返回给主规划器。该连接的简化版本如下// Adapted from cmd/late/main.go root : orchestrator.NewBaseOrchestrator(main, planningSession, nil, 0) runner : func(ctx context.Context, goal string, files []string, agentType string) (string, error) { child, err : agent.NewSubagentOrchestrator( client, goal, files, agentType, enabledTools, injectCWD, gemmaThinking, subagentMaxTurns, root, program, ) if err ! nil { return , err } return child.Execute() }关键在于生命周期规划器保持存活子 agent 为一个有界任务而生成子 agent 仅接收目标和选定的上下文文件子 agent 使用自己的会话运行子 agent 的结果以简洁摘要的形式返回规划器线程保持相对干净这就是上下文隔离策略的具体形式。3、Late 如何构建子 agentinternal/agent/agent.go中的子 agent 创建路径值得一看因为它展示了仓库对隔离的重视程度。流程大致如下加载编码提示如有需要注入工作目录占位符创建一个没有持久历史的新会话从父级继承工具但跳过递归工具如spawn_subagent和write_implementation_plan注册完整的编码工具构建包含目标和选定上下文文件的初始用户消息创建子编排器并将其附加到父级以下是逻辑的简化、改编草图// Adapted from internal/agent/agent.go systemPrompt : loadPrompt(prompts/instruction-coding.md) subSession : session.New(client, , nil, systemPrompt, true) // inherit safe parent tools, but block recursion/confusion tools for _, tool : range parent.Registry().All() { if tool.Name() spawn_subagent || tool.Name() write_implementation_plan { continue } subSession.Registry.Register(tool) } // ensure coder gets edit tools executor.RegisterTools(subSession.Registry, enabledTools, false) initial : Goal: goal \n\n initial renderContextFiles(ctxFiles) subSession.AddUserMessage(initial) child : orchestrator.NewBaseOrchestrator(subagent, subSession, middlewares, maxTurns)4、精确匹配编辑作为可靠性策略许多编码 agent 仍然依赖脆弱的 diff 格式或基于 bash 的文件变异技巧这些技巧在方便的时候很好用直到模型损坏文件、错过目标块或写入错误路径。Late 的target_edit工具严格得令人耳目一新。internal/tool/targetEdit.go中的工具需要三样东西一个目标文件一个精确的搜索块一个替换块它读取文件验证搜索块是否存在计算它出现多少次如果块缺失或出现多次则失败。只有在那时它才应用替换。这意味着模型不能模糊地指向类似这个函数的东西并希望补丁能正确着陆。简化版本如下// Adapted from internal/tool/targetEdit.go content : readFile(file) count : strings.Count(content, search) if count 0 { return error(search block not found) } if count 1 { return error(search block must be unique) } updated : strings.Replace(content, search, replace, 1) writeFile(file, updated)它将文件编辑变成了一个确定性契约子 agent 必须先读取文件编辑目标必须明确目标必须唯一失败是显式的不是静默的Late 通过严格的精确匹配search/replace块来实现零静默破坏代码的目标。5、Late 的 bash 模型在正确的地方保持保守Late 使用一套实用的、可检查的约束白名单某些读取密集型命令以进行快速路径执行阻止cd并要求使用显式cwd阻止文件写入 shell 技巧如cat file根据安全路径策略验证工作目录当命令是变更性的、有歧义的或在白名单之外时要求确认截断过大的命令输出以避免内存爆炸防护栏逻辑的简化草图如下// Adapted from internal/tool/implementations.go if containsCd(command) { return error(use cwd parameter instead of cd) } if usesCatRedirection(command) { return error(use native write_file or target_edit instead) } if cwd ! !IsSafePath(cwd) { return error(cwd is outside the allowed directory) } if hasNonWhitelistedCommand(command) { requireConfirmation() }编码 agent 的很多可用质量来自于模型周围的工具链编辑契约工具验证审批流程上下文隔离停止条件路径控制输出截断确定性可重放会话状态这展示了通过将 agent 视为真正的系统组件你可以获得多少严谨性。6、在本地设置 Late你需要Linux 或 macOS shell 环境一个 OpenAI 兼容的端点可选地如果你想从源码构建需要 Go如果你想完全本地运行需要一个模型后端对于后端llama.cpp 是最明显的本地选择因为它暴露了 OpenAI 兼容的llama-serverHTTP 端点。你可以从发布二进制文件安装 Late# Download the latest release binary from the repos Releases page chmod x late-linux-amd64 mv late-linux-amd64 ~/.local/bin/late或从源码构建 Lategit clone https://github.com/mlhher/late.git cd late make build make install然后启动本地 OpenAI 兼容的模型服务器。使用llama.cpp的最小本地示例如下# Example only: point -m at your local GGUF model file llama-server -m /models/qwen3.5-35b-a3b-q4.gguf --port 8080重要的是llama-server暴露了 Late 期望的 OpenAI 兼容 API默认的聊天补全路由是http://localhost:8080/v1/chat/completions7、将 Late 指向端点Late 读取OPENAI_BASE_URL如果你不设置默认为http://localhost:8080。export OPENAI_BASE_URLhttp://localhost:8080如果你使用托管的 OpenAI 兼容提供商请根据需要设置 API 密钥export OPENAI_API_KEYyour-key然后你可以运行 Latelate这将启动 TUI。8、快速入门工作流进入你想要工作的项目并运行late。cd ~/src/my-app lateLate 将当前工作目录注入到需要的提示中并将其用作操作的有效项目边界。然后你可以给它一个需要规划的任务。使用一个具有足够结构化的请求使规划器能够调查仓库并生成真正的实现计划。例如Add optimistic UI updates to the comment form, preserve rollback on server failure, and add tests for the new behavior.一个好的 Late 任务具有具体的功能或错误目标足够的特异性以识别受影响的区域至少一个验证期望因为规划器被指示在规划之前先探索这种任务效果很好。然后让规划器映射仓库并编写implementation_plan.mdLate 的规划提示指示主编排器读取文件、追踪逻辑、识别约束然后将结构化的 Markdown 计划保存到implementation_plan.md。这个先计划后执行的产物是系统最强大的部分之一。你可以检查它、质疑它或稍后从中恢复。然后你可以批准计划。Late 的规划器应该在执行之前请求批准这是你作为开发人员应该像对待初级工程师的提案一样做的事情检查文件是否合理检查是否包含测试检查是否缺少约束在代码被触碰之前拒绝或完善一旦批准每个步骤被委派给一个编码子 agent。这是 Late 与大多数 agent CLI 不同之处。规划器不应自己执行编辑而是为计划的一个步骤生成一个编码子 agent。子 agent 获得一个有界的目标以及可选的选定上下文文件。它读取所需内容通过原生工具编辑并返回摘要。因为规划器只获得步骤的摘要而不是整个嘈杂的实现追踪它保持了更清晰的整体项目状态表示。这就是架构与较小本地模型配合良好的全部原因。9、Worktree 支持Late 还暴露了 worktree 命令late worktree listlate worktree create path [branch]late worktree remove pathlate worktree active这些命令在cmd/late/main.go中连接用于隔离的并行开发。不是一个 agent 在一个工作树上来回折腾你可以以匹配人类工程师降低合并风险的方式隔离分支和实验。10、配置工具和 MCPLate 包含两个有用的配置界面。10.1 工具配置internal/config/config.go显示 Late 在用户配置目录下查找配置文件并默认预填充启用的工具read_filewrite_filetarget_editspawn_subagentbash配置结构的简化示例如下{ enabled_tools: { read_file: true, write_file: true, target_edit: true, spawn_subagent: true, bash: true } }如果你想在更严格的环境中硬禁用 bash 或其他功能这很有用。10.2 MCP 配置Late 还支持 MCP 服务器配置文件。在internal/mcp/config.go中加载器首先检查项目级.late/mcp_config.json然后检查 Late 配置目录下的用户级配置。每个服务器条目支持command、args、env和disabled。最小形状如下{ mcpServers: { my-server: { command: /path/to/mcp-server, args: [--stdio], env: { TOKEN: ${MY_TOKEN} } } } }MCP 集成将外部服务器映射到工具接口同时避免大规模 token 膨胀。这与 Late 的总体理念一致在运行时将 agent 连接到能力而不是永远膨胀规划器上下文。11、寻找工具链理念的 Agent 构建者即使你从不直接使用 Late它也为如何构建规划器/工作者系统提供了强大的模式。从 Late 中获取的最重要的东西是代理式编码产品的质量同样取决于编排架构和底层模型的前沿性能。这意味着如果你正在构建自己的 agent 平台你应该花更多时间在以下问题上哪个线程拥有架构决策哪个线程拥有编辑什么状态是持久的什么状态是可丢弃的计划如何外化工具如何失败我们如何防止上下文污染我们如何让工作者即时获取上下文哪些能力是继承的哪些是故意阻止的安全的、可检查的执行循环是什么样的这些是软件架构问题不是模型基准测试问题。这就是为什么即使你从不运行 Late它也是相关的。它指向了一种更成熟的构建面向开发者的 agent 的方式一种假设模型是更大系统的一部分而不是整个系统的方式。原文链接Late本地优先的编程智能体 - 汇智网

相关文章:

Late:本地优先的编程智能体

如果能在 5GB 显存上使用本地 Qwen3.5-35B-A3B 编排代码库(通过 llama.cpp 达到约 25-30 tokens/sec,65k 上下文,其余层卸载到系统内存),你觉得如何? 更妙的是,两个并行的 agent 实例可以舒适地…...

高效使用NotebookLM的5种方法

如果你曾经被笔记、PDF、研究论文,甚至自己的想法弄得焦头烂额,那么谷歌的 NotebookLM 很可能会成为你最喜欢的新工具。 你可以把它想象成一个智能研究助手,它不仅真正理解你的文档,还能帮助你更好地思考,而不仅仅是更…...

Qianfan-OCR效果分享:培训教材PPT→知识点分级+案例引用+习题答案结构化

Qianfan-OCR效果分享:培训教材PPT→知识点分级案例引用习题答案结构化 1. 工具概览 Qianfan-OCR是基于百度千帆InternVL架构开发的单卡GPU专属文档解析工具,专为解决教育培训场景中的复杂文档解析需求而设计。与传统OCR工具不同,它不仅能识…...

使用FCM进行编码解码

文章目录1 FCM到底是什么?2 为什么论文里要用FCM?3 FCM输出的两个核心结果是什么?1. prototype / cluster centers2. membership matrix4 FCM到底在优化什么?5 FCM是怎么一步一步算出来的?第一步:先定簇数 c第二步:初始化隶属度矩阵第三步&#xff…...

TuShare的注册和使用

前言 TuShare是比较知名的证券第三方数据提供网站,最近我被试用各种爬虫搞烦了。打算花点钱直接试用第三方的数据看看。 1、TuShare上账号的注册 打开TuShare网址 https://tushare.pro/2、安装Tushare对应的包 Pip install tushare如果安装途中有断开的话&#xff0…...

在PyCharm的Django工程中修改初始页

1、原始的初始页2、setting.py中添加应用在quiz_site的setting.py 进行应用到的设置(对应的是一个根目录下的文件夹)3、Quiz_site\urls.py中的设置4、修改quiz/urls.py修改后的内容如下:5、views.py的设置如图:6、建立主页在quiz目…...

全栈编程基础知识8

全栈编程基础知识81.Redis1.介绍:基于C语言。开发的一款nosql数据库,基于内存的,读写快,支持多种数据类型。存的是键值对。2.类型:string list hash set bitmap,sorted set等。支持事务,lua脚本…...

大模型RAG (三)

一、文档的加载和分割1、文档LLM回复系统搭建2、把文本切分成chunks把文本切分成chunks的方式有很多种: 1.按照句子来切分 2.按照字符数来切分 3.按固定字符数结合overlapping window 4. 递归方法 RecursiveCharacterTextSplitter案例1: 按照句子来切分import retxt…...

航空特色学校建设实施方案

【核心亮点】1. "三维一体"课程体系:● 基础课(航空原理/飞行启蒙) 专项课(模拟飞行、航模制作、无人机编程) 学科融合课(航空物理/美术/编程),覆盖全学段。● 自主研发校…...

学工平台变革之旅:从管理到成长赋能,真正为学生点亮前行之路

✅作者简介:合肥自友科技 📌核心产品:智慧校园平台(包括教工管理、学工管理、教务管理、考务管理、后勤管理、德育管理、资产管理、公寓管理、实习管理、就业管理、离校管理、科研平台、档案管理、学生平台等26个子平台) 。公司所有人员均有多…...

智慧校园的权限管控,如何按角色精准设置操作范围?

✅作者简介:合肥自友科技 📌核心产品:智慧校园平台(包括教工管理、学工管理、教务管理、考务管理、后勤管理、德育管理、资产管理、公寓管理、实习管理、就业管理、离校管理、科研平台、档案管理、学生平台等26个子平台) 。公司所有人员均有多…...

Java 25虚拟线程性能断崖式跃迁:阿里云真实订单链路压测数据(RT从412ms→23ms,附全链路火焰图)

第一章:Java 25虚拟线程演进脉络与高并发架构新范式Java 25正式将虚拟线程(Virtual Threads)从预览特性转为标准特性,标志着JVM并发模型进入“轻量级线程即原语”时代。这一转变并非孤立演进,而是历经Project Loom多年…...

【毕设】城镇保障性住房管理系统

💟博主:程序员俊星:CSDN作者、博客专家、全栈领域优质创作者 💟专注于计算机毕业设计,大数据、深度学习、Java、小程序、python、安卓等技术领域 📲文章末尾获取源码数据库 🌈还有大家在毕设选题…...

【毕设】城市公园信息管理系统的设计与实现

💟博主:程序员俊星:CSDN作者、博客专家、全栈领域优质创作者 💟专注于计算机毕业设计,大数据、深度学习、Java、小程序、python、安卓等技术领域 📲文章末尾获取源码数据库 🌈还有大家在毕设选题…...

从dbus-send到busctl:手把手教你迁移到更现代的D-Bus调试工具链

从dbus-send到busctl:现代D-Bus调试工具链迁移实战指南 如果你曾经在Linux系统中与D-Bus打交道,那么对dbus-send这个老牌命令行工具一定不陌生。它就像一把瑞士军刀,虽然功能全面但用起来总有些笨拙——复杂的参数构造、晦涩的输出格式、缺乏…...

DevExpress GridControl单元格合并后无法编辑?一个属性帮你避开这个坑

DevExpress GridControl单元格合并实战:解决编辑冲突与高级应用 当我们在企业级应用开发中使用DevExpress的GridControl时,单元格合并是一个常见的可视化需求。想象一下这样的场景:你的财务系统需要展示客户交易记录,而同一个客户…...

别再只会用Canny了!深入对比Sobel、Prewitt、LoG:OpenCV边缘检测算法选型与避坑指南

边缘检测算法深度解析:从Sobel到Canny的工程实践指南 在计算机视觉领域,边缘检测是图像处理中最基础也最关键的步骤之一。许多开发者习惯性地将Canny算子作为默认选择,却忽略了其他算法在不同场景下的独特优势。本文将带您深入理解主流边缘检…...

我的模型总在测试集翻车?可能是数据增强的‘姿势’不对!聊聊那些年我们踩过的坑

模型测试集翻车?数据增强的六大陷阱与实战解决方案 当你满怀期待地将精心调参的模型投入测试集,却发现性能断崖式下跌——这种挫败感每个算法工程师都深有体会。上周团队里一位资深研究员盯着0.23的测试F1分数苦笑:"训练集明明98%准确率…...

MATLAB优化实战:从fminsearch到fmincon的工程问题求解

1. MATLAB优化工具箱入门:从实际问题到数学模型 第一次接触MATLAB优化工具箱时,我被它强大的功能震撼到了。记得当时正在做一个机械臂参数标定的项目,需要根据实验数据反推关节参数。这个问题本质上就是个典型的无约束优化问题,正…...

**链路追踪实战:用Go语言打造分布式系统的“心跳图谱”**在微服务架构日益普及的今天,一

链路追踪实战:用Go语言打造分布式系统的“心跳图谱” 在微服务架构日益普及的今天,一个请求可能跨越多个服务、几十个中间件甚至上百个节点。当问题出现时,传统的日志排查方式早已力不从心。这时,链路追踪(Tracing&am…...

第三章 低通滤波(LPF)

一 应用场景及公式当负载设备VCC需要的电压是1V,但是我们有12V的电压时,就需要使用电阻分压。问题:非理想环境中12V的电压会有波动(噪声)的,故而分出来1V电压也是有噪声的。1.1 容抗公式 :容抗&#xff08…...

PostgreSQL WITH 子句详解

PostgreSQL WITH 子句详解 引言 在数据库查询中,WITH 子句(也称为公用表表达式或 Common Table Expressions,简称 CTE)是一种强大的工具,它允许开发者将查询结果集作为子查询或临时表使用。WITH 子句在 PostgreSQL 中有…...

FPGA实战:手把手教你用Verilog实现有符号数的四舍五入(附完整代码与仿真)

FPGA实战:手把手教你用Verilog实现有符号数的四舍五入(附完整代码与仿真) 在数字信号处理领域,有符号数的四舍五入是一个看似简单却暗藏玄机的操作。许多初学者在处理负数时常常会遇到意想不到的结果,这是因为负数的四…...

工业级3D打印机季度出货回暖,入门级市场再创新高

当行业讨论从“技术突破”逐渐转向“规模落地”,全球3D打印市场正在经历一轮更深层次的结构调整。从TCT Asia 2026现场的热度变化,到厂商战略重心的转移,可以明显感受到:增长的引擎正在重塑,市场逻辑也在悄然变化。而C…...

基于鸿蒙Electron框架的物体碰撞效果测试应用开发详解

欢迎加入开源鸿蒙PC社区: https://harmonypc.csdn.net/ atomgit开源仓库地址: https://atomgit.com/feng8403000/game_Collisioneffect 示例效果 基于鸿蒙Electron框架的物体碰撞效果测试应用开发详解示例效果技术栈选择前端技术后端技术技术优势应用功…...

淘宝图片搜索API:通过图片地址获取淘宝相似商品

下面给你一份可直接用于开发、解析、入库的淘宝图片搜索API 完整解析,包含标准返回结构、关键字段、解析要点、常见坑。一、接口基本信息接口名:taobao.item_search_img作用:通过图片url搜索相似商品,平台外图片地址可先用taobao.…...

FRED应用:模拟沃拉斯顿棱镜偏振器

介绍沃拉斯顿棱镜偏振器包含两个由单轴晶体构成的直角棱镜,如方解石,它经常用于沃拉斯顿棱镜中。两块单轴晶体是定向的,使得晶轴互相垂直。如下图所示的几何结构,水平偏振光在第一个区域中以非寻常折射率(ne&#xff0…...

多元线性回归实战:逐步回归的自动化变量筛选

1. 多元线性回归中的变量筛选难题 做数据分析的朋友们肯定都遇到过这样的困扰:手头有一大堆可能影响结果的变量,但不知道哪些才是真正有用的。比如预测房价时,可能有面积、房龄、地段、装修等几十个因素,全扔进模型不仅计算量大&a…...

从实验室到量产车:BEVFusion多传感器融合方案的落地挑战与调优实战

从实验室到量产车:BEVFusion多传感器融合方案的落地挑战与调优实战 自动驾驶技术正经历从原型验证到规模化量产的跨越,而多传感器融合作为环境感知的核心环节,其工程化落地面临诸多现实挑战。BEVFusion框架通过统一的鸟瞰图(BEV&a…...

Hypnos-i1-8Bmarkdown输出:自动生成含公式、代码块、步骤编号的结构化报告

Hypnos-i1-8B:自动生成含公式、代码块、步骤编号的结构化报告 1. 模型概述 Hypnos-i1-8B是一款专注于强推理能力和思维链(CoT)表现的8B参数开源大模型。该模型基于NousResearch/Hermes-3-Llama-3.1-8B微调而来,通过量子噪声注入训练技术显著提升了在复…...