当前位置: 首页 > article >正文

从零入门 LangChain:Python 语法详解 + 工具开发 + 结构化输出实战

一、LangChain 宏观定义LangChain 是大模型与实际AI应用之间的桥梁。裸调用API淌水过河需手动处理底层细节开发繁琐。使用LangChain走桥过河封装通用能力消息管理、工具调用等降低开发成本。二、大模型核心概念2.1 模型海量数据中总结规律的程序/函数传统模型多单任务专精。2.2 大语言模型LLM基于万亿级参数神经网络以自监督/半监督方式训练的通用语言模型。大规模神经网络海量参数模拟人脑神经元动态调整权重习得能力。自监督学习无标准答案通过文本掩码、上下文预测自学。半监督学习少量标注数据打底海量无标注数据自我迭代。核心能力基于上下文预测后续文本输出人类可读语言。2.3 大模型定位大模型AI大脑自带通用知识LangChain补充实时信息、外部工具、记忆、结构化输出。三、提示词工程核心核心原则严格限定范围、角色、规则、格式消除模糊输出。CO-STAR 原则Context上下文、Objective目标、Step步骤、Tone口吻、Audience受众、Response输出格式少样本提示示例标准答案复刻逻辑。思维链完整推理步骤示例引导分步思考。零样本结尾加“请一步一步写出思考过程”。自我批评迭代要求AI按标准自查修正。四、大模型接入方式API-Key调用轻量化、开箱即用隐私性弱。云端SaaS SDK接入适配简单业务。本地私有化部署推荐隐私/复杂场景突破上下文限制、支持私有数据、管控合规性。五、LangChain 核心代码实战含Python语法解释5.1 基础消息模型调用核心消息类型SystemMessage系统角色、HumanMessage用户请求、AIMessage模型响应fromlangchain_core.messagesimportHumanMessage,SystemMessagefromlangchain_openaiimportChatOpenAIfromlangchain_core.output_parsersimportStrOutputParser# 初始化模型Python关键字参数config配置推荐环境变量避免硬编码modelChatOpenAI(modelqwen-turbo,# 模型名称Python字符串参数# temperature随机性0~2Python浮点型越高越发散)# 消息列表Python列表存储消息对象messages[SystemMessage(将英文翻译成通顺中文),HumanMessage(hi!)]# 调用解析Python对象方法调用resultmodel.invoke(messages)# invoke方法传入消息列表获取响应parserStrOutputParser()# 实例化解析器Python类实例化print(parser.invoke(result))# 解析响应并打印Python打印函数5.2 LCEL 链式调用(LangChain Expression Language)借鉴Linux管道思想| 运算符重载串联可运行组件Python运算符重载语法# 链式简写| 管道符串联模型与解析器chainmodel|parser retchain.invoke(messages)# 链式调用简化代码# 等价写法Python对象构造两种方式fromlangchain_core.runnablesimportRunnableSequence chain1RunnableSequence(firstmodel,lastparser)# 关键字参数构造chain2model.pipe(parser)# 实例方法调用5.3 统一模型初始化 init_chat_model统一入口创建多厂商模型支持运行时动态配置参数fromlangchain.chat_modelsimportinit_chat_model# 初始化可配置模型Python关键字参数指定可配置字段config_modelinit_chat_model(modeldeepseek-chat,temperature1.0,configurable_fields[model,temperature],# 可动态修改的参数Python列表config_prefixllm)# 调用时临时修改参数Python嵌套字典传参resconfig_model.invoke(你好,config{configurable:{llm_temperature:0.3}})六、LangChain 工具系统6.1 工具作用打破大模型知识截止、封闭无法联网的局限扩展外部能力。6.2 自定义工具开发含三种Schema参数描述方案完整代码核心三要素函数类型注解标准文档注释自动生成工具Schema。方案1基础tool装饰器 Google风格文档注释简单工具首选Python函数注解指定参数/返回值类型、文档字符串说明函数用途与参数fromlangchain_core.toolsimporttool# tool装饰器将普通Python函数转为LangChain工具tooldefmultiply(a:int,b:int)-int:# 类型注解a、b为int返回值为intPython语法 multiply two integers Args: a: First Integer b: Second Integer returna*b# 工具调用Python字典传参key对应函数参数名print(multiply.invoke({a:2,b:3}))print(multiply.name)# 查看工具名称工具对象属性print(multiply.description)# 查看工具描述来自文档注释print(multiply.args)# 查看工具参数自动解析方案2Pydantic BaseModel Field复杂结构化参数Python类继承继承BaseModel、Field校验指定参数描述与约束frompydanticimportBaseModel,Fieldfromlangchain_core.toolsimporttool# Pydantic输入模型Python类继承定义参数结构classmultiplyInput(BaseModel):this function multiply two number# Field指定参数描述...表示必填Pydantic语法a:intField(...,descriptionfirst arg)b:intField(...,descriptionsecond arg)# 绑定Schema通过args_schema参数关联Pydantic模型tool(args_schemamultiplyInput)defmultiply(a,b)-int:# 无需重复写类型注解由Schema提供returna*b方案3Annotated Field无额外类轻量化Python类型注解扩展Annotated直接为参数添加描述无需额外定义类fromtyping_extensionsimportAnnotatedfromlangchain_core.toolsimporttoolfrompydanticimportField# Annotated为参数添加类型描述Python类型注解扩展tooldefadd(a:Annotated[int,Field(...,descriptionFirst Arg)],b:Annotated[int,Field(...,descriptionSecond Arg)])-int:add two integerreturnab6.3 工具绑定与调用流程# 工具绑定Python列表传入工具bind_tools方法绑定tools[add,multiply]model_with_toolmodel.bind_tools(tools)# 构造消息Python列表存储消息msg_list[HumanMessage(100*20等于多少)]ai_msgmodel_with_tool.invoke(msg_list)# 遍历执行工具Python for循环遍历tool_callsforcallinai_msg.tool_calls:# 字典映射根据工具名称获取对应工具Python字典取值tool{multiply:multiply}[call[name]]tool_restool.invoke(call)# 执行工具msg_list.append(tool_res)# 结果加入消息列表# 最终整合回答final_resmodel_with_tool.invoke(msg_list)这里工作可以分成三部分将工具绑定到模型将用户请求交给绑定后的模型由此解析出调用工具及相应参数。这个过程中并不执行工具只是为真正的工具调用做准备这也是为什么 AIMessage 中 content 为空现在我们有了 LLM 提供的工具调用信息接下来在本地调用工具。把 LLM 返回的调用信息交给包装好的工具就完成调用了。返回的结果是 ToolMessage包含调用结果等接下来将 ToolMessage 和最初的请求再交给 LLM由 LLM 组织成最后的回答七、结构化输出通过with_structured_output强制约束输出格式支持4种方式适配业务序列化需求。7.1 Pydantic 嵌套模型最常用支持嵌套frompydanticimportBaseModel,FieldfromtypingimportList,Optional# Python类型提示List表示列表Optional表示可选# 嵌套Pydantic模型Python类继承支持嵌套定义classJoke(BaseModel):给用户讲一个笑话 setup:strField(description笑话的开头)# str类型必填punchline:strField(description笑话的笑点)# Optional[int]可选int类型默认Nonerating:Optional[int]Field(defaultNone,description笑话的评分(1~10))classJokes(BaseModel):给用户提供的几个笑话# List[Joke]列表类型元素为Joke模型Python类型提示jokes:List[Joke]Field(description笑话的合集)# 绑定结构化输出传入Pydantic模型指定输出格式model_structured_outputmodel.with_structured_output(Jokes)message[HumanMessage(分别讲一个关于唱歌和跳舞的笑话)]resultmodel_structured_output.invoke(message)print(result)# 直接返回模型对象可通过属性取值Python对象属性访问7.2 TypedDict 结构化轻量字典类型约束fromtyping_extensionsimportTypedDict,AnnotatedfrompydanticimportField# TypedDict轻量字典类型约束Python字典类型提示classJoke(TypedDict):# Annotated为字典键添加描述无需实例化直接约束类型setupAnnotated[str,笑话的开头]punchlineAnnotated[str,笑话的笑点]ratingAnnotated[Optional[int],Field(defaultNone,description笑点评分(1~10))]# 绑定结构化输出include_rawTrue返回原始输出model_structured_outputmodel.with_structured_output(Joke,include_rawTrue)message[HumanMessage(讲一个关于跳舞的笑话)]resultmodel_structured_output.invoke(message)7.3 JSON Schema 直接定义自定义JSON格式# Python字典定义JSON Schema指定字段类型、描述、必填项json_schema{title:joke,description:给用户讲一个笑话。,type:object,properties:{setup:{type:string,description:这个笑话的开头,},punchline:{type:string,description:这个笑话的妙语,},rating:{type:integer,description:从1到10分给这个笑话评分,default:None,},},required:[setup,punchline],# 必填字段Python列表}# 绑定JSON Schemamodel_structured_outputmodel.with_structured_output(json_schema)message[HumanMessage(讲一个关于跳舞的笑话)]resultmodel_structured_output.invoke(message)7.4 Union 联合类型多格式兼容fromtypingimportUnion# Python联合类型支持多种类型兼容classStandard(BaseModel):# Union[Dialog, Joke]输出可为Dialog或Joke类型Python联合类型提示output:Annotated[Union[Dialog,Joke],Field(description最后输出内容的要求)]八、流式传输Python迭代器/协程/生成器8.1 基础流式 stream同步迭代器chunks[]# for循环遍历迭代器Python迭代器语法forchunkinmodel.stream(讲一个长笑话):chunks.append(chunk)# 收集所有块Python列表append方法print(chunk.content,end,flushTrue)# 实时打印flushTrue刷新缓冲区8.2 异步流式 astream协程高并发importasyncio# Python异步模块# 异步函数async def定义Python协程语法asyncdefasync_output():# async for遍历异步迭代器Python异步迭代语法asyncforchunkinmodel.astream(讲一个言情小故事):print(chunk.content,end,flushTrue)asyncio.run(async_output())# 运行协程Python异步运行方法8.3 自定义流式解析器生成器yieldfromtypingimportIterator# Python迭代器类型提示# 自定义解析器生成器函数yield关键字生成迭代器Python生成器语法defdefined_parser(input:Iterator[str])-Iterator[str]:bufferforchunkininput:bufferchunk# 按中文标点切割Python字符串操作index找下标、切片whileinbufferor。inbuffer:ifinbuffer:stop_indexbuffer.index()yieldbuffer[:stop_index].strip()# yield生成每一块内容bufferbuffer[stop_index1:]elif。inbuffer:stop_indexbuffer.index(。)yieldbuffer[:stop_index].strip()bufferbuffer[stop_index1:]yieldbuffer.strip()# 生成最后一块内容# 链式调用自定义解析器parserStrOutputParser()chainmodel|parser|defined_parserforchunkinchain.stream(写一首关于爱情的诗歌):print(chunk)九、关键优化建议密钥管理API_KEY、BASE_URL存入环境变量/.env禁止硬编码。参数调优temperature0严谨场景0.7~1.2创意场景。工具开发注释清晰提升调用准确率。生产优先结构化输出工具调用本地部署保障隐私与稳定。

相关文章:

从零入门 LangChain:Python 语法详解 + 工具开发 + 结构化输出实战

一、LangChain 宏观定义 LangChain 是大模型与实际AI应用之间的桥梁。裸调用API:淌水过河,需手动处理底层细节,开发繁琐。使用LangChain:走桥过河,封装通用能力(消息管理、工具调用等)&#xff…...

Weka机器学习实战:7天掌握核心技巧与应用

1. Weka机器学习迷你课程概述Weka作为一款开源的机器学习工具集,已经成为了学术界和工业界入门机器学习的经典选择。这套迷你课程的设计初衷,是帮助学习者在最短时间内掌握Weka的核心功能和应用技巧。不同于市面上冗长的教程,我们聚焦于"…...

2.6万亿天量成交却跌破4100点!A股这波“性能调优”,咱们程序员该怎么看懂?

大家好,我是Kyle,今天收盘估计不少持仓的兄弟跟我一样,看着K线的波动,心跳频率都跟着大盘震荡走了——这行情,简直比线上服务高峰期的QPS波动还刺激。先给大家上最新的“生产环境数据”:今天两市成交量干到…...

mysql如何安全地删除数据库账号_使用DROP USER命令清理

...

CSS如何处理CSS颜色模式不兼容_通过fallback定义标准颜色值

...

ASPICE Level 1到Level 5升级打怪全解析:你的团队到底卡在哪一级?如何制定改进路线图

ASPICE能力跃迁实战指南:从流程混沌到数据驱动的五步进化论 当德国汽车制造商将一份ASPICE Level 3的合规要求扔到会议桌上时,某零部件供应商的研发VP发现团队连基础的需求追溯矩阵都凑不齐——这个场景正在全球汽车供应链重复上演。ASPICE框架像一面照妖…...

别再乱写时钟使能了!手把手教你用Verilog实现无毛刺的Clock Gating(附完整代码)

数字IC设计实战:Verilog无毛刺时钟门控技术深度解析 时钟信号在数字电路中如同心脏般持续跳动,但这份"活力"也带来了惊人的功耗代价。某次流片后的功耗分析让我记忆犹新——一个中等规模的SoC芯片中,时钟网络竟吞噬了总功耗的42%。…...

AI 在软件开发中的角色:工具、场景、效率与未来趋势深度研究报告

核心摘要与关键发现截至 2026 年 4 月,人工智能(AI)已从软件开发的 “辅助工具” 演进为 “核心协同引擎”—— 这一转变并非线性的功能增强,而是软件工程范式的根本性重构:AI 不再是简单的代码补全工具,而…...

AI Scientist-v2:智能体树搜索驱动的自动化科研系统部署与实战

1. 项目概述:当AI成为“科学家” 想象一下,你给一个AI系统一个模糊的研究方向,比如“探索小样本学习在图像分类中的新方法”,然后它就能自己提出具体的假设、设计并运行实验、分析数据,最终生成一篇结构完整、逻辑自洽…...

LSGAN原理与Keras实现:解决GAN训练梯度消失问题

1. LSGAN基础概念与核心优势在传统GAN训练过程中,鉴别器(Discriminator)使用Sigmoid交叉熵损失函数,这容易导致梯度消失问题——当生成样本与真实样本差距较大时,梯度会变得非常小,使得生成器(G…...

[AutoSar]BSW_Memory_Stack_007 FEE 模块核心机制:顺序写入与翻页策略详解

1. FEE模块在AutoSar架构中的核心作用 在汽车电子系统中,数据存储的可靠性直接关系到车辆功能的正常运行。FEE(Flash EEPROM Emulation)作为AutoSar BSW层的关键模块,承担着模拟EEPROM存储行为的重要职责。不同于传统EEPROM芯片&a…...

从游戏机制实战出发:用UE5的碰撞与重叠,5分钟实现一个‘拾取道具’和‘推开木箱’功能

从游戏机制实战出发:用UE5的碰撞与重叠实现道具拾取与物理推动 在独立游戏开发中,快速验证核心玩法是原型设计阶段的关键。虚幻引擎5(UE5)的物理交互系统为开发者提供了强大的工具集,但如何精准运用碰撞(Co…...

别再手动翻页了!给Ant Design Vue2的a-calendar日历加上『上一月/下一月』按钮(附完整代码)

深度定制Ant Design Vue2日历组件:打造高效月份切换体验 在后台管理系统开发中,日历组件是日程管理、数据看板和内容排期的核心交互界面。Ant Design Vue2的a-calendar组件虽然功能完善,但在全屏模式下缺乏直观的月份切换按钮,用户…...

应对设计高峰期的Allegro的license峰值管理技巧

待激活的“隐形财富”:破解Allegro license高峰瓶颈的实战经验你是并非也常常听到工程师在项目关键时刻喊:“又抢不到许可证了!”项目急着出图,偏偏授权全被占用,这事儿干过,也见过太多。你有还没有想过你买…...

Citrix虚拟桌面与应用程序许可证管理综合分点指南

Citrix虚拟桌面及应用程序许可证管理综合分点指南我上个月在给一家汽车零部件厂做系统审计时,愣是被一道软件许可的分配问题卡了整整一天。工程师说找不到授权,结果IT瞅见许可不算满,可就是没人能拿到。这事儿把我等全部人都给整懵了。到头来…...

UE Water插件进阶:从静态浮力到动态驾驶的物理系统全解析

1. 从静态浮力到动态驾驶的完整工作流 当你第一次使用UE Water插件让物体在水面漂浮时,那种成就感确实让人兴奋。但很快你会发现,这只是一个开始。真正的挑战在于如何让这个漂浮的物体变成一艘可以自由驾驶、与水波互动、甚至产生尾迹的船只。这就像从学…...

高密度机柜满载怎么办?热管理的“最后一厘米”:两相液冷

核心要点摘要:AI算力爆发,单机柜功率突破30kW甚至120kW,传统风冷与单相液冷已难以支撑芯片持续满载运行。客户真正的痛点不是“能不能开机”,而是“能不能持续满载”。两相液冷利用相变潜热,实现1.5℃精准控温&#xf…...

为什么建议所有程序员,尽早布局大模型技术栈

文章目录前言一、先问个扎心的问题:你写的CRUD,到底还能写几年?1.1 2026年的程序员圈,一半是海水一半是火焰1.2 大模型不是风口,是软件开发的基础设施革命二、别再被误区困住!普通程序员入局大模型&#xf…...

自动驾驶基础:感知、决策、控制三层解析

文章目录前言一、自动驾驶的灵魂之眼:感知层1.1 感知层的核心使命:把物理世界翻译成AI能读懂的语言1.2 感知层的硬件:AI司机的“五官”1.2.1 摄像头:AI司机的“主眼”,负责看懂世界1.2.2 激光雷达:AI司机的…...

后端转智能体开发有多香 核心技能无缝衔接

文章目录前言一、别再被忽悠了!智能体开发,根本不是算法岗的专利二、后端转智能体有多香?这6大核心技能,直接无缝衔接2.1 接口调用与封装能力:智能体开发的基本功,你早就玩透了2.2 业务逻辑与流程编排能力&…...

WebStorm已经过期的重置方法

1、删除整个文件夹:%APPDATA%\JetBrains\WebStormXXXX.X 2、删除整个文件夹:%LOCALAPPDATA%\JetBrains\WebStormXXXX.X 3、删除注册表:\HKEY_ CURRENT_ USER\Software\JavaSoft\Prefs\jetbrains\webstormIDEA应该也一样...

R语言列表与数据框:数据处理核心技巧

1. R语言中的列表与数据框:从基础到实战作为一名长期使用R进行数据分析的从业者,我深刻理解列表(list)和数据框(data.frame)这两个数据结构在实际工作中的重要性。它们不仅是R语言的核心容器类型,更是数据整理、清洗和分析的基础工具。本文将…...

代码生成器使用:从手写单表 CURD 到自动生成多表业务

🎯 一、前言:为什么要用代码生成器上一节我们学会了手写单表 CURD,但在实际开发中,如果要做多张类似单表,一直手写会出现很多问题:📝 大量重复代码:Controller、Service、Mapper 几乎…...

LeetCode 热题 100 -- 295.数据流的中位数

1、题目分析题目要求实现MedianFinder类,构造函数可以将数据流中的整数num添加到数据结构中,成员方法findMedian()可以返回到目前为止所有元素的中位数。要考虑到偶数个数和奇数个数的情况。中位数就是有序整数列表中的中间值,那么要找出中位…...

“探索型 AI“和“交付型AI“是两个完全不同的物种 [特殊字符]

"探索型 AI"和"交付型 AI"是两个完全不同的物种 🧬 大家好,我是 AI 研究员阿满 🌸 今天聊一个我自己瞎编的词——不是什么学术界黑话,就是我用了一年 AI 之后的真实体感: "探索型 AI"和…...

史诗级更新!我把ComfyUI资产库重写了!除了素材管理,还有图片差异对比、视频差异对比、导出工作流...

一、资产库 1.资产库功能讲解 基本功能:在ComfyUI中内置的资产库可以方便查看导入和生成的各类资产,包括图片、视频和音频文件。 使用限制:当前功能尚不稳定且功能单一,有时会出现内容显示不出来的情况。 功能增强:在…...

Zig之数值运算与操作

Zig 追求的是显式性(Explicitness)和对硬件行为的精确控制。 类型 整数 Zig 支持任意位宽的整数。通过在 u(无符号)或 i(有符号)后加上数字即可定义,例如 i7 代表有符号的 7 位整数。整数类型允许的最大位宽为 65535。 硬件对齐:当需要操作非标准硬件(如网络协议中…...

解析CSS变换矩阵的技巧与最佳实践

在前端开发中,CSS变换(Transform)是实现动画和布局调整的重要工具。今天我们将探讨如何从JavaScript中获取并解析一个元素的CSS变换矩阵,并讨论一些最佳实践。 背景 假设我们有一个HTML元素,其CSS设置了如下变换: transform: translateY(-560px);当我们试图通过JavaSc…...

TX141F 双极锁存型霍尔位置传感器

产品特点 ● 双极锁存型霍尔效应传感器 ● 宽的工作电压范围: 3.8V~30V ● 集电极开路输出 ● 最大输出灌电流:50mA ● 电源反极性保护 ● 工作温度:-40℃~125℃ ● 封装形式: SIP3L(TO92S) 典型应用 ● 直流无刷电机 ● 位置控制 ● 安全报警装置 ● 转…...

解读鱼类社会选择模型中的秩缺陷问题

在统计学和数据分析中,秩缺陷(rank deficiency)是一个常见的挑战,特别是在处理复杂的交互效应模型时。让我们通过一个实际案例,探讨如何解决在R语言中构建的广义线性混合模型(GLMM)中的秩缺陷问题。 案例背景 假设我们正在研究鱼类的社会选择行为。我们有五个自变量(…...