当前位置：首页 > news >正文

使用LangChain创建简易聊天机器人

news 2025/12/27 1:39:01

LangChain 是什么

就是一个框架或者说是一个工具，用来写 AI 应用。对，没有错！AI小白也可以，有手就行！

LangChain有几个核心模块：Models、Prompts、Chains、Indexes、Memory、Agents。

这篇主要介绍Models、Prompts这2个最基本的模块。

配置环境

开发之前需要先配置好开发环境变量，我使用Python语言，然后安装LangChain即可。这2项都可以通过pip 命令完成

pip install Python
pip install langchain

Models

LangChain 最核心的功能就是能够集成各种大模型LLM，后续所有的功能实现以及扩展都是基于此功能的基础之上。

云端大模型 API

LangChain 官网列举了它能够集成调用的所有大模型，如下图：

几乎你在网上能看到的模型LangChain都支持。以 OpenAi 使用为例，可以通过以下方式导入并创建OpenAi大模型：

from langchain.llms import OpenAI
llm = OpenAI()

上述代码中的llm 就是创建的OpenAi模型对象。接下来只要传入相应的Prompt(提示词)，并调用invoke方法就可以拿到OpenAi大模型的输出，如下：

response = llm.invoke("List the seven wonders of the world.")
print(response)

"List the seven wonders of the world." 就是传入大模型的Prompt(提示词), response就是调用大模型invoke方法之后的结果，将结果打印出来如下：

1. Great Pyramid of Giza
2. Hanging Gardens of Babylon
3. Temple of Artemis at Ephesus, Turkey
4. Statue of Zeus at Olympia, Greece
5. Colossus of Rhodes, Greece
6. Lighthouse of Alexandria, Egypt
7. Mausoleum at Halicarnassus, Turkey

本地 local 模型

除了 OpenAi 这些收费的大模型之外，LangChain也可以集成本地大模型。以Meta公司的Llama举例。在LangChain官网的支持的大模型介绍中，有如下描述：

可以看出，使用 Llama.cpp 加载本地的gguf格式大模型。

因此我们需要下载一个大模型到电脑本地，我使用的是Mistral的免费模型，可以在 HugginFace 网站中找到，如下：

下载好 gguf 格式大模型文件并保存后，在同级目录下创建langchain_intro.py文件，目录结构如下：

然后在 langchain_intro.py 中导入 LlamaCpp，并创建模型实例。如下：

from langchain_community.llms import LlamaCpp# 声明大模型的路径
MODEL_NAME = 'mistral-7b-instruct-v0.1.Q4_K_M.gguf'# 加载本地 mistal 大模型
llm = LlamaCpp(
model_path=MODEL_NAME,
n_gpu_layers=40,
n_batch=512,  # Batch size for model processing
verbose=False,  # Enable detailed logging for debugging
)

创建好 llm 模型实例之后，就可以构建模型需要的Prompt(提示词)。最终调用 llm 模型的 invoke 方法就可以获取大模型的返回结果了。如下：

question = "What is a good name for a company that makes Chocolate Milk ?"result = llm.invoke(question)
print(result)

最终打印结果如下：

This is an open-ended question, so there are many potential names that could work well depending on your specific vision and goals for the company. Here are some suggestions to get you started:1. Creamy Delight: This name plays off the creamy texture of chocolate milk and suggests a delicious treat.
2. Chocolate Bliss: A simple and straightforward name that captures the pleasure of enjoying chocolate milk.
3. Sweet Milk: This name emphasizes the sweetness of chocolate milk and could appeal to customers who enjoy a sweet drink.
4. Velvet Chocolate: The velvety texture of chocolate milk is highlighted in this name, which also suggests a rich and indulgent taste.
5. Rich and Creamy: This name emphasizes the richness and creaminess of chocolate milk, making it sound like a luxurious treat.
6. Milk Chocolate Dreams: This name plays off the idea of enjoying chocolate milk as a way to escape from everyday stresses and indulge in a sweet moment of bliss.
7. Cocoa Delight: A name that emphasizes the cocoa content of chocolate milk, which could appeal to customers who enjoy the rich taste of

Prompt

在上面加载 LLM 的实例代码中，直接使用了 "What is a good name for a company that makes Chocolate Milk ?" 来当做大模型的文本输入。

但是这种文本输入格式不具备灵活性。比如我们做的大模型应用是根据用户的输入来动态设置制作的产品，也就是将 Chocolate Milk 设置为一个变量。

这就需要 LangChain 中的 Prompts 模块发挥作用。具体通过 PromptTemplate 来创建 Prompt 模版。如下所示：

from langchain_community.llms import LlamaCpp
from langchain.prompts import PromptTemplateMODEL_NAME = 'mistral-7b-instruct-v0.1.Q4_K_M.gguf'# 加载本地 mistal 大模型
llm = LlamaCpp(model_path=MODEL_NAME,n_gpu_layers=40,n_batch=512,  # Batch size for model processingverbose=False,  # Enable detailed logging for debugging
)# 在 question 中添加占位符
question = "What is a good name for a company that makes {product}?"# 构建 PromptTemplate
prompt = PromptTemplate(input_variables=["product"],template=question,
)

可以看到，对 question 进行了修改,主要是添加了占位符{product}。然后创建PromptTemplate实例，并设置LangChain的第一个输入将占位符进行替换。

建好 PromptTemplate 之后，就可以通过LangChain将 LLM 和 prompt 对象进行组合，并调用大模型方法获取结果。如下：

product_name = "candy"
product_format = prompt.format(product=product_name)
print("final prompt is " + product_format)
# 使用 LLM Chain 组合 Prompt 和 LLM
llm_chain = prompt | llm# 执行 llm_chain,并打印结果
answer = llm_chain.invoke(product_name)
print(answer, '\n')

可以看到，设置了 product=candy。最终打印结果如下：

使用 LangChain 实现简易聊天机器人

通过加载 Models，并创建合适的Prompts。我们已经可以调用本地大模型获取相应的输出结果。可以在此基础上，再加上循环接收用户输入。并将输入设置到 PromptTemplate 中，并最终从本地大模型中获取结果。完整代码如下：

from langchain_community.llms import LlamaCpp
from langchain.prompts import PromptTemplateMODEL_NAME = 'mistral-7b-instruct-v0.1.Q4_K_M.gguf'# 加载本地 mistal 大模型
llm = LlamaCpp(model_path=MODEL_NAME,n_gpu_layers=40,n_batch=512,  # Batch size for model processingverbose=False,  # Enable detailed logging for debugging
)# 在 question 中添加占位符
question = "What is a good name for a company that makes {product}?"# 构建 PromptTemplate
prompt = PromptTemplate(input_variables=["product"],template=question,
)# 使用 LLM Chain 组合 Prompt 和 LLM
llm_chain = prompt | llmprint("请输入产品名称:")while True:# 由用户输入 product_name,并设置到PromptTemplate中product_name = input("> ")product_format = prompt.format(product=product_name)print("final prompt is " + product_format)# 执行 llm_chain,并打印结果answer = llm_chain.invoke(product_name)print(answer, '\n')

运行效果如下：

如果你喜欢本文

长按二维码关注

使用LangChain创建简易聊天机器人

LangChain 是什么就是一个框架或者说是一个工具，用来写 AI 应用。对，没有错！AI小白也可以，有手就行！ LangChain有几个核心模块：Models、Prompts、Chains、Indexes、Memory、Agents。这篇主要介绍Models、…...

编程日记 2024/5/15 9:31:54

研究生学习---找工作

规划研一~研二上学期完成小论文，实习，秋招竞赛：kaggle？ 面试题一般简单且为原题，笔试题目很难，不会出原题项目找工作软件...

编程日记 2024/5/15 9:30:53

偶然发现了Python的一个BUG。。。

一般情况下，dict(id1, **{id: 1})这句代码应该报TypeError。但如果在捕获了其他异常的情况下，再来执行这句代码，却是会报KeyError，如下图： Python3.10和Python3.9也能复现该情况，正当我摩拳踩掌&#xff0c…...

编程日记 2024/5/15 9:28:49

36. 有效的数独 - 力扣(LeetCode)

基础知识要求： Java：方法、for循环、if判断、数组 Python： 方法、for循环、if判断、列表、集合题目： 请你判断一个 9 x 9 的数独是否有效。只需要根据以下规则 ，验证已经填入的数字是否有效即可。数字 1-9 在每一…...

编程日记 2024/5/15 9:27:48

开源收银系统在服装连锁店中发挥的重要作用

在当今竞争激烈的零售市场中，服装连锁店面临着日益复杂的经营环境和多样化的消费需求。在这样的背景下，开源收银系统成为了服装连锁店管理的关键利器。该系统不仅提供了高效的收银功能，还涵盖了进销存管理、会员管理、门店补货等多方面功能&a…...

编程日记 2024/5/15 9:25:46

代码随想录三刷day51

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、力扣200. 岛屿数量二、力扣695. 岛屿的最大面积三、力扣1020. 飞地的数量四、力扣130. 被围绕的区域前言依然是从地图周边出发，将周边空格相邻…...

编程日记 2024/5/15 9:22:42

基于python+Django的二维码生成算法设计与实现

博主介绍： 大家好，本人精通Java、Python、C#、C、C编程语言，同时也熟练掌握微信小程序、Php和Android等技术，能够为大家提供全方位的技术支持和交流。我有丰富的成品Java、Python、C#毕设项目经验，能够为学生提供各类…...

编程日记 2024/5/15 9:21:41

pytorch 2.0 多线程并行，导致GPU利用100%，卡住

背景： 程序中有pytorch模型两个，yolov5，crnn。之前无论是pth格式，还是TRT格式，并行的都没有问题。最近发现，多线程ThreadPoolExecutor(max_workers2)调用的时候，即单个进程内处理一张图像&a…...

编程日记 2024/5/15 9:19:38

后端开发面经系列 -- 阿里C++二面面经

阿里C二面面经公众号：阿Q技术站来源：https://www.nowcoder.com/feed/main/detail/fc4a48403b534aafa6a6bce14b542c4e?sourceSSRsearch 1、智能指针？ std::shared_ptr： 原理：std::shared_ptr是基于引用计数的智能指…...

编程日记 2024/5/15 9:18:37

【Image captioning】In Defense of Grid Features for Visual Question Answering实现流程

In Defense of Grid Features for Visual Question Answering实现流程网格特征预训练代码这是该论文的特征预训练代码发布： @InProceedings{jiang2020defense,title={In Defense of Grid Features for Visual Question Answering},author={Jiang, Huaizu and Misra, Ishan…...

编程日记 2024/5/15 9:17:35

MySQL用SQL取三列中最大的数据值

1、有如下数据： ABC000097.0600330.72330.720069.650027.8827.85086.92086.92219.42219.4219.41 需要展示为如下形式： ABC结果列0000097.06097.060330.72330.72330.7200669.65009.6527.8827.85027.8886.92086.9286.92219.42219.4219.41219.42 解决办…...

编程日记 2024/5/15 9:15:33

【Mac】如何解决打开PD虚拟机后Mac无法上网的问题？

问题描述部分用户在运行Parallels Desktop并打开Windows 11后，发现Windows上网没有问题，但是Mac主机不能访问带域名的网站，而访问带IP的网站没问题，退出Parallels虚拟机以后，Mac网络又恢复正常。解决办法退出 Pa…...

编程日记 2024/5/15 9:10:28

【NodeMCU实时天气时钟温湿度项目 7】和风天气API返回JSON数据信息的解压缩实现——ArduinoUZlib功能库

今天是第七专题，主要内容是：导入ArduinoUZlib功能库，借助该库把从【和风天气】官网返回的经过Gzip压缩的JSON数据，进行解压缩和t解析，在串口监视器上输出解析后的JSON信息。如您需要了解其它专题的内容，请…...

编程日记 2024/5/15 9:07:24

leetcode题目9

回文数简单给你一个整数 x ，如果 x 是一个回文整数，返回 true ；否则，返回 false 。回文数:是指正序（从左向右）和倒序（从右向左）读都是一样的整数。思路对于数字进行反转&a…...

编程日记 2024/5/15 9:06:23

CNAME记录

CNAME记录维基百科，自由的百科全书 （重定向自CNAME） 真实名称记录（英语：Canonical Name Record），即CNAME记录，是域名系统（DNS）的一种记录。CNAME记录用于…...

编程日记 2024/5/15 9:05:22

pytest + yaml 框架 -69.新增depend 关键字，导入其它yaml用例

前言有小伙伴提到，test_a.yml 中已经写了几个流程，test_b.yml 中希望能接着test_a.yml去写用例，于是就需要先导入test_a.yml用例。为了满足此需求，v1.6.3版本在config 中新增 depend 关键字。需求场景 test_a.yml 中已经写…...

编程日记 2024/5/15 9:04:21

【网络】tcp的初始化序列号为什么要随机生成

TCP序列号和确认序列号在TCP协议中，每个数据包都包含一个序列号和一个确认序列号，用于实现可靠的数据传输和流量控制。序列号（Sequence Number）：序列号是发送端为每个发送的数据包分配的唯一标识，用于标…...

编程日记 2024/5/15 9:03:19

【SRC实战】利用APP前端加密构造数据包

挖个洞先 https://mp.weixin.qq.com/s/ZnaRn222xJU0MQxWoRaiJg “ 以下漏洞均为实验靶场，如有雷同，纯属巧合” 01 — 漏洞证明 “ 参数加密的情况，不会逆向怎么办？” 1、新用户首次设置密码时抓包，此处设置为0000…...

编程日记 2024/5/15 9:02:18

ThreadLocal描述

ThreadLocal是Java中的一个类，用于在多线程环境下存储和获取线程相关的数据。每个ThreadLocal对象都可以维护一个线程本地的变量副本，这意味着每个线程都可以独立地改变自己的副本，而不会影响其他线程的副本。这种特性使得ThreadLocal非常适合…...

编程日记 2024/5/15 9:01:17

Linux-基础命令第三天

1、命令：wc 作用：统计行数、单词数、字符数格式：wc 选项文件名例： 统计文件中的行数、单词数、字符数说明：59代表行数，111代表单词数，2713代表字符数，a.txt代表文件名选项…...

编程日记 2024/5/15 9:00:16

vscode里如何用git

打开vs终端执行如下： 1 初始化 Git 仓库（如果尚未初始化） git init 2 添加文件到 Git 仓库 git add . 3 使用 git commit 命令来提交你的更改。确保在提交时加上一个有用的消息。 git commit -m "备注信息" 4 …...

编程新知 2025/8/24 20:45:38

进程地址空间（比特课总结）

一、进程地址空间 1. 环境变量 1 ）⽤户级环境变量与系统级环境变量全局属性：环境变量具有全局属性，会被⼦进程继承。例如当bash启动⼦进程时，环境变量会⾃动传递给⼦进程。本地变量限制：本地变量只在当前进程(ba…...

编程新知 2025/11/15 6:48:52

vscode（仍待补充）

写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用侧边栏 vscode还能连接ssh？ debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...

编程新知 2025/12/17 13:07:40

Opencv中的addweighted函数

一.addweighted函数作用 addweighted（）是OpenCV库中用于图像处理的函数，主要功能是将两个输入图像（尺寸和类型相同）按照指定的权重进行加权叠加（图像融合），并添加一个标量值&#x…...

编程新知 2025/12/26 14:44:50

React19源码系列之事件插件系统

事件类别事件类型定义文档 Event Event 接口表示在 EventTarget 上出现的事件。 Event - Web API | MDN UIEvent UIEvent 接口表示简单的用户界面事件。 UIEvent - Web API | MDN KeyboardEvent KeyboardEvent 对象描述了用户与键盘的交互。 KeyboardEvent - Web…...

编程新知 2025/12/19 3:18:28

css的定位（position）详解：相对定位绝对定位固定定位

在 CSS 中，元素的定位通过 position 属性控制，共有 5 种定位模式：static（静态定位）、relative（相对定位）、absolute（绝对定位）、fixed（固定定位）和…...

编程新知 2025/12/20 15:01:20

学习STC51单片机32（芯片为STC89C52RCRC）OLED显示屏2

每日一言今天的每一份坚持，都是在为未来积攒底气。案例：OLED显示一个A 这边观察到一个点，怎么雪花了就是都是乱七八糟的占满了屏幕。。解释 ： 如果代码里信号切换太快（比如 SDA 刚变，SCL 立刻变&#…...

编程新知 2025/12/22 8:41:04

保姆级教程：在无网络无显卡的Windows电脑的vscode本地部署deepseek

文章目录 1 前言2 部署流程2.1 准备工作2.2 Ollama2.2.1 使用有网络的电脑下载Ollama2.2.2 安装Ollama（有网络的电脑）2.2.3 安装Ollama（无网络的电脑）2.2.4 安装验证2.2.5 修改大模型安装位置2.2.6 下载Deepseek模型 2.3 将deepse…...

编程新知 2025/12/18 13:04:01

安全突围：重塑内生安全体系：齐向东在2025年BCS大会的演讲

文章目录前言第一部分：体系力量是突围之钥第一重困境是体系思想落地不畅。第二重困境是大小体系融合瓶颈。第三重困境是“小体系”运营梗阻。第二部分：体系矛盾是突围之障一是数据孤岛的障碍。二是投入不足的障碍。三是新旧兼容难的障碍。第三部分&am…...

编程新知 2025/12/17 19:15:03

GruntJS-前端自动化任务运行器从入门到实战

Grunt 完全指南：从入门到实战一、Grunt 是什么？ Grunt是一个基于 Node.js 的前端自动化任务运行器，主要用于自动化执行项目开发中重复性高的任务，例如文件压缩、代码编译、语法检查、单元测试、文件合并等。通过配置简洁的任务…...

编程新知 2025/12/21 18:53:40

相关文章：