当前位置: 首页 > article >正文

LangChain4j(1):初步认识Java 集成 LLM 的技术架构

LangChain 作为构建具备 LLM 能力应用的框架,虽在 Python 领域大放异彩,但 Java 开发者却只能望洋兴叹。LangChain4j 正是为解决这一困境而诞生,它旨在借助 LLM 的强大效能,增强 Java 应用,简化 LLM 功能在Java应用中的集成流程。

官网为LangChain4j | LangChain4j

一、独具魅力的特点与优势

  1. 兼容多元 LLM:LangChain4j 支持超过 15 种流行的 LLM,OpenAI、ZhiPu、Qianfan 等均在其列,可以依据项目的实际需求、成本考量,灵活切换适配的 LLM。
  2. Java 集成无缝对接:它实现了 LLM 与 Java 的双向深度集成,二者之间可自如相互调用。
  3. 降低学习成本与灵活切换:通过提供如 AiServices 这般的高级 API 与 LLM 交互,开发者无需再为逐个钻研每个 LLM 的复杂细节而头疼,同时还能轻松在不同 LLM 间自由切换。
  4. 功能模式:当前LangChain4j 支持聊天对话、流式对话、文生图这三种常见且实用的模式。

二、解析 LangChain4j 架构模块

  1. Chains:Chains 负责定义输入输出的链式步骤,但官网推荐使用功能更为强劲的 AIService,所以在实际开发中,它的出场频率相对较低。
  2. AI Services:作为封装了与 LLM 交互功能的高级 API,AI Services 无疑是 LangChain4j 的核心枢纽。它以简洁高效的方式,将复杂的 LLM 交互逻辑封装起来,为开发者提供了便捷且强大的交互能力。
  3. Basics:Basics 模块汇聚了 LLM 大模型、提示词模板、历史对话内存等基本组件,为构建基于 LLM 的 Java 应用奠定了基础。
  4. RAG:RAG 模块作为检索增强组件,包含文档加载器、文档分割器、向量模型、向量存储等,提升了应用在处理海量信息时的检索与增强能力。

三、LangChain4j 类库:

LangChain4j 采用精妙的模块化设计,不同模块各司其职,协同为开发者提供强大支持。

  1. langchain4j-core 模块:作为核心抽象的定义者,ChatLanguageModel 和 EmbeddingStore 及其 API 均在此模块中诞生。
  2. langchain4j 模块:这里汇聚了众多实用工具,如 ChatMemory、OutputParser,同时还包含像 AiServices 这样的高级功能。
  3. langchain4j-{integration} 模块:该模块系列为各种 LLM 提供商及嵌入存储与 LangChain4j 的集成搭建了桥梁,每个模块都能独立使用,开发者可按需引入,实现与特定 LLM 或嵌入存储的无缝对接。
  4. langchain4j-spring-{integration}-spring-boot-starter 模块:此模块专为与 Spring boot 项目集成而设,意图实现开箱即用的便捷体验。从模块划分角度来看,相较于 Spring AI 清晰的Models 模块、Embeddings模块等划分方式,langchain4j-spring 模块的划分稍显混乱。

四、API 抽象层级

在 LangChain4j 的 API 抽象层面,分为 Low Level 和 High Level 两种,为开发者提供了不同维度的开发选择。

  1. Low Level:处于此级别,开发者能够像摆弄乐高积木一样,自由调用所有低级组件,如 ChatLanguageModel、UserMessage、AiMessage、EmbeddingStore 等 Embedding。这些组件构成了所谓的 “胶水代码”,开发者可依据具体需求,以任意组合方式使用它们,实现高度定制化的功能开发。
  2. High Level:简洁高效的 “一键快车”:在 High Level 层级,开发者可借助如 AiServices 这样的高级 API 与 LLMs 进行交互。这一层级将所有复杂的底层逻辑与样板代码统统隐藏起来,开发者只需专注于业务逻辑的实现。

 

相关文章:

LangChain4j(1):初步认识Java 集成 LLM 的技术架构

LangChain 作为构建具备 LLM 能力应用的框架,虽在 Python 领域大放异彩,但 Java 开发者却只能望洋兴叹。LangChain4j 正是为解决这一困境而诞生,它旨在借助 LLM 的强大效能,增强 Java 应用,简化 LLM 功能在Java应用中的…...

JDK 21 的新特性有哪些?带你全面解读 Java 的未来

引言:从 JDK 21 看 Java 的进化之路 Java 是一门历久弥新的语言,每一次版本更新都在强化它的生态体系。2023 年发布的 JDK 21,作为长期支持版本(LTS),带来了许多令人兴奋的新特性。不论你是开发者、架构师…...

【C++算法】53.链表_重排链表

文章目录 题目链接:题目描述:解法C 算法代码: 题目链接: 143. 重排链表 题目描述: 解法 模拟 找到链表的中间节点 快慢双指针 把后面的部分逆序 双指针,三指针,头插法 合并两个链表 合并两个有…...

多卡分布式训练:torchrun --nproc_per_node=5

多卡分布式训练:torchrun --nproc_per_node=5 1. torchrun 实现规则 torchrun 是 PyTorch 提供的用于启动分布式训练作业的实用工具,它基于 torch.distributed 包,核心目标是简化多进程分布式训练的启动和管理。以下是其主要实现规则: 进程启动 多进程创建:torchrun 会…...

系统架构设计师之系统设计模块笔记

一、系统设计概述 定义与目标 系统设计是根据系统分析结果,制定系统构建蓝图的过程,核心目标是合理分配功能需求、优化资源使用、确保系统高内聚低耦合,并满足性能、安全、可扩展等非功能需求。主要内容 概要设计:将功能需求分配…...

Elasticsearch:加快 HNSW 图的合并速度

作者:来自 Elastic Thomas Veasey 及 Mayya Sharipova 过去,我们曾讨论过搜索多个 HNSW 图时所面临的一些挑战,以及我们是如何缓解这些问题的。当时,我们也提到了一些计划中的改进措施。本文正是这项工作的成果汇总。 你可能会问…...

图片中文字无法正确显示的解决方案

图片中文字无法正确显示的解决方案 问题描述 在 Linux 系统中生成图片时,图片中的文字(如中文)未能正确显示,可能表现为乱码或空白。这通常是由于系统缺少对应的字体文件(如宋体/SimSun),或者…...

数据结构:通俗解释AOE 网中事件的最早发生时间和最迟发生时间

1. 事件的最早发生时间 在 AOE 网(Activity On Edge Network,边表示活动的网络)中,事件的最早发生时间指从源点(起点)到该事件结点的最长路径长度(即所需时间)。它决定了所有以该事…...

C# 看门狗策略实现

using System; using System.Threading;public class Watchdog {private Timer _timer;private volatile bool _isTaskAlive;private readonly object _lock new object();private const int CheckInterval 5000; // 5秒检测一次private const int TimeoutThreshold 10000; …...

在 openEuler 24.03 (LTS) 操作系统上添加 ollama 作为系统服务的步骤

以下是在 openEuler 操作系统上添加 ollama 作为系统服务的步骤: 创建 systemd 服务文件 sudo vi /etc/systemd/system/ollama.service将以下内容写入服务文件(按需修改参数): [Unit] DescriptionOllama Service Afternetwork.…...

Elasticsearch中的基本全文搜索和过滤

Elasticsearch中的基本全文搜索和过滤 知识点参考: https://www.elastic.co/guide/en/elasticsearch/reference/current/full-text-filter-tutorial.html#full-text-filter-tutorial-range-query 1. 索引设计与映射 多字段类型(Multi-Fields) &#xff…...

基于VSCode的Qt开发‘#include ui_test.h’报错没有该文件

笔者在基于VSCode进行Qt开发时,test.ui文件是在Qt软件中绘制的,导致本项目无法使用这个ui文件,报错如标题。事实上,本工程中也确实没有生成这个头文件。出现这个错误的原因是ui文件没有被编译为c头文件。 要生成 ui_test.h 文件&…...

Python常用排序算法

1. 冒泡排序 冒泡排序是一种简单的排序算法,它重复地遍历要排序的列表,比较相邻的元素,如果他们的顺序错误就交换他们。 def bubble_sort(arr):# 遍历所有数组元素for i in range(len(arr)):# 最后i个元素是已经排序好的for j in range(0, …...

ISP--Demosaicking

文章目录 前言算法解释简单的线性插值代码实现 色差法和色比法基于方向加权的方法RB缺失的G通道的插值RB缺失的BR的插值G缺失的BR的插值代码实现 基于边缘检测的方法计算缺失的G计算缺失的RB值/计算缺失的G值 前言 人眼之所以有能感受到自然界的颜色,是因为人眼的感…...

国标GB28181协议EasyCVR视频融合平台:5G时代远程监控赋能通信基站安全管理

一、背景介绍 随着移动通信行业的迅速发展,无人值守的通信基站建设规模不断扩大。这些基站大多建于偏远地区,周边人迹罕至、交通不便,给日常的维护带来了极大挑战。其中,位于空旷地带的基站设备,如空调、蓄电池等&…...

vue watch 和 watchEffect的区别和用法

在 Vue.js 里,watch 和 watchEffect 都用于响应式地追踪数据变化并执行相应操作,不过它们在使用方式、应用场景等方面存在差异。 1. watch watch 是 Vue 提供的一个选项,用于监听特定数据的变化。当监听的数据发生变化时,会触发…...

SQL 不走索引的常见情况

在 SQL 查询中&#xff0c;即使表上有索引&#xff0c;某些情况下数据库优化器也可能决定不使用索引。以下是常见的不走索引的情况&#xff1a; 1. 使用否定操作符 NOT IN ! 或 <> NOT EXISTS NOT LIKE 2. 对索引列使用函数或运算 -- 不走索引 SELECT * FROM user…...

git配置 gitcode -- windows 系统

版本 $ git --version git version 2.49.0.windows.1检查现有的 SSH 密钥 打开git-bash终端&#xff0c;执行以下命令查看是否已经生成过 SSH 密钥&#xff1a; ls -al ~/.ssh如果看到类似 id_rsa 和 id_rsa.pub&#xff08;或者其他命名的密钥对&#xff09;文件&#xff0…...

基于Kubeadm实现K8S集群扩缩容指南

一、集群缩容操作流程 1.1 缩容核心步骤 驱逐节点上的Pod 执行kubectl drain命令驱逐节点上的Pod&#xff0c;并忽略DaemonSet管理的Pod&#xff1a; kubectl drain <节点名> --ignore-daemonsets # 示例&#xff1a;驱逐worker233节点 kubectl drain worker233 --ignor…...

模拟-与-现实协同训练:基于视觉机器人操控的简单方法

25年3月来自 UT Austin、Nvidia、UC Berkeley 和纽约大学的论文“Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation”。 大型现实世界机器人数据集在训练通才机器人模型方面拥有巨大潜力&#xff0c;但扩展现实世界人类数据收集既耗时又耗资…...

WRS-PHM电机智能安康系统:为浙江某橡胶厂构筑坚实的生产防线

以行业工况为背景 一、顾客工厂的背景 浙江某橡胶厂以电机为中心生产设备必须连续平稳运行。但由于缺乏有效的故障预警体系&#xff0c;电机故障就像潜伏着的“不定时炸弹”,不但不时地造成生产流程的中断&#xff0c;也使对生产进行管理异常艰难&#xff0c;对持续安全生产提…...

将 CrewAI 与 Elasticsearch 结合使用

作者&#xff1a;来自 Elastic Jeffrey Rengifo 学习如何使用 CrewAI 为你的代理团队创建一个 Elasticsearch 代理&#xff0c;并执行市场调研任务。 CrewAI 是一个用于编排代理的框架&#xff0c;它通过角色扮演的方式让多个代理协同完成复杂任务。 如果你想了解更多关于代理…...

wait 和notify ,notifyAll,sleep

wait 使线程进入阻塞状态&#xff0c;释放CPU&#xff0c;以及锁 sleep 使线程进入睡眠状态&#xff0c;sleep方法不会释放CPU资源和锁资源&#xff0c;而是让出CPU的使用权。操作系统会将CPU分配给其他就绪线程&#xff0c;但当前线程依然存在&#xff0c;不会释放其占用的…...

ECMAScript 6 新特性(二)

ECMAScript 6 新特性&#xff08;二&#xff09; ECMAScript 6 新特性&#xff08;一&#xff09; ECMAScript 6 新特性&#xff08;二&#xff09;&#xff08;本文&#xff09; ECMAScript 7~10 新特性 1. 生成器 生成器函数是 ES6 提供的一种解决异步编程方案&#xff0c;一…...

SpringBoot接口覆盖上一次调用的实现方案

调用springboot接口时&#xff0c;如何实现覆盖上一次调用 Spring Boot 接口覆盖上一次调用的实现方案 以下是多种实现覆盖上一次接口调用的方案&#xff0c;适用于不同场景。 方案一&#xff1a;同步锁控制&#xff08;单机环境&#xff09; 适用场景‌&#xff1a;单实例…...

Spring 的 IoC 和 DI 详解:从零开始理解与实践

Spring 的 IoC和 DI 详解&#xff1a;从零开始理解与实践 一、IoC&#xff08;控制反转&#xff09; 1、什么是 IoC&#xff1f; IoC 是一种设计思想&#xff0c;它的核心是将对象的创建和管理权从开发者手中转移到外部容器&#xff08;如 Spring 容器&#xff09;。通过这种…...

Python Cookbook-5.12 检查序列的成员

任务 你需要对一个列表执行很频繁的成员资格检査。而in操作符的 O(n)时间复杂度对性能的影响很大&#xff0c;你也不能将序列转化为一个字典或者集合&#xff0c;因为你还需要保留原序列的元素顺序。 解决方案 假设需要给列表添加一个在该列表中不存在的元素。一个可行的方法…...

签名过期怎么办?

1无论是证书到期还是被封停&#xff0c;只需要找到签名服务商&#xff0c;重新签名就可以了&#xff0c;但签名经常性过期会造成app用户流失&#xff0c;所以我们在选择签名时需要注意&#xff0c;在资金充足的情况下&#xff0c;优先选择独立、稳定签名&#xff0c;接下来我们…...

ZYNQ笔记(四):AXI GPIO

版本&#xff1a;Vivado2020.2&#xff08;Vitis&#xff09; 任务&#xff1a;使用 AXI GPIO IP 核实现按键 KEY 控制 LED 亮灭&#xff08;两个都在PL端&#xff09; 一、介绍 AXI GPIO (Advanced eXtensible Interface General Purpose Input/Output) 是 Xilinx 提供的一个可…...

实操(环境变量)Linux

环境变量概念 我们用语言写的文件编好后变成了程序&#xff0c;./ 运行的时候他就会变成一个进程被操作系统调度并运行&#xff0c;运行完毕进程相关资源被释放&#xff0c;因为它是一个bash的子进程&#xff0c;所以它退出之后进入僵尸状态&#xff0c;bash回收他的退出结果&…...