当前位置: 首页 > article >正文

终极指南:如何快速扩展LangExtract社区插件生态系统支持AWS Bedrock和LiteLLM

终极指南如何快速扩展LangExtract社区插件生态系统支持AWS Bedrock和LiteLLM【免费下载链接】langextractA Python library for extracting structured information from unstructured text using LLMs with precise source grounding and interactive visualization.项目地址: https://gitcode.com/GitHub_Trending/la/langextractLangExtract是一个功能强大的Python库能够使用LLM从非结构化文本中提取结构化信息并提供精确的源定位和交互式可视化功能。本文将详细介绍如何为LangExtract扩展社区插件生态系统以支持AWS Bedrock和LiteLLM让你轻松扩展文本提取能力。为什么需要扩展LangExtract插件生态系统随着人工智能技术的快速发展越来越多的大型语言模型LLM服务提供商涌现如AWS Bedrock和LiteLLM。扩展LangExtract的插件生态系统能够让用户根据自己的需求选择合适的LLM服务提高文本提取的灵活性和效率。LangExtract的交互式可视化功能可以帮助用户更直观地查看提取结果。例如在医疗文本提取场景中它能够清晰地标记出药物名称、剂量、频率等关键信息准备工作环境搭建与项目结构在开始扩展插件之前首先需要搭建开发环境并了解LangExtract的项目结构。1. 克隆项目仓库git clone https://gitcode.com/GitHub_Trending/la/langextract cd langextract2. 项目结构概览LangExtract的项目结构清晰主要包含以下几个关键目录langextract/核心代码目录包含了LangExtract的主要功能实现examples/示例代码目录包含了各种使用示例和插件开发示例plugins/插件目录用于存放社区开发的各种插件scripts/脚本目录包含了一些实用的工具脚本其中examples/custom_provider_plugin/目录提供了一个自定义provider插件的示例我们可以以此为基础进行扩展。扩展LangExtract支持AWS BedrockAWS Bedrock是一项完全托管的服务提供了对各种基础模型的访问。下面我们将介绍如何为LangExtract开发一个支持AWS Bedrock的插件。1. 创建插件骨架LangExtract提供了一个便捷的脚本create_provider_plugin.py可以帮助我们快速创建插件骨架。运行以下命令python scripts/create_provider_plugin.py AWSBedrockProvider --with-schema这将在examples/custom_provider_plugin/目录下创建一个名为langextract_provider_awsbedrock的插件目录包含了基本的插件结构和schema文件。2. 实现AWS Bedrock Provider打开langextract_provider_awsbedrock/provider.py文件我们需要实现AWS Bedrock的具体调用逻辑。以下是关键部分的实现# 导入必要的库 import boto3 from langextract.core import base_model from langextract.providers import router router.register(r^aws-bedrock) class AWSBedrockProvider(base_model.BaseLanguageModel): def __init__(self, model_id: str anthropic.claude-v2, region_name: str us-east-1, **kwargs): super().__init__() self.model_id model_id self.region_name region_name self.client boto3.client(bedrock-runtime, region_nameregion_name, **kwargs) def infer(self, batch_prompts: Sequence[str], **kwargs): # 实现AWS Bedrock API调用逻辑 for prompt in batch_prompts: # 构造请求 request { prompt: prompt, max_tokens_to_sample: kwargs.get(max_tokens, 1000), # 其他参数... } # 调用AWS Bedrock API response self.client.invoke_model( modelIdself.model_id, bodyjson.dumps(request) ) # 处理响应 result json.loads(response[body].read()) yield [types.ScoredOutput(score1.0, outputresult[completion])]3. 配置Schema编辑langextract_provider_awsbedrock/schema.py文件定义AWS Bedrock特有的配置参数如模型ID、区域等。扩展LangExtract支持LiteLLMLiteLLM是一个统一的API支持多种LLM服务。下面我们将介绍如何为LangExtract开发一个支持LiteLLM的插件。1. 创建插件骨架同样使用create_provider_plugin.py脚本创建LiteLLM插件骨架python scripts/create_provider_plugin.py LiteLLMProvider --with-schema2. 实现LiteLLM Provider打开langextract_provider_litellm/provider.py文件实现LiteLLM的调用逻辑# 导入必要的库 import litellm from langextract.core import base_model from langextract.providers import router router.register(r^litellm) class LiteLLMProvider(base_model.BaseLanguageModel): def __init__(self, model_id: str gpt-3.5-turbo, **kwargs): super().__init__() self.model_id model_id self.kwargs kwargs def infer(self, batch_prompts: Sequence[str], **kwargs): # 合并默认参数和调用参数 all_kwargs {**self.kwargs, **kwargs} # 实现LiteLLM API调用逻辑 for prompt in batch_prompts: # 调用LiteLLM API response litellm.completion( modelself.model_id, messages[{role: user, content: prompt}], **all_kwargs ) # 处理响应 yield [types.ScoredOutput(score1.0, outputresponse.choices[0].message.content)]3. 测试插件功能创建测试文件test_litellm_provider.py编写测试用例验证插件功能import langextract as lx def test_litellm_provider(): config lx.factory.ModelConfig( model_idgpt-3.5-turbo, providerLiteLLMProvider ) model lx.factory.create_model(config) # 测试简单提取 text Lady Juliet gazed longingly at the stars, her heart aching for Romeo schema lx.schema.EntitySchema( entities[lx.schema.EntityType(namecharacter), lx.schema.EntityType(nameemotion)] ) result lx.extract(text, schemaschema, modelmodel) assert len(result.entities) 0运行测试确保插件能够正常工作。插件注册与使用完成插件开发后需要将插件注册到LangExtract中以便在实际应用中使用。1. 注册插件在插件的__init__.py文件中添加注册代码from .provider import AWSBedrockProvider, LiteLLMProvider __all__ [AWSBedrockProvider, LiteLLMProvider]2. 在项目中使用插件在实际应用中可以通过以下方式使用我们开发的插件import langextract as lx # 使用AWS Bedrock插件 bedrock_config lx.factory.ModelConfig( model_idanthropic.claude-v2, providerAWSBedrockProvider, region_nameus-east-1 ) bedrock_model lx.factory.create_model(bedrock_config) # 使用LiteLLM插件 litellm_config lx.factory.ModelConfig( model_idgpt-3.5-turbo, providerLiteLLMProvider ) litellm_model lx.factory.create_model(litellm_config) # 提取文本 text The patient was prescribed Lisinopril and Metformin last month. He takes the Lisinopril 10mg daily for hypertension, but often misses his Metformin 500mg dose which should be taken twice daily for diabetes. schema lx.schema.EntitySchema( entities[ lx.schema.EntityType(namemedication), lx.schema.EntityType(namedosage), lx.schema.EntityType(namefrequency), lx.schema.EntityType(namecondition) ] ) result lx.extract(text, schemaschema, modelbedrock_model) print(result)运行上述代码你将看到LangExtract使用AWS Bedrock或LiteLLM模型提取出文本中的医疗实体信息效果如下总结与展望通过本文的介绍你已经了解了如何为LangExtract扩展社区插件生态系统以支持AWS Bedrock和LiteLLM。这不仅可以提高LangExtract的灵活性和适用性还能为你的文本提取任务带来更多可能性。未来我们可以期待LangExtract社区开发更多的插件支持更多的LLM服务和功能如多模态文本提取、实时数据处理等。如果你有兴趣参与LangExtract的开发可以参考CONTRIBUTING.md文件了解贡献指南。希望本文能够帮助你更好地使用和扩展LangExtract为你的文本提取任务提供有力的支持【免费下载链接】langextractA Python library for extracting structured information from unstructured text using LLMs with precise source grounding and interactive visualization.项目地址: https://gitcode.com/GitHub_Trending/la/langextract创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

终极指南:如何快速扩展LangExtract社区插件生态系统支持AWS Bedrock和LiteLLM

终极指南:如何快速扩展LangExtract社区插件生态系统支持AWS Bedrock和LiteLLM 【免费下载链接】langextract A Python library for extracting structured information from unstructured text using LLMs with precise source grounding and interactive visualiza…...

VBA-JSON终极指南:在Excel中轻松处理JSON数据的完整解决方案

VBA-JSON终极指南:在Excel中轻松处理JSON数据的完整解决方案 【免费下载链接】VBA-JSON JSON conversion and parsing for VBA 项目地址: https://gitcode.com/gh_mirrors/vb/VBA-JSON 还在为VBA无法处理现代API数据而烦恼吗?VBA-JSON就是你的救星…...

SPWM 与 SVPWM (零序分量法实现) 电压利用率简谈

一、电压利用率是什么1.1 电压分析根据上图所示的连接方式,可以分析端电压 当控制 M1 的占空比为 100% 时,端电压 当控制 M1 的占空比为 50% 时,端电压 当控制 M1 的占空比为 0% 时,端电压 1.2 电压利用率是什么电压利用率的定义&…...

SemanticSlicer:为LLM应用设计的智能文本切片工具详解

1. 项目概述:为什么我们需要一个“聪明”的文本切片器? 在构建基于大语言模型(LLM)的应用时,无论是做知识库问答、文档摘要还是智能检索,我们常常面临一个基础但棘手的问题:如何把一篇长文档&a…...

Unity游戏本地化解决方案:XUnity.AutoTranslator技术实现与实战应用

Unity游戏本地化解决方案:XUnity.AutoTranslator技术实现与实战应用 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 在跨语言游戏体验日益重要的今天,Unity游戏开发者面临着多语言…...

LLM推理优化:State over Tokens方法与性能提升实践

1. 项目概述:重新思考LLM的推理机制最近在优化大语言模型推理性能时,我发现传统基于token的生成方式存在一些根本性限制。State over Tokens(SoT)这个新视角彻底改变了我的认知——它把语言模型视为一个持续演化的状态机&#xff…...

如何快速实现游戏多语言翻译:XUnity Auto Translator完全配置指南

如何快速实现游戏多语言翻译:XUnity Auto Translator完全配置指南 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator XUnity Auto Translator是一款强大的Unity游戏实时翻译插件,能够…...

突破瓶颈!5大核心优势让Tianshou成为你的深度强化学习首选框架

突破瓶颈!5大核心优势让Tianshou成为你的深度强化学习首选框架 【免费下载链接】tianshou An elegant PyTorch deep reinforcement learning library. 项目地址: https://gitcode.com/gh_mirrors/ti/tianshou Tianshou是一个优雅的PyTorch深度强化学习库&…...

计算机教材策划与写作的系统性方法论

1. 计算机教材策划的核心原则计算机教材作为知识传递的重要载体,其内容策划与写作需要遵循系统性、科学性和实用性的原则。在十多年的计算机教育实践中,我发现优秀的教材必须建立在三个基本支柱上:知识体系的完整性、技术原理的准确性以及实践…...

小熊猫Dev-C++:让C++编程变得简单高效的终极解决方案

小熊猫Dev-C:让C编程变得简单高效的终极解决方案 【免费下载链接】Dev-CPP A greatly improved Dev-Cpp 项目地址: https://gitcode.com/gh_mirrors/dev/Dev-CPP 在C开发的世界中,找到一个既强大又易用的集成开发环境(IDE)…...

Protocol Buffers实战指南:彻底解决跨语言数据交换难题的终极方案

Protocol Buffers实战指南:彻底解决跨语言数据交换难题的终极方案 【免费下载链接】protobuf Protocol Buffers - Googles data interchange format 项目地址: https://gitcode.com/GitHub_Trending/pr/protobuf Protocol Buffers(简称Protobuf&a…...

【无人机控制】基于PID和模糊PID实现无人机航路控制附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。https://gitcode.com/qq_59747472/Matlab/blob/main/README.md🍎 往期回顾关注个人主页:…...

Phi-3.5-mini-instruct开源模型实践:模型权重下载、本地推理验证与网页服务二次开发

Phi-3.5-mini-instruct开源模型实践:模型权重下载、本地推理验证与网页服务二次开发 1. 模型概述 Phi-3.5-mini-instruct 是一款轻量级文本生成模型,专为中文场景优化设计。该模型在保持较小参数规模的同时,展现出优秀的文本理解和生成能力…...

WebRTC终极指南:如何用simple-peer轻松构建P2P实时通信应用

WebRTC终极指南:如何用simple-peer轻松构建P2P实时通信应用 【免费下载链接】simple-peer 📡 Simple WebRTC video, voice, and data channels 项目地址: https://gitcode.com/gh_mirrors/si/simple-peer simple-peer是一个简洁高效的WebRTC库&am…...

【路径规划】基于扩展卡尔曼滤波和树木直径结合遗传算法估计实现最优农田路径规划附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。https://gitcode.com/qq_59747472/Matlab/blob/main/README.md🍎 往期回顾关注个人主页:…...

G-Helper:华硕笔记本色彩管理革命性突破与智能优化全面指南

G-Helper:华硕笔记本色彩管理革命性突破与智能优化全面指南 【免费下载链接】g-helper Fast, native tool for tuning performance, fans, GPU, battery, and RGB on any Asus laptop or handheld - ROG Zephyrus, Flow, Strix, TUF, Vivobook, Zenbook, ProArt, Al…...

Trestle部署与性能优化:生产环境最佳配置清单

Trestle部署与性能优化:生产环境最佳配置清单 【免费下载链接】trestle A modern, responsive admin framework for Ruby on Rails 项目地址: https://gitcode.com/gh_mirrors/tr/trestle Trestle作为一款现代化的Ruby on Rails管理框架,在生产环…...

手机号定位查询工具:3秒精准定位陌生来电地理位置

手机号定位查询工具:3秒精准定位陌生来电地理位置 【免费下载链接】location-to-phone-number This a project to search a location of a specified phone number, and locate the map to the phone number location. 项目地址: https://gitcode.com/gh_mirrors/…...

MAA明日方舟助手:跨平台自动化游戏解决方案终极指南

MAA明日方舟助手:跨平台自动化游戏解决方案终极指南 【免费下载链接】MaaAssistantArknights 《明日方舟》小助手,全日常一键长草!| A one-click tool for the daily tasks of Arknights, supporting all clients. 项目地址: https://gitco…...

基于MCP协议构建AI工具集成服务:从原理到实践

1. 项目概述与核心价值 最近在折腾一些AI应用开发,发现一个挺有意思的现象:很多开发者想把自己的本地数据、工具或者服务接入到大语言模型(LLM)的工作流里,但往往卡在“连接”这一步。要么是API设计复杂,要…...

LingBot-Depth效果对比展示:lingbot-depth-dc在稀疏点云补全中的精度提升

LingBot-Depth效果对比展示:lingbot-depth-dc在稀疏点云补全中的精度提升 1. 引言:从残缺到完整的深度感知 想象一下,你手里有一张用激光雷达扫描出来的深度图,但上面布满了空洞和缺失的数据点,就像一张被虫子啃过的…...

别再死记硬背了!用‘存储器金字塔’的视角,重新理解你的电脑为什么卡

别再死记硬背了!用‘存储器金字塔’的视角,重新理解你的电脑为什么卡 你是否曾经遇到过这样的场景:打开一个大型设计文件时,进度条像蜗牛一样缓慢爬行;或者在处理海量数据时,程序突然变得异常迟钝。大多数人…...

Phi-3-mini-4k-instruct-gguf企业知识库构建:PDF解析+向量检索+Phi-3问答三件套

Phi-3-mini-4k-instruct-gguf企业知识库构建:PDF解析向量检索Phi-3问答三件套 1. 项目概述 Phi-3-mini-4k-instruct-gguf是一个38亿参数的轻量级开源模型,属于Phi-3系列中的Mini版本。这个模型特别适合企业知识库构建场景,因为它&#xff1…...

高斯信源渐进披露与Hopfield网络容量优化研究

1. 项目背景与核心问题在信息论与神经网络交叉领域,高斯信源的最优渐进披露深度与Hopfield网络容量分析是一个极具理论价值和实践意义的课题。这个研究主要解决两个关键问题:连续型信源在渐进式信息传输中的最优精度控制,以及联想记忆网络在存…...

手把手教你用CH32V208的TMOS玩转BLE多任务:从LED闪烁到数据收发

从零玩转CH32V208的TMOS与BLE开发:从LED控制到无线通信实战 第一次拿到CH32V208开发板时,面对TMOS和BLE这两个概念,我完全摸不着头脑。作为一个嵌入式开发新手,我需要的不是晦涩的理论,而是能快速上手的实战指南。本文…...

协程栈帧逃逸检测失败?——基于Clang Static Analyzer定制的C++27协程安全审计工具链(GitHub Star 1.2k,内部禁用未审核协程调用)

更多请点击: https://intelliparadigm.com 第一章:C27协程标准化工业应用教程 协程核心语义与标准化演进 C27 将正式将协程(coroutines)纳入语言核心标准,而非仅作为库设施(如 C20 的 std::coroutine_ha…...

为什么92%的Java项目卡在等保四级复测?揭秘测评机构最新“一票否决”项(含源码级审计示例)

更多请点击: https://intelliparadigm.com 第一章:Java等保四级合规性全景认知 等保四级是我国网络安全等级保护制度中最高级别的安全要求,适用于涉及国家安全、社会秩序和公共利益的关键信息基础设施。Java 应用系统若承载核心业务&#xf…...

开源会话数据分析工具 open-claw-session-analyzer 实战指南

1. 项目概述与核心价值最近在折腾一些开源项目,发现一个挺有意思的东西,叫arkbuilder/open-claw-session-analyzer。光看名字,你可能会觉得有点云里雾里,什么“爪子”、“会话分析器”?其实,这是一个专门用…...

C语言中的puts函数

puts 函数是stdio.h库中的函数&#xff0c;语法形式为&#xff1a; int puts ( const char * str );表示将 str 所指向的 C 字符串写入标准输出流&#xff08;stdout&#xff09;&#xff0c;并自动追加一个换行符&#xff08;\n&#xff09;。 示例&#xff1a; #include <…...

C语言中void * 和 void的区别

void * 表示指向任意类型的指针&#xff0c;是通用指针&#xff1b; 而void是一种类型&#xff0c;表示无。 示例&#xff1a; void * memset ( void * ptr, int value, size_t num );表示函数返回指向任意类型的指针&#xff0c;而参数void * ptr 表示接收指向向任意类型的指针…...