当前位置: 首页 > article >正文

用免费的github的key调用gpt实现一个简单的rag自动打分评测系统,不用任何框架

1.环境准备

!pip install pymupdf numpy openai

2.导入依赖

import fitz
import os
import numpy as np
import json
from openai import OpenAI

3.pdf提取文本

def extract_text_from_pdf(pdf_path):"""从 PDF 文件中提取文本内容。参数:pdf_path (str): PDF 文件的路径。返回:str: 提取出的完整文本内容。"""# 打开 PDF 文件mypdf = fitz.open(pdf_path)all_text = ""  # 初始化一个空字符串,用于存储所有页的文本# 遍历 PDF 的每一页for page_num in range(mypdf.page_count):page = mypdf[page_num]  # 获取当前页text = page.get_text("text")  # 提取当前页的纯文本内容all_text += text  # 将当前页的文本追加到总文本中return all_text  # 返回所有提取出的文本

4.将上个步骤提取的文本按固定长度分段

def chunk_text(text, n, overlap):"""将输入文本按固定长度进行分段,支持设置重叠部分。参数:text (str): 需要被分段的原始文本。n (int): 每个文本块的字符数。overlap (int): 相邻文本块之间重叠的字符数。返回:List[str]: 分段后的文本块列表。"""chunks = []  # 初始化一个空列表,用于存储所有的文本块# 以步长 (n - overlap) 遍历整个文本for i in range(0, len(text), n - overlap):# 从当前位置 i 开始,取 n 个字符,作为一个 chunk 添加到列表中chunks.append(text[i:i + n])return chunks  # 返回所有分好的文本块

5.初始化openai实例

import os
from openai import OpenAItoken = ""
endpoint = "https://models.inference.ai.azure.com"
model_name = "gpt-4o"client = OpenAI(base_url=endpoint,api_key=token,
)

6.从指定pdf文件中提取文本内容

# 定义 PDF 文件的路径
pdf_path = "/content/设计前沿-ai文生图.pdf"# 调用自定义函数,从 PDF 文件中提取纯文本内容
extracted_text = extract_text_from_pdf(pdf_path)# 将提取到的文本进行分块处理
# 每个块包含 1000 个字符,块与块之间有 200 个字符的重叠部分
text_chunks = chunk_text(extracted_text, 1000, 200)# 打印生成的文本块数量
print("Number of text chunks:", len(text_chunks))# 打印第一个文本块的内容,查看是否提取和分块成功
print("\nFirst text chunk:")
print(text_chunks[0])

7.将文本转换为向量

def create_embeddings(text, model="text-embedding-3-small"):"""使用指定的 OpenAI 模型为输入文本创建嵌入向量(embeddings)。参数:text (str 或 List[str]): 要进行嵌入的文本或文本列表。model (str): 使用的嵌入模型名称,默认使用 "text-embedding-3-small"。返回:object: 来自 OpenAI API 的响应结果,包含嵌入向量信息。"""# 使用 OpenAI 客户端调用嵌入接口,生成文本的向量表示response = client.embeddings.create(model=model,  # 使用的嵌入模型input=text     # 传入待编码的文本(可以是字符串或字符串列表))return response  # 返回包含嵌入信息的 API 响应

8.计算两个向量(用户问题和检索到的文本块)的相似度

def cosine_similarity(vec1, vec2):"""计算两个向量之间的余弦相似度(Cosine Similarity)。参数:vec1 (np.ndarray): 第一个向量(numpy 数组)。vec2 (np.ndarray): 第二个向量(numpy 数组)。返回:float: 两个向量之间的余弦相似度,取值范围 [-1, 1],越接近 1 表示越相似。"""# 计算两个向量的点积(内积)dot_product = np.dot(vec1, vec2)# 分别计算两个向量的模(长度)norm_vec1 = np.linalg.norm(vec1)norm_vec2 = np.linalg.norm(vec2)# 用点积除以两个模的乘积,得到余弦相似度similarity = dot_product / (norm_vec1 * norm_vec2)return similarity  # 返回余弦相似度得分

9.检索逻辑

def semantic_search(query, text_chunks, embeddings, k=5):"""使用语义相似度在文本块中检索与查询最相关的内容。参数:query (str): 用户输入的查询问题。text_chunks (List[str]): 需要检索的文本块列表。embeddings (List[dict]): 每个文本块对应的嵌入向量(OpenAI 返回的数据结构)。k (int): 返回与查询最相关的前 k 个文本块。默认值为 5。返回:List[str]: 与查询最相关的前 k 个文本块(按相似度排序)。"""# 为用户查询生成嵌入向量query_embedding = create_embeddings(query).data[0].embeddingsimilarity_scores = []  # 初始化一个列表,用于存储每个文本块与查询的相似度得分# 遍历所有文本块的嵌入向量,与查询向量计算相似度for i, chunk_embedding in enumerate(embeddings):# 提取该文本块的向量并计算与查询向量的余弦相似度similarity_score = cosine_similarity(np.array(query_embedding),np.array(chunk_embedding.embedding))# 将文本块的索引和相似度添加到结果列表中similarity_scores.append((i, similarity_score))# 按相似度从高到低排序similarity_scores.sort(key=lambda x: x[1], reverse=True)# 获取前 k 个最相关文本块的索引top_indices = [index for index, _ in similarity_scores[:k]]# 返回对应的文本块内容return [text_chunks[index] for index in top_indices]

用户输入 query
     ↓
生成 query 向量
     ↓
与每个 chunk 的向量计算余弦相似度
     ↓
相似度排序 → 选前 k 个
     ↓
返回最相关的文本块(用于回答生成)
10. 从pdf提取的文本中找到与问题最相似的前两个文本(通过向量找)

# 从 JSON 文件中加载验证数据(val.json 文件中存有多个问答对)
with open('/content/ val.json') as f:data = json.load(f)# 从验证数据中提取第一个问题(用户查询)
query = data[0]['question']# 使用语义检索,从文本块中找出与该问题最相关的前 2 个文本块
top_chunks = semantic_search(query, text_chunks, response.data, k=2)# 打印用户提问的内容
print("Query:", query)# 打印检索到的前 2 个最相关的文本块,用作后续生成回答的上下文
for i, chunk in enumerate(top_chunks):print(f"Context {i + 1}:\n{chunk}\n=====================================")

11.定义提示词实现对问题的回答

# 定义 AI 助手的系统提示词(设定它的行为准则)
# 要求它必须基于上下文回答;如果上下文中找不到答案,就明确说没有信息。
system_prompt = ("You are an AI assistant that strictly answers based on the given context. ""If the answer cannot be derived directly from the provided context, respond with: ""'I do not have enough information to answer that.'"
)# 定义生成 AI 回答的函数
def generate_response(system_prompt, user_message, model="gpt-4o"):"""使用指定的大语言模型生成回答。参数:system_prompt (str): 系统提示词,引导 AI 的行为(定义身份、回答风格等)。user_message (str): 用户的消息(包括上下文和问题)。model (str): 使用的模型名称,默认使用 gpt-4o(也可以替换为其他兼容模型)。返回:dict: 模型生成的完整响应对象(包含回答内容等)。"""# 调用 Chat 接口,生成回答response = client.chat.completions.create(model=model,        # 指定使用的模型temperature=0,      # 温度设置为 0,表示尽可能确定性回答(减少随机性)messages=[{"role": "system", "content": system_prompt},  # 系统设定{"role": "user", "content": user_message}      # 用户输入(包含上下文 + 问题)])return response  # 返回完整响应对象

12.结合上步给出的答案以及真正的答案进行打分


# 定义评分系统的提示词(system prompt)
# 告诉 AI 你是一个智能评估系统,要根据回答的准确性打分:
# 1 分:完全正确;0.5 分:部分正确;0 分:错误或答非所问。
evaluate_system_prompt = ("You are an intelligent evaluation system tasked with assessing the AI assistant's responses. ""If the AI assistant's response is very close to the true response, assign a score of 1. ""If the response is incorrect or unsatisfactory in relation to the true response, assign a score of 0. ""If the response is partially aligned with the true response, assign a score of 0.5."
)
# 构造评估任务的完整提示内容(evaluation_prompt)
# 包括:
# - 用户问题(User Query)
# - AI 的实际回答(AI Response)
# - 标准答案(True Response)
# - 评分规则(evaluate_system_prompt)
evaluation_prompt = (f"User Query: {query}\n"f"AI Response:\n{ai_response.choices[0].message.content}\n"f"True Response: {data[0]['ideal_answer']}\n"f"{evaluate_system_prompt}"
)
# 使用之前定义的 generate_response 函数,调用模型进行评分
# 评分系统会根据 AI 的回答和真实答案之间的匹配程度输出评分(0, 0.5, 1)
evaluation_response = generate_response(evaluate_system_prompt, evaluation_prompt)
# 打印模型生成的评分结果(通常会包含得分和简要理由)
print(evaluation_response.choices[0].message.content)

相关文章:

用免费的github的key调用gpt实现一个简单的rag自动打分评测系统,不用任何框架

1.环境准备 !pip install pymupdf numpy openai 2.导入依赖 import fitz import os import numpy as np import json from openai import OpenAI 3.pdf提取文本 def extract_text_from_pdf(pdf_path):"""从 PDF 文件中提取文本内容。参数:pdf_path (str): …...

SQLServer列转行操作及union all用法

1.创建测试表及数据sql如下 create table ScoresTable( Name varchar(50), ChineseScore int, MathScore int ) insert into ScoresTable values(小张,90,95) insert into ScoresTable values(小王,98,99) 2.表中查询结果如下 3.现需列转行显示,每行显示 姓名…...

深度学习框架PyTorch——从入门到精通(6.2)自动微分机制

本节自动微分机制是上一节自动微分的扩展内容 自动微分是如何记录运算历史的保存张量 非可微函数的梯度在本地设置禁用梯度计算设置requires_grad梯度模式(Grad Modes)默认模式(梯度模式)无梯度模式推理模式评估模式(n…...

Java面试10个“隐藏考点”

1. Java模块化系统(JPMS)的requires transitive作用 问题:如何在模块化项目中传递依赖? 解析: ​**requires transitive**:声明模块的依赖可被下游模块隐式继承。​示例:模块A依赖模块B并添加…...

【GL010】C++

1.C中的const关键字有哪些用法? 1.修饰变量:表示变量的值不可修改。 const int a 10; 2.修饰指针: const int* p: // 指针指向的内容不可修改。 int* const p: // 指针本身不可修改。 const int* const…...

(Arxiv-2025)MagicDistillation:用于大规模人像少步合成的弱到强视频蒸馏

MagicDistillation:用于大规模人像少步合成的弱到强视频蒸馏 paper是HKUST发布在Arxiv 2025的工作 paper title:MagicDistillation: Weak-to-Strong Video Distillation for Large-Scale Portrait Few-Step Synthesis Project page:地址 Abst…...

Linux paste命令

目录 一. 简介二. 基本语法三. 小案例 一. 简介 paste 命令用于合并多个文件的行&#xff0c;按列方式输出&#xff0c;默认以制表符&#xff08;Tab&#xff09;分隔。 ⏹基本语法 paste [选项] 文件1 文件2 ...二. 基本语法 <()的方式模拟文件流paste命令将2个文件流粘…...

大模型金融企业场景落地应用

一、商业银行体系 1. 江苏银行 企业背景&#xff1a;江苏银行是总部位于江苏南京的全国性股份制商业银行&#xff0c;在城商行中资产规模位居前列&#xff0c;积极拥抱金融科技&#xff0c;将数字化转型作为核心战略之一。近年来&#xff0c;江苏银行持续加大在人工智能、大数…...

Excel(进阶篇):powerquery详解、PowerQuery的各种用法,逆透视表格、双行表头如何制作透视表、不规则数据如何制作数据透视表

目录 PowerQuery工具基础修改现有数据理规则PowerQuery抓取数据的两种方式多文件合并透视不同表结构多表追加数据透视追加与合并整理横向表格:逆透视 数据用拆分工具整理数据算账龄 不等步长值组合合并文件夹中所有文件PowerQuery处理CSV文件双行表头、带合并单元格如何做数据…...

神经网络解决非线性二分类

这份 Python 代码实现了一个简单的神经网络&#xff0c;用于解决复杂的非线性二分类问题。具体步骤包含生成数据集、定义神经网络模型、训练模型、测试模型以及可视化决策边界。 依赖库说明 python import numpy as np import matplotlib.pyplot as plt from sklearn.datase…...

CentOS 8.2 上安装 JDK 17 和 Nginx

AI越来越火了&#xff0c;我们想要不被淘汰就得主动拥抱。推荐一个人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;最重要的屌图甚多&#xff0c;忍不住分享一下给大家。点击跳转到网站 一、安装 JDK 17 1. 使用 dnf 安装&#xff08;推荐&#xff09…...

Python 爬虫(4)HTTP协议

文章目录 一、HTTP协议1、HTTP特点2、HTTP工作原理3、HTTP与HTTPS的区别 前言&#xff1a; HTTP&#xff08;HyperText Transfer Protocol&#xff0c;超文本传输协议&#xff09;是互联网上应用最为广泛的一种网络协议&#xff0c;用于在客户端和服务器之间传输超文本&#xf…...

Simple-BEV的bilinear_sample 作为view_transformer的解析,核心是3D-2D关联点生成

文件路径models/view_transformers 父类 是class BiLinearSample(nn.Module)基于https://github.com/aharley/simple_bev。 函数解析 函数bev_coord_to_feature_coord的功能 将鸟瞰图3D坐标通过多相机&#xff08;针孔/鱼眼&#xff09;内外参投影到图像特征平面&#xff0…...

Midscene.js自然语言驱动的网页自动化全指南

一、概述 网页自动化在数据抓取、UI 测试和业务流程优化中发挥着重要作用。然而&#xff0c;传统工具如 Selenium 和 Puppeteer 要求用户具备编程技能&#xff0c;编写复杂的选择器和脚本维护成本高昂。Midscene.js 通过自然语言接口革新了这一领域&#xff0c;用户只需描述任…...

同一个局域网的话 如何访问另一台电脑的ip

在局域网内访问另一台电脑&#xff0c;可以通过以下几种常见的方法来实现&#xff1a; ‌直接通过IP地址访问‌&#xff1a; 首先&#xff0c;确保两台电脑都连接在同一个局域网内。获取目标电脑的IP地址&#xff0c;这可以通过在目标电脑上打开命令提示符&#xff08;Windows系…...

基于SpringBoot的名著阅读网站

作者&#xff1a;计算机学姐 开发技术&#xff1a;SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等&#xff0c;“文末源码”。 专栏推荐&#xff1a;前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏&#xff1a;…...

Excel(实战):INDEX函数和MATCH函数、INDEX函数实战题

目录 经典用法两者嵌套查值题目解题分析 INDEX巧妙用法让数组公式&#xff0c;自动填充所有、有数据的行/列INDEX函数和SEQUENCE函数 经典用法两者嵌套查值 题目 根据左表查询这三个人的所有数据 解题分析 INDEX函数的参数&#xff1a;第1个参数是选定查找范围&#xff0c…...

希尔排序中的Hibbard序列

一 定义 Hibbard序列的每个元素由以下公式生成: h_k = 2^k - 1 其中k从1开始递增,序列为:1, 3, 7, 15, 31, 63, … 二 生成方式 起始条件:k=1,对应h_1=2^1-1=1 递推公式:每次k增加1,计算 h_{k+1}=2^{k+1}-1 示例:前5项…...

uniapp超简单ios截屏和上传app store构建版本方法

​ 假如使用windows开发ios的应用&#xff0c;上架的时候&#xff0c;你会发现&#xff0c;上架需要ios应用多种尺寸的ios设备的截图&#xff0c;和需要xcode等工具将打包好的ipa文件上传到app store的构建版本。 大部分情况下&#xff0c;我们的公司都没有这么多款ios设备来…...

Netty源码—5.Pipeline和Handler一

大纲 1.Pipeline和Handler的作用和构成 2.ChannelHandler的分类 3.几个特殊的ChannelHandler 4.ChannelHandler的生命周期 5.ChannelPipeline的事件处理 6.关于ChannelPipeline的问题整理 7.ChannelPipeline主要包括三部分内容 8.ChannelPipeline的初始化 9.ChannelPi…...

Netlify 的深度解析及使用指南

以下是关于 Netlify 的深度解析及使用指南&#xff0c;结合其核心功能与用户需求&#xff0c;提供一站式解决方案&#xff1a; 一、Netlify 核心优势 全托管静态网站服务Netlify 提供从代码托管、自动化构建到全球 CDN 加速的全流程服务&#xff0c;支持 HTML/CSS/JS 静态资源及…...

MySQL小练习

目录 一、单表查询 二、多表查询 一、单表查询 素材&#xff1a; 表名&#xff1a;worker-- 表中字段均为中文&#xff0c;比如 部门号 工资 职工号 参加工作 等 CREATE TABLE worker ( 部门号 int(11) NOT NULL, 职工号 int(11) NOT NULL, 工作时间 date NOT NULL, 工资 float…...

Apache Hive:基于Hadoop的分布式数据仓库

Apache Hive 是一个基于 Apache Hadoop 构建的开源分布式数据仓库系统&#xff0c;支持使用 SQL 执行 PB 级大规模数据分析与查询。 主要功能 Apache Hive 提供的主要功能如下。 HiveServer2 HiveServer2 服务用于支持接收客户端连接和查询请求。 HiveServer2 支持多客户端…...

推荐算法分析

一、性能分析指标 1. 准确性指标&#xff08;Accuracy Metrics&#xff09; 衡量推荐系统预测评分的准确性&#xff0c;包括&#xff1a; ✅ RMSE&#xff08;均方根误差, Root Mean Squared Error&#xff09; 解释&#xff1a;衡量预测评分 (\hat{r}_i) 和真实评分 (r_i)…...

vllm 离线推理Qwen2.5-VL-Instruct,API部署,支持max_pixels

使用这里的最新镜像: https://www.dong-blog.fun/post/1799 启动环境 docker run -it --rm --gpus "device=1,2" \ --net host \ -v ./zizhi_merge_2025-1/:/Qwen2.5-VL-Instruct \ -v ./test:/test \...

检波、限幅、钳位电路

检波电路&#xff1a; 类似调制收音机信号&#xff1a;输入的基波和载波叠加成调制信号&#xff08;信号需要长距离里传输&#xff0c;频率要高&#xff0c;M级别的频率&#xff0c;所以要把低频信号叠在高频信号&#xff0c;才能把低频信号长距离传输&#xff0c;最后到达接收…...

学习threejs,使用TextGeometry文本几何体

&#x1f468;‍⚕️ 主页&#xff1a; gis分享者 &#x1f468;‍⚕️ 感谢各位大佬 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍⚕️ 收录于专栏&#xff1a;threejs gis工程师 文章目录 一、&#x1f340;前言1.1 ☘️THREE.TextGeometry1.1.1 ☘…...

Go红队开发—CLI框架(一)

CLI开发框架 命令行工具开发&#xff0c;主要是介绍开发用到的包&#xff0c;集成了一个框架&#xff0c;只要学会了基本每个人都能开发安全工具了。 该文章先学flags包&#xff0c;是比较经典的一个包&#xff0c;相比后面要学习的集成框架这个比较自由比较细化点&#xff0…...

解决点击按钮页面自动刷新

在React中&#xff0c;当你点击按钮时&#xff0c;如果按钮的type属性没有明确指定&#xff0c;它的默认值是submit。这意味着如果这个按钮被放置在一个<form>表单中&#xff0c;点击它会触发表单的提交行为&#xff0c;导致页面刷新。 在你的代码中&#xff0c;展开/折叠…...

高效团队开发的工具与方法 引言

引言 在现代软件开发领域&#xff0c;团队协作的效率和质量直接决定了项目的成败。随着项目规模的扩大和技术复杂度的增加&#xff0c;如何实现高效团队开发成为每个开发团队必须面对的挑战。高效团队开发不仅仅是个人技术能力的简单叠加&#xff0c;更需要借助合适的工具和方…...