OpenAI 实战进阶教程 - 第二节:生成与解析结构化数据:从文本到表格
目标
- 学习如何使用 OpenAI API 生成结构化数据(如 JSON、CSV 格式)。
- 掌握解析数据并导出表格文件的技巧,以便适用于不同实际场景。
场景背景
假设你是一名开发人员,需要快速生成一批产品信息列表(如名称、价格、描述),并将这些信息导出为 CSV 文件供其他系统使用。
一、生成结构化数据(JSON 格式)
代码示例:生成产品信息列表
import openai
import json# 设置 API 密钥
openai.api_key = "Your_API_Key"# 定义 API 请求参数
prompt = """
Generate a list of 5 products with the following attributes:
- Product Name
- Price (in USD)
- Short Description
Return the result as a JSON array.
"""# 调用 OpenAI API
response = openai.ChatCompletion.create(model="gpt-4",messages=[{"role": "user", "content": prompt}],max_tokens=300,temperature=0.5
)# 解析生成结果
generated_text = response['choices'][0]['message']['content']try:product_data = json.loads(generated_text)if isinstance(product_data, dict):product_data = [product_data]print("Parsed Data:", product_data)
except json.JSONDecodeError:print("Failed to parse JSON. Check API response format.")
代码说明
- 模型选择:使用 gpt-4 生成高质量、结构化的产品数据。
- 请求内容
prompt:要求返回 JSON 数组以降低解析出错的可能性。 - 解析数据
json.loads():将返回的 JSON 字符串转换为 Python 列表格式。
输出示例
[{"Product Name": "Smartphone X10","Price": 499,"Short Description": "A powerful smartphone with advanced features."},{"Product Name": "Wireless Earbuds Z","Price": 79,"Short Description": "High-quality sound with noise cancellation."},...
]
二、导出数据到 CSV 文件
代码示例:导出生成数据为 CSV 文件
# 确保数据为列表格式
if isinstance(product_data, list):with open("products.csv", "w", newline="") as file:writer = csv.DictWriter(file, fieldnames=["Product Name", "Price", "Short Description"])writer.writeheader()writer.writerows(product_data)print("Data successfully saved to products.csv")
else:print("No valid data to save.")
代码说明
csv.DictWriter():将字典格式数据写入 CSV 文件。writer.writeheader():写入表头。writer.writerows():写入数据行。
三、实际应用案例
1. 数据自动生成
- 市场营销:批量生成商品描述以加快推广文案输出。
- 数据分析:生成模拟数据进行测试和建模。
2. 数据导出与分析
- 自动生成客户报告并导出为 Excel/CSV 格式。
- 将表格数据上传到数据库进行分析。
小结
- 通过 OpenAI 生成结构化数据(如 JSON 格式)可以显著提高数据处理效率。
- 解析生成结果并导出为 CSV 文件是实现数据自动化的重要环节。
练习题
- 生成订单数据:使用 OpenAI API 生成包含订单编号、商品名称、数量和总价的订单信息。
- 导出 Excel 文件:将生成的订单数据保存为 Excel 文件(可使用
pandas库)。 - 增强提示词:尝试优化
prompt以生成更丰富的产品数据,例如增加Category和Stock Availability字段。
相关文章:
OpenAI 实战进阶教程 - 第二节:生成与解析结构化数据:从文本到表格
目标 学习如何使用 OpenAI API 生成结构化数据(如 JSON、CSV 格式)。掌握解析数据并导出表格文件的技巧,以便适用于不同实际场景。 场景背景 假设你是一名开发人员,需要快速生成一批产品信息列表(如名称、价格、描述…...
《基于Scapy的综合性网络扫描与通信工具集解析》
在网络管理和安全评估中,网络扫描和通信是两个至关重要的环节。Python 的 Scapy 库因其强大的网络数据包处理能力,成为开发和实现这些功能的理想工具。本文将介绍一个基于 Scapy 编写的 Python 脚本,该脚本集成了 ARP 扫描、端口扫描以及 TCP…...
MiniQMT与xtquant:量化交易的利器
MiniQMT与xtquant:量化交易的利器 在量化交易的世界里,工具的选择至关重要。今天,我们将深入探讨券商版的MiniQMT及其核心组件xtquant的使用技巧和实践心得。MiniQMT以其简洁的操作界面和强大的功能,在量化交易者中颇受欢迎。 技…...
如何实现一个CLI命令行功能 | python 小知识
如何实现一个CLI命令行功能 | python 小知识 在现代软件开发中,命令行界面(CLI)的设计与交互至关重要。Click是一个强大的Python库,专门用于快速创建命令行界面,以其简单易用性和丰富的功能赢得了开发者的青睐。本文将…...
基于Python的药物相互作用预测模型AI构建与优化(上.文字部分)
一、引言 1.1 研究背景与意义 在临床用药过程中,药物相互作用(Drug - Drug Interaction, DDI)是一个不可忽视的重要问题。当患者同时服用两种或两种以上药物时,药物之间可能会发生相互作用,从而改变药物的疗效、增加不良反应的发生风险,甚至危及患者的生命安全。例如,…...
Linux环境下的Java项目部署技巧:环境安装
安装 JDK: 第上传 jdk 压缩安装包到服务器 将压缩安装包解压缩: tar -xvf jdk-8uXXX-linux-x64.tar.gz 配置环境变量: 编辑 /etc/profile 文件,在文件末尾添加以下内容: export JAVA_HOME/path/to/jdk //JAVA_HOME…...
【系统迁移】将系统迁移到新硬盘中(G15 5520)
文章目录 前言问题描述解决步骤(红色为 debug 步骤)参考文献 前言 参数: 电脑 dell g15 5520硬盘:1T 自带硬盘 海力士 2230 -> 2T 西数蓝盘 2280 问题描述 电脑硬盘过小(且只有一个接口),将…...
pytorch实现主成分分析 (PCA):用于数据降维和特征提取
人工智能例子汇总:AI常见的算法和例子-CSDN博客 使用 PyTorch 实现主成分分析(PCA)可以通过以下步骤进行: 标准化数据:首先,需要对数据进行标准化处理,确保每个特征的均值为 0,方差…...
跨越通信障碍:深入了解ZeroMQ的魅力
在复杂的分布式系统开发中,进程间通信就像一座桥梁,连接着各个独立运行的进程,让它们能够协同工作。然而,传统的通信方式往往伴随着复杂的设置、高昂的性能开销以及有限的灵活性,成为了开发者们前进道路上的 “绊脚石”…...
pytorch实现文本摘要
人工智能例子汇总:AI常见的算法和例子-CSDN博客 import numpy as npfrom modelscope.hub.snapshot_download import snapshot_download from transformers import BertTokenizer, BertModel import torch# 下载模型到本地目录 model_dir snapshot_download(tians…...
小智 AI 聊天机器人
小智 AI 聊天机器人 (XiaoZhi AI Chatbot) 👉参考源项目复现 👉 ESP32SenseVoiceQwen72B打造你的AI聊天伴侣!【bilibili】 👉 手工打造你的 AI 女友,新手入门教程【bilibili】 项目目的 本…...
MySql运维篇---008:日志:错误日志、二进制日志、查询日志、慢查询日志,主从复制:概述 虚拟机更改ip注意事项
#先登录mysql mysql -uroot -p1234#通过此系统变量,查看当前mysql的版本中默认的日志格式是哪个 show variables like %binlog\_format%;1.2.3 查看 由于日志是以二进制方式存储的,不能直接读取,需要通过二进制日志查询工具 mysqlbinlog 来查…...
理解DeepSeek源代码之如何安装triton包
DeepSeek选择了开源路线,在github上可以下载到所有的源代码还有参数(数据集应该没有开源),大语言模型的源代码规模其实非常小,DeepSeek V3的模型函数不过804行,阅读源代码有助于更好理解大语言模型。 1. D…...
C++ Primer 标准库类型string
欢迎阅读我的 【CPrimer】专栏 专栏简介:本专栏主要面向C初学者,解释C的一些基本概念和基础语言特性,涉及C标准库的用法,面向对象特性,泛型特性高级用法。通过使用标准库中定义的抽象设施,使你更加适应高级…...
网站快速收录:如何优化网站视频内容?
本文转自:百万收录网 原文链接:https://www.baiwanshoulu.com/57.html 为了优化网站视频内容以实现快速收录,以下是一些关键的策略和步骤: 一、高质量内容创作 原创性: 确保视频内容是原创的,避免抄袭或…...
医学图像分割任务的测试代码
测试集进行测试 import os import torch import numpy as np from torch.utils.data import DataLoader from sklearn.metrics import (precision_score,recall_score,f1_score,roc_curve,auc,confusion_matrix, ) import matplotlib.pyplot as plt from utils import NiiData…...
放假前的最后一天
放假前的最后一天了,公司里基本没啥人了。上午整理了整理周报和节后上班要干的事儿。说是下午不用上班了,但是一直没有正式通知。中午出来,准备吃个饭,想吃公司附近的那个驻京办的饭,之前都是一直要排队,因…...
FFmpeg源码:av_base64_decode函数分析
一、引言 Base64(基底64)是一种基于64个可打印字符来表示二进制数据的表示方法。由于log2 646,所以每6个比特为一个单元,对应某个可打印字符。3个字节相当于24个比特,对应于4个Base64单元,即3个字节可由4个…...
为AI聊天工具添加一个知识系统 之83 详细设计之24 度量空间之1 因果关系和过程:认知金字塔
本文要点 度量空间 在本项目(为AI聊天工具添加一个知识系统 )中 是出于对“用”的考量 来考虑的。这包括: 相对-位置 力用(“相”)。正如 法力,相关-速度 体用 (“体”)。例如 重…...
如何配置Java JDK
步骤1:点击资源,点击Java下载 https://www.oracle.com/ 步骤2:点击java下载、JDK23下载,下载第一行第一个 步骤3:解压到一个空文件夹下,复制lib地址 步骤4:在设置里面搜索“高级系统设置”;点击…...
蓝桥杯例题六
奋斗是一种态度,也是一种生活方式。无论我们面对什么样的困难和挑战,只要心怀梦想,坚持不懈地努力,就一定能够迈向成功的道路。每一次失败都是一次宝贵的经验,每一次挫折都是一次锻炼的机会。在困难面前,我…...
MVS pythonSamples 运行环境配置
1.首先计算机:操作系统Win10_X64 22H2; 2.MVS V4.4.0 3.python3.8.8_64; 安装时勾选添加path; 最后安装依赖包:(所有必须安装) 图像处理: mvtec-halcon23050(可选) p…...
深度学习查漏补缺:2. 三个指标和注意力机制
一、bachsize, num_epochs, dataset 在训练卷积神经网络(CNN)或任何其他深度学习模型时,有几个关键参数和概念需要了解:batch size、num epochs 和 dataset。下面是对它们的详细解释: Batch Size(批量大小&…...
CodeGPT使用本地部署DeepSeek Coder
目前NV和github都托管了DeepSeek,生成Key后可以很方便的用CodeGPT接入。CodeGPT有三种方式使用AI,分别时Agents,Local LLMs(本地部署AI大模型),LLMs Cloud Model(云端大模型,从你自己…...
Python3 + Qt5:实现AJAX异步更新UI
使用 Python 和 Qt5 开发时异步加载数据的方法 在开发使用 Python 和 Qt5 的应用程序时,为了避免在加载数据时界面卡顿,可以采用异步加载的方式。以下是几种实现异步加载的方法: 1. 使用多线程(QThread) 通过将数据…...
JAVA安全—反射机制攻击链类对象成员变量方法构造方法
前言 还是JAVA安全,哎,真的讲不完,太多啦。 今天主要是讲一下JAVA中的反射机制,因为反序列化的利用基本都是要用到这个反射机制,还有一些攻击链条的构造,也会用到,所以就讲一下。 什么是反射…...
【深度学习】softmax回归的简洁实现
softmax回归的简洁实现 我们发现(通过深度学习框架的高级API能够使实现)(softmax)线性(回归变得更加容易)。 同样,通过深度学习框架的高级API也能更方便地实现softmax回归模型。 本节继续使用Fashion-MNIST数据集,并保持批量大小为256。 import torch …...
基础篇03-图像的基本运算
本节将简要介绍Halcon中有关图像的两类基本运算,分别是代数运算和逻辑运算。除此之外,还介绍几种特殊的代数运算。 目录 1.引言 2. 基本运算 2.1 加法运算 2.2 减法运算 2.3 乘法运算 2.4 除法运算 2.5 综合实例 3. 逻辑运算 3.1 逻辑与运算 …...
工具的应用——安装copilot
一、介绍Copilot copilot是一个AI辅助编程的助手,作为需要拥抱AI的程序员可以从此尝试进入,至于好与不好,应当是小马过河,各有各的心得。这里不做评述。重点在安装copilot的过程中遇到了一些问题,然后把它总结下&…...
面试问题知识
文章目录 1. Linux 和 CentOS基础指令:VMware 和 CentOS:扩充问题: 2. 前端开发(JS、CSS)JavaScript:CSS:扩充问题: 3. 数据库(MySQL)基础语法:事…...
