使用DeepSeek API进行情感分析:超简单
文章目录
- 1. 引言
- 1.1 情感分析概述
- 1.2 为什么选择DeepSeek API
- 1.3 本文目标
- 2. 技术方案对比
- 2.1 传统情感分析方法
- 2.2 基于LLM的方法
- DeepSeek API优势
- 3. DeepSeek 情感分析实战
- 3.1 Few-shot Learning方法
- 3.2 完整的DeepSeek API调用示例
- 3.3 案例演示
- 4. DeepSeek开发情感分析工具的劣势
- 5. 总结
- 5.1 传统机器学习方案和DeepSeek进行情感分析对比
- 5.2 混合方案建议
- 附录
1. 引言
1.1 情感分析概述
“情感分析”问题,是指我们根据一段文字,去判断它的态度是正面的还是负面的。在传统的互联网产品里,经常会被用来分析用户对产品、服务的评价,典型应用场景有:
- 电商评论分析
- 社交媒体舆情监控
- 客户服务质量评估
1.2 为什么选择DeepSeek API
- 中文优化效果显著
- 零样本学习能力
- 灵活的提示工程控制
1.3 本文目标
使用DeepSeek API构建一个简单的情感分析工具。
2. 技术方案对比
2.1 传统情感分析方法
传统进行情感分析时,需要经过以下步骤:
- 数据收集
- 数据标注
- 特征工程
- 机器学习算法选择
- 模型训练
- 模型应用
工作量大不说,还需要你有相对丰富的机器学习经验。
2.2 基于LLM的方法
DeepSeek API优势
- 无需训练数据
- 理解复杂语义(反讽、隐喻)
- 多任务统一处理
3. DeepSeek 情感分析实战
3.1 Few-shot Learning方法
Few-shot Learning(少样本学习)是一种让模型通过少量示例快速学习新任务的技术。在情感分析中,它可以显著提升模型对特定领域或复杂语义的理解能力。
- Few-shot Learning 的优势
- 传统监督学习:需要大量标注数据训练模型。
- Few-shot Learning:仅提供少量示例(如3-5个),模型通过类比推理完成任务。
- Few-shot Learning 示例
messages = [{"role": "system", "content": """你是一个情感分析助手。请根据以下示例判断新文本的情感倾向:评论:东西收到这么久,都忘了去好评,美的大品牌,值得信赖,东西整体来看,个人感觉还不错,没有出现什么问题情感:正面评论:随意降价,不予价保,服务态度差情感:负面评论:品符合预期,但价格略高情感:中性"""}
]
输出:正面
3.2 完整的DeepSeek API调用示例
from openai import OpenAIclient = OpenAI(api_key="your-api-key",base_url="https://api.deepseek.com/"
)# 向LLM发起API发起请求
def chat_completion_request(messages):completion = client.chat.completions.create(model="deepseek-chat", # 此处以deepseek-chat为例,可按需更换模型名称messages=messages)return completiondef main_loop():"""主循环,获取用户输入并与 LLM 进行对话。"""print("欢迎使用情感分析专家!输入内容开始对话(输入 bye 退出)")while True:try:user_input = input("\n输入评论内容: ")if user_input.lower() in ("bye", "goodbye", "exit"):break# 使用 few-shots learning (少样本学习) 方案messages = [{"role": "system", "content": """你是一个情感分析助手。请根据以下示例判断新文本的情感倾向:评论:东西收到这么久,都忘了去好评,美的大品牌,值得信赖,东西整体来看,个人感觉还不错,没有出现什么问题情感:正面评论:随意降价,不予价保,服务态度差情感:负面评论:品符合预期,但价格略高情感:中性"""},{"role": "user", "content": "评论:" + user_input}]completion = chat_completion_request(messages)if not completion:continueprint(f"DeepSeek: {completion.choices[0].message.content}\n")except KeyboardInterrupt:breakexcept Exception as e:print(f"发生错误: {str(e)}")if __name__ == "__main__":main_loop()print("\ngoodbye!")
3.3 案例演示

4. DeepSeek开发情感分析工具的劣势
看到这里的你是不是已经跃跃欲试的要开发自己的 DeepSeek 情感分析工具了吗?别急,说了这么多使用 DeepSeek 开发情感分析工具的优势,难道就完全没有一点劣势吗?其实不是,正如软件没有银弹一样,DeepSeek或者说LLM也不是银弹,比如有LLM有如下劣势:
- 计算成本高:API调用或大模型部署资源消耗大
- 输出不稳定:可能受Prompt设计影响
- 数据安全:云API需考虑敏感信息传输
5. 总结
5.1 传统机器学习方案和DeepSeek进行情感分析对比
| 维度 | 传统方法 | LLM方法 |
|---|---|---|
| 开发速度 | 慢(需数据收集+训练) | 快(即时API调用) |
| 准确率 | 领域内高,跨领域低 | 泛化性强,领域适应快 |
| 硬件需求 | CPU即可运行小模型 | 需要GPU/API调用 |
| 适用场景 | 固定领域的大规模分析 | 灵活需求、小样本场景 |
| 成本 | 前期训练成本高,后期推理成本低 | 按API调用次数计费 |
5.2 混合方案建议
现实世界并不是一场非黑即白,非此即彼的游戏,往往是你中有我,五中有你,因此在实际应用中你很可能采取的是混合型方案:
- 冷启动阶段
- 使用LLM(DeepSeek API)快速验证需求,同时积累标注数据。
- 数据充足后
- 微调小型BERT模型替代API,降低成本。
- 复杂场景
- LLM处理疑难样本(如反讽),传统模型处理常规样本。
附录
- DeepSeek API文档
- 情感分析数据集资源
相关文章:
使用DeepSeek API进行情感分析:超简单
文章目录 1. 引言1.1 情感分析概述1.2 为什么选择DeepSeek API1.3 本文目标 2. 技术方案对比2.1 传统情感分析方法2.2 基于LLM的方法DeepSeek API优势 3. DeepSeek 情感分析实战3.1 Few-shot Learning方法3.2 完整的DeepSeek API调用示例3.3 案例演示 4. DeepSeek开发情感分析工…...
一套SaaS多租户医疗云his源码,基于云计算的医院信息管理系统(云HIS)
基于云计算的医院信息管理系统(云HIS),通过SaaS服务模式提供。这种云HIS系统设计考虑了模板化、配置化、智能化和可扩展性,覆盖了基层医疗机构的核心工作流程,并且能够与监管系统无缝对接,满足未来的扩展需…...
数据处理与机器学习入门
一、数据处理概述 数据处理是通过统计学、机器学习和数据挖掘方法从原始数据中提取有价值信息的过程。数据处理的目标是将杂乱无章的原始数据转化为可用于分析和建模的结构化数据。对于小规模数据处理,常用工具分为两类: • 可视化分析工具:…...
Qt中绘制不规则控件
在Qt中绘制不规则控件可通过设置遮罩(Mask)实现。以下是详细步骤: 继承目标控件:如QPushButton或QWidget。重写resizeEvent:当控件大小变化时,更新遮罩形状。创建遮罩区域:使用QRegion或QPain…...
【SPP】深入解析蓝牙 L2CAP 协议在SPP中的互操作性要求 —— 构建可靠的蓝牙串口通信基础
在蓝牙协议体系中,L2CAP(Logical Link Control and Adaptation Protocol)作为基带协议与高层协议之间的桥梁,承担着数据分帧、协议复用、QoS协商等核心功能。当涉及串行端口通信时,L2CAP的规范实现直接决定了设备间数据…...
21 模板方法(Template Method)模式
模板方法模式 1.1 分类 (类)行为型 1.2 提出问题 做一款数据挖掘的程序,需要支持不同格式的数据文件,虽然文件格式不同,实现步骤基本一致。 1.3 解决方案 定义一个算法骨架,而将一些步骤延迟到子类。…...
一些练习 C 语言的小游戏
一些练习 C 语言的小游戏 — 1. 猜数字游戏 描述:程序随机生成一个数字,玩家需要猜测这个数字,并根据提示(太高或太低)调整猜测,直到猜中为止。 功能点: 随机数生成 (rand() 函数)。循环和…...
【AI News | 20250331】每日AI进展
AI Repos 1、MCP-Chinese-Getting-Started-Guide 模型上下文协议(MCP)是一个创新的开源协议,旨在标准化大语言模型(LLM)与外部数据源及工具的连接方式,类似AI应用的“USB-C接口”。其核心功能包括资源、提…...
程序化广告行业(45/89):RTB竞价后续流程、结算规则及相关要点解读
程序化广告行业(45/89):RTB竞价后续流程、结算规则及相关要点解读 大家好!一直以来,我都希望能和大家一起在程序化广告这个领域不断探索、共同成长,这也是我写这系列博客的初衷。之前我们了解了程序化广告…...
Python人工智能大模型入门教程:从零构建高性能预测模型
引言:AI大模型时代的技术革命 在AlphaGo战胜人类棋手的里程碑事件后,人工智能技术进入爆发式发展阶段。本教程将带您从零开始,使用Python构建一个工业级神经网络模型。通过本教程,您不仅能掌握GPU加速训练、混合精度计算等前沿技…...
C++/数据结构:哈希表知识点
目录 哈希表 理解哈希表 哈希值(整形) BKDR哈希 异或组合 hash_combine 哈希函数 直接定址法 除留余数法 平方取中法 基数转换法 哈希冲突 开放定址法 哈希桶 unordered_map和unorder_set如何共用一个哈希桶模板类 stl的哈希桶中Insert如…...
基于SpringBoot的求职招聘网站系统(源码+数据库)
473基于SpringBoot的求职招聘网站系统,本系统共分为2个角色:系统管理员、用户,主要功能如下 【前台功能】 用户角色功能: 1. 注册和登录:注册账户并登录系统,以便访问更多功能。 2. 个人信息管理&#x…...
Linux : System V 共享内存
目录 一 前言 二 共享内存概念 三 共享内存创建 四 查看共享内存 五 共享内存的删除 六 共享内存的关联 七 共享内存去关联 八 共享内存的使用(通信) 九 共享内存的特点 一 前言 共享内存区是最快的IPC形式(进程间通信࿱…...
端到端语音识别案例
《DeepSeek大模型高性能核心技术与多模态融合开发(人工智能技术丛书)》(王晓华)【摘要 书评 试读】- 京东图书 语音识别这一技术正如其名,是通过精密地解析说话人的语音来识别并准确转写出其所说的内容。它不仅仅是一个简单的转录过程&#…...
【软件系统架构】微服务架构
一、引言 随着互联网技术的快速发展,传统的单体应用架构在面对复杂业务需求时逐渐暴露出诸多问题,如开发效率低、部署困难、扩展性差等。为了解决这些问题,微服务架构应运而生。本文将详细介绍微服务架构的定义、发展历史、特点、细分类型、优…...
【Kafka】消费者幂等性保障全解析
文章目录 消费者幂等性的重要性基于消息唯一标识的幂等处理消息去重表缓存去重 基于事务的幂等处理消费者事务与幂等性 幂等性保障的挑战与应对性能开销数据一致性 总结 在 Kafka 生态系统中,我们往往着重关注生产者端的幂等性,确保…...
Linux内核设计——(一)进程管理
目录 一、进程及线程简介 二、进程描述符 2.1 进程描述符简介 2.2 分配进程描述符 2.3 进程标识值 2.4 进程状态 2.5 进程上下文 三、进程创建 3.1 写时拷贝 3.2 fork()和vfork() 四、线程 4.1 Linux线程实现 4.2 内核线程 五、进程终结 5.1 删除进程描述符 5.…...
Ubuntu 22.04 LTS 下载英伟达驱动
在 Ubuntu 22.04 LTS 上安装 NVIDIA 驱动可以通过以下几种方法完成。以下是详细的步骤: 方法 1:使用 apt 包管理器安装(推荐) 这是最简单的方法,适合大多数用户。 更新系统包列表 sudo apt update检查可用的 NVIDIA 驱…...
22 安装第三方包
一、什么是第三方包 在 Python 的世界里,包就像是一个个功能强大的工具箱,它将多个 Python 模块收纳其中,而每个模块又蕴含着丰富多样的具体功能。可以说,一个包就是一系列同类功能的集合体,它们就像紧密协作的团队&a…...
深度学习deeplearn1
import torch # 导入 PyTorch 库,PyTorch 是一个用于深度学习和张量计算的强大库x torch.arange(12) # 创建一个包含从 0 到 11 的整数的一维张量 x # torch.arange 函数用于生成一个指定范围的整数序列print(x) # 打印张量 x 的内容print(x.shape) # 打印张量 x 的…...
oracle 常用函数的应用
在使用开发中会经常遇到数据类型转换、显示系统时间等情况,需要使用函数来实现。通过函数来实现业务需求会非常的省事便捷,函数可以用在适当的dml语句和查询语句中。 Oracle 数据库中主要使用两种类型的函数: (1)单行函数:对每一个…...
指纹浏览器技术解析:如何实现多账号安全运营与隐私保护
浏览器指纹的挑战与需求 在数字化运营场景中,浏览器指纹技术被广泛用于追踪用户行为。通过采集设备硬件参数(如屏幕分辨率、操作系统)、软件配置(如字体、插件)及网络特征(如IP地址、时区)&…...
“上云入端” 浪潮云剑指组织智能化落地“最后一公里”
进入2025年,行业智能体正在成为数实融合的核心路径。2025年初DeepSeek开源大模型的横空出世,通过算法优化与架构创新,显著降低算力需求与部署成本,推动大模型向端侧和边缘侧延伸。其开源策略打破技术垄断,结合边缘计算…...
CentOS 7 如何挂载ntfs的移动硬盘
CentOS 7 如何挂载ntfs的移动硬盘 前言一、查看硬盘并尝试挂载(提示无法挂载)二、yum安装epel-release提示yum被锁定三、强行终止yum的进程四、yum安装epel-release完成五、yum安装ntfs-3g六、此时可正常挂载NTFS硬盘 前言 CentOS 7默认情况下是不支持NTFS的文件系统ÿ…...
pytorch+maskRcnn框架训练自己的模型以及模型导出ONXX格式供C++部署推理
背景 maskrcnn用作实例分割时,可以较为精准的定位目标物体,相较于yolo只能定位物体的矩形框而言,优势更大。虽然yolo的计算速度更快。 直接开始从0到1使用maskrCNN训练自己的模型并并导出给C部署(亲测可用) 数据标注…...
①EtherCAT/Ethernet/IP/Profinet/ModbusTCP协议互转工业串口网关
型号 协议转换通信网关 EtherCAT 转 Modbus TCP MS-GW15 概述 MS-GW15 是 EtherCAT 和 Modbus TCP 协议转换网关,为用户提供一种 PLC 扩展的集成解决方案,可以轻松容易将 Modbus TCP 网络接入 EtherCAT 网络 中,方便扩展,不受限…...
Python扩展知识详解:lambda函数
目录 前言 1 基本知识点 语法 特点 代码示例 2 常见使用场景 1. 与高阶函数配合使用 2. 作为排序键来使用 3. 立即调用函数 4. 在字典中使用 3 高级用法(进阶版) 1. 多参数lambda 2. 设置默认参数 3. 嵌套lambda 注意事项 何时…...
信号量与基于环形队列的生产者消费者模型
目录 POSIX信号量 理解 使用 初始化 销毁 等待 发布信号量 基于环形队列的生产者消费者模型 POSIX信号量 理解 信号量可用于线程间的同步,它可以用于将一整块资源切成一个个的小部分以供并发访问。它实际上是一个计数器,但特别之处在于支持原子…...
《Oracle服务进程精准管控指南:23c/11g双版本内存优化实战》 ——附自动化脚本开发全攻略
正在学习或者是使用 Oracle 数据库的小伙伴,是不是对于那个一直启动且及其占用内存的后台进程感到烦躁呢?而且即使是手动去开关也显得即为麻烦,所以基于我之前所学习到的方法,我在此重新整理,让大家动动手指就能完成开…...
Java单列集合[Collection]
目录 1.Collection单列集合 1.1单列集合各集合特点 1.2、Collection集合 1.2.1、Collection方法 1.2.2、Collection遍历方式 1.2.2.1、迭代器遍历集合 1.2.2.2、增强for遍历集合 1.2.2.3、forEach遍历集合(JDK8之后) 1.2.2.4、遍历案例 1.3、Li…...
