怎么通过OpenAI API调用其多模态大模型(GPT-4o)
现在只要有额度,大家都可以调用OpenAI的多模态大模型了,例如GPT-4o和GPT-4 Turbo,我一年多前总结过一些OpenAI API的用法,发现现在稍微更新了一下。主要参考了这里:https://platform.openai.com/docs/guides/vision
其实也是比较简单的,就是本地图片需要用base 64先编码,然后再上传。我举个例子,大家应该一看就清楚(图片放在Processed文件夹里面):
from openai import OpenAI
import os
import base64client = OpenAI(api_key="Your_API_Key"
)# Function to encode the image
def encode_image(image_path):with open(image_path, "rb") as image_file:return base64.b64encode(image_file.read()).decode('utf-8')fig_path='Processed'for filename in os.listdir(fig_path):if filename.endswith('.png'):image_path=os.path.join(fig_path, filename)print(image_path)base64_image = encode_image(image_path)messages=[{"role": "user", "content": [{"type":"text", "text":"What's in this image?"},{"type":"image_url","image_url":{"url":f"data:image/png;base64,{base64_image}"}}]}]completion = client.chat.completions.create(model="gpt-4o",messages=messages)chat_response = completionanswer = chat_response.choices[0].message.contentprint(f'ChatGPT: {answer}')
当然,大家用的时候还是要注意花费,现在感觉还是有点贵的。
相关文章:
怎么通过OpenAI API调用其多模态大模型(GPT-4o)
现在只要有额度,大家都可以调用OpenAI的多模态大模型了,例如GPT-4o和GPT-4 Turbo,我一年多前总结过一些OpenAI API的用法,发现现在稍微更新了一下。主要参考了这里:https://platform.openai.com/docs/guides/vision 其…...
自定义文字线性
...
robosuite导入自定义机器人
目录 目的:案例一:成果展示具体步骤:URDF文件准备xml文件生成xml修改机器人构建 目的: 实现其他标准/非标准机器人的构建 案例一: 成果展示 添加机器人JAKA ZU 7 这个模型 具体步骤: URDF文件准备 从…...
四天学会JS高阶(学好vue的关键)——构造函数数据常用函数(理论+实战)(第二天)
一、对象创建引发构造函数产生 1.1 创建对象三种方式: 利用对象字面量创建对象 const obj {name: 佩奇}注:对象字面量的由来:即它是直接由字面形式(由源代码直接)创建出来的对象,而不是通过构造函数或者…...
【Linux学习】进程地址空间与写时拷贝
文章目录 Linux进程内存布局图:内存布局的验证 进程地址空间写时拷贝 Linux进程内存布局图: 地址空间的范围,在32位机器上是2^32比特位,也就是[0,4G]。 内存布局的验证 代码验证内存布局: 验证代码: #include<s…...
Git远程控制
文章目录 1. 创建仓库1.1 Readme1.2 Issue1.3 Pull request 2. 远程仓库克隆3. 推送远程仓库4. 拉取远程仓库5. 配置Git.gitignore配置别名 使用GitHub可以,采用Gitee也行 1. 创建仓库 1.1 Readme Readme文件相当于这个仓库的说明书,gitee会初始化2两份…...
怎样从SQL中分析和提取访问的字段信息?| OceanBase实践
当执行任意一条SELECT SQL语句时,我们如何能够分析出所访问的字段信息,并进一步判断结果集中的每一列数据具体来自于哪些数据库、表以及表中的哪些字段呢?本文将会详细阐述针对此问题的技术解决方案。 应用场景 从 SQL 中解析访问的原始字段…...
MySQL 服务无法启动
常见原因: 检查端口占用: 使用命令行工具(如netstat)来检查3306端口是否已被其他程序占用,输入netstat -ano(Windows)或netstat -tulnp | grep 3306(Linux/Mac)来查找3306端口的占用情况。如果…...
Python贪心算法
贪心算法(Greedy Algorithm)是一种常见的算法设计策略,它在每一步选择当前最优解,希望通过局部最优解最终得到全局最优解。贪心算法通常适用于满足一些特定条件的问题,例如货币找零、活动选择、任务调度等。贪心算法的…...
牛客网刷题 | BC85 牛牛学数列3
目前主要分为三个专栏,后续还会添加: 专栏如下: C语言刷题解析 C语言系列文章 我的成长经历 感谢阅读! 初来乍到,如有错误请指出,感谢! 描述 牛牛准备继续进阶&…...
quartz定时任务
Quartz 数据结构 quartz采用完全二叉树:除了最后一层每一层节点都是满的,而且最后一层靠左排列。 二叉树节点个数规则:每层从左开始,第一层只有一个,就是2的0次幂,第二层两个就是2的1次幂,第三…...
Python基础学习笔记(五)——选择结构与循环结构
目录 程序的组织结构条件选择结构1. 单分支结构2. 双分支结构3. 多分支结构4. 嵌套(分支)结构5. 无内容执行6. 条件表达式 循环结构1. 可迭代对象2. range()函数3. for循环语句4. while循环语句5. 结束语句 程序的组织结构 程序的组织结构主要有以下三种…...
Vue插槽solt如何传递具名插槽的数据给子组件?
在Vue中,你可以通过作用域插槽(scoped slots)来传递数据给子组件。这同样适用于具名插槽。首先,你需要在子组件中定义一个具名插槽,并通过v-slot指令传递数据。例如: 子组件(ChildComponent.vu…...
小程序-收货地址管理模块实现
页面结构代码: address-form.vue --->新建地址和修改地址页面 <template><view class"content"><form><!-- 表单内容 --><view class"form-item"><text class"label">收货人</text>…...
【星海随笔】微信小程序(三)
网络数据请求 1.小程序中网络数据请求的限制 出于安全性方面的考虑,小程序官方对 数据接口的请求 做出了如下 两个限制: ① 只能请求 HTTPS 类型的接口 ② 必须将 接口的域名 添加到 信任列表 中 微信小程序只能请求 https 类型的接口 且需要请求的域名必须提前进行设置后,才可…...
pip(包管理器) for Python
pip是什么 pip是Python的包安装程序,即python包管理器。您可以使用 pip 从Python包索引和其他索引安装包。 1. pip 安装 python 包 pip install 包名 例如:pip install pymssql : 使用pip安装数据库驱动包 pymssql 2.pip 卸载 python 包 pi…...
Ubuntu上安装Maven
在Ubuntu上安装Maven的步骤如下: 更新包索引: sudo apt update 安装Maven: sudo apt install maven 验证安装是否成功: mvn -version 以上步骤将会安装Maven并添加到系统路径中,你可以通过运行mvn -version来验…...
java中使用svnkit实现文件的版本管理
java中使用svnkit实现文件的版本管理 一、引入svnKit依赖二、初始化仓库工厂类二、使用svnkit创建本地存储仓库三、svn基本原子操作四、通过原子方法实现简单svn相应操作 一、引入svnKit依赖 <dependency><groupId>org.tmatesoft.svnkit</groupId><artifa…...
了解 Linux 网络卡绑定:提高网络性能与冗余性
在现代 IT 基础设施中,网络性能和可靠性至关重要。对于许多企业和个人用户来说,确保网络的高可用性和冗余性是首要任务之一。Linux 提供了一个强大的解决方案——网络卡绑定(Network Interface Card Bonding,简称 NIC Bonding&…...
2024年618购物狂欢节即将来袭!精选五款超值入手数码好物!
618购物狂欢盛宴即将落幕,是时候展现我们的购物智慧了!在追求价格优惠的同时,我们更应看重商品的品质与实用性。面对琳琅满目的选择,如何筛选出真正值得拥有的好物呢?为了让大家的购物之旅更加轻松愉快,以下…...
React-share源码架构揭秘:从TypeScript到Vite构建的完整技术栈
React-share源码架构揭秘:从TypeScript到Vite构建的完整技术栈 【免费下载链接】react-share Social media share buttons and share counts for React 项目地址: https://gitcode.com/gh_mirrors/re/react-share React-share是一个功能强大的React社交媒体分…...
OpenClaw+千问3.5-35B-A3B-FP8:24/7自动化内容审核方案
OpenClaw千问3.5-35B-A3B-FP8:24/7自动化内容审核方案 1. 为什么需要个人级内容审核方案 去年运营技术社区时,我每天要处理上百条用户生成内容。凌晨三点被举报消息吵醒的经历,让我开始寻找能替代人工初审的自动化方案。市面上的SaaS审核服…...
HeyGem数字人视频生成系统批量版:快速部署与使用,新手入门全攻略
HeyGem数字人视频生成系统批量版:快速部署与使用,新手入门全攻略 1. 系统概述与核心价值 HeyGem数字人视频生成系统批量版是一款基于AI技术的智能视频合成工具,能够将音频与视频素材智能结合,生成口型同步的数字人视频。科哥的二…...
【AI】RAG的原理
目录 前言 一、为什么会有RAG 二、RAG完整流程 阶段一:离线建库(准备知识) 阶段二:在线问答 三、RAG和微调的区别 微调(Fine-tuning) RAG 总结 前言 上一篇博客中,介绍了大模型的幻觉是…...
Cursor/AI 助手用自然语言操作监控与告警
主要用途告警管理:查询活跃告警和历史告警,查看告警规则和订阅目标监控:浏览和搜索被监控的主机,分析目标状态事件响应:创建和管理告警屏蔽规则、通知规则和事件流水线团队协作:查询用户、团队和业务组快速…...
SOLOv2的‘动态’内核与‘矩阵’NMS:深入代码看它如何比SOLO快3倍
SOLOv2动态内核与矩阵NMS的工程实现奥秘 在计算机视觉领域,实例分割一直是一个极具挑战性的任务,它要求模型不仅要检测出图像中的每个对象,还要精确地描绘出每个对象的轮廓。SOLO系列算法作为这一领域的创新者,从v1到v2的演进中展…...
AI绘画进阶:如何利用Stable Diffusion的图片参数反向优化你的提示词
AI绘画进阶:如何利用Stable Diffusion的图片参数反向优化你的提示词 在AI绘画领域,Stable Diffusion已经成为创作者们不可或缺的工具。当你已经能够熟练生成基础图像后,如何进一步提升作品质量?答案可能就藏在那些被忽视的图片参数…...
Webpacker终极集成指南:如何与React、Vue、TypeScript完美协作
Webpacker终极集成指南:如何与React、Vue、TypeScript完美协作 【免费下载链接】webpacker Use Webpack to manage app-like JavaScript modules in Rails 项目地址: https://gitcode.com/gh_mirrors/we/webpacker Webpacker是Rails生态系统中一个革命性的工…...
GPT-SoVITS语音克隆镜像评测:5秒样本实现高质量声音复刻
GPT-SoVITS语音克隆镜像评测:5秒样本实现高质量声音复刻 1. 引言:声音克隆技术的新突破 在虚拟助手、有声读物和数字人应用爆发的今天,语音克隆技术正变得越来越重要。传统语音合成系统往往需要数小时的录音样本才能训练出可用的声音模型&a…...
如何15分钟搞定黑苹果配置:OpCore-Simplify零代码自动化终极指南
如何15分钟搞定黑苹果配置:OpCore-Simplify零代码自动化终极指南 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify 还在为复杂的黑苹果配置头…...
