当前位置: 首页 > article >正文

12-Oracle 23ai Vector 使用ONNX模型生成向量嵌入

一、Oracle 23ai Vector Embeddings 核心概念

向量嵌入(Vector Embeddings)​​

-- 将非结构化数据(文本/图像)转换为数值向量

- - 捕获数据的语义含义而非原始内容

- 示例:"数据库" → [0.24, -0.78, 0.56, ...]

​ONNX(Open Neural Network Exchange)​​

- 开放神经网络交换格式

- 实现跨框架模型互操作(PyTorch → TensorFlow → Oracle)

- Oracle 23ai 原生支持 ONNX 模型部署

​生成方式

可使用内置,也可以使用外部的第三方API

二、关于Vector Generator

FLOAT32 Vector Generator,BINARY Vector Generator
不建议在生产数据库上使用矢量生成器。本教程可用于测试和 演示目的。

​三、环境准备(基于Oracle 23ai Free版,安装模式参考前文)

8-Oracle23 ai free True Cache OL9.6上部署和实操-已验证-CSDN博客
  1. 环境限制
  • CPU:最大 2 核
  • 数据量:≤ 12 GB
  • 内存:≤ 2 GB
  • 单实例限制:每主机仅允许一个实例

四、准备ONNX模型

  • ​步骤1:下载预训练模型​
  • - 从Hugging Face下载模型(如all-MiniLM-L12-v2):
  • - 从Hugging Face下载模型(如all-MiniLM-L12-v2):其中huggingface.co没梯子无法下载,“https://huggingface.co/sentence-transformers/all-MiniLM-L12-v2/resolve/main/onnx/model.onnx”
  • oracled OCI 地址可以下载,下载预训练模型。此次选择将命令用于本地 ,未测试将模型和数据放在对象存储的情况。​"https://adwc4pm.objectstorage.us-ashburn-1.oci.customer-oci.com/p/VBRD9P8ZFWkKvnfhrWxkpPe8K03-JIoM5h_8EJyJcpE80c108fuUjg7R5L5O7mMZ/n/adwc4pm/b/OML-Resources/o/all_MiniLM_L12_v2_augmented.zip"

 传输模型到服务器​,本地服务器​:复制到数据库可访问目录

[root@OL96 home]# unzip all_MiniLM_L12_v2_augmented.zip
Archive:  all_MiniLM_L12_v2_augmented.zipinflating: all_MiniLM_L12_v2.onnxinflating: README-ALL_MINILM_L12_V2-augmented.txt
[root@OL96 home]# ll
total 1618196
drwx------. 14 admin  admin          4096 Jun  2 22:54 admin
-rw-r--r--.  1 root   root      122597346 Jul 16  2024 all_MiniLM_L12_v2_augmented.zip
-rw-r--r--.  1 root   root      133322334 Jul 15  2024 all_MiniLM_L12_v2.onnx
drwx------.  4 oracle oinstall        143 Jun  3 18:56 oracle
-rw-r--r--.  1 root   root     1401096996 May  6 18:50 oracle-database-free-23ai-23.8-1.el9.x86_64.rpm
-rw-r--r--.  1 root   root           4232 Jul 15  2024 README-ALL_MINILM_L12_V2-augmented.txt
cp all_MiniLM_L12_v2.onnx /opt/oracle/models/
步骤2:数据库环境配置
  • 创建专用用户和目录
  • DB_DEVELOPER_ROLE是Oracle 23ai引入的新角色,整合了CONNECT和RESOURCE角色,并增加了更多现代开发所需的权限,比如创建多维数据模型、机器学习模型
su - oracle
sqlplus / as sysdba
alter session set container=FREEPDB1;
CREATE TABLESPACE vec_ts DATAFILE 'vector_ts.dbf' SIZE 2G AUTOEXTEND ON;
CREATE USER vector_user IDENTIFIED BY Oracle_4U DEFAULT TABLESPACE vec_ts;
GRANT DB_DEVELOPER_ROLE TO vector_user;CREATE OR REPLACE DIRECTORY MODEL_DIR AS '/opt/oracle/models/';
GRANT READ, WRITE ON DIRECTORY MODEL_DIR TO vector_user;
步骤3:加载ONNX模型到数据库​

连接创建的用户,并导入嵌入模型到数据库中。

DBMS_VECTOR.LOAD_ONNX_MODEL 是Oracle提供的存储过程,用于加载ONNX格式的机器学习模型,可以通过这个存储导入嵌入模型到数据库中。

SYS@FREE> show pdbs;CON_ID CON_NAME                       OPEN MODE  RESTRICTED
---------- ------------------------------ ---------- ----------3 FREEPDB1                       READ WRITE NO
SYS@FREE> col algorithm for a50
SYS@FREE> aol mining_funtion for a50
SYS@FREE> col mining_funtion for a50
select model_name, algorithm, mining_function from user_mining_models where model_name = 'ALL_MINILM_L12_V2';
未选定行
SYS@FREE> !ls -lrht /opt/oracle/models
总用量 128M
-rw-r--r--. 1 root root 128M  6月  6 13:33 all_MiniLM_L12_v2.onnx
SYS@FREE> SET SERVEROUTPUT ON;
begin2    dbms_vector.drop_onnx_model (3      model_name => 'ALL_MINILM_L12_V2',4      force => true);5    dbms_vector.load_onnx_model (6      directory  => 'MODEL_DIR',7      file_name  => 'all_MiniLM_L12_v2.onnx',8      model_name => 'ALL_MINILM_L12_V2');9  end;10  /PL/SQL 过程已成功完成。
SYS@FREE> SET SERVEROUTPUT OFF;
SYS@FREE> select model_name, algorithm, mining_function from user_mining_models where model_name = 'ALL_MINILM_L12_V2';MODEL_NAME
------------------------------------------------------------------------------------------------------------------------
ALGORITHM                                          MINING_FUNCTION
-------------------------------------------------- ------------------------------
ALL_MINILM_L12_V2
ONNX                                               EMBEDDING
参数说明:

dbms_vector.drop_onnx_model :删除数据库中的同名模型。

dbms_vector.load_onnx_model :加载ONNX格式的机器学习模型。

directory => 'model_dir':指定数据库目录对象(Directory Object),需提前创建并授权访问。

file_name => 'all_MiniLM_L12_v2.onnx':模型文件名。

model_name => 'ALL_MINILM_L12_V2':模型在数据库中的注册名称。

步骤4. 验证使用数据库中的embedding模型的有效性

可以通过VECTOR_EMBEDDING调用嵌入模型将非结构化文本转换为高维向量,用于支持语义相似性搜索。

VECTOR_EMBEDDING 函数语法结构:

VECTOR_EMBEDDING ( [ schema.] model_name USING mining_attribute_clause )

SYS@FREE>  SELECT VECTOR_EMBEDDING(ALL_MINILM_L12_V2 USING 'test模型向量化的有效性' as DATA) AS embedding;EMBEDDING
------------------------------------------------------------------------------------------------------------------------
[2.66404985E-003,9.65440422E-002,-1.35087622E-002,-5.54944314E-002,SYS@FREE> set linesize 300
SYS@FREE> set pagesize 300
SYS@FREE> set long 1000000
SYS@FREE> select model_name, algorithm, mining_function from user_mining_models where model_name = 'ALL_MINILM_L12_V2';MODEL_NAME                                                                                                                       ALGORITHM                                           MINING_FUNCTION
-------------------------------------------------------------------------------------------------------------------------------- -------------------------------------------------- ------------------------------
ALL_MINILM_L12_V2                                                                                                                ONNX       EMBEDDINGSYS@FREE>  SELECT VECTOR_EMBEDDING(ALL_MINILM_L12_V2 USING 'test模型向量化的有效性' as DATA) AS embedding;EMBEDDING
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
[2.66404985E-003,9.65440422E-002,-1.35087622E-002,-5.54944314E-002,-4.43398356E-002,2.62922514E-002,2.59053931E-002,-7.91817252E-003,-9.61533338E-002,-5.10287704E-003,9.70973819E-002,-4.75466549E-002,9.48436558E-002,-2.00812109E-002,-1.11816991E-002,3.50039313E-003,2.49711871E-002,-4.08663116E-002,-
1.09921098E-002,1.97709594E-002,-4.39038612E-002,-1.07046172E-001,3.40610854E-002,1.17250914E-002,-7.20420256E-002,-4.8628971E-003,4.66601141E-002,-6.6996634E-002,1.15193594E-002,-1.86132006E-002,6.65622903E-003,1.11891717E-001,2.63250824E-002,-3.45257223E-002,2.68428884E-002,-1.63987558E-002,-2.753
36318E-002,-4.55752388E-002,3.59995365E-002,-2.89271609E-003,1.96910854E-002,-1.21251133E-003,1.0335011E-001,4.18214463E-002,6.89237565E-002,5.2454304E-002,6.04937077E-002,-6.6135779E-002,-9.3136644E-003,-3.22942957E-002,-5.8344584E-002,-3.99274416E-002,8.9949511E-002,9.88921244E-003,-2.11505666E-00

五、生成向量嵌入的SQL实操

​场景1:文本转向量​
-- 创建测试表
CREATE TABLE testdocs (id NUMBER PRIMARY KEY,content CLOB
);INSERT INTO testdocs VALUES (1, 'Oracle AI Vector Search revolutionizes data querying');
INSERT INTO testdocs VALUES (2, '机器学习模型需要高质量的数据嵌入');-- 生成向量嵌入
ALTER TABLE testdocs ADD (embedding VECTOR(384));UPDATE testdocs d
SET embedding = VECTOR_EMBEDDING(MINILM_MODEL USING d.content
);

 场景2:相似性搜索​

SELECT id, content, VECTOR_DISTANCE(embedding, VECTOR_EMBEDDING(MINILM_MODEL USING 'AI data processing'),COSINE) AS similarity
FROM testdocs
ORDER BY similarity DESC;--   --------------------------------------   ----------
1    Oracle AI Vector Search...                0.872
2    机器学习模型...                           0.215

、常见错误解决方案

  • ORA-40200:模型加载失败
    -- 检查模型访问权限
    SELECT directory_path 
    FROM ALL_DIRECTORIES 
    WHERE directory_name = 'MODEL_DIR';chmod -R 755 /opt/oracle/models
    • ORA-56904:向量维度不匹配
    • 修复​:调整表列定义 VECTOR(384)
    -- 检查模型输出维度
    SELECT vector_dimension 
    FROM USER_VECTOR_MODELS 
    WHERE model_name = 'ALL_MINILM_L12_V2';
    • CPU资源超限优化​:限制并发请求数 
    -- 监控资源使用
    SELECT * FROM VECTOR_RESOURCE_USAGE;

     ​TIPS:所有操作需在Oracle 23ai Free版限制内进行,建议生产环境使用企业版突破资源限制。此次实现Oracle 23ai的向量嵌入功能,将非结构化数据转化为可分析的语义向量,为AI搜索和分析奠定基础。 

    相关文章:

    12-Oracle 23ai Vector 使用ONNX模型生成向量嵌入

    一、Oracle 23ai Vector Embeddings 核心概念​ 向量嵌入(Vector Embeddings)​​ -- 将非结构化数据(文本/图像)转换为数值向量 - - 捕获数据的语义含义而非原始内容 - 示例:"数据库" → [0.24, -0.78, 0.5…...

    2. 库的操作

    2.1 创建数据库 语法: CREATE DATABASE [IF NOT EXISTS] db_name [create_specification [, create_specification] ...] create_specification: [DEFAULT] CHARACTER SET charset_name # 字符集: 存储编码 [DEFAULT] COLLATE collation_name # 校验集: 比较/选择/读…...

    pytorch 与 张量的处理

    系列文章目录 文章目录 系列文章目录一、Tensor 的裁剪二、Tensor 的索引与数据筛选torch.wheretorch.indicestorch.gathertorch.masked_selecttorch.taketorch.nonzero(省略) 三、Tensor 的组合与拼接torch.cattorch.stack 四、Tensor的切片chunksplit …...

    layer norm和 rms norm 对比

    Layer norm # Layer Norm 公式 mean x.mean(dim-1, keepdimTrue) var x.var(dim-1, keepdimTrue) output (x - mean) / sqrt(var eps) * gamma beta特点: 减去均值(去中心化)除以标准差(标准化)包含可学习参数 …...

    Java高级 | 【实验六】Springboot文件上传和下载

    隶属文章:Java高级 | (二十二)Java常用类库-CSDN博客 系列文章:Java高级 | 【实验一】Springboot安装及测试 |最新-CSDN博客 Java高级 | 【实验二】Springboot 控制器类相关注解知识-CSDN博客 Java高级 | 【实验三】Springboot 静…...

    RKNN开发环境搭建1-基于Ubuntu 18.04系统使用Docker安装rknn-toolkit2

    目录 写在最前面Docker 方式安装rknn-toolkit2写在最前面 瑞芯微在RKNN的环境搭建方面的资料很多,但是在搭建过程中发现很多问题教程中并未提及,对初学者不友好。所以博主做了这个系列的文章,从开始搭建环境到对于RKNN Model Zoo的示例进行实践,希望能对初学者有帮助。坚持…...

    qt使用笔记二:main.cpp详解

    Qt中main.cpp文件详解 main.cpp是Qt应用程序的入口文件&#xff0c;包含程序的启动逻辑。下面我将详细解析其结构和功能。 基本结构 一个典型的Qt main.cpp 文件结构如下&#xff1a; #include <QApplication> // 或者 QGuiApplication/QCoreApplication #include &…...

    VBA进度条ProgressForm1

    上一章《VBA如何使用ProgressBar进度条控件》介绍了ProgressBar控件的使用方法&#xff0c;今天我给大家介绍ProgressForm1进度条的使用方法&#xff0c;ProgressForm1是集成ProgressBar控件和Label控件的窗体&#xff0c;可以同时显示进度条和百分比&#xff0c;如下图&#x…...

    行为型设计模式之Interpreter(解释器)

    行为型设计模式之Interpreter&#xff08;解释器&#xff09; 前言&#xff1a; 自己的话理解&#xff1a;自定义一个解释器用来校验参数或数据是否合法。 1&#xff09;意图 给定一个语言&#xff0c;定义它的文法的一种表示&#xff0c;并定义一个解释器&#xff0c;这个解…...

    深入解析 CAS 操作

    一、CAS 的本质&#xff1a;硬件级别的乐观锁 CAS&#xff08;Compare-And-Swap&#xff0c;比较并交换&#xff09; 是一种原子操作指令&#xff0c;用于实现对共享变量的无锁并发修改。它是现代多核处理器支持的底层硬件指令&#xff0c;也是构建高效并发数据结构&#xff0…...

    vue3+TS+eslint9配置

    记录eslint升级到9.x的版本之后遇到的坑 在 ESLint 9 中&#xff0c;配置方式发生了变化。Flat Config 格式&#xff08;eslint.config.js 或 .ts&#xff09;不再支持 extensions 选项。所以vscode编辑器中的 extensions 需要注释掉&#xff0c;要不然保存的时候不会格式化。…...

    【bug】Error: /undefinedfilename in (/tmp/ocrmypdf.io.9xfn1e3b/origin.pdf)

    在使用ocrmypdf的时候&#xff0c;需要Ghostscript9.55及以上的版本&#xff0c;但是ubuntu自带为9.50 然后使用ocrmypdf报错了 sudo apt update sudo apt install ghostscript gs --version 9.50 #版本不够安装的版本为9.50不够&#xff0c;因此去官网https://ghostscript.c…...

    HarmonyOS5.0——CodeGenie:鸿蒙生态的AI编程革命​

    ​​CodeGenie&#xff1a;鸿蒙生态的AI编程革命​​ 华为推出的 ​​CodeGenie​​ 是集成于 DevEco Studio 的 AI 辅助编程工具&#xff0c;专为 HarmonyOS 应用开发设计。它通过深度优化 ArkTS 和 C 语言的代码生成能力&#xff0c;显著提升开发效率&#xff0c;降低鸿蒙生…...

    【Dv3Admin】系统视图字典管理API文件解析

    业务系统中静态数据管理常被忽视&#xff0c;但它直接影响到扩展性与维护效率。字典模块通过集中管理各类基础数据&#xff0c;避免硬编码&#xff0c;使系统具备更高的灵活性和适配能力&#xff0c;成为后台管理平台的重要基础组件。 文章解析 dvadmin/system/views/dictiona…...

    免费 SecureCRT8.3下载、安装、注册、使用与设置

    参考&#xff1a;SecureCRT 8.3中文 安装教程 - Hope - 博客园...

    Redis :String类型

    String类型 String是Redis中的字符串&#xff0c;是Redis中最基本的数据类型&#xff0c;直接是按照二进制数据的进行存储 Redis中的所有key都是String类型&#xff0c;但是value是有差别的 常见的命令 set 将String类型的value存储到key中&#xff0c;如果之间有相同的ke…...

    两种Https正向代理的实现原理

    正向代理 HTTPS 主要有两种方案&#xff0c;分别是基于证书的解密与再加密方案和基于 HTTP CONNECT 隧道的方案&#xff0c;以下是这两种方案的具体信息&#xff1a; 一、基于证书的解密与再加密方案 原理 工作原理&#xff1a;代理服务器拥有自己的证书&#xff0c;客户端需…...

    第18节 Node.js Web 模块

    什么是 Web 服务器&#xff1f; Web服务器一般指网站服务器&#xff0c;是指驻留于因特网上某种类型计算机的程序。 Web服务器的基本功能就是提供Web信息浏览服务。它只需支持HTTP协议、HTML文档格式及URL&#xff0c;与客户端的网络浏览器配合。 大多数web服务器都支持服务…...

    网络爬虫一课一得

    网页爬虫&#xff08;Web Crawler&#xff09;是一种自动化程序&#xff0c;通过模拟人类浏览行为&#xff0c;从互联网上抓取、解析和存储网页数据。其核心作用是高效获取并结构化网络信息&#xff0c;为后续分析和应用提供数据基础。以下是其详细作用和用途方向&#xff1a; …...

    LeetCode--24.两两交换链表中的结点

    解题思路&#xff1a; 1.获取信息&#xff1a; 给了一个链表&#xff0c;要求两两一组地交换位置 限定条件&#xff1a;只能进行结点交换&#xff0c;不能修改结点内部的值 额外条件&#xff1a;结点数在0-100的范围&#xff0c;闭区间 2.分析题目&#xff1a;…...

    嵌入式SDK技术EasyRTC音视频实时通话助力即时通信社交/教育等多场景创新应用

    一、引言​ 在数字化时代&#xff0c;即时通信已成为人们生活和工作中不可或缺的部分。音视频功能作为即时通信的核心&#xff0c;能实现更加直观、高效的信息传递。EasyRTC作为一款强大的实时通信框架&#xff0c;具备诸多优势&#xff0c;为即时通信的音视频应用提供了优质解…...

    IDEA集成JRebel插件,实现实时热部署

    系列文章目录 文章目录 系列文章目录一、JRebel是什么&#xff1f;1.1、对比传统开发流程1.2、JRebel特性以及优势 二、IDEA集成JRebel三、IDEA以JRebel运行报错处理四、IDEA以JRebel运行演示实时热部署 一、JRebel是什么&#xff1f; JRebel 是一款针对 Java 开发的热部署工具…...

    1-3 Linux-虚拟机(2025.6.7学习篇- mac版本)

    1、VMware Fusion下载 在windows系统中使用的VMwareWorkStation未提供Mac版&#xff0c;Mac系统可以使用VMwareFusionPro FusionPro和WorkstationPro均是VMware公司出品&#xff0c;完全兼容&#xff0c;体验基本是一致的。 下载地址&#xff1a;https://www.vmware.com/cn/pro…...

    如何打造一款金融推理工具Financial Reasoning Workflow:WebUI+Ollama+Fin-R1+MCP/RAG

    在之前的文章中&#xff0c;我探讨了如何使用具身人工智能&#xff0c;让大语言模型智能体来模仿[当今著名对冲基金经理的投资策略]。 在本文中&#xff0c;我将探讨另一种方法&#xff0c;该方法结合了经过金融推理训练的特定大语言模型&#xff08;LLM&#xff09;&#xff0…...

    mybatis的if判断==‘1‘不生效,改成‘1‘.toString()才生效的原因

    mybatis的xml文件中的if判断‘1’不生效&#xff0c;改成’1’.toString()才生效 Mapper接口传入的参数 List<Table> queryList(Param("state") String state);xml内容 <where><if test"state ! null and state 1">AND EXISTS(select…...

    【试卷篇】Spring面试试卷题

    一、选择题 1. 下面关于AOP的说法错误的是&#xff08; C&#xff09;。 A&#xff0e;AOP将散落在系统中的“方面”代码集中实现 B&#xff0e;AOP有助于提高系统的可维护性 C&#xff0e;AOP已经表现出了将要替代面向对象的趋势 D&#xff0e;AOP是一种设计模式&#xff0c…...

    通过阿里云 DashScope API 调用通义千问

    获取API Key 百炼控制台https://bailian.console.aliyun.com/?tabmodel#/api-key 步骤 1&#xff1a;安装 DashScope SDK pip install dashscope 步骤 2&#xff1a;LangChain 调用 from langchain_community.llms import Tongyi# 设置阿里云 API Key&#xff08;从环境变…...

    Go 中 map 的双值检测写法详解

    Go 中 map 的双值检测写法详解 在 Go 中&#xff0c;if char, exists : pairs[s[i]]; exists { 是一种利用 Go 语言特性编写的优雅条件语句&#xff0c;用于检测 map 中是否存在某个键。让我们分解解释这种写法&#xff1a; 语法结构解析 if value, ok : mapVariable[key]; …...

    大故障:阿里云核心域名爆炸了

    大故障&#xff1a;阿里云核心域名被拖走了 今天早上许多群里出现网站故障的讨论&#xff0c;比如 cnblogs 全国访问一片红&#xff0c;一看原来是阿里云又出故障了。 今天早上许多群里出现网站故障的讨论&#xff0c;比如 cnblogs 全国访问一片红&#xff0c;一看原来是阿里云…...

    解决Zotero翻译插件Zotero PDF Translate无法正常翻译

    试了很多方法了&#xff0c;不管怎么样还是报错&#xff0c;找到最简单的解决办法&#xff0c;把翻译引擎改成CNJI学术翻译就可以了。 不能用的原因是google 翻译API 无法调用。...