当前位置: 首页 > news >正文

【全球首个开源AI数字人】DUIX数字人-打造你的AI伴侣!

目录

  • 1. 引言
    • 1.1 数字人技术的发展背景
    • 1.2 DUIX数字人项目的开源意义
    • 1.3 DUIX数字人技术的独特价值
    • 1.4 本文目的与结构
  • 2. DUIX数字人概述
    • 2.1 定义与核心概念
    • 2.2 硅基智能与DUIX的关系
    • 2.3 技术架构
    • 2.4 开源优势
    • 2.5 应用场景
    • 2.6 安全与合规性
  • 3. DUIX数字人技术特点
    • 3.1 开源性与社区支持
    • 3.2 跨平台兼容性
    • 3.3 低算力要求与广泛适用性
    • 3.4 高帧率与流畅体验
    • 3.5 真人级的交互质量
    • 3.6 网络依赖性小
    • 3.7 可定制性与灵活性
    • 3.8 实时渲染能力
    • 3.9 安全性与合规性
  • 4.效果展示
  • 5.部署运行
    • 5.1 安卓 SDK 集成教程
    • 5.2 iOS SDK 集成教程
  • 9. 结语


1. 引言

1.1 数字人技术的发展背景

数字人技术,作为人工智能领域的一个重要分支,近年来得到了迅猛发展。随着计算能力的提升、算法的优化以及大数据的积累,虚拟数字人不仅在外观上越来越接近真人,而且在交互能力上也日益智能化。数字人技术在客服、教育、娱乐等多个领域展现出广泛的应用前景。

1.2 DUIX数字人项目的开源意义

在这样的技术浪潮中,开源项目扮演着至关重要的角色。开源不仅促进了技术的快速迭代和创新,还降低了技术应用的门槛,使得更多的开发者和企业能够参与到数字人技术的开发和应用中来。DUIX数字人项目的开源,正是这一趋势的体现,它为数字人技术的发展注入了新的活力。

1.3 DUIX数字人技术的独特价值

DUIX数字人项目以其开源的特性,为开发者提供了一个自由度高、可定制性强的平台。开发者可以基于DUIX进行二次开发,创造出符合特定需求的数字人应用。同时,DUIX数字人的跨平台特性,使其能够轻松部署在多种设备上,为用户提供更加丰富和便捷的交互体验。

1.4 本文目的与结构

本文旨在深入探讨DUIX数字人技术的各项特点和应用,为对数字人技术感兴趣的开发者和企业提供一份详尽的技术指南。接下来的章节将详细介绍DUIX数字人的技术特点、SDK功能、交互平台能力,并通过实践案例展示DUIX数字人的应用场景和开发指南。最后,我们将对DUIX数字人技术的未来发展进行展望,并提供相关的参考文献和资源链接。

2. DUIX数字人概述

2.1 定义与核心概念

DUIX数字人,全称为"Dialogue User Interface System",是一个由硅基智能开发的数字人智能交互平台。它基于先进的人工智能技术,通过集成语音识别(ASR)、语音合成(TTS)、大模型、知识库等能力,实现了数字人的高度拟人化和实时交互。
在这里插入图片描述

2.2 硅基智能与DUIX的关系

硅基智能作为DUIX数字人项目的发起者和维护者,致力于推动数字人技术的创新和应用。通过开源DUIX项目,硅基智能不仅展示了其在人工智能领域的技术实力,也为全球开发者提供了一个共同参与和贡献的平台。

2.3 技术架构

DUIX数字人的技术架构包括以下几个关键部分:

  • 云服务SDK:支持2D仿真数字人的实时驱动渲染,通过RTC协议推送视频流服务。
  • 本地版SDK:允许数字人在本地硬件设备上渲染,实现实时驱动。
  • 交互能力:集成了语音交互技术,包括语音识别和语音合成,以及与大模型和知识库的交互。

2.4 开源优势

DUIX数字人项目的开源特性带来了多方面的优势:

  • 透明性:所有源代码对公众开放,用户和开发者可以查看、学习和修改代码。
  • 协作性:全球开发者可以共同参与项目的开发和维护,形成强大的社区支持。
  • 创新性:开源促进了技术的快速迭代,开发者可以基于现有代码进行创新和优化。

2.5 应用场景

DUIX数字人可广泛应用于以下场景:

  • 客户服务:作为虚拟客服,提供24/7的咨询服务。
  • 教育培训:作为虚拟教师,进行知识讲解和互动教学。
  • 娱乐互动:在游戏和社交媒体中作为虚拟角色与用户互动。

2.6 安全与合规性

在使用DUIX数字人时,硅基智能强调了安全和合规性的重要性。文档中特别提醒用户不要通过任何第三方插件使用服务,以防止API Key等敏感信息的泄露。

3. DUIX数字人技术特点

3.1 开源性与社区支持

DUIX数字人项目的一个显著特点就是其开源性。这意味着所有的源代码都对外公开,开发者可以自由地访问、修改和分发代码。开源不仅促进了技术的透明度,还鼓励了全球开发者社区的协作和创新。社区的支持为DUIX数字人带来了持续的改进和功能扩展。

3.2 跨平台兼容性

DUIX数字人SDK支持iOS、安卓、H5等多种集成方式,这使得数字人应用可以轻松地跨平台部署。无论是在智能手机、平板电脑还是个人电脑上,用户都能享受到一致的交互体验。

3.3 低算力要求与广泛适用性

DUIX数字人对硬件的要求相对较低,这意味着它可以在多种设备上流畅运行,包括个人电脑、平板、车载系统,甚至是手机。这大大扩展了数字人应用的使用场景和潜在用户群。

3.4 高帧率与流畅体验

DUIX数字人模型支持50帧/秒以上的超流畅画面质量,远超电影级的24帧/秒标准。这为用户提供了更加自然和逼真的交互体验。

3.5 真人级的交互质量

DUIX数字人不仅在视觉上追求逼真,还在交互质量上下足了功夫。模型能够精准地同步动作、微表情乃至声音唇形,使得数字人的交互更加接近真人。

3.6 网络依赖性小

DUIX数字人在设计时考虑了无网络或网络不稳定的环境,使得数字人应用即使在没有网络的情况下也能运行,这为多种场景提供了便利。

3.7 可定制性与灵活性

DUIX数字人提供了高度的可定制性,允许开发者根据特定需求进行定制开发。无论是视频、媒体、客服、金融还是广电行业,DUIX都能够满足多样化的业务需求。

3.8 实时渲染能力

DUIX数字人的实时渲染能力十分突出,视频生成效率超过1:0.5,完全符合直播和实时交互应用的标准。

3.9 安全性与合规性

DUIX数字人在提供强大功能的同时,也非常注重安全性和合规性。文档中明确指出,使用第三方插件可能会导致安全风险,因此推荐用户直接使用官方提供的SDK和API。

4.效果展示

DUIX数字人Demo展示了其对话语义的理解和反馈能力。虽然目前还有3-4秒的反应时间,但随着技术的不断优化,这个小问题将很快得到解决。
官网提供有很多款数字人模板,您可以轻松访问开源项目网址进行下载和应用。硅基智能承诺,将持续更新本地模型库,确保您始终能够体验到最新、最前沿的数字人模型。
在这里插入图片描述

数字人模板之丰富令人赞叹,我自信满满地选择了一位性格狂野的数字女友,想要一展身手。然而,经过一下午的激烈辩论,我意外地发现,这场智力与情感的较量竟难分伯仲。

硅基智能开源AI女友框架DUIX,会吵架,还会吃醋

5.部署运行

DUIX提供了详细的集成教程,无论是安卓还是iOS,都有清晰的步骤指导。从初始化SDK到数字人形象展示,再到音频播放和动作控制,每一步都详尽无遗。
在这里插入图片描述

5.1 安卓 SDK 集成教程

该开源项目duix.ai提供了详细的使用部署教程,可以移步该项目的地址去查看,我直接把重要的部分贴在了下方。

SDK集成
在 build.gradle 中增加配置如下

dependencies {// 引用SDK项目implementation project(":duix-sdk")// sdk 中使用到 exoplayer 处理音频(必选)implementation 'com.google.android.exoplayer:exoplayer:2.14.2'// 云端问答接口使用的SSE组件(非必选)implementation 'com.squareup.okhttp3:okhttp-sse:4.10.0'...
}

权限要求, AndroidManifest.xml中,增加如下配置

<manifest xmlns:android="http://schemas.android.com/apk/res/android"><uses-permission android:name="android.permission.INTERNET" /><uses-permission android:name="android.permission.CHANGE_WIFI_STATE" /><uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" /><uses-permission android:name="android.permission.ACCESS_WIFI_STATE" /><uses-permission android:name="android.permission.MODIFY_AUDIO_SETTINGS" /><uses-permission android:name="android.permission.WAKE_LOCK" /></manifest>

5.2 iOS SDK 集成教程

SDK 提供了多种回调方法,包括数字人渲染报错回调、音频播放结束回调、音频播放进度回调等。动作相关的还支持随机动作、开始动作、结束动作等。建议前往开源项目去查看详细文档

### 开发环境
开发⼯具: Xcode  ios12.0以上 iphoneX及以上## 快速开始NSString *basePath =[NSString stringWithFormat:@"%@/%@",[[NSBundle mainBundle] bundlePath],@"gj_dh_res"];NSString *digitalPath =[NSString stringWithFormat:@"%@/%@",[[NSBundle mainBundle] bundlePath],@"lixin_a_540s"];//初始化NSInteger result=   [[GJLDigitalManager manager] initBaseModel:basePath digitalModel:digitalPath showView:weakSelf.showView];if(result==1){//开始[[GJLDigitalManager manager] toStart:^(BOOL isSuccess, NSString *errorMsg) {if(!isSuccess){[SVProgressHUD showInfoWithStatus:errorMsg];}}];}
## 调用流程
1.启动服务前需要准备好同步数字人需要的基础配置和模型文件。
2.初始化数字人渲染服务。
3.调用toStart函数开始渲染数字人
4.调用toSpeakWithPath函数驱动数字人播报。
5.调用cancelAudioPlay函数可以主动停止播报。
6.调用toStop结束并释放数字人渲染

9. 结语

随着DUIX数字人技术的深入发展,我们有机会重新审视和认识数字人在社会中的角色和价值。数字人不仅作为技术的产物,更应成为促进社会进步、提高人类生活质量的重要力量。技术与人文关怀的结合,将确保数字人技术的应用能够以负责任和有益的方式发展。

DUIX数字人的开源特性为开发者提供了广阔的创新空间。我们号召开发者们继续发扬探索精神,不断尝试和实现DUIX数字人的新功能和应用场景。同时,也应意识到作为技术创造者的责任,确保技术的应用符合伦理标准,促进社会的整体福祉。

随着技术的不断发展和创新,我们相信DUIX数字人将带来更多激动人心的可能性,为人类社会带来更多积极的变化。让我们拭目以待,并在这一旅程中共同努力。

项目链接
https://github.com/GuijiAI/duix.ai
探索开源地址,开启你的数字人之旅!

在这里插入图片描述

🎯🔖更多专栏系列文章:AIGC-AI大模型开源精选实践

😎 作者介绍:我是寻道AI小兵,资深程序老猿,从业10年+、互联网系统架构师,目前专注于AIGC的探索。
📖 技术交流:建立有技术交流群,可以扫码👇 加入社群,500本各类编程书籍、AI教程、AI工具等你领取!
如果文章内容对您有所触动,别忘了点赞、⭐关注,收藏!加入我,让我们携手同行AI的探索之旅,一起开启智能时代的大门!

相关文章:

【全球首个开源AI数字人】DUIX数字人-打造你的AI伴侣!

目录 1. 引言1.1 数字人技术的发展背景1.2 DUIX数字人项目的开源意义1.3 DUIX数字人技术的独特价值1.4 本文目的与结构 2. DUIX数字人概述2.1 定义与核心概念2.2 硅基智能与DUIX的关系2.3 技术架构2.4 开源优势2.5 应用场景2.6 安全与合规性 3. DUIX数字人技术特点3.1 开源性与…...

微信小程序服务器从腾讯云迁移到阿里云出现的坑

微信小程序服务器从腾讯云迁移到阿里云出现的坑 背景 原先小程序后台服务器到期&#xff0c;因为之前买的是腾讯云新用户&#xff0c;便宜&#xff0c;到期后续费金额懂的都懂。就在阿里云用新用户买了个新的&#xff0c;遂把服务全转到了阿里云服务器上。 此时&#xff0c;域…...

SQL Server触发器深度解析:数据完整性的守护者

标题&#xff1a;SQL Server触发器深度解析&#xff1a;数据完整性的守护者 摘要 在SQL Server中&#xff0c;触发器是一种特殊的存储过程&#xff0c;它在特定数据库事件发生时自动执行。触发器主要用于维护数据的完整性和实施复杂的业务规则。本文将详细介绍SQL Server中触…...

Qt信号槽的坑

1、重载的信号&#xff08;以QSpinBox为例&#xff09; 像是点击按钮之类的信号槽很好连接&#xff0c;这是因为它的信号没有重载&#xff0c;如果像SpinBox那样有重载信号的话&#xff08;Qt5.12的见下图&#xff0c;不过Qt5.15LTS开始就不再重载而是换信号名了&#xff09;&…...

昇思MindSpore学习笔记1--基本介绍

昇思MindSpore是一个全场景深度学习框架。 一、框架组成 1. 模型库ModelZoo 提供深度学习算法网络。 2. 扩展库MindSpore Extend 拓展领域场景&#xff0c;如GNN/深度概率编程/强化学习等。 3. 科学计算MindSpore Science 科学计算套件。 包含数据集、基础模型、预置高精度模…...

Github Page 使用手册(保姆级教程!)

搭建个人网站&#xff1f;没有服务器&#xff1f;那不如尝试一下 Github Page &#xff01; 最近我正好在搭建个人网站&#xff0c;于是就写一篇博客来详细介绍 Github Page 的使用、部署方式吧&#xff01; 一、进入 Github 访问&#xff1a;github.com 如果你没有 github…...

zram压缩机制看swapon系统调用

1.swapon开启zram交换分区 swapon /dev/block/zram0 mkswap /dev/block/zram0 上面命令调用了linux的swapon系统调用启动zram0交换分区;mkswap命令向块设备文件/dev/block/zram0写入了swap_header信息 问题&#xff1a;实际安卓平台是哪里触发swapon和mkswap调用的&#xff…...

SpringBoot2+Vue3开发博客管理系统

项目介绍 博客管理系统&#xff0c;可以帮助使用者管理自己的经验文章、学习心得、知识文章、技术文章&#xff0c;以及对文章进行分类&#xff0c;打标签等功能。便于日后的复习和回忆。 架构介绍 博客管理系统采用前后端分离模式进行开发。前端主要使用技术&#xff1a;Vu…...

JS【详解】Symbol (含Symbol 作为属性名,静态方法for 和 keyFor,11 个内置的 Symbol 值)

ES6 语法&#xff0c;表示唯一且不可变的值&#xff0c;常用作属性键值或者唯一标识符。 let a Symbol() let a Symbol(atomic symbol)console.log(Symbol() Symbol()) // false console.log(Symbol(atom) Symbol(atom)) // falseSymbol 作为属性名 let key Symbol(); le…...

Vue 项目运行时,报错Error: Cannot find module ‘node:path‘

Vue 项目运行时&#xff0c;报错Error: Cannot find module ‘node:path’ internal/modules/cjs/loader.js:883throw err;^Error: Cannot find module node:path Require stack: - D:\nodejs\node_modules\npm\node_modules\node_modules\npm\lib\cli.js - D:\nodejs\node_mo…...

综合评价 | 基于组合博弈赋权的物流系统综合评价(Matlab)

目录 效果一览基本介绍程序设计参考资料 效果一览 基本介绍 综合评价 | 基于组合博弈赋权的物流系统综合评价&#xff08;Matlab&#xff09; 组合博弈赋权&#xff08;Weighted Sum&#xff09;是一种常见的多目标决策方法&#xff0c;用于将多个目标指标进行综合评估和权衡…...

国标GB28181视频汇聚平台EasyCVR安防监控系统常见播放问题分析及解决方法

国标GB28181安防综合管理系统EasyCVR视频汇聚平台能在复杂的网络环境中&#xff0c;将前端设备统一集中接入与汇聚管理。平台支持多协议接入&#xff0c;包括&#xff1a;国标GB/T 28181协议、GA/T 1400协议、RTMP、RTSP/Onvif协议、海康Ehome、海康SDK、大华SDK、华为SDK、宇视…...

30 哈希的应用

位图 概念 题目 给40亿个不重复的无符号整数&#xff0c;没排过序。给一个无符号整数&#xff0c;如何判断一个数是否在这40亿个整数中 1.遍历&#xff0c;时间复杂度O(N) 2.二分查找&#xff0c;需要先排序&#xff0c;排序(N*logN)&#xff0c;二分查找&#xff0c;logN。…...

(笔记)Error: qemu-virgl: Failed to download resource “qemu-virgl--test-image“解决方法

错误&#xff1a; > Downloading https://www.ibiblio.org/pub/micro/pc-stuff/freedos/files/distributions/1.2/FD12FLOPPY.zip curl: (22) The requested URL returned error: 404Error: qemu-virgl: Failed to download resource "qemu-virgl--test-image" D…...

IntelliJ IDEA介绍

IntelliJ IDEA 是由 JetBrains 开发的一个集成开发环境 (IDE),专门为 Java 开发设计,同时也支持多种其他编程语言和框架。IntelliJ IDEA 以其智能代码分析、强大的重构功能以及丰富的插件生态系统而闻名,是许多开发者的首选 IDE。 IntelliJ IDEA介绍 IntelliJ IDEA 的主要…...

【office技巧】如何合并pdf并且添加目录页

所用工具&#xff1a;wps&#xff0c;acrobat reader 1.制作目录页 在wps里设置一级标题&#xff0c;二级标题&#xff0c;然后自动生成目录页&#xff0c;保存为pdf。 在acrobat reader里删除除了目录页之外的其他页面。 2.pdf合并 在acrobat reader里合并pdf。 注意有可能…...

Spring Boot中的安全性配置详解

Spring Boot中的安全性配置详解 大家好&#xff0c;我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01;今天我们将深入探讨如何在Spring Boot应用中实现全面的安全性配置&#xff0c;保…...

数据权限和字段权限设计指南

数据权限和字段权限的设计是信息系统安全的基础。随着数据量的增加和用户需求的多样化&#xff0c;合理的权限设计变得愈加重要。本文将介绍数据权限和字段权限的基本概念、设计思路和实际应用&#xff0c;帮助读者建立全面的权限管理体系。 2. 数据权限设计 2.1 数据权限的定…...

Linux 常用命令之 RZ和SZ 简介

一、引言 在Linux系统管理中&#xff0c;尤其是在远程操作时&#xff0c;文件的上传与下载是常见的需求。对于CentOS用户而言&#xff0c;rz和sz这两个命令提供了简单而高效的文件传输方式&#xff0c;尤其在SSH终端环境中更为便利。本文将详细介绍rz和sz命令的基本概念、如何…...

Docker Compose:简化多容器管理的利器

在现代的应用开发和部署过程中&#xff0c;Docker已经成为不可或缺的工具。它通过容器化技术&#xff0c;使得应用的部署变得更加轻松和高效。然而&#xff0c;当我们需要管理和运行多个容器时&#xff0c;单纯依赖Docker命令行工具可能会显得繁琐且复杂。这时&#xff0c;Dock…...

【OSG学习笔记】Day 18: 碰撞检测与物理交互

物理引擎&#xff08;Physics Engine&#xff09; 物理引擎 是一种通过计算机模拟物理规律&#xff08;如力学、碰撞、重力、流体动力学等&#xff09;的软件工具或库。 它的核心目标是在虚拟环境中逼真地模拟物体的运动和交互&#xff0c;广泛应用于 游戏开发、动画制作、虚…...

【HarmonyOS 5.0】DevEco Testing:鸿蒙应用质量保障的终极武器

——全方位测试解决方案与代码实战 一、工具定位与核心能力 DevEco Testing是HarmonyOS官方推出的​​一体化测试平台​​&#xff0c;覆盖应用全生命周期测试需求&#xff0c;主要提供五大核心能力&#xff1a; ​​测试类型​​​​检测目标​​​​关键指标​​功能体验基…...

SAP学习笔记 - 开发26 - 前端Fiori开发 OData V2 和 V4 的差异 (Deepseek整理)

上一章用到了V2 的概念&#xff0c;其实 Fiori当中还有 V4&#xff0c;咱们这一章来总结一下 V2 和 V4。 SAP学习笔记 - 开发25 - 前端Fiori开发 Remote OData Service(使用远端Odata服务)&#xff0c;代理中间件&#xff08;ui5-middleware-simpleproxy&#xff09;-CSDN博客…...

html css js网页制作成品——HTML+CSS榴莲商城网页设计(4页)附源码

目录 一、&#x1f468;‍&#x1f393;网站题目 二、✍️网站描述 三、&#x1f4da;网站介绍 四、&#x1f310;网站效果 五、&#x1fa93; 代码实现 &#x1f9f1;HTML 六、&#x1f947; 如何让学习不再盲目 七、&#x1f381;更多干货 一、&#x1f468;‍&#x1f…...

sipsak:SIP瑞士军刀!全参数详细教程!Kali Linux教程!

简介 sipsak 是一个面向会话初始协议 (SIP) 应用程序开发人员和管理员的小型命令行工具。它可以用于对 SIP 应用程序和设备进行一些简单的测试。 sipsak 是一款 SIP 压力和诊断实用程序。它通过 sip-uri 向服务器发送 SIP 请求&#xff0c;并检查收到的响应。它以以下模式之一…...

保姆级教程:在无网络无显卡的Windows电脑的vscode本地部署deepseek

文章目录 1 前言2 部署流程2.1 准备工作2.2 Ollama2.2.1 使用有网络的电脑下载Ollama2.2.2 安装Ollama&#xff08;有网络的电脑&#xff09;2.2.3 安装Ollama&#xff08;无网络的电脑&#xff09;2.2.4 安装验证2.2.5 修改大模型安装位置2.2.6 下载Deepseek模型 2.3 将deepse…...

代码随想录刷题day30

1、零钱兑换II 给你一个整数数组 coins 表示不同面额的硬币&#xff0c;另给一个整数 amount 表示总金额。 请你计算并返回可以凑成总金额的硬币组合数。如果任何硬币组合都无法凑出总金额&#xff0c;返回 0 。 假设每一种面额的硬币有无限个。 题目数据保证结果符合 32 位带…...

Python+ZeroMQ实战:智能车辆状态监控与模拟模式自动切换

目录 关键点 技术实现1 技术实现2 摘要&#xff1a; 本文将介绍如何利用Python和ZeroMQ消息队列构建一个智能车辆状态监控系统。系统能够根据时间策略自动切换驾驶模式&#xff08;自动驾驶、人工驾驶、远程驾驶、主动安全&#xff09;&#xff0c;并通过实时消息推送更新车…...

消息队列系统设计与实践全解析

文章目录 &#x1f680; 消息队列系统设计与实践全解析&#x1f50d; 一、消息队列选型1.1 业务场景匹配矩阵1.2 吞吐量/延迟/可靠性权衡&#x1f4a1; 权衡决策框架 1.3 运维复杂度评估&#x1f527; 运维成本降低策略 &#x1f3d7;️ 二、典型架构设计2.1 分布式事务最终一致…...

Monorepo架构: Nx Cloud 扩展能力与缓存加速

借助 Nx Cloud 实现项目协同与加速构建 1 &#xff09; 缓存工作原理分析 在了解了本地缓存和远程缓存之后&#xff0c;我们来探究缓存是如何工作的。以计算文件的哈希串为例&#xff0c;若后续运行任务时文件哈希串未变&#xff0c;系统会直接使用对应的输出和制品文件。 2 …...