AI日报:百度发布文心大模型学习机;Open-Sora 1.1可生成21秒视频;Canva可以自动剪辑视频了;超牛ComfyUI节点AnyNode来了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:AIbase - 智能匹配最适合您的AI产品和网站
1、百度文心大模型学习机“小度学习机Z30”发布
这篇文章介绍了百度旗下的小度科技推出的首款基于文心大模型的学习机Z30,旨在重新定义AI老师,通过先进的AI技术助力孩子主动学习,同时让家长享受全陪伴的超省心体验。该学习机拥有出色的视觉体验和多项先进技术,以及针对多个学习环节的全面重构,提供科学、高效的学习方案。AI老师能够提供丰富的教育内容,支持多轮交互和个性化定制,让学习更加生动有趣和高效有针对性。

【AiBase提要:】
📚 小度Z30学习机采用文心大模型技术,逼真还原课文情景,帮助孩子更好地理解和掌握知识。
👩🏫 小度Z30支持AI师生互动课和课后个性化练习,量身定制学习计划,实现全科全学段的随时答疑。
💡 AI老师基于文心知识增强的大模型,为孩子提供权威且丰富的教育内容,支持多模态感知和拟人化呈现,让学习更加生动有趣。
2、Open-Sora 1.1发布 视频质量提升,生成时长延长至21秒
Open-Sora1.1发布带来了显著提升,尤其在视频生成质量和时长方面。新版本模型能生成最长约21秒视频,使用高质量视觉数据和字幕训练,提升对世界运作的理解。CausalVideoVAE架构优化提高性能和推理效率。

【AiBase提要:】
🚀 视频生成质量和时长提升: 新版本能生成最长约21秒视频,通过高质量视觉数据和字幕训练,提升对世界运作的理解。
🔍 高质量视觉数据和字幕训练: 使用更高质量的视觉数据和字幕进行训练,增强模型对世界运作的理解。
⚙️ CausalVideoVAE架构优化: 优化后的架构提高了视频生成的性能和推理效率,与Sora基础模型性能相似。
详情链接:Open-Sora-Plan-v1.1.0使用入口地址 Ai模型最新工具和软件app下载
在线体验地址:https://huggingface.co/spaces/LanguageBind/Open-Sora-Plan-v1.1.0
3、Canva上线多个好用功能:文本生成插画、自动剪辑视频精华片段
Canva设计平台最新更新旨在提升专业团队和工作空间的吸引力,包括重新设计平台、推出企业版、提供AI风格匹配功能等。更新内容涵盖多项功能和改进,使设计工作更高效便捷。

【AiBase提要:】
🎨 Canva推出企业版,提供更多协作和安全性控制。
🌟 新增AI风格匹配功能,定制工作区显示文件夹。
💡 Canva Docs推出建议模式和彩色突出显示块,提供编辑建议和强调文本区域。
4、超牛ComfyUI节点AnyNode来了!要啥功能让AI帮你编写
AnyNode是ComfyUI中一个令人印象深刻的新节点,利用了大型语言模型(LLMs)的能力,允许用户通过输入提示词来创建具有特定功能的节点。它为用户提供了在ComfyUI中进行多样化操作的工具,极大地扩展了用户在创建自定义节点和工作流时的可能性。对于希望实现高级功能和自动化任务的用户来说,无疑是一个宝贵的资源。
作者发布的视频教程
【AiBase提要:】
🔑 功能编写: 用户可以根据要求编写Python函数,实现任何功能。
🔧 灵活性: 用户可以通过提示词让LLM帮助编写不同类型的节点,如文本总结、颜色通道调整、Ins滤镜效果等。
🔗 与ComfyUI的兼容性: AnyNode作为ComfyUI中的节点,可以与其他节点配合使用,链接到所需的输出格式节点。
详情链接:https://top.aibase.com/tool/anynode
5、ChatTTS:一个专为对话场景设计的语音生成模型
ChatTTS是一个专为对话场景设计的语音生成模型,支持中文和英文,通过大量数据训练,提供高质量和自然度的语音合成。项目团队计划开源一个基础模型,注重模型的可控性和安全性。用户在使用ChatTTS时需注意免责声明,开源模型将为社区带来新的学习和创新机会。

【AiBase提要:】
🔑 应用场景广泛:ChatTTS适用于大型语言模型助手的对话任务、对话语音和视频介绍,提供自然流畅的交互体验。
🔑 多语言支持:模型支持中文和英文,跨越语言障碍,服务于更广泛的用户群体。
🔑 开源计划:团队计划开源一个基础模型,促进学术界和开发者社区的研究和开发。
详情链接:https://www.bilibili.com/video/BV1zn4y1o7iV/
项目地址:ChatTTS使用入口地址 Ai模型最新工具和软件app下载
6、视频修复项目ProPainter发布Comfyui节点
这篇文章介绍了ComfyUI_ProPainter_Nodes项目,它是一个专门针对视频修复的解决方案,基于ProPainter框架并实现了ComfyUI界面。该项目提供了高级视频帧编辑和无缝的视频修复任务,为视频编辑和修复领域带来了强大的工具。

【AiBase提要:】
🔧 基于ProPainter框架,提供高级视频帧编辑和无缝的视频修复任务。
🎨 提供视频修复节点,包括ProPainter节点和ProPainter Outpainting节点。
📚 提供详细的安装说明、工作流程示例和推荐节点,丰富的输入参数和节点参考信息。
详情链接:https://top.aibase.com/tool/comfyui-propainter-nodes
7、AI可以生成手语手势视频了!SignLLM通过文字描述即可生成手语视频
SignLLM是一项创新的多语言手语模型,为听力障碍者提供了重要的沟通工具,推动了人工智能在语言理解和生成领域的研究。它通过文字描述生成手语视频,促进信息的无障碍交流。

【AiBase提要:】
🤖 文本到手语视频转换:SignLLM模型能将文本转化为手语手势视频,直观易懂。
🌍 支持多种手语:包括美国手语(ASL)、德国手语(GSL)等八种手语,适用性广泛。
📊 首创多语言手语数据集:引入Prompt2Sign数据集,对模型训练和发展至关重要。
详情链接:https://top.aibase.com/tool/signllm
8、降噪黑科技Look Once to Hear!只需看一眼说话的人 除了他以外的声音就消失了
这篇文章介绍了一种先进的降噪耳机技术“Look Once to Hear”,通过用户的视觉输入来控制声音的放大或消除。这项技术在嘈杂环境中提供了专注和便利,让用户能够清晰听到目标说话者的声音。可能结合了人工智能、机器学习和声音处理算法,对听力障碍者尤其有用。

【AiBase提要:】
👀 视觉控制: 用户只需短暂看向想要聆听的说话者,耳机便能识别并放大该说话者的声音。
🌆 环境适应性: 适用于嘈杂环境,帮助用户在街道、咖啡馆等场合中清晰听到目标说话者的声音。
🚶 移动中使用: 即使用户在移动中,耳机能持续追踪并播放目标说话者的语音,提供专注和便利。
详情链接:https://top.aibase.com/tool/lookoncetohear
9、Meta被曝使用Instagram等照片训练AI模型引发隐私争议
这篇文章揭露了Meta利用Instagram和Facebook用户照片训练AI模型的隐私争议。用户隐私受到严重侵犯,数据隐私搜集条例被严重违反。Meta声称用户可以退出数据搜集模式,但之前搜集的数据仍可能保存在AI模型中,引发关注和担忧。在数据隐私和保护方面,企业应加强合规措施,确保用户个人信息得到妥善处理和保护。
【AiBase提要:】
📷 Meta使用用户照片训练AI模型,违反数据隐私搜集条例
🔍 用户隐私受到侵犯,引发广泛关注
❌ 用户可以退出数据搜集模式,但之前搜集的数据仍可能保存在AI模型中
10、比对口型还牛!InstructAvatar:实现文字生成指定面部的表情和动作
InstructAvatar 是一项最新的对话形象生成模型,通过文本引导方法实现了对情感和面部动作的细粒度控制,提升了虚拟形象的互动性和泛化能力。该模型在细粒度情感控制、口型同步质量和自然性方面优于现有方法,能指定面部的表情和动作,为生成具有情感表达的2D虚拟形象带来了突破性进展。

【AiBase提要:】
👄 InstructAvatar 实现了对情感和面部动作的细粒度控制,提升了虚拟形象的互动性和泛化能力。
😊 实验结果显示,InstructAvatar 在细粒度情感控制、口型同步质量和自然性方面优于现有方法,能指定面部的表情和动作。
🎭 InstructAvatar 的框架包括变分自动编码器(VAE)和基于扩散模型的动作生成器,通过自然语言界面实现了对生成视频的细粒度控制。
详情链接:https://top.aibase.com/tool/instructavatar
11、马斯克的 xAI 融资 60 亿美元,估值达 240 亿美元
Elon Musk的xAI公司在B轮融资中成功筹集了60亿美元,使公司估值达到240亿美元。该公司致力于开发先进的人工智能系统,旨在为全人类提供真实、有能力且最大限度有益的AI技术。最新融资将用于推出首个产品、建设先进基础设施,并加速未来技术的研发。
【AiBase提要:】
💰 xAI公司在B轮融资中筹集了60亿美元,估值达240亿美元
🚀 最新融资将用于推出首个产品、建设先进基础设施,并加速未来技术的研发
🤖 xAI正在开发先进的人工智能系统,旨在为全人类提供真实、有能力且最大限度有益的AI技术
12、苹果的“Greymatter 项目”将是普通用户在日常中可使用的AI工具
苹果将在即将到来的WWDC上展示其最新的人工智能进展,重点放在普通用户可以在日常生活中使用的AI工具上。新计划名为“Project Greymatter”,将整合AI工具到主要应用中,并改进操作系统通知功能。苹果的AI策略是追赶竞争对手,利用用户基础和隐私品牌形象继续引领市场。
【AiBase提要:】
🔍 苹果将在WWDC展示最新的人工智能进展,专注于普通用户可用的AI工具。
🛠 苹果计划将AI工具整合到主要应用中,改进操作系统通知功能。
💬 苹果与OpenAI合作开发聊天机器人,但不会在WWDC展示,而是作为插件显示在iOS18中。
相关文章:
AI日报:百度发布文心大模型学习机;Open-Sora 1.1可生成21秒视频;Canva可以自动剪辑视频了;超牛ComfyUI节点AnyNode来了
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:AIbase - 智能匹配最适合您的AI产品和网站 1、百度文心…...
VUE3+TS+elementplus+Django+MySQL实现从数据库读取数据,显示在前端界面上
一、前言 前面通过VUE3和elementplus创建了一个table,VUE3TSelementplus创建table,纯前端的table,以及使用VUE3TSelementplus创建一个增加按钮,使用前端的静态数据,显示在表格中。今天通过从后端获取数据来显示在表格…...
用c++做贪吃蛇
由于蛇是由多块蛇身组成的,机构体数组或者链表来存储蛇 蛇在运行过程中,如果吃了食物,那么这块食物就可以看作是新的蛇头了, 数组存储 存储新蛇身,在数组的第一个位置插入一个元素。 链表 插入和删除元素效率很高&…...
【UE5.1 角色练习】08-传送技能
前言 在上一篇(【UE5.1 角色练习】07-AOE技能)基础上继续实现人物通过鼠标点击然后传送技能的功能。 效果 步骤 1. 首先需要显示鼠标光标,我们可以在玩家控制器中勾选“显示鼠标光标” 2. 在项目设置中添加一个操作映射,设置按…...
力扣283题:移动零(快慢指针)
给定一个数组 nums,编写一个函数将所有 0 移动到数组的末尾,同时保持非零元素的相对顺序。 请注意 ,必须不复制数组的情况下原地对数组进行操作。 示例 1: 输入: nums [0,1,0,3,12] 输出: [1,3,12,0,0]示例 2: 输入: nums [0] 输出: [0…...
Java面试精粹:高级问题与解答集锦(一)
Java 高级面试问题及答案 问题1:Java中如何实现多线程,以及有哪些线程同步机制? 答案: Java实现多线程主要有两种方式:继承 Thread 类和实现 Runnable 接口。通过继承 Thread 类,可以重写 run() 方法来定…...
Yourpassword does not satisfy the current policyrequirements
mysql 新增数据库用户失败 解决方法: 修改校验密码策略等级 set global validate_password.policyLOW;...
解决vue3 vite打包报Root file specified for compilation问题
解决方法: 修改package.json打包命令 把 "build": "vue-tsc --noEmit && vite build" 修改为 "build": "vite build" 就可以了 另外关于allowJs这个问题,在tsconfig.json文件中配置"allowJs&qu…...
Java Swing + MySQL图书借阅管理系统
系列文章目录 Java Swing MySQL 图书管理系统 Java Swing MySQL 图书借阅管理系统 文章目录 系列文章目录前言一、项目展示二、部分代码1.Book2.BookDao3.DBUtil4.BookAddInternalFrame5.Login 三、配置 前言 项目是使用Java swing开发,界面设计比较简洁、适合作…...
ssm招聘信息管理系统-计算机毕业设计源码78049
摘 要 由于数据库和数据仓库技术的快速发展,招聘客户管理系统建设越来越向模块化、智能化、自我服务和管理科学化的方向发展。招聘客户系统对处理对象和服务对象,自身的系统结构,处理能力,都将适应技术发展的要求发生重大的变化。…...
eBPF可观测之网络流量控制和管理traffic control浅尝
目录 工程背景 环境准备 安装工具 安装依赖包 安装C依赖库 操作步骤 目录结构 代码展示 效果展示 拓展提升 工程背景 首先发表一个"暴论" eBPF在可观测方面的应用,就是各种google。 不需要学习内核,只要掌握ebpf开发套路。…...
Java技术精粹:高级面试问题与解答指南(二)
Java面试问题及答案 1. 什么是Java中的集合框架?请简述其主要接口和类。 答案: Java中的集合框架是一个设计用来存储和操作大量数据的统一架构。它主要由以下几个接口及其实现类组成: Collection: 它是最基本的集合接口,所有单列…...
地下停车场FM信号覆盖系统技术原理用与应用
随着我国城市化水平的快速推进与房地产的快速发展,城市停车场称为每栋建筑物的硬性配套建筑,尤其是商业综合体、医院、政府机关、机场、高铁站等场所出现了超大规模停车场,停放车辆可达数千辆,停车场的智能化与信息化水平也越来越…...
idea 出现 cpu占用100%
一、IDEA的CPU占用率过高 二、解决办法 idea安装路径bin目录 修改idea64.exe.vmoptions配置文件 原来的 -Xms128m -Xmx750m -XX:ReservedCodeCacheSize240m -XX:UseConcMarkSweepGC -XX:SoftRefLRUPolicyMSPerMB50 修改为(IDEA优化内存配置) -Xms2048m -Xmx4096m -XX:Reser…...
如何学到数据库从入门到入土(MySQL篇)
本篇会加入个人的所谓鱼式疯言 ❤️❤️❤️鱼式疯言:❤️❤️❤️此疯言非彼疯言 而是理解过并总结出来通俗易懂的大白话, 小编会尽可能的在每个概念后插入鱼式疯言,帮助大家理解的. 🤭🤭🤭可能说的不是那么严谨.但小编初心是能让更多人能接…...
安卓手机APP开发__Wi-Fi扫描概述
安卓手机APP开发__Wi-Fi扫描概述 目录 概述 Wi-Fi的扫描过程 限制 权限 Android 8.0 and Android 8.1: Android 9: Android 10 (API 级别 29) 和 更高版本: 扫描频率的限制 Android 8.0 and Android 8.1: Android 9: Android 10 and higher: 概述 你能使用Wi-Fi的…...
深入理解二叉树及其在C语言中的实现
一、引言 二叉树是数据结构中一种非常基础且重要的树形结构,它的每个节点最多有两个子节点,通常被称为左子节点和右子节点。二叉树在计算机科学中有着广泛的应用,如搜索、排序、存储数据等。本文将详细介绍二叉树的基本概念、特性以及在C语言…...
基于ssm+vue图书管理系统
基于ssmvue图书管理系统 ssm477图书管理系统 相关技术 javassmmysqlvueelementui...
高防ip能防护变异CC攻击吗
高防ip能防护变异CC攻击吗?随着互联网的不断发展,网络安全问题也日益突出,各类网络攻击层出不穷,其中CC攻击(Challenge Collapsar攻击)及其变种——变异CC攻击,更是让众多企业和个人网站头疼不已…...
从多站点到多活,XEOS 对象数据容灾能力再提升
近日, XSKY SDS V6.4 新版本发布,其中 XEOS V6.4 全新升级并完善了统一命名空间功能,更进一步增强和完善了异地容灾方案,配合强一致代理读,可以实现异地多活;同时大幅降低管理复杂度,有效降低容…...
Vue记事本应用实现教程
文章目录 1. 项目介绍2. 开发环境准备3. 设计应用界面4. 创建Vue实例和数据模型5. 实现记事本功能5.1 添加新记事项5.2 删除记事项5.3 清空所有记事 6. 添加样式7. 功能扩展:显示创建时间8. 功能扩展:记事项搜索9. 完整代码10. Vue知识点解析10.1 数据绑…...
MySQL 隔离级别:脏读、幻读及不可重复读的原理与示例
一、MySQL 隔离级别 MySQL 提供了四种隔离级别,用于控制事务之间的并发访问以及数据的可见性,不同隔离级别对脏读、幻读、不可重复读这几种并发数据问题有着不同的处理方式,具体如下: 隔离级别脏读不可重复读幻读性能特点及锁机制读未提交(READ UNCOMMITTED)允许出现允许…...
day52 ResNet18 CBAM
在深度学习的旅程中,我们不断探索如何提升模型的性能。今天,我将分享我在 ResNet18 模型中插入 CBAM(Convolutional Block Attention Module)模块,并采用分阶段微调策略的实践过程。通过这个过程,我不仅提升…...
UDP(Echoserver)
网络命令 Ping 命令 检测网络是否连通 使用方法: ping -c 次数 网址ping -c 3 www.baidu.comnetstat 命令 netstat 是一个用来查看网络状态的重要工具. 语法:netstat [选项] 功能:查看网络状态 常用选项: n 拒绝显示别名&#…...
Go 语言接口详解
Go 语言接口详解 核心概念 接口定义 在 Go 语言中,接口是一种抽象类型,它定义了一组方法的集合: // 定义接口 type Shape interface {Area() float64Perimeter() float64 } 接口实现 Go 接口的实现是隐式的: // 矩形结构体…...
转转集团旗下首家二手多品类循环仓店“超级转转”开业
6月9日,国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解,“超级…...
P3 QT项目----记事本(3.8)
3.8 记事本项目总结 项目源码 1.main.cpp #include "widget.h" #include <QApplication> int main(int argc, char *argv[]) {QApplication a(argc, argv);Widget w;w.show();return a.exec(); } 2.widget.cpp #include "widget.h" #include &q…...
汇编常见指令
汇编常见指令 一、数据传送指令 指令功能示例说明MOV数据传送MOV EAX, 10将立即数 10 送入 EAXMOV [EBX], EAX将 EAX 值存入 EBX 指向的内存LEA加载有效地址LEA EAX, [EBX4]将 EBX4 的地址存入 EAX(不访问内存)XCHG交换数据XCHG EAX, EBX交换 EAX 和 EB…...
Redis的发布订阅模式与专业的 MQ(如 Kafka, RabbitMQ)相比,优缺点是什么?适用于哪些场景?
Redis 的发布订阅(Pub/Sub)模式与专业的 MQ(Message Queue)如 Kafka、RabbitMQ 进行比较,核心的权衡点在于:简单与速度 vs. 可靠与功能。 下面我们详细展开对比。 Redis Pub/Sub 的核心特点 它是一个发后…...
Android屏幕刷新率与FPS(Frames Per Second) 120hz
Android屏幕刷新率与FPS(Frames Per Second) 120hz 屏幕刷新率是屏幕每秒钟刷新显示内容的次数,单位是赫兹(Hz)。 60Hz 屏幕:每秒刷新 60 次,每次刷新间隔约 16.67ms 90Hz 屏幕:每秒刷新 90 次,…...
