当前位置: 首页 > news >正文

20240809 每日AI必读资讯

乒乓球AI机器人赢了人类!正反手灵活转换,擦网球高球都能接 

- 谷歌发布首个达到人类竞技水平的机器人Agent,挑战乒乓球赛场。

- 机器人通过学习大量乒乓球状态数据,掌握了正手上旋球、反手瞄准等技能,展现出高速运动和实时精确性。

- 机器人在与不同技能水平选手的比赛中取得一定成绩,展现出与人类对手直接竞争的能力。

🔗 https://sites.google.com/view/competitive-robot-table-tennis/home

🔗 详情:https://blog.csdn.net/m0_46163918/article/details/141068947

 通义千问推出专门的数学语言模型:Qwen2-Math 

- 性能超越GPT-4o、Claude-3.5等

- Qwen2-Math 包括 1.5B、7B 和 72B 。 是基于 Qwen2 LLM 构建的专门针对数学解题的模型。

- 在多个数学基准测试中数学能力显著超越了开源模型包括Llama-3.1-405B,甚至超过了闭源模型 (包括GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro )。

苹果发布一种新的图像和视频生成方法:Matryoshka Diffusion Models (MDM)

- 可以理解为“套娃扩散模型”。名字来源于俄罗斯套娃,因为它像套娃一样,把小的结构嵌套在大的结构里。

- MDM 能够在不同清晰度下同时处理图像,比如它可以同时生成低清晰度的草图和高清晰度的细节部分。 这种方法让整个过程更快,而且生成的图像质量更高。

- 用于生成高质量图像和视频的模型面临很大的计算和优化难题。大多数方法要么在图像的像素层面上逐步生成,要么通过先训练一个压缩图像的模型,再在低分辨率的图像上进行处理。

- MDM 的创新在于它能同时处理不同分辨率的图像。就像你在画一幅画,先画小的细节,然后再画大的背景,MDM 就是这样同时处理不同层次的内容。

- 训练过程是从低分辨率到高分辨率逐步进行的,这让生成高分辨率图像和视频变得更加高效。

- MDM 不仅限于静态图像生成,还可以扩展到视频生成领域,生成符合文本描述的动态视频序列。

- 研究表明,这种方法可以生成分辨率高达 1024x1024 像素的图像,并且即使使用相对较少的数据,它也能很好地生成出符合要求的图像。

🔗GitHub:https://github.com/apple/ml-mdm

🔗论文:https://arxiv.org/pdf/2310.15111

 字节跳动AI助手豆包app、电脑版上线音乐生成功能

- 用户可在豆包app或电脑版中生成独特歌曲,选择曲风、氛围和人声,歌词限制在200字以内。

- 提供11种不同音乐风格和多种情绪状态选择,包括民谣、嘻哈、R&B,用户可选择男声或女声演唱。

- 用户可一键生成完整歌词,下载并分享生成的歌曲和封面。音乐生成功能仍在不断完善中,豆包鼓励用户用音乐分享故事,激发创造力。

LSLM:一种新的语音模型 

- 由上海交通大学X-LANCE人工智能实验室和字节跳动联合开发的一种新的语言模型

- 能够在说话的同时也能听到外界的声音,从而支持实时的语音交互。

- 而且还可以随时打断它,即时是在嘈杂的环境中也能工作。

🔗项目地址:https://ziyang.tech/LSLM/

相关文章:

20240809 每日AI必读资讯

乒乓球AI机器人赢了人类!正反手灵活转换,擦网球高球都能接 - 谷歌发布首个达到人类竞技水平的机器人Agent,挑战乒乓球赛场。 - 机器人通过学习大量乒乓球状态数据,掌握了正手上旋球、反手瞄准等技能,展现出高速运动…...

《投资的原理》阅读笔记一

这是我准备集中学习投资类书籍后阅读的第8本书,但是是第一本读到一半决定从新开始、每章都写笔记的第一本书。 《投资的原理》的作者陈嘉禾先生是一位资深的价值投资者,书中也是大力弘扬着价值投资,跟我倾向于量化投资方向的想法并不合拍&am…...

金九银十,全网最详细的软件测试面试题总结

前面看到了一些面试题,总感觉会用得到,但是看一遍又记不住,所以我把面试题都整合在一起,都是来自各路大佬的分享,为了方便以后自己需要的时候刷一刷,不用再到处找题,今天把自己整理的这些面试题…...

ActiveMQ任意文件写入漏洞(CVE-2016-3088)复现

一.环境配置 腾讯云的ubuntu操作系统,已经安装有docker 和 vulhub 直接来到 启动环境docker-compose,要在root权限下运行。 docker-compose up -d 若出现等待时间过长的情况,请参考这篇文章http://t.csdnimg.cn/SYhbE 访问http://公网ip:8…...

网络协议四 物理层,数据链路层

从这一节开始学习 五层模型。学习方法是从最底层物理层开始学习 七层模型 五层模型 各个层用的协议,以及加上协议后的称谓 各个层的作用 应用层:可以认为是原始数据,该数据称为 报文,用户数据。 运输层:也叫传输层&am…...

Python知识点:如何使用Twisted进行异步网络编程

Twisted是一个事件驱动的网络编程框架,支持异步编程,适用于处理大量并发网络连接的应用。使用Twisted进行异步网络编程可以分为以下几个步骤: 安装Twisted: 首先需要安装Twisted库,可以使用pip进行安装: pi…...

循环神经网络

一、RNN神经网络 基本网络结构 RNN神经网络数学模型 RNN反向传播 二、LSTM神经网络 LSTM的遗忘门 对数据进行筛选,有的抛弃,有的保留 LSTM的输入门 LSTM输出门 LSTM缓解RNN梯度消失问题...

SQL进阶技巧:有序数据合并问题之如何按照指定的规则对数据进行合并?【详解collect_list函数有序性保证】

目录 0 问题描述【小红书面试题】 1 数据准备 2 问题分析 3 小结 0 问题描述【小红书】 有如下需求,需要将左边的表变换成右边的表,注意字段内容的顺序及对应内容的一致性。 第一个字段为name,第二个字段为subject,第三个字段为score,变换后要求subject按照语文、数学…...

windows和office微软官方免费激活教程

微软提供了windows系统和office的官方免费激活,其实不用去买什么激活码,官方提供了激活方式,完全免费。目前测试没发现什么问题,windows还支持永久激活,比一些乱七八糟的kms激活工具还省心。 github地址:Gi…...

【C++ 面试 - 基础题】每日 3 题(七)

✍个人博客:Pandaconda-CSDN博客 📣专栏地址:http://t.csdnimg.cn/fYaBd 📚专栏简介:在这个专栏中,我将会分享 C 面试中常见的面试题给大家~ ❤️如果有收获的话,欢迎点赞👍收藏&…...

Java面试题精选:消息队列(一)

1、为什么使用消息队列 问题用意: 其实就是想问一下消息队列有哪些使用场景,你项目中什么业务场景用到了消息队列,有什么技术挑战。使用MQ后给你带来了什么好处 规范回答: 消息队列的常见使用场景很多,但比较核心的…...

宝塔面板启用 QUIC 与 Brotli 的完整教程

环境 系统:Ubuntu 22.04.4 LTS x86_64 宝塔版本:7.7.0 (可使用本博客提供的一键安装优化脚本) nginx版本:1.26.1 开放UDP端口 注意:在你的服务器商家那里也要开放443 udp端口 sudo ufw allow 443/udp然后重新加载 UFW 以使新…...

Linux 进程调度(二)之进程的上下文切换

目录 一、概述二、上下文切换的实现1、context_switch2、switch_mm3、switch_to 三、观测进程上下文切换 一、概述 进程的上下文切换是指在多任务操作系统中,当操作系统决定要切换当前运行的进程时,将当前进程的状态保存起来,并恢复下一个要…...

Oracle事物临时表

在Oracle数据库中,事务临时表是一种特殊的表类型,主要用于存储在事务处理过程中产生的临时数据。这些表的数据只对当前会话或事务可见,并且在事务结束时会自动清除。 事务临时表的特点 生命周期: 事务临时表中的数据在事务提交或…...

看图学sql之sql的执行顺序

学完前面的内容,我们已经掌握了基本的sql语法了,那我们学的 select, distinct, from, where,group by, having, order by, limit 他们具体的执行顺序是什么样的呢? 语法: SELECT distinct column1, column2 FROM table1 join …...

百日筑基第四十五天-从JAVA8走到JAVA9

JAVA9新特性 Java 9发布于 2017 年 9 月 21 日 。 快速创建不可变集合 增加了List.of()、Set.of()、Map.of() 和 Map.ofEntries()等工厂方法来创建不可变集合(有点参考 Guava 的味道): List.of("Java", "C"); Set.of…...

力扣第五十七题——插入区间

内容介绍 给你一个 无重叠的 ,按照区间起始端点排序的区间列表 intervals,其中 intervals[i] [starti, endi] 表示第 i 个区间的开始和结束,并且 intervals 按照 starti 升序排列。同样给定一个区间 newInterval [start, end] 表示另一个区…...

跟《经济学人》学英文:2024年08月03日这期 India’s economic policy will not make it rich

India’s economic policy will not make it rich A new World Bank report takes aim at emerging-market growth plans 原文: The developing world has fallen back in love with economic planning. As protectionism sweeps the West, poor countries are n…...

js 深拷贝、浅拷贝深度解析

赋值操作: let obj{a:1,b:[1,2,3],c:{m:2}}let newObjobjnewObj.a2newObj.b.push(4)newObj.c.m3console.log(obj,newObj); 将一个对象赋值给一个变量,其实就是将这个对象在栈内存中的引用地址复制给了这个变量,这两个对象指向堆内存中的同一个…...

CSS文本两端对齐

背景 如果我们要写了列表或表单类的样式&#xff0c;名称长短不一&#xff0c;但是想要两端对齐&#xff0c;如下面这样的&#xff1a; 你是怎么写的&#xff1f; 是这样的吗&#xff0c;在HTML里调整加空格&#xff1a; <ul><li>用户名</li><li>账 …...

S7-1200 PLC 高级语言SCL数控G代码功能块源文件解析及程序思路

S7-1200PLC 高级语言SCL数控G代码功能块源文件| S7-1200PLC 高级语言SCL数控G代码功能块源文件| S7-1200PLC 高级语言SCL数控G代码功能块源文件||| 整个G代码解析的程序做成了一个FB功能块,利用1200PLC内置的字符串控制指令来实现拆分提取字符串信息;整个程序的大概思路就是1.解…...

油冷式电动滚筒设计【含说明书、CAD图纸、SW三维】

油冷式电动滚筒作为带式输送机的核心驱动部件&#xff0c;集电机、减速器与冷却系统于一体&#xff0c;通过内部循环油路实现高效散热与润滑&#xff0c;显著提升设备运行的稳定性与寿命。其核心作用在于将电能转化为机械能&#xff0c;驱动输送带运转&#xff0c;同时利用油液…...

别再东拼西凑了!保姆级教程:用Anaconda在Windows上搞定PaddleOCR CPU版(附shapely安装避坑指南)

从零到一&#xff1a;Windows下Anaconda环境配置PaddleOCR全攻略 在文字识别技术领域&#xff0c;PaddleOCR以其出色的性能和易用性赢得了众多开发者的青睐。但对于初学者而言&#xff0c;从环境配置到成功运行往往充满挑战——版本冲突、依赖缺失、环境变量配置等问题层出不穷…...

开源串流方案实现跨设备游戏:Sunshine自建串流服务器全指南

开源串流方案实现跨设备游戏&#xff1a;Sunshine自建串流服务器全指南 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 当你想在平板上畅玩PC端3A大作&#xff0c;或在客厅电视上体…...

3步实现AI动作迁移:如何让视频人物“学会“任何动作

3步实现AI动作迁移&#xff1a;如何让视频人物"学会"任何动作 【免费下载链接】ComfyUI-MimicMotionWrapper 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI-MimicMotionWrapper 想象这样一个场景&#xff1a;你拍摄了一段朋友的日常视频&#xff0c;…...

CBAM:轻量级注意力机制在CNN中的高效集成与应用

1. CBAM&#xff1a;让CNN学会"看重点"的黑科技 第一次听说CBAM这个名词时&#xff0c;我还以为是什么新型环保政策&#xff08;笑&#xff09;。后来才发现&#xff0c;这其实是计算机视觉领域的一个"小而美"的发明——Convolutional Block Attention Mod…...

Smithbox:游戏个性化定制的全功能开发平台

Smithbox&#xff1a;游戏个性化定制的全功能开发平台 【免费下载链接】Smithbox Smithbox is a modding tool for Elden Ring, Armored Core VI, Sekiro, Dark Souls 3, Dark Souls 2, Dark Souls, Bloodborne and Demons Souls. 项目地址: https://gitcode.com/gh_mirrors/…...

解决Obsidian图片管理痛点:打造稳定可靠的本地图片库

解决Obsidian图片管理痛点&#xff1a;打造稳定可靠的本地图片库 【免费下载链接】obsidian-local-images-plus This repo is a reincarnation of obsidian-local-images plugin which main aim was downloading images in md notes to local storage. 项目地址: https://git…...

5分钟搭建Python微信机器人:零基础实现自动化办公的完整指南

5分钟搭建Python微信机器人&#xff1a;零基础实现自动化办公的完整指南 【免费下载链接】WechatBot 项目地址: https://gitcode.com/gh_mirrors/wechatb/WechatBot 还在为重复的微信消息回复而烦恼吗&#xff1f;每天处理大量群消息、客户咨询和通知发送&#xff0c;占…...

YimMenu:GTA V安全增强工具全维度应用指南

YimMenu&#xff1a;GTA V安全增强工具全维度应用指南 【免费下载链接】YimMenu YimMenu, a GTA V menu protecting against a wide ranges of the public crashes and improving the overall experience. 项目地址: https://gitcode.com/GitHub_Trending/yi/YimMenu 价…...