Meta 首个多模态大模型一键启动!首个多针刺绣数据集上线,含超 30k 张图片
小扎在 Meta Connect 2024 主题演讲中宣布推出首个多模态大模型 Llama 3.2 vision!该模型有 11B 和 90B 两个版本,成为首批支持多模态任务的 Llama 系列模型,根据官方数据,这两个开原模型的性能已超越闭源模型。
小编已经迫不及待部署起来了,并第一时间在 hyper.ai 官网上线了 11B 模型的一键部署教程, 欢迎大家一起推理体验~
在线运行:https://go.hyper.ai/DKGzm
9 月 23 日-9 月 27 日,hyper.ai 官网更新速览:
-
优质公共数据集:10 个
-
优质教程精选:2 个
-
社区文章精选:3 篇
-
热门百科词条:5 条
-
10 月截稿顶会:7 个
访问官网:hyper.ai
公共数据集精选
1. MSEmbGAN 多针刺绣数据集
该数据集是第一个通过单针和多针标签详细标注的刺绣数据集。通过专业的刺绣软件 (Wilcom 9.0) 制作了超过 30K 的图像,包括刺绣图像和相应的内容图像。本文将构建的多针刺绣数据集贡献给本研究领域的其他研究者。
直接使用:https://go.hyper.ai/urNGE
2. The Movies Dataset 电影信息数据集
该数据集包含了完整 MovieLens 数据集中 45,000 部电影的详尽元数据,这些电影都是在 2017 年 7 月之前上映的。这个数据集不仅涵盖了电影的基本资料,如海报、背景、预算和收入,还包括了上映日期、语言、制作国家和公司等详细信息。
直接使用:https://go.hyper.ai/SDwXX
3. Open X-Embodiment 真实机器人数据集
该数据集汇集了从单臂机器人到双手机器人和四足机器人的 22 种不同机器人类型的数据,由 21 个不同机构合作收集,涵盖了 527 种不同的技能和 160,266 项任务。它是通过汇集来自全球 34 个机器人研究实验室的 60 个现有机器人数据集构建的,展示了各种机器人任务和环境。
直接使用:https://go.hyper.ai/Cqlw6
4. TMDB 5k Movie Dataset 电影信息数据集
该数据集包含了 5k 部电影的详细信息,这些电影主要来自美国地区一百年间 (1916-2017) 的作品。数据集旨在帮助研究人员和分析师探索电影行业的流行趋势、投资方向,以及为电影行业的新入局者提供参考建议。
直接使用:https://go.hyper.ai/zaRFY
5. LongCite-45k 大模型细粒度提升数据集
该数据集包含 44,600 条带有句子级引用的高质量问答数据,支持最长 128k token 的长文本处理,通过生成细粒度的句子级引用,使用户能够验证模型回答的准确性。
直接使用:https://go.hyper.ai/omO5f
6. Full TMDB Movies Dataset 2024 电影资料集
TMDb(电影数据库)是一个综合电影数据库,该数据集包含来自 TMDB 数据库的 1,000k 部电影的集合,提供有关电影的信息,包括标题、评级、上映日期、收入、类型等详细信息。
直接使用:https://go.hyper.ai/r9ks2
7. InfiMM-WebMath-40B 多模态数学推理数据集
该数据集专门为数学推理任务设计的大型开源多模态数据集,包含 2.4k 万网页、 8.5k 万相关图像 URL 和 400 亿个 tokens,所有这些都经过精心提取和过滤,来自 CommonCrawl 数据库 (2019-2023) 。
直接使用:https://go.hyper.ai/P8m9l
8. VoiceAssistant-400K 语音助手优化数据集
VoiceAssistant-400K 是一个专门为语音助手优化的数据集,旨在帮助模型在提供语音助手服务时减少生成代码符号,增强模型在真实应用中的实用性。
直接使用:https://go.hyper.ai/KGIM0
9. Top 5k Albums of All Time 音乐专辑评论数据集
该数据集包含 http://rateyourmusic.com 社区用户评选出的史上最热门的 5k 张专辑。该数据集于 2021 年 10 月 12 日通过抓取获取,包括排名、专辑名称、艺术家姓名、发行日期、流派、描述、平均评分、评分数量和评论数量这些属性。
直接使用:https://go.hyper.ai/c4Olt
10. Spotify daily top 200 songs 音乐歌曲趋势数据集
该数据集包含了 2017 年至 2021 年期间,全球范围内每天的 Spotify Top 200 歌曲列表。这个数据集涵盖了超过 350k 首歌曲,为研究人员和音乐爱好者提供了丰富的信息,用于分析流行趋势、音乐偏好和其他相关研究。
直接使用:https://go.hyper.ai/afvbK
更多公共数据集,请访问:
https://hyper.ai/datasets
公共教程精选
1. 一键部署 Llama-3.2-11B-Vision-Instruct
该模型是 Llama 3.2-Vision 多模态大模型系列的 11B 参数大小,支持高分辨率图像输入(1120x1120 像素),并使用交叉注意力机制与基础模型完成和指令调整的聊天变体。进入官网克隆并启动容器,直接复制 API 地址,即可对模型进行推理体验。
直接使用:https://go.hyper.ai/DKGzm
2.ComfyUl Littletinies 童话故事插图生成 Demo
该模型能够根据文本提示生成手绘卡通风格的图像。这个模型特别适合创造具有经典卡通美学的异想天开和风格化的插图,其生成的图像具有手绘的质感、流畅的笔触,以及柔和的色彩。模型与环境已经部署完毕,根据教程指引即可进行推理生成。
直接使用:https://go.hyper.ai/YHu0a
我们还建立了 Stable Diffusion 教程交流群,欢迎小伙伴们扫码备注【SD教程】,入群探讨各类技术问题、分享应用效果~
社区文章精选
1. 可智能生成刺绣图案!武汉纺织大学可视计算与数字纺织团队发布首个多缝线刺绣生成对抗网络模型,被顶级期刊 TVCG 录用
武汉纺织大学计算机与人工智能学院胡新荣课题组提出了一种多缝线刺绣生成对抗网络模型 MSEmbGAN,并创建了当前最大刺绣数据集,相关论文还被顶级期刊 TVCG 录用。本文是对论文的详细解读与分享。
查看完整汇总:https://go.hyper.ai/5t8NQ
2. 权威期刊Cell Discovery新成果!上海交大洪亮团队提出CPDiffusion模型,超低成本、全自动设计功能型蛋白质
上海交通大学洪亮团队设计了一种扩散概率模型框架,该框架能够以非常低的训练成本、数据成本学习蛋白质的序列、结构与功能之间的隐含映射关系,从而生成多样化的蛋白质序列。本文是对论文的详细解读与分享。
查看完整报道:https://go.hyper.ai/ziRvz
3. 入选 ECCV 2024!覆盖 5.4w+图像,MIT 提出医学图像分割通用模型 ScribblePrompt,性能优于 SAM
美国麻省理工学院计算机科学与人工智能实验室团队联合麻省总医院和哈佛医学院的研究人员,提出了一种用于交互式生物医学图像分割的通用模型 ScribblePrompt,这是一种基于神经网络的分割工具,支持注释人员使用涂鸦、点击和边界框等不同的注释方式,灵活地进行生物医学图像的分割任务,甚至是对于未经训练的标签和图像类型。本文是对论文的详细解读与分享。
查看完整报道:https://go.hyper.ai/QQjAf
热门百科词条精选
1. Sigmoid 函数
2. 配对 t 检验 Paired t-Test
3. 对比学习 Contrastive Learning
4. 半监督学习 Semi-Supervised Learning
5. 数据增强 Data Augmentation
这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:
https://go.hyper.ai/wiki
一站式追踪人工智能学术顶会:https://go.hyper.ai/event
以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!
下周再见!
关于 HyperAI超神经 (hyper.ai)
HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:
-
为 1300+ 公开数据集提供国内加速下载节点
-
收录 400+ 经典及流行在线教程
-
解读 100+ AI4Science 论文案例
-
支持 500+ 相关词条查询
-
托管国内首个完整的 Apache TVM 中文文档
访问官网开启学习之旅:
https://hyper.ai/
相关文章:

Meta 首个多模态大模型一键启动!首个多针刺绣数据集上线,含超 30k 张图片
小扎在 Meta Connect 2024 主题演讲中宣布推出首个多模态大模型 Llama 3.2 vision!该模型有 11B 和 90B 两个版本,成为首批支持多模态任务的 Llama 系列模型,根据官方数据,这两个开原模型的性能已超越闭源模型。 小编已经迫不及待…...
阿里云ECS服务器仿真
1.首先使用qemu-img对RAW镜像进行转换,qemu-img convert -O vmdk 1.raw 2.vmdk 2.使用WinHex对镜像的root密码进行删除 3.由于这次阿里云ECS使用了CONFIG_SYSTEM_TRUSTED_KEYS验证,无法直接仿真,需使用live系统对内核进行修改。分为以下几步&…...

如何为树莓派安装操作系统,以及远程操控树莓派的两种方法,无线操控和插网线操控
文章目录 一、下载树莓派的系统二、将文件下载到SD卡中1.使用官方软件2.其他选择 三、远程连接电脑安装vnc-viewer1.无线操作(配置树莓派,开启VNC)电脑远程配置2.有线连接(需要一根网线) 总结 一、下载树莓派的系统 下…...

【最新华为OD机试E卷-支持在线评测】简单的自动曝光(100分)多语言题解-(Python/C/JavaScript/Java/Cpp)
🍭 大家好这里是春秋招笔试突围 ,一枚热爱算法的程序员 💻 ACM金牌🏅️团队 | 大厂实习经历 | 多年算法竞赛经历 ✨ 本系列打算持续跟新华为OD-E/D卷的多语言AC题解 🧩 大部分包含 Python / C / Javascript / Java / Cpp 多语言代码 👏 感谢大家的订阅➕ 和 喜欢�…...
每日一练:等差数列划分
413. 等差数列划分 - 力扣(LeetCode) 题目要求: 如果一个数列 至少有三个元素 ,并且任意两个相邻元素之差相同,则称该数列为等差数列。 例如,[1,3,5,7,9]、[7,7,7,7] 和 [3,-1,-5,-9] 都是等差数列。 给…...

Kotlin真·全平台——Kotlin Compose Multiplatform Mobile(kotlin跨平台方案、KMP、KMM)
前言 随着kotlin代码跨平台方案的推出,kotlin跨平台一度引起不少波澜。但波澜终归没有掀起太大的风浪,作为一个敏捷型开发的公司,依然少不了Android和iOS的同步开发,实际成本和效益并没有太多变化。所以对于大多数公司来说依然风平…...

unity 默认渲染管线材质球的材质通道,材质球的材质通道
标准渲染管线——材质球的材质通道 文档,与内容无关,是介绍材质球的属性的。 https://docs.unity3d.com/2022.1/Documentation/Manual/StandardShaderMaterialParameters.html游戏资源中常见的贴图类型 https://zhuanlan.zhihu.com/p/260973533 十大贴图…...

PostgreSQL升级:使用pg_upgrade进行大版本(16.3)升级(17.0)
1.pg_upgrade工具介绍 pg_upgrade 会创建新的系统表,并以重用旧的数据文件的方式进行升级。 pg_upgrade 的参数选项如下: -b bindir,--old-bindirbindir:旧的 PostgreSQL 可执行文件目录; -B bindir,--new-…...
userdel命令:删除指定Linux用户
一、命令简介 userdel 命令用于删除 Linux 系统中的用户账号。当您不再需要某个用户账号时,可以使用 userdel 命令将其从系统中删除。 二、命令参数 userdel [选项] 用户名一些常用的选项包括: -r, --remove: 删除用户的家目录及邮件目录。…...
QT系统学习篇(1)
一、什么是Qt、Qt的优势 QT是一个跨平台的C图形用户界面库,目前包括Qt Creator、Qt Designer等等快速开发工具。支持所有Linux/Unix系统,还支持windows平台。Qt很容易扩展,并且允许真正的组件编程。(军工企业项目开发基本离不开Q…...
每日一刷——9.26——ACM训练题——Fibonacci Again
题目描述: There are another kind of Fibonacci numbers: F(0) 7, F(1) 11, F(n) F(n-1) F(n-2) (n>2). Input Input consists of a sequence of lines, each containing an integer n. (n < 1,000,000). Output Print the word "yes" if 3 d…...

代码随想录 | Day28 | 回溯算法:组合组合总和III
代码随想录 | Day28 | 回溯算法:组合&&组合总和III 关于这个章节,大家最好是对递归函数的理解要比较到位,听着b站视频课可能呢才舒服点,可以先去搜一搜关于递归函数的讲解,理解,再开始这个章节会比…...

【重学 MySQL】四十五、数据库的创建、修改与删除
【重学 MySQL】四十五、数据库的创建、修改与删除 一条数据存储的过程数据输入数据验证数据处理数据存储数据持久化反馈与日志注意事项 标识符命名规则基本规则长度限制保留字与特殊字符命名建议示例 MySQL 中的数据类型创建数据库创建数据库时指定字符集和排序规则 查看数据库…...

STM32驱动直流电机
stm32通过PWM控制直流电机的方向和速度。 小直流电机需要几百毫安的电流,单片机只能提供几毫安的电流。电机内线圈转动时切割磁感线以及电机内转子线圈的电感效应都会产生反电动势,损坏芯片。 电机驱动芯片能够作为STM32驱动电机的帮手。 SLEEP暂停工作…...

【C++】二叉搜索树+变身 = AVL树
🚀个人主页:小羊 🚀所属专栏:C 很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~ 目录 前言一、AVL树二、AVL树的实现2.1 平衡因子2.2 旋转处理2.2.1 左单旋:插入新节点后单纯的右边高2.2.2 …...

Flutter String 按 ,。分割
在 Flutter 中,如果你想将一个字符串按特定的字符(例如中文逗号 , 和英文句号 .)进行分割,可以使用 Dart 语言的字符串处理功能。具体来说,你可以使用 split 方法,并传入一个正则表达式来匹配这…...
Redis: 集群高可用之MOVED转向和ASK转向解决方案
MOVED转向 1 ) 问题描述 在客户端操作Redis集群的时候 MOVED转向 或 MOVED错误是经常遇到的一类问题我们先连入集群:$ /usr/local/redis/bin/redis-cli -a 123456 -h 192.168.10.101 -p 6371之前在Redis中存储过一些数据,比如下面的情况,当输…...

idea插件市场安装没反应
https://plugins.jetbrains.com/idea重启后还是不行那就...

数据结构之排序(5)
摘要:本文主要讲各种排序算法,注意它们的时间复杂度 概念 将各元素按关键字递增或递减排序顺序重新排列 评价指标 稳定性: 关键字相同的元素经过排序后相对顺序是否会改变 时间复杂度、空间复杂度 分类 内部排序——数据都在内存中 外部排序——…...

R包的安装、加载以及如何查看帮助文档
0x01 如何安装R包 一、通过R 内置函数安装(常用) 1.安装CRAN的R包 install.packages()是一个用于安装 R 包的重要函数。 语法:install.packages(pkgs, repos getOption("repos"),...) 其中: pkgs:要安…...
变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析
一、变量声明设计:let 与 mut 的哲学解析 Rust 采用 let 声明变量并通过 mut 显式标记可变性,这种设计体现了语言的核心哲学。以下是深度解析: 1.1 设计理念剖析 安全优先原则:默认不可变强制开发者明确声明意图 let x 5; …...

【OSG学习笔记】Day 18: 碰撞检测与物理交互
物理引擎(Physics Engine) 物理引擎 是一种通过计算机模拟物理规律(如力学、碰撞、重力、流体动力学等)的软件工具或库。 它的核心目标是在虚拟环境中逼真地模拟物体的运动和交互,广泛应用于 游戏开发、动画制作、虚…...

边缘计算医疗风险自查APP开发方案
核心目标:在便携设备(智能手表/家用检测仪)部署轻量化疾病预测模型,实现低延迟、隐私安全的实时健康风险评估。 一、技术架构设计 #mermaid-svg-iuNaeeLK2YoFKfao {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg…...

【网络安全产品大调研系列】2. 体验漏洞扫描
前言 2023 年漏洞扫描服务市场规模预计为 3.06(十亿美元)。漏洞扫描服务市场行业预计将从 2024 年的 3.48(十亿美元)增长到 2032 年的 9.54(十亿美元)。预测期内漏洞扫描服务市场 CAGR(增长率&…...

为什么需要建设工程项目管理?工程项目管理有哪些亮点功能?
在建筑行业,项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升,传统的管理模式已经难以满足现代工程的需求。过去,许多企业依赖手工记录、口头沟通和分散的信息管理,导致效率低下、成本失控、风险频发。例如&#…...

Opencv中的addweighted函数
一.addweighted函数作用 addweighted()是OpenCV库中用于图像处理的函数,主要功能是将两个输入图像(尺寸和类型相同)按照指定的权重进行加权叠加(图像融合),并添加一个标量值&#x…...
系统设计 --- MongoDB亿级数据查询优化策略
系统设计 --- MongoDB亿级数据查询分表策略 背景Solution --- 分表 背景 使用audit log实现Audi Trail功能 Audit Trail范围: 六个月数据量: 每秒5-7条audi log,共计7千万 – 1亿条数据需要实现全文检索按照时间倒序因为license问题,不能使用ELK只能使用…...
五年级数学知识边界总结思考-下册
目录 一、背景二、过程1.观察物体小学五年级下册“观察物体”知识点详解:由来、作用与意义**一、知识点核心内容****二、知识点的由来:从生活实践到数学抽象****三、知识的作用:解决实际问题的工具****四、学习的意义:培养核心素养…...

React19源码系列之 事件插件系统
事件类别 事件类型 定义 文档 Event Event 接口表示在 EventTarget 上出现的事件。 Event - Web API | MDN UIEvent UIEvent 接口表示简单的用户界面事件。 UIEvent - Web API | MDN KeyboardEvent KeyboardEvent 对象描述了用户与键盘的交互。 KeyboardEvent - Web…...
大语言模型(LLM)中的KV缓存压缩与动态稀疏注意力机制设计
随着大语言模型(LLM)参数规模的增长,推理阶段的内存占用和计算复杂度成为核心挑战。传统注意力机制的计算复杂度随序列长度呈二次方增长,而KV缓存的内存消耗可能高达数十GB(例如Llama2-7B处理100K token时需50GB内存&a…...