当前位置: 首页 > news >正文

每周编辑精选|在线运行 Deepmoney 金融大模型、AI 偏好等多个优质数据集上线

目前,AI 领域对金融模型的研究成果大多是基于公共知识进行训练的,但在实际的金融实践中,这些公共知识对于当前市场的可解释性往往严重不足。一个理想的金融大模型应该能够理解新闻或数据事件,并能够即时地从主观和量化两个角度对事件进行评估。
Deepmoney 便是为此而生的,它是一个专注于金融领域投资的大型语言模型项目。 hyper.ai 官网现已提供在线运行教程,快来体验一下吧!

3 月 18 日-3 月 22 日,hyper.ai 官网更新速览:

  • 优质公共数据集:10 个

  • 优质教程精选:3 个

  • 社区文章精选:3 篇

  • 热门百科词条:10 条

访问官网:hyper.ai

公共数据集精选

1. OpenHermesPreferences:AI 偏好数据集

OpenHermesPreferences 数据集是由 Argilla 与 Hugging Face H4 团队协作创建的,包含约 100 万条 AI 偏好数据。该数据集可用于训练偏好模型或通过直接偏好优化等技术对齐语言模型。

直接使用:

https://my5353.com/30168

2. LongAlign 10K 大模型长上下文对齐数据集

LongAlign-10k 是清华大学提出的一个针对大模型在长上下文对齐任务中面临的挑战而设计的数据集,包含 10,000 条长指令数据,长度在 8k-64k 之间。该数据集旨在测评大模型于长上下文中的表现,及其对 10k-100k 长度任务指令的遵循能力。

直接使用:

https://my5353.com/30247

3. CyberMetric 大模型网络安全评测数据集

CyberMetric 数据集包含 10,000 个问题,旨在综合评估大模型的网络安全知识。该数据集采用不同大模型创建,并由网络安全领域的专家进行了验证,以确保其相关性和准确性。

直接使用:

https://my5353.com/30251

4. 2020 年中国地面光伏电站 10 米全国比例尺地图数据集

中国农业大学与中国科学院地理科学与资源研究所合作,针对国内缺乏高分辨率、开源的全国地面光伏电站分布数据现状,开发了一套全国性的制图方法,成功发布了 2020 年全国 10 米分辨率地面光伏电站分类数据集。该成果不仅精确揭示了我国光伏电站的空间分布特征,而且以 89% 的分类精度,为能源规划、土地利用、遥感监测及环境研究等领域提供了宝贵的数据资源。此举填补了国内该领域数据的空白,对相关研究具有重要意义。

直接使用:

https://my5353.com/30283

5. Crop Diseases Classification 农作物病害分类图像数据集

该数据集是 5 种农作物病害的分类图像,这些图像已被分别标记为:木薯细菌性枯萎病 (CBB) 、木薯褐条病 (CBSD) 、木薯绿斑驳病 (CGM) 、木薯马赛克病 (CMD) 和健康 。可用于训练机器学习模型来检测植物疾病,或开发自动植物诊断算法。

直接使用:

https://my5353.com/30293

6. Tomato Leaf Diseases Detection 番茄叶病图像检测数据集

该数据集为番茄叶病图像检测数据集,图像分为以下几类:健康、细菌斑、早疫病、健康、晚疫病、叶霉病、目标点和黑点。图像是用 YOLO v5 PyTorch 格式注释的。

直接使用:

https://my5353.com/30306

7. AMAZON REVIEWS 2023 大型亚马逊评论数据集

AMAZON REVIEWS 2023 是由 McAuley 实验室在 2023 年收集的大规模亚马逊评论数据集,包含了超过 5.7 亿条评论和 4,800 万个商品,涵盖了 33 个不同的类别。

直接使用:

https://my5353.com/30267

8. DiFF 扩散模型生成的面部伪造数据集

DiFF 是一个由山东大学、新加坡国立大学等机构共同研发的高质量、大规模的面部伪造图像数据集,其基于扩散模型生成,含有超过 50 万张图像。该数据集适用于面部伪造检测、深度伪造的对抗性攻击与防御,以及其他相关的计算机视觉任务训练。

直接使用:

https://my5353.com/30260

9. MIntRec2.0 多模态意图识别对话数据集

MIntRec2.0 是清华大学等提出的一个大规模多模态多方基准数据集,专门用于识别对话中的意图和检测非意图内容。相较于先前的 MIntRec,MIntRec2.0 的数据量增至 15K,涵盖 30 种意图类别,并包含约 9.3K 个意图内及 5.7K 个意图外的标注语句,涉及文本、视频和音频等多种模态。

直接使用:

https://my5353.com/30166

10. ApolloCorpora 多语言医疗数据集

ApolloCorpora 是深圳市大数据研究院和香港中文大学的研究团队联合构建的一个多语言医疗数据集。该数据集涵盖了全球 61 亿人口使用的六种主要语言,包括英语、中文、印地语、西班牙语、法语和阿拉伯语。

直接使用:

https://my5353.com/30285

更多公共数据集,请访问

https://hyper.ai/datasets

公共教程精选

1. 在线运行 Deepmoney-34b-full

Deepmoney 是一个专注于金融领域投资的大型语言模型项目。Deepmoney-34b-full是基于 01-ai 开源的 Yi-34B-200K 模型进行训练的,分为 pt(全参数训练)和 sft(lora 微调) 两个阶段。现可在超神经官网一键克隆使用。

在线运行:

https://my5353.com/t30314

2. 在线运行 Deepmoney-miqu-70b

该模型是基于 huggingface.co 的 miqu-1-70b-sf 进行训练的,仅进行 sft (lora 微调) ,现可在超神经官网一键克隆使用。

在线运行:

https://my5353.com/t30314

3. 在线运行 Deepmoney-67b-full

该模型是基于 deepseek-ai 开源的 deepseek-llm-67b-base 进行训练的,分为 pt(lora训练)和 sft (lora 训练) 两个阶段,现可在超神经官网一键克隆使用。

在线运行:

https://my5353.com/t30310

社区文章精选

1. 英伟达黄仁勋发布 GB200,比 H100 推理能力提高 30 倍,能耗降低 25 倍,将 AI4S 能力做成微服务

今年的 2024 GTC AI 大会如约而至,在 3 月 18 日至 3 月 21 日期间,有超 900 场会议与 20 余场技术讲座。本文为黄仁勋在 GTC 主题演讲的干货汇总。

查看完整报道:

https://my5353.com/p30224

2. 33 分钟生成 12 万种碳捕捉候选材料,美国阿贡国家实验室发布生成式 AI 框架,加速 MOFs 创新

来自美国阿贡国家实验室的研究团队,提出了一种生成式 AI 框架 GHP-MOFsassemble,该框架能够随机生成并组装新的 MOFs 结构,通过分子动力学模拟筛选高稳定性的 MOFs 结构,并用晶体图神经网络 (CGCNN) 和巨正则系统蒙特卡罗模拟 (GCMC) 来测试 MOFs 对二氧化碳的吸附能力。相关论文已发表于「Nature」。

查看完整报道:

https://my5353.com/p30269

3. 提前 300 毫秒预测等离子体撕裂风险,普林斯顿大学发布 AI Controller

普林斯顿大学的研究人员开发了一个 AI 控制器进行自适应预测和控制,能够提前 300 毫秒预测到等离子体的潜在撕裂风险并及时干预,相关成果已发表于「Nature」。

查看完整报道:

https://my5353.com/p30296

热门百科词条精选

1. 数据引力 Data Gravity

2. 大规模多任务语言理解(MMLU)

3. 混合专家模型 Mixture of Experts (MoE)

4. 量子神经网络 Quantum Neural Network

5. 神经辐射场 Neural Radiance Field (NeRF)

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://hyper.ai/wiki

B 站直播预告

日期时间内容
3 月 25 日 星期一10:0017:00MIT深度学习课程 2020MIT深度学习课程 2021
3 月 26 日星期二10:00Python API 开发——初学者综合课程
3 月 27 日星期三10:0014:00SQL 教程—初学者课程生成式 AI 全套课程
3 月 28 日星期四21:00面向初学者的 Flutter 课程
3 月 29 日星期五10:00面向初学者的 Flutter 课程
3 月 30 日星期六10:00哈佛 CS50—Python 人工智能课程
3 月 31 日星期日10:00一天内学习 PyTorch 进行深度学习

超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:

http://live.bilibili.com/26483094

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!


关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1200+ 公开数据集提供国内加速下载节点

  • 收录 300+ 经典及流行在线教程

  • 解读 100+ AI4Science 论文案例

  • 支持 500+ 相关词条查询

  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai/

相关文章:

每周编辑精选|在线运行 Deepmoney 金融大模型、AI 偏好等多个优质数据集上线

目前,AI 领域对金融模型的研究成果大多是基于公共知识进行训练的,但在实际的金融实践中,这些公共知识对于当前市场的可解释性往往严重不足。一个理想的金融大模型应该能够理解新闻或数据事件,并能够即时地从主观和量化两个角度对事…...

C++多重继承与虚继承

多重继承的原理 多重继承(multiple inheritance)是指从多个直接基类中产生派生类的能力。 多重继承的派生类继承了所有父类的属性。 在面向对象的编程中,多重继承意味着一个类可以从多个父类继承属性和方法。 就像你有一杯混合果汁,它是由多种水果榨取…...

请简单介绍一下Shiro框架是什么?Shiro在Java安全领域的主要作用是什么?Shiro主要提供了哪些安全功能?

请简单介绍一下Shiro框架是什么? Shiro框架是一个强大且灵活的开源安全框架,为Java应用程序提供了全面的安全解决方案。它主要用于身份验证、授权、加密和会话管理等功能,可以轻松地集成到任何Java Web应用程序中,并提供了易于理解…...

TouchGFX之Button

TouchGFX中的按钮是一种感应触控事件的控件&#xff0c;能够在按钮被按下/释放时发送回调 代码 #ifndef TOUCHGFX_ABSTRACTBUTTON_HPP #define TOUCHGFX_ABSTRACTBUTTON_HPP #include <touchgfx/Callback.hpp> #include <touchgfx/events/ClickEvent.hpp> #includ…...

计算机组成原理 — 指令系统

指令系统 指令系统指令的概述指令的格式指令的字长取决于 操作数类型和操作种类操作数的类型数据在存储器中的存放方式操作类型 寻址方式指令寻址数据寻址立即寻址直接寻址隐含寻址间接寻址寄存器寻址寄存器间接寻址基址寻址变址寻址堆栈寻址 RISC 和 CISC 技术RISC 即精简指令…...

使用easyYapi生成文档

easyYapi生成文档 背景1.安装配置1.1 介绍1.2 安装1.3 配置1.3.1 Export Postman1.3.2 Export Yapi1.3.3 Export Markdown1.3.4 Export Api1.3.6 常见问题补充 2. java注释规范2.1 接口注释规范2.2 出入参注释规范 3. 特定化支持3.1 必填校验3.2 忽略导出3.3 返回不一致3.4 设置…...

蓝桥杯练习题总结(三)线性dp题(摆花、数字三角形加强版)

目录 一、摆花 思路一&#xff1a; 确定状态&#xff1a; 初始化&#xff1a; 思路二&#xff1a; 确定状态&#xff1a; 初始化&#xff1a; 循环遍历&#xff1a; 状态转移方程&#xff1a; 二、数字三角形加强版 一、摆花 题目描述 小明的花店新开张&#xff0c;为了吸…...

Elasticsearch(15) multi_match的使用

elasticsearch version&#xff1a; 7.10.1 multi_match是Elasticsearch中的一种查询类型&#xff0c;允许在一个或多个字段上执行全文本搜索&#xff0c;并合并各个字段的结果得分。这种查询有助于实现跨多个字段的统一搜索体验。 语法 {"query": {"multi_m…...

nodejs的线程模型和libuv库的基本使用

文章目录 nodejs中集成addon本地代码的回调问题单线程事件驱动模型libuvlibuv基本框架addon中使用libuv代码nodejs中集成addon本地代码的回调问题 在C++的代码中,回调函数是一个基本的代码调用方式。而在我自己的开发实践中,需要在addon这样一个nodejs的本地化模块中实现一个…...

Uni-app/Vue/Js本地模糊查询,匹配所有字段includes和some方法结合使用e

天梦星服务平台 (tmxkj.top)https://tmxkj.top/#/ 1.第一步 需要一个数组数据 {"week": "全部","hOutName": null,"weekendPrice": null,"channel": "门市价","hOutId": 98,"cTime": "…...

深度学习pytorch——激活函数损失函数(持续更新)

论生物神经元与神经网络中的神经元联系——为什么使用激活函数&#xff1f; 我们将生物体中的神经元与神经网络中的神经元共同分析。从下图可以看出神经网络中的神经元与生物体中的神经元有很多相似之处&#xff0c;由于只有刺激达到一定的程度人体才可以感受到刺激&#xff0c…...

《苹果 iOS 应用开发与分发的关键问题解析》

一、背景 解决同事问的问题&#xff0c;来来回回被问好几次相同的问题&#xff0c;然后确认&#xff0c;我觉得不如写个文档 二、非研发人员安装iOS应用方式 TestFlightIPA 文件 对比 TestFlightIPA 文件安装方式TestFlight 是苹果提供的一个 beta 测试平台&#xff0c;开发者…...

爱上数据结构:顺序表和链表

一、线性表 线性表&#xff08;linear list&#xff09;是n个具有相同特性的数据元素的有限序列。 线性表是一种在实际中广泛使 用的数据结构&#xff0c;常见的线性表&#xff1a;顺序表、链表、栈、队列、字符串... 线性表在逻辑上是线性结构&#xff0c;也就说是连续的一条…...

python知识点总结(十)

python知识点总结十 1、装饰器的理解、并实现一个计时器记录执行性能&#xff0c;并且将执行结果写入日志文件中2、队列和栈的区别&#xff0c;并且用python实现3、设计实现遍历目录与子目录4、CPU处理进程最慢的情况通常发生在以下几种情况下&#xff1a;5、CPU处理线程最慢的…...

【Python】探索 Python 编程世界:常量、变量及数据类型解析

欢迎来CILMY23的博客 本篇主题为 探索 Python 编程世界&#xff1a;常量、变量及数据类型解析 个人主页&#xff1a;CILMY23-CSDN博客 Python系列专栏&#xff1a;http://t.csdnimg.cn/HqYo8 上一篇博客&#xff1a; http://t.csdnimg.cn/SEdbp C语言专栏&#xff1a; htt…...

vue页面实现左右div宽度,上下div高度分割线手动拖动高度或者宽度自动变化,两个div宽度或者高度拉伸调节,实现左右可拖动改变宽度的div内容显示区

实现左右或者上下div两部分拖动&#xff0c;宽度或者高度自动变化,实现流畅平滑的变化&#xff0c;还可以是实现拖动到一定宽度就不让拖动了&#xff0c;如果你不需要最小宽度&#xff0c;就直接去掉样式就行 这是页面。分左中右三部分&#xff0c;中间我是用来作为拖动的按钮…...

知攻善防应急靶场-Linux(1)

前言&#xff1a; 堕落了三个月&#xff0c;现在因为被找实习而困扰&#xff0c;着实自己能力不足&#xff0c;从今天开始 每天沉淀一点点 &#xff0c;准备秋招 加油 注意&#xff1a; 本文章参考qax的网络安全应急响应和知攻善防实验室靶场&#xff0c;记录自己的学习过程&am…...

ffmpeg命令行

ffmpeg 如果要在linux gdb 调试&#xff0c;需要在configure 时候不优化 开启调试 ./configure --enable-debug --disable-optimizations make如何开启gdb 调试 gdb ffmpeg_gset args -i test.hevc -c:v copy -c:a copy output_265.mp4rh264 的流生成mp4 文件&#xff0c;不转…...

VMware虚拟机更换引导顺序

前言 我用wmware装了黑群晖测试&#xff0c;将img转成vmdisk的格式之后发现系统引导盘之后1G&#xff0c;有点太小了 我准备把wmware的黑群晖系统迁移到新添加的虚拟磁盘里 1.登录黑群晖的SSH 请先在黑群晖的控制面板中的终端机和SNMP里面启用SSH功能&#xff0c;才能使用ss…...

RAFT:让大型语言模型更擅长特定领域的 RAG 任务

RAFT&#xff08;检索增强的微调&#xff09;代表了一种全新的训练大语言模型&#xff08;LLMs&#xff09;以提升其在检索增强生成&#xff08;RAG&#xff09;任务上表现的方法。“检索增强的微调”技术融合了检索增强生成和微调的优点&#xff0c;目标是更好地适应各个特定领…...

攻克Hugo-PaperMod菜单故障:导航异常的系统化解决策略

攻克Hugo-PaperMod菜单故障&#xff1a;导航异常的系统化解决策略 【免费下载链接】hugo-PaperMod A fast, clean, responsive Hugo theme. 项目地址: https://gitcode.com/GitHub_Trending/hu/hugo-PaperMod Hugo-PaperMod作为一款轻量级静态站点生成主题&#xff0c;…...

OpenClaw+GLM-4.7-Flash:科研数据收集与处理自动化方案

OpenClawGLM-4.7-Flash&#xff1a;科研数据收集与处理自动化方案 1. 为什么科研需要自动化助手 去年冬天&#xff0c;我在整理一篇跨学科综述论文时&#xff0c;经历了连续三周每天14小时的手动文献筛选和数据提取。当我在凌晨三点对着第237篇PDF文件发呆时&#xff0c;突然…...

网站外部 SEO 优化有哪些策略_SEO 网络推广与传统推广有什么区别

<h2>网站外部 SEO 优化有哪些策略</h2> <p>在当今的数字营销领域&#xff0c;外部 SEO 优化已经成为提升网站排名和流量的关键策略。外部 SEO&#xff08;Search Engine Optimization&#xff09;优化是一项通过外部手段提升网站在搜索引擎结果页面&#xff…...

别再手动调参了!用Matlab+NRBO-BP+NSGAII搞定工艺优化,自动生成最优参数组合Excel

工艺优化新范式&#xff1a;基于NRBO-BP与NSGAII的智能参数寻优系统 在化工、材料、制造等领域的工艺优化过程中&#xff0c;工程师和研究人员常常面临一个共同的挑战&#xff1a;如何在有限的实验资源和时间约束下&#xff0c;从海量的参数组合中找到最优解。传统的手动调参方…...

EF Core与SQLite实战:从零构建轻量级数据库应用

1. 为什么选择EF Core与SQLite这对黄金组合 如果你正在开发一个需要本地数据存储的移动应用或桌面小工具&#xff0c;SQLite绝对是你的首选数据库。这个只有几百KB的小家伙&#xff0c;不需要任何服务器配置&#xff0c;直接读写单个文件就能完成所有数据库操作。而EF Core作为…...

别再踩坑了!Win10下从零编译Mamba-SSM 2.2.2的保姆级避坑指南(含修改好的源码包)

Win10平台Mamba-SSM 2.2.2终极编译指南&#xff1a;避开90%开发者踩过的坑 在深度学习领域&#xff0c;Mamba-SSM因其高效的状态空间模型架构而备受关注。然而&#xff0c;当开发者们兴冲冲地想在Windows 10平台上搭建这一环境时&#xff0c;往往会遭遇各种"玄学报错"…...

extern ‘C‘原理与C/C++混合编程实践

1. 深入解析extern C的底层原理与工程实践1.1 C/C混合编程的核心挑战在嵌入式系统开发中&#xff0c;C与C语言的混合编程是常见需求。当C代码需要调用C语言编写的库函数时&#xff0c;编译器对函数名的处理方式差异会导致链接错误。这种差异源于两种语言对函数重载和名字空间的…...

【巴法云】零代码安卓App开发:用App Inventor + MQTT + ESP8266打造智能硬件遥控器

1. 零代码开发智能硬件遥控器的魅力 想象一下&#xff0c;你躺在沙发上发现忘关客厅的灯&#xff0c;这时候掏出手机点一下就能远程关灯&#xff1b;或者夏天回家前提前打开空调&#xff0c;进门就能享受清凉。这些智能家居场景现在用App Inventor 巴法云 ESP8266组合就能轻松…...

Claude模型选型指南:Opus/Sonnet/Haiku三大系列在真实项目中的性能价格对比

Claude模型选型实战&#xff1a;Opus/Sonnet/Haiku三大系列性能与成本深度评测 1. 企业级AI选型的核心考量 在构建商业AI解决方案时&#xff0c;技术决策者往往面临模型选型的复杂权衡。Anthropic推出的Opus、Sonnet和Haiku三大系列&#xff0c;分别针对不同规模和应用场景的…...

VLP-16数据包解析实战:从原始字节到三维点云

1. VLP-16数据包解析入门指南 第一次拿到VLP-16激光雷达的原始UDP数据流时&#xff0c;我完全被那一串串十六进制数字搞懵了。这就像收到一封用密码写成的信&#xff0c;明明知道里面藏着宝贵的三维环境信息&#xff0c;却不知道如何破译。经过几个项目的实战积累&#xff0c;我…...