当前位置: 首页 > news >正文

每周编辑精选|在线运行 Deepmoney 金融大模型、AI 偏好等多个优质数据集上线

目前,AI 领域对金融模型的研究成果大多是基于公共知识进行训练的,但在实际的金融实践中,这些公共知识对于当前市场的可解释性往往严重不足。一个理想的金融大模型应该能够理解新闻或数据事件,并能够即时地从主观和量化两个角度对事件进行评估。
Deepmoney 便是为此而生的,它是一个专注于金融领域投资的大型语言模型项目。 hyper.ai 官网现已提供在线运行教程,快来体验一下吧!

3 月 18 日-3 月 22 日,hyper.ai 官网更新速览:

  • 优质公共数据集:10 个

  • 优质教程精选:3 个

  • 社区文章精选:3 篇

  • 热门百科词条:10 条

访问官网:hyper.ai

公共数据集精选

1. OpenHermesPreferences:AI 偏好数据集

OpenHermesPreferences 数据集是由 Argilla 与 Hugging Face H4 团队协作创建的,包含约 100 万条 AI 偏好数据。该数据集可用于训练偏好模型或通过直接偏好优化等技术对齐语言模型。

直接使用:

https://my5353.com/30168

2. LongAlign 10K 大模型长上下文对齐数据集

LongAlign-10k 是清华大学提出的一个针对大模型在长上下文对齐任务中面临的挑战而设计的数据集,包含 10,000 条长指令数据,长度在 8k-64k 之间。该数据集旨在测评大模型于长上下文中的表现,及其对 10k-100k 长度任务指令的遵循能力。

直接使用:

https://my5353.com/30247

3. CyberMetric 大模型网络安全评测数据集

CyberMetric 数据集包含 10,000 个问题,旨在综合评估大模型的网络安全知识。该数据集采用不同大模型创建,并由网络安全领域的专家进行了验证,以确保其相关性和准确性。

直接使用:

https://my5353.com/30251

4. 2020 年中国地面光伏电站 10 米全国比例尺地图数据集

中国农业大学与中国科学院地理科学与资源研究所合作,针对国内缺乏高分辨率、开源的全国地面光伏电站分布数据现状,开发了一套全国性的制图方法,成功发布了 2020 年全国 10 米分辨率地面光伏电站分类数据集。该成果不仅精确揭示了我国光伏电站的空间分布特征,而且以 89% 的分类精度,为能源规划、土地利用、遥感监测及环境研究等领域提供了宝贵的数据资源。此举填补了国内该领域数据的空白,对相关研究具有重要意义。

直接使用:

https://my5353.com/30283

5. Crop Diseases Classification 农作物病害分类图像数据集

该数据集是 5 种农作物病害的分类图像,这些图像已被分别标记为:木薯细菌性枯萎病 (CBB) 、木薯褐条病 (CBSD) 、木薯绿斑驳病 (CGM) 、木薯马赛克病 (CMD) 和健康 。可用于训练机器学习模型来检测植物疾病,或开发自动植物诊断算法。

直接使用:

https://my5353.com/30293

6. Tomato Leaf Diseases Detection 番茄叶病图像检测数据集

该数据集为番茄叶病图像检测数据集,图像分为以下几类:健康、细菌斑、早疫病、健康、晚疫病、叶霉病、目标点和黑点。图像是用 YOLO v5 PyTorch 格式注释的。

直接使用:

https://my5353.com/30306

7. AMAZON REVIEWS 2023 大型亚马逊评论数据集

AMAZON REVIEWS 2023 是由 McAuley 实验室在 2023 年收集的大规模亚马逊评论数据集,包含了超过 5.7 亿条评论和 4,800 万个商品,涵盖了 33 个不同的类别。

直接使用:

https://my5353.com/30267

8. DiFF 扩散模型生成的面部伪造数据集

DiFF 是一个由山东大学、新加坡国立大学等机构共同研发的高质量、大规模的面部伪造图像数据集,其基于扩散模型生成,含有超过 50 万张图像。该数据集适用于面部伪造检测、深度伪造的对抗性攻击与防御,以及其他相关的计算机视觉任务训练。

直接使用:

https://my5353.com/30260

9. MIntRec2.0 多模态意图识别对话数据集

MIntRec2.0 是清华大学等提出的一个大规模多模态多方基准数据集,专门用于识别对话中的意图和检测非意图内容。相较于先前的 MIntRec,MIntRec2.0 的数据量增至 15K,涵盖 30 种意图类别,并包含约 9.3K 个意图内及 5.7K 个意图外的标注语句,涉及文本、视频和音频等多种模态。

直接使用:

https://my5353.com/30166

10. ApolloCorpora 多语言医疗数据集

ApolloCorpora 是深圳市大数据研究院和香港中文大学的研究团队联合构建的一个多语言医疗数据集。该数据集涵盖了全球 61 亿人口使用的六种主要语言,包括英语、中文、印地语、西班牙语、法语和阿拉伯语。

直接使用:

https://my5353.com/30285

更多公共数据集,请访问

https://hyper.ai/datasets

公共教程精选

1. 在线运行 Deepmoney-34b-full

Deepmoney 是一个专注于金融领域投资的大型语言模型项目。Deepmoney-34b-full是基于 01-ai 开源的 Yi-34B-200K 模型进行训练的,分为 pt(全参数训练)和 sft(lora 微调) 两个阶段。现可在超神经官网一键克隆使用。

在线运行:

https://my5353.com/t30314

2. 在线运行 Deepmoney-miqu-70b

该模型是基于 huggingface.co 的 miqu-1-70b-sf 进行训练的,仅进行 sft (lora 微调) ,现可在超神经官网一键克隆使用。

在线运行:

https://my5353.com/t30314

3. 在线运行 Deepmoney-67b-full

该模型是基于 deepseek-ai 开源的 deepseek-llm-67b-base 进行训练的,分为 pt(lora训练)和 sft (lora 训练) 两个阶段,现可在超神经官网一键克隆使用。

在线运行:

https://my5353.com/t30310

社区文章精选

1. 英伟达黄仁勋发布 GB200,比 H100 推理能力提高 30 倍,能耗降低 25 倍,将 AI4S 能力做成微服务

今年的 2024 GTC AI 大会如约而至,在 3 月 18 日至 3 月 21 日期间,有超 900 场会议与 20 余场技术讲座。本文为黄仁勋在 GTC 主题演讲的干货汇总。

查看完整报道:

https://my5353.com/p30224

2. 33 分钟生成 12 万种碳捕捉候选材料,美国阿贡国家实验室发布生成式 AI 框架,加速 MOFs 创新

来自美国阿贡国家实验室的研究团队,提出了一种生成式 AI 框架 GHP-MOFsassemble,该框架能够随机生成并组装新的 MOFs 结构,通过分子动力学模拟筛选高稳定性的 MOFs 结构,并用晶体图神经网络 (CGCNN) 和巨正则系统蒙特卡罗模拟 (GCMC) 来测试 MOFs 对二氧化碳的吸附能力。相关论文已发表于「Nature」。

查看完整报道:

https://my5353.com/p30269

3. 提前 300 毫秒预测等离子体撕裂风险,普林斯顿大学发布 AI Controller

普林斯顿大学的研究人员开发了一个 AI 控制器进行自适应预测和控制,能够提前 300 毫秒预测到等离子体的潜在撕裂风险并及时干预,相关成果已发表于「Nature」。

查看完整报道:

https://my5353.com/p30296

热门百科词条精选

1. 数据引力 Data Gravity

2. 大规模多任务语言理解(MMLU)

3. 混合专家模型 Mixture of Experts (MoE)

4. 量子神经网络 Quantum Neural Network

5. 神经辐射场 Neural Radiance Field (NeRF)

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://hyper.ai/wiki

B 站直播预告

日期时间内容
3 月 25 日 星期一10:0017:00MIT深度学习课程 2020MIT深度学习课程 2021
3 月 26 日星期二10:00Python API 开发——初学者综合课程
3 月 27 日星期三10:0014:00SQL 教程—初学者课程生成式 AI 全套课程
3 月 28 日星期四21:00面向初学者的 Flutter 课程
3 月 29 日星期五10:00面向初学者的 Flutter 课程
3 月 30 日星期六10:00哈佛 CS50—Python 人工智能课程
3 月 31 日星期日10:00一天内学习 PyTorch 进行深度学习

超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:

http://live.bilibili.com/26483094

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!


关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1200+ 公开数据集提供国内加速下载节点

  • 收录 300+ 经典及流行在线教程

  • 解读 100+ AI4Science 论文案例

  • 支持 500+ 相关词条查询

  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai/

相关文章:

每周编辑精选|在线运行 Deepmoney 金融大模型、AI 偏好等多个优质数据集上线

目前,AI 领域对金融模型的研究成果大多是基于公共知识进行训练的,但在实际的金融实践中,这些公共知识对于当前市场的可解释性往往严重不足。一个理想的金融大模型应该能够理解新闻或数据事件,并能够即时地从主观和量化两个角度对事…...

C++多重继承与虚继承

多重继承的原理 多重继承(multiple inheritance)是指从多个直接基类中产生派生类的能力。 多重继承的派生类继承了所有父类的属性。 在面向对象的编程中,多重继承意味着一个类可以从多个父类继承属性和方法。 就像你有一杯混合果汁,它是由多种水果榨取…...

请简单介绍一下Shiro框架是什么?Shiro在Java安全领域的主要作用是什么?Shiro主要提供了哪些安全功能?

请简单介绍一下Shiro框架是什么? Shiro框架是一个强大且灵活的开源安全框架,为Java应用程序提供了全面的安全解决方案。它主要用于身份验证、授权、加密和会话管理等功能,可以轻松地集成到任何Java Web应用程序中,并提供了易于理解…...

TouchGFX之Button

TouchGFX中的按钮是一种感应触控事件的控件&#xff0c;能够在按钮被按下/释放时发送回调 代码 #ifndef TOUCHGFX_ABSTRACTBUTTON_HPP #define TOUCHGFX_ABSTRACTBUTTON_HPP #include <touchgfx/Callback.hpp> #include <touchgfx/events/ClickEvent.hpp> #includ…...

计算机组成原理 — 指令系统

指令系统 指令系统指令的概述指令的格式指令的字长取决于 操作数类型和操作种类操作数的类型数据在存储器中的存放方式操作类型 寻址方式指令寻址数据寻址立即寻址直接寻址隐含寻址间接寻址寄存器寻址寄存器间接寻址基址寻址变址寻址堆栈寻址 RISC 和 CISC 技术RISC 即精简指令…...

使用easyYapi生成文档

easyYapi生成文档 背景1.安装配置1.1 介绍1.2 安装1.3 配置1.3.1 Export Postman1.3.2 Export Yapi1.3.3 Export Markdown1.3.4 Export Api1.3.6 常见问题补充 2. java注释规范2.1 接口注释规范2.2 出入参注释规范 3. 特定化支持3.1 必填校验3.2 忽略导出3.3 返回不一致3.4 设置…...

蓝桥杯练习题总结(三)线性dp题(摆花、数字三角形加强版)

目录 一、摆花 思路一&#xff1a; 确定状态&#xff1a; 初始化&#xff1a; 思路二&#xff1a; 确定状态&#xff1a; 初始化&#xff1a; 循环遍历&#xff1a; 状态转移方程&#xff1a; 二、数字三角形加强版 一、摆花 题目描述 小明的花店新开张&#xff0c;为了吸…...

Elasticsearch(15) multi_match的使用

elasticsearch version&#xff1a; 7.10.1 multi_match是Elasticsearch中的一种查询类型&#xff0c;允许在一个或多个字段上执行全文本搜索&#xff0c;并合并各个字段的结果得分。这种查询有助于实现跨多个字段的统一搜索体验。 语法 {"query": {"multi_m…...

nodejs的线程模型和libuv库的基本使用

文章目录 nodejs中集成addon本地代码的回调问题单线程事件驱动模型libuvlibuv基本框架addon中使用libuv代码nodejs中集成addon本地代码的回调问题 在C++的代码中,回调函数是一个基本的代码调用方式。而在我自己的开发实践中,需要在addon这样一个nodejs的本地化模块中实现一个…...

Uni-app/Vue/Js本地模糊查询,匹配所有字段includes和some方法结合使用e

天梦星服务平台 (tmxkj.top)https://tmxkj.top/#/ 1.第一步 需要一个数组数据 {"week": "全部","hOutName": null,"weekendPrice": null,"channel": "门市价","hOutId": 98,"cTime": "…...

深度学习pytorch——激活函数损失函数(持续更新)

论生物神经元与神经网络中的神经元联系——为什么使用激活函数&#xff1f; 我们将生物体中的神经元与神经网络中的神经元共同分析。从下图可以看出神经网络中的神经元与生物体中的神经元有很多相似之处&#xff0c;由于只有刺激达到一定的程度人体才可以感受到刺激&#xff0c…...

《苹果 iOS 应用开发与分发的关键问题解析》

一、背景 解决同事问的问题&#xff0c;来来回回被问好几次相同的问题&#xff0c;然后确认&#xff0c;我觉得不如写个文档 二、非研发人员安装iOS应用方式 TestFlightIPA 文件 对比 TestFlightIPA 文件安装方式TestFlight 是苹果提供的一个 beta 测试平台&#xff0c;开发者…...

爱上数据结构:顺序表和链表

一、线性表 线性表&#xff08;linear list&#xff09;是n个具有相同特性的数据元素的有限序列。 线性表是一种在实际中广泛使 用的数据结构&#xff0c;常见的线性表&#xff1a;顺序表、链表、栈、队列、字符串... 线性表在逻辑上是线性结构&#xff0c;也就说是连续的一条…...

python知识点总结(十)

python知识点总结十 1、装饰器的理解、并实现一个计时器记录执行性能&#xff0c;并且将执行结果写入日志文件中2、队列和栈的区别&#xff0c;并且用python实现3、设计实现遍历目录与子目录4、CPU处理进程最慢的情况通常发生在以下几种情况下&#xff1a;5、CPU处理线程最慢的…...

【Python】探索 Python 编程世界:常量、变量及数据类型解析

欢迎来CILMY23的博客 本篇主题为 探索 Python 编程世界&#xff1a;常量、变量及数据类型解析 个人主页&#xff1a;CILMY23-CSDN博客 Python系列专栏&#xff1a;http://t.csdnimg.cn/HqYo8 上一篇博客&#xff1a; http://t.csdnimg.cn/SEdbp C语言专栏&#xff1a; htt…...

vue页面实现左右div宽度,上下div高度分割线手动拖动高度或者宽度自动变化,两个div宽度或者高度拉伸调节,实现左右可拖动改变宽度的div内容显示区

实现左右或者上下div两部分拖动&#xff0c;宽度或者高度自动变化,实现流畅平滑的变化&#xff0c;还可以是实现拖动到一定宽度就不让拖动了&#xff0c;如果你不需要最小宽度&#xff0c;就直接去掉样式就行 这是页面。分左中右三部分&#xff0c;中间我是用来作为拖动的按钮…...

知攻善防应急靶场-Linux(1)

前言&#xff1a; 堕落了三个月&#xff0c;现在因为被找实习而困扰&#xff0c;着实自己能力不足&#xff0c;从今天开始 每天沉淀一点点 &#xff0c;准备秋招 加油 注意&#xff1a; 本文章参考qax的网络安全应急响应和知攻善防实验室靶场&#xff0c;记录自己的学习过程&am…...

ffmpeg命令行

ffmpeg 如果要在linux gdb 调试&#xff0c;需要在configure 时候不优化 开启调试 ./configure --enable-debug --disable-optimizations make如何开启gdb 调试 gdb ffmpeg_gset args -i test.hevc -c:v copy -c:a copy output_265.mp4rh264 的流生成mp4 文件&#xff0c;不转…...

VMware虚拟机更换引导顺序

前言 我用wmware装了黑群晖测试&#xff0c;将img转成vmdisk的格式之后发现系统引导盘之后1G&#xff0c;有点太小了 我准备把wmware的黑群晖系统迁移到新添加的虚拟磁盘里 1.登录黑群晖的SSH 请先在黑群晖的控制面板中的终端机和SNMP里面启用SSH功能&#xff0c;才能使用ss…...

RAFT:让大型语言模型更擅长特定领域的 RAG 任务

RAFT&#xff08;检索增强的微调&#xff09;代表了一种全新的训练大语言模型&#xff08;LLMs&#xff09;以提升其在检索增强生成&#xff08;RAG&#xff09;任务上表现的方法。“检索增强的微调”技术融合了检索增强生成和微调的优点&#xff0c;目标是更好地适应各个特定领…...

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…...

多云管理“拦路虎”:深入解析网络互联、身份同步与成本可视化的技术复杂度​

一、引言&#xff1a;多云环境的技术复杂性本质​​ 企业采用多云策略已从技术选型升维至生存刚需。当业务系统分散部署在多个云平台时&#xff0c;​​基础设施的技术债呈现指数级积累​​。网络连接、身份认证、成本管理这三大核心挑战相互嵌套&#xff1a;跨云网络构建数据…...

python/java环境配置

环境变量放一起 python&#xff1a; 1.首先下载Python Python下载地址&#xff1a;Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个&#xff0c;然后自定义&#xff0c;全选 可以把前4个选上 3.环境配置 1&#xff09;搜高级系统设置 2…...

页面渲染流程与性能优化

页面渲染流程与性能优化详解&#xff08;完整版&#xff09; 一、现代浏览器渲染流程&#xff08;详细说明&#xff09; 1. 构建DOM树 浏览器接收到HTML文档后&#xff0c;会逐步解析并构建DOM&#xff08;Document Object Model&#xff09;树。具体过程如下&#xff1a; (…...

Web 架构之 CDN 加速原理与落地实践

文章目录 一、思维导图二、正文内容&#xff08;一&#xff09;CDN 基础概念1. 定义2. 组成部分 &#xff08;二&#xff09;CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 &#xff08;三&#xff09;CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 &#xf…...

【数据分析】R版IntelliGenes用于生物标志物发现的可解释机器学习

禁止商业或二改转载&#xff0c;仅供自学使用&#xff0c;侵权必究&#xff0c;如需截取部分内容请后台联系作者! 文章目录 介绍流程步骤1. 输入数据2. 特征选择3. 模型训练4. I-Genes 评分计算5. 输出结果 IntelliGenesR 安装包1. 特征选择2. 模型训练和评估3. I-Genes 评分计…...

C++:多态机制详解

目录 一. 多态的概念 1.静态多态&#xff08;编译时多态&#xff09; 二.动态多态的定义及实现 1.多态的构成条件 2.虚函数 3.虚函数的重写/覆盖 4.虚函数重写的一些其他问题 1&#xff09;.协变 2&#xff09;.析构函数的重写 5.override 和 final关键字 1&#…...

排序算法总结(C++)

目录 一、稳定性二、排序算法选择、冒泡、插入排序归并排序随机快速排序堆排序基数排序计数排序 三、总结 一、稳定性 排序算法的稳定性是指&#xff1a;同样大小的样本 **&#xff08;同样大小的数据&#xff09;**在排序之后不会改变原始的相对次序。 稳定性对基础类型对象…...

力扣热题100 k个一组反转链表题解

题目: 代码: func reverseKGroup(head *ListNode, k int) *ListNode {cur : headfor i : 0; i < k; i {if cur nil {return head}cur cur.Next}newHead : reverse(head, cur)head.Next reverseKGroup(cur, k)return newHead }func reverse(start, end *ListNode) *ListN…...

Python训练营-Day26-函数专题1:函数定义与参数

题目1&#xff1a;计算圆的面积 任务&#xff1a; 编写一个名为 calculate_circle_area 的函数&#xff0c;该函数接收圆的半径 radius 作为参数&#xff0c;并返回圆的面积。圆的面积 π * radius (可以使用 math.pi 作为 π 的值)要求&#xff1a;函数接收一个位置参数 radi…...