当前位置: 首页 > article >正文

OpenCSG月度更新2025.1

1月的OpenCSG取得了一些亮眼的成绩


在2025年1月,OpenCSG在产品和社区方面继续取得了显著进展。产品方面,推出了AutoHub浏览器自动化助手,帮助用户提升浏览体验;CSGHub企业版功能全面升级,现已开放试用申请,为企业用户提供更高效的AI资产管理与应用平台;同时,CSGHub开源版本v1.3.0更新,提升了平台性能和稳定性;CodeSouler v1.13.0版本也进行了更新,增强了功能和交互体验,提升了开发效率。社区方面,OpenCSG发布了UltraFeedback中文数据集,助力中文NLP技术进步,并助力国产大模型YuLan-Mini的研发;通过直播活动“OpenCSG&人大YuLan|LLM数据新范式”和“OpenCSG AutoHub智能探索”,为开发者提供了深入的技术洞察与实用经验;此外,OpenCSG还发布了2024年度报告,总结了过去一年的成果。未来,OpenCSG将继续助力国产AI生态建设,推动技术创新与智能化升级!
01 产品
1.1 限时福利|AutoHub正式上线:您的浏览器自动化助手
1.2 新版本|CSGHub 企业版功能全面升级,限时开放试用申请!
1.3 CSGHub开源版本v1.3.0更新
1.4 CodeSouler v1.13.0 版本更新

02 社区
2.1 回首2024 | OpenCSG社区年度报告请查收
2.2 开年巨献|OpenCSG携UltraFeedback中文数据集强势来袭
2.3 OpenCSG助力国产大模型|YuLan-Mini:数据高效的AI模型突破
2.4 社区精选推荐
2.5 社区本月重点数据

01

产品

社区功能体验增强

1 新增 SGlang 推理引擎

  • 引入全新的 SGlang 推理引擎,提供更高效的模型推理能力,能够满足复杂场景下对高性能推理的严格需求。

2 新增文生图推理引擎

  • 为专属实例增加文生图推理支持,支持多种参数配置选项,能够满足不同场景下对图像生成的多样化需求。

3 模型树功能升级

  • 现已新增直观展示模型派生关系的功能,用户可以轻松查看当前模型衍生出的下一级模型,快速了解模型的版本信息与演变路径。

4 模型和数据集标签支持多选

  • 标签管理功能得到显著增强,现已支持多标签选择,帮助用户更加精准地组织资源和进行高效筛选。

5 搜索功能增强

  • 模型与数据集搜索全面升级:新增多关键词模糊匹配功能,同时支持对名称和描述内容的搜索,大幅提升资源查找效率与精确度。

6 数据集预览功能增强

  • 新增对 CSV 和 JSON 文件的预览支持,为用户提供更多数据格式的直观浏览体验,使得数据探索更加便捷。

7 后台新增标签管理功能

  • 后台管理工具新增标签管理模块,管理员可轻松查看、编辑、添加或删除标签,并灵活管理标签分组,设置显示名称和可见性。

8 企业版正式上线

  • CSGHub 企业版现已全面上线,提供更多高阶功能与企业级支持服务,全面满足企业用户的专业需求。即日起,用户可前往官网申请 30 天免费试用 License,抢先体验企业版的强大功能。

9 全新上线 AutoHub

  • 通过智能对话与自动化技术,AutoHub 为用户提供更加高效、智能的网页浏览体验,解锁更多提升生产力的可能
  • OpenCSG社区月度发布 2025.1


限时福利|AutoHub正式上线:您的浏览器自动化助手

OpenCSG推出的AutoHub正式上线,作为一款基于大型语言模型的浏览器自动化助手,旨在提升用户的网页浏览体验。AutoHub通过智能对话和自动化技术,简化了表单填写、信息提交、页面总结等操作,帮助用户节省时间,提高效率。AutoHub支持Chrome等主流浏览器,提供语音输入、历史操作重复执行、复杂检索等实用功能,是提升工作和生活效率的理想助手。


新版本|CSGHub 企业版功能全面升级,限时开放试用申请!

CSGHub企业版功能全面升级,现已开放限时试用申请。新版本提供高效的AI资产管理、智能化数据工具和企业级安全保障,支持多源数据同步、智能算力调度和高性能推理引擎,帮助企业提升团队协作效率、加速创新和优化资源管理。该平台适用于AI研发、行业应用和数据安全要求高的企业,提供灵活的定制化服务和专家支持。现在申请试用,体验AI驱动的创新未来!


CSGHub开源版本v1.3.0更新

CSGHub开源版本v1.3.0现已发布,带来了一系列增强功能,旨在提升工作效率和用户体验。此次更新包括改进标签管理、优化导航体验、强大的多标签过滤功能以及性能提升,如支持SGLang推理引擎和更新的微调镜像。同时,平台基础设施也得到了加强,支持多同步代理和通过API创建公共数据集。此次更新让平台变得更加流畅和强大,提升了用户的整体使用体验。


CodeSouler v1.13.0 版本更新

CodeSouler v1.13.0版本进行了显著更新,提升了用户交互体验和开发效率。此次更新新增了对@CSGHub指令的支持,简化了模块操作,并通过GitLab集成优化了代码提交流程,如一键创建合并请求和自动生成提交信息。还引入了多轮Chat模式,提升了软件的互动性和稳定性。用户可以通过VSCode插件市场下载此版本,享受更高效的开发环境。


02

社区

回首2024 | OpenCSG社区年度报告请查收

2024年,OpenCSG社区取得了显著的成就,从技术创新到用户生态建设,从开源产品发布到社区活动,影响力不断扩大,技术成果丰硕。感谢每一位社区伙伴的支持与贡献,帮助我们稳步发展,推出高质量的数据集、模型和工具。展望2025年,OpenCSG将继续秉持开源精神,与社区共同成长,推动技术创新,提供更多学习交流机会,扩展技术边界,推动全球开源技术应用。我们期待与更多创新者携手,书写开源技术的新篇章,共同迎接更加辉煌的未来!


开年巨献|OpenCSG携UltraFeedback中文数据集强势来袭OpenCSG社区在2025年初推出了UltraFeedback-Chinese数据集,专为训练奖励模型和批评模型设计。该数据集汇集了58,000个中文指令,支持PPO和DPO训练方法,能够有效提升中文NLP模型的表现,特别在智能客服和内容生成等领域。OpenCSG致力于提供高质量的中文数据资源,推动中文NLP技术的快速发展,并持续完善数据集,以满足全球开发者和研究者的需求。


OpenCSG助力国产大模型|YuLan-Mini:数据高效的AI模型突破

OpenCSG在推动国产大模型发展中发挥了重要作用,特别是在YuLan-Mini模型的训练过程中,提供了强大的数据支持。YuLan-Mini在仅有24.2亿参数的情况下,凭借创新的数据处理管道和优化策略,展现了优异的性能,超越了许多更大模型。OpenCSG通过提供包含90M条高质量中文文本的Chinese Fineweb Edu数据集,确保了模型在教育领域的出色表现,帮助YuLan-Mini在教育相关任务中获得了卓越的成果。OpenCSG的开源理念不断推动高质量数据的共享,助力国内大模型技术的突破与应用。


OpenCSG社区精选推荐

ModernBERT:下一代 Encoder-Only 模型的全面进化

NVIDIA Cosmos平台:开启物理AI时代的技术革命

Phi-4: 微软开源的14亿参数模型,重定义AI性能新标准

书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型

MiniMax-01重磅发布:突破Transformer架构,4M超长上下文

全新推理模型 DeepSeek-R1 问世,全面对标 OpenAI o1

相关文章:

OpenCSG月度更新2025.1

1月的OpenCSG取得了一些亮眼的成绩 在2025年1月,OpenCSG在产品和社区方面继续取得了显著进展。产品方面,推出了AutoHub浏览器自动化助手,帮助用户提升浏览体验;CSGHub企业版功能全面升级,现已开放试用申请&#xff0c…...

【算法与数据结构】动态规划

目录 基本概念 最长递增子序列(中等) 最大子数组和(中等) 基本概念 重叠子问题 一个问题可以被分解为多个子问题,并且这些子问题在求解过程中会被多次重复计算。例如,在计算斐波那契数列时,…...

AWTK 骨骼动画控件发布

Spine 是一款广泛使用的 2D 骨骼动画工具,专为游戏开发和动态图形设计设计。它通过基于骨骼的动画系统,帮助开发者创建流畅、高效的角色动画。本项目是基于 Spine 实现的 AWTK 骨骼动画控件。 代码:https://gitee.com/zlgopen/awtk-widget-s…...

【llm对话系统】什么是 LLM?大语言模型新手入门指南

什么是 LLM?大语言模型新手入门指南 大家好!欢迎来到 LLM 的奇妙世界!如果你对人工智能 (AI) 的最新进展,特别是那些能像人类一样阅读、写作甚至进行对话的 AI 感兴趣,那么你来对地方了。这篇文章将带你认识 LLM 的基…...

三角形的最大周长(LeetCode 976)

给定由一些正数(代表长度)组成的数组 A,返回由其中三个长度组成的、面积不为零的三角形的最大周长。如果不能形成任何面积不为零的三角形,返回 0。 示例 1: 输入:[2,1,2] 输出:5 示例 2&…...

go到底是什么意思:对go的猜测或断言

go这个单词,简单地讲,表示“走或去”的意思: go v.去;走 认真想想,go是一个非常神秘的单词,g-和o-这两个字母,为什么就会表达“去;走”的意思呢?它的字面义或本质&…...

学习数据结构(2)空间复杂度+顺序表

1.空间复杂度 (1)概念 空间复杂度也是一个数学表达式,表示一个算法在运行过程中根据算法的需要额外临时开辟的空间。 空间复杂度不是指程序占用了多少bytes的空间,因为常规情况每个对象大小差异不会很大,所以空间复杂…...

DeepSeek--通向通用人工智能的深度探索者

一、词源与全称 “DeepSeek"由"Deep”(深度)与"Seek"(探索)组合而成,中文译名为"深度求索"。其全称为"深度求索人工智能基础技术研究有限公司",英文对应"De…...

Unity游戏(Assault空对地打击)开发(1) 创建项目和选择插件

目录 前言 创建项目 插件导入 地形插件 前言 这是游戏开发第一篇,进行开发准备。 创作不易,欢迎支持。 我的编辑器布局是【Tall】,建议调整为该布局,如下。 创建项目 首先创建一个项目,过程略,名字请勿…...

(三)Session和Cookie讲解

目录 一、前备知识点 (1)静态网页 (2)动态网页 (3)无状态HTTP 二、Session和Cookie 三、Session 四、Cookie (1)维持过程 (2)结构 正式开始说 Sessi…...

【信息系统项目管理师-选择真题】2011下半年综合知识答案和详解

更多内容请见: 备考信息系统项目管理师-专栏介绍和目录 文章目录 【第1题】【第2题】【第3题】【第4题】【第5题】【第6题】【第7题】【第8题】【第9~10题】【第11题】【第12题】【第13题】【第14题】【第15题】【第16题】【第17题】【第18题】【第19题】【第20题】【第21题】…...

1.Template Method 模式

模式定义 定义一个操作中的算法的骨架(稳定),而将一些步骤延迟(变化)到子类中。Template Method 使得子类可以不改变(复用)一个算法的结构即可重定义(override 重写)该算法的某些特…...

【PyTorch】5.张量索引操作

目录 1. 简单行、列索引 2. 列表索引 3. 范围索引 4. 布尔索引 5. 多维索引 个人主页:Icomi 在深度学习蓬勃发展的当下,PyTorch 是不可或缺的工具。它作为强大的深度学习框架,为构建和训练神经网络提供了高效且灵活的平台。神经网络作为…...

力扣25.k个一组翻转链表

给你链表的头节点 head ,每 k 个节点一组进行翻转,请你返回修改后的链表。k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍,那么请将最后剩余的节点保持原有顺序。你不能只是单纯的改变节点内部的值&…...

[EAI-023] FAST: Efficient Action Tokenization for Vision-Language-Action Models

Paper Card 论文标题:FAST: Efficient Action Tokenization for Vision-Language-Action Models 论文作者:Karl Pertsch, Kyle Stachowicz, Brian Ichter, Danny Driess, Suraj Nair, Quan Vuong, Oier Mees, Chelsea Finn, Sergey Levine 论文链接&…...

2025年AI手机集中上市,三星Galaxy S25系列上市

2025年被认为是AI手机集中爆发的一年,各大厂商都会推出搭载人工智能的智能手机。三星Galaxy S25系列全球上市了。 三星Galaxy S25系列包含S25、S25和S25 Ultra三款机型,起售价为800美元(约合人民币5800元)。全系搭载骁龙8 Elite芯…...

八股文 (一)

文章目录 项目地址一、前端1.1 大文件上传,预览1.2 首页性能优化1.2 流量染色,灰度发布1.3 Websock心跳机制,大数据实时数据优化1.4 Gpu 加速 fps优化1.5 echarts包大小优化和组件封装1.6 前端监控系统1.7 超大虚拟列表卡顿1. 实现2. 相关问题(1) 什么是虚拟化列表,为什么要…...

在虚拟机里运行frida-server以实现对虚拟机目标软件的监测和修改参数(一)(android Google Api 35高版本版)

frida-server下载路径 我这里选择较高版本的frida-server-16.6.6-android-x86_64 以root身份启动adb 或 直接在android studio中打开 adb root 如果使用android studio打开的话,最好选择google api的虚拟机,默认以root模式开启 跳转到下载的frida-se…...

FLTK - FLTK1.4.1 - demo - animgifimage-play

文章目录 FLTK - FLTK1.4.1 - demo - animgifimage-play概述笔记END FLTK - FLTK1.4.1 - demo - animgifimage-play 概述 看的官方demo越多,在每个新demo中能看到的新增知识点越少。这是好事。 不可能一次将细节都记住,只要知道每个官方demo能干啥&…...

2024年除夕

多少年前的除夕,一如今天这样的除夕;多少年后的除夕,也一如多少年前的除夕。 无数个这样的除夕下午,我打开电脑,望着窗外安静的小区,车声渐渐稀疏的马路,想写下一些新的感受时,多少…...

如何实现滑动删除功能

文章目录 1 概念介绍2 使用方法3 示例代码 我们在上一章回中介绍了GestureDetector Widget相关的内容,本章回中将介绍Dismissible Widget.闲话休提,让我们一起Talk Flutter吧。 1 概念介绍 我们在这里介绍的Dismissible是一个事件响应Widget,它和GestureDetector类…...

golang通过AutoMigrate方法自动创建table详解

一.AutoMigrate介绍 1.介绍 在 Go 语言中,GORM支持Migration特性,支持根据Go Struct结构自动生成对应的表结构,使用 GORM ORM 库的 AutoMigrate 方法可以自动创建数据库表,确保数据库结构与定义的模型结构一致。AutoMigrate 方法非常方便&am…...

JAVA:利用 Content Negotiation 实现多样式响应格式的技术指南

1、简述 Content Negotiation(内容协商) 是 RESTful 服务的重要特性,允许客户端和服务器根据请求的不同特性动态选择适合的响应格式。它是一种在 HTTP 协议中实现的机制,通过它,服务器能够根据客户端需求返回适合的内…...

Python 函数魔法书:基础、范例、避坑、测验与项目实战

Python 函数魔法书:基础、范例、避坑、测验与项目实战 内容简介 本系列文章是为 Python3 学习者精心设计的一套全面、实用的学习指南,旨在帮助读者从基础入门到项目实战,全面提升编程能力。文章结构由 5 个版块组成,内容层层递进…...

OpenBMC:编译

1.安装依赖 OpenBMC是基于Yocto搭建的,基于不同的OS预先需要安装的依赖包和工具,清参考: 1 System Requirements — The Yocto Project 5.1.999 documentation 2.下载代码 OpenBMC的源码位于: openbmc/openbmc: OpenBMC Distri…...

Effective Objective-C 2.0 读书笔记—— objc_msgSend

Effective Objective-C 2.0 读书笔记—— objc_msgSend 文章目录 Effective Objective-C 2.0 读书笔记—— objc_msgSend引入——静态绑定和动态绑定OC之中动态绑定的实现方法签名方法列表 其他方法objc_msgSend_stretobjc_msgSend_fpretobjc_msgSendSuper 尾调用优化总结参考文…...

使用EVE-NG-锐捷实现OSPF

一、OSPF基础知识 Open shortest Path First(OSPF)开放式最短路径优先协议 1.OSPF的关系状态 (1)邻居关系(TWO-WAY) 只发送hello包不发送LSA包(链路状态通告包) (2)邻接关系(FULL) OSPF设备与设备之间相互建立OSPF关系,初始为邻居关系(TWO-WAY)状态&#xff0…...

电商系统-用户认证(三)基于公钥解析JWT令牌

一、 基于私钥生成jwt令牌 步骤: 导入认证服务 将shangcheng_user_auth工程导入到项目中去,如下图 启动eureka,再启动认证服务 3) 认证服务中创建测试类 public class CreateJwtTest { ​ /**** 创建令牌测试*/Testpublic voi…...

【论文投稿-第八届智能制造与自动化学术会议(IMA 2025)】HTML, CSS, JavaScript:三者的联系与区别

大会官网:www.icamima.org 目录 前言 一、HTML(超文本标记语言):网页的骨架 HTML 的作用: 例子: 总结: 二、CSS(层叠样式表):网页的外观设计 CSS 的…...

Baklib赋能下的内容中台智能化推荐系统解析与展望

内容概要 在数字化时代,内容中台的智能化推荐系统正逐渐成为各类企业提升用户体验与运营效率的重要工具。该系统通过集成和分析大量用户数据及内容信息,能够实现精准的个性化推荐,为用户提供最相关的内容。 以下是内容中台智能化推荐系统的…...