当前位置: 首页 > news >正文

2023年7月第4周大模型荟萃

2023年7月第4周大模型荟萃

  • 2023.7.31
  • 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。

1、Cerebras推出全球最强AI超算

AI芯片初创公司Cerebras Systems和总部位于阿联酋的技术控股集团G42于7月20日宣布,携手打造一个由互联的超级计算机组成的网络,为AI计算提供一种新的方案,有望大幅减少AI大模型训练时间。目前,该网络上的第一台AI超级计算机——“Condor Galaxy 1(CG-1)”正式上线,AI算力高达4 exaFLOPS,这也是目前性能最强的AI超级计算机。

CG-1由64台CS-2 AI计算机组合而成,每台CS-2 AI计算机则是由一个WSE-2芯片所驱动,使得整个CG-1系统当中的AI内核数量达到了5400万个,总体的片上内存容量达到了82TB,各个CS-2系统间的带宽速率高达388Tbps。同时,CG-1还配备了高达72704个AMD EPYC CPU内核。

CG-1针对大型语言模型和生成人工智能进行了优化,标准支持多达6000亿个参数模型。CG-1使用简单的数据并行性,就可实现从1到64个CS-2系统的近乎线性的性能扩展。扩展后的配置可支持多达100万亿个参数模型。要知道今年以来非常火爆的AI大模型GPT-4为1.8万亿个参数。

2、微软、OpenAI、谷歌等巨头联合成立前沿模型论坛

微软、OpenAI、谷歌和 Anthropic 四家公司共同发起成立前沿模型论坛,它是一个专注于前沿人工智能模型的组织。所谓前沿人工智能模型,是指那些超越现有最先进模型的能力,并且可以执行多种任务的大规模机器学习模型。论坛认为,创造人工智能技术的公司有责任确保它是安全、可靠且受人类控制的。

前沿模型论坛组织公布了其发展目标:

  • 推进人工智能安全研究,促进前沿模型的负责任开发,降低风险,并实现独立、标准化的能力和安全评估。
  • 确定前沿模型负责任开发和部署的最佳实践,帮助公众了解这项技术的性质、能力、局限和影响。
  • 与政策制定者、学者、民间社会和企业合作,分享有关信任和安全风险的知识。
  • 支持开发可以帮助应对社会最大挑战的应用,例如减缓和适应气候变化、早期癌症检测和预防、以及应对网络威胁。

3、网易有道发布垂直教育行业的大模型“子曰”

2023年7月26日,网易有道发布垂直教育行业的大模型“子曰”。“子曰”大模型现已应用于有道生态内的软件和硬件上,实现了产品化,包括大模型翻译、AI作文批改、英语语法精讲、虚拟人口语教练、AIBox、文档问答等,面向付费用户。网易内部调研中,自认为“子曰”大模型的翻译能力已经优于ChatGPT、超过了市面上所有主流翻译引擎。

点评:官方的新闻稿有点自大,动不动就超越ChatGPT。从网页版的有道翻译来看,目前的翻译质量只能说还行,有道总不能说,“我们还没有把大模型用到我们的产品上”。

4、用友发布企业服务大模型YonGPT

7月27日,用友发布企业服务大模型YonGPT。在大模型赛道上,用友选择做自己长期专注且有一定积累的企业服务领域的大模型,而不是做通用语言大模型。发布会上用友展示了基于YonGPT已经实现的四个智能化场景服务:1)基于YonGPT的企业收入/利税经营智能分析,可实时掌控经营状况、快速洞察问题、准确预测企业效益、有效预见变化;2)基于YonGPT的智能生单,实现快速智能生单,提高企业效能;3)基于YonGPT的智能招聘,帮助企业快速识别人才,从简历池发现人才,通过AI互动改善应聘体验;4)基于YonGPT的智能大搜,改善搜索体验,加速企业知识的价值化服务,让知识赋能业务和组织。

5、新壹科技发布视频垂直大模型

7月27日,新壹科技发布了面向视频的大模型“新壹视频大模型”,以及基于此大模型的AIGC视频生成平台,根据新壹科技的宣称,其AI生成能力已覆盖文本、图像、音视频等内容模态,号称实现了从大模型到平台服务再到产品服务落地的AIGC业务全链路打通。遗憾的是,发布会主要还是动嘴皮子,看不到实际的东西。

6、AI初创公司Cohere推出面向企业用户的知识助手Coral

7月26日,AI初创公司Cohere宣布推出面向企业用户的知识助手Coral。Coral是一款企业级聊天机器人,可以与用户进行对话,帮助他们完成业务方面的任务。公司表示,Coral通过提供对专有的内部公司数据以及公开来源的引用来缓解幻觉问题。此外,Coral可以接受内部数据和公司技术资源方面的培训,以提供分析、报告和其他定制信息。公司表示,Coral已与上百个集成的数据源链接,包括CRM、协作工具、数据库、搜索基础设施和支持系统等。

7、Stability AI推出开源文生图模型SDXL 1.0

明星AI初创公司Stability AI打造的文本到图像生成模型Stable Diffusion在今年风靡全球。虽然从文本到图像的生成模型并不少,但Stable Diffusion是最受欢迎的开源模型。各路开发者也基于Stable Diffusion模型进行二创,推出各种各样、花式繁多的AIGC应用。7月26日,Stability AI公司正式推出了Stable Diffusion XL(SDXL)1.0开源文生图模型,完成了进化过程中的又一次重要迭代。这是Stability AI最新的旗舰图像模型,也是当前图像生成领域最好的开源模型。

在SDXL 1.0版发布之前,Stability AI在六月份推出的SDXL 0.9仅能作研究用途。但从今天起,SDXL 1.0将通过Stability AI的API开源开放给开发者,普通人也可以通过消费级应用Clipdrop和DreamStudio访问。

体验SDXL 1.0目前有几种渠道:

  • Clipdrop:https://clipdrop.co/stable-diffusion
  • DreamStudio:https://dreamstudio.ai/generate
  • Stability AI Platform:https://platform.stability.ai/
  • Github:https://github.com/Stability-AI/generative-models

国内的一些大模型可以跟着进化一波了。

8、C-Eval中文大模型权威排名公布

C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖52个不同学科和四个难度级别。7月23日,最新的排名公布了,中文大模型全球排名前四分别为清华智谱的ChatGLM2、OpenAI的GPT-4、商汤的SenseChat,APUS的AiLMe-100Bv1。具体如下:
C-Eval中文大模型权威排名
大模型测试跟手机跑分差不多,做个参考即可。以国人的聪明才智,针对测试题对大模型做训练,拿个90多分,甚至100分都可以。有些手机厂家就做过针对跑分软件做优化,一检测到跑分软件运行就开启超频加速。

9、Runway视频生成工具Gen-2全面开放

Runway是一家专注于提供各种AI影像编辑工具的公司,Runway Gen-2是其推出的最新文本生成视频的AI模型。Gen-2不仅可以像Gen-1一样在原视频的基础上编辑出符合用户要求的视频,还可以从头生成视频。使用Gen-2模型,用户能够根据简单的文本提示生成4秒的视频片段,这些片段,可以被看作是动画GIF,提供了一种独特而简洁的方式来让想法变为现实。而想要使用Runway Gen-2的用户,只需在Runway网站上创建一个免费账户。

然而,免费生成的视频数量是有限制的,免费试用的额度为105秒,每个视频为4秒,也就是大约可免费生成26个Gen-2视频。用户可以通过每月15美元或每年144美元(预付)的价格,获取一系列的高级功能。这包括更高分辨率的视频,去除Runway的水印,以及每月视频限制增加到125秒等。

相关文章:

2023年7月第4周大模型荟萃

2023年7月第4周大模型荟萃 2023.7.31版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。 1、Cerebras推出全球最强AI超算 AI芯片初创公司Cerebras Systems和总部位于阿联酋的技术控股集团G42于7月20日宣布,携手打造一个由互联的超…...

Meta分析的选题与文献计量分析CiteSpace应用丨R语言Meta分析【数据清洗、精美作图、回归分析、诊断分析、不确定性及贝叶斯应用】

目录 ​专题一、Meta分析的选题与文献计量分析CiteSpace应用 专题二、Meta分析与R语言数据清洗及相关应用 专题三、R语言Meta分析与精美作图 专题四、R语言Meta回归分析 专题五、R语言Meta诊断分析与进阶 专题六、R语言Meta分析的不确定性及贝叶斯应用 专题七、深度拓展…...

vscode eslint配置

1. 全局安装 eslint npm install -g eslint 2. control shift p 输入 settings 打开设置进行配置 3. 添加配置 {"workbench.colorTheme": "One Dark Pro","eslint.debug": true,"eslint.execArgv": null,"eslint.alwaysShow…...

C++ 对象模型 C++ Object Model

C 对象模型 C Object Model 文章目录 C 对象模型 C Object ModelC语言的数据及函数C的类C对象模型 C语言的数据及函数 C语言中,数据和函数是分开声明的。 数据 typedef struct point2d {float x;float y; } Point2d;函数 打印Point2d的数值 void Point2d_print…...

leetcode做题笔记47

给定一个可包含重复数字的序列 nums ,按任意顺序 返回所有不重复的全排列。 思路一:回溯 int* Source NULL; int Source_Size 0;int** Result NULL; int* Retcolsizes NULL; int Result_Index 0;int* Path NULL; int Path_Index 0;bool* Used …...

Linux Day04

目录 一、文件压缩与解压命令 1.1 tar cvf 文件名 ---打包命令生成.tar 1.2 tar xvf 文件名 ----解开包 生成文件 1.3 gzip .tar 压缩 生成.tar.gz压缩包 1.4 gzip -d .tar.gz 解压成包 1.5 直接把压缩包解压成文件 tar zxf .tar.gz 二、Linux 系统上 C 程序的…...

上海亚商投顾:沪指冲高回落 两市成交重回万亿

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 市场情绪 三大指数今日冲高回落,盘初一度集体涨超1%,随后涨幅明显回落,上证50午后一度翻…...

2023最新版本~十分钟零基础搭建EMQX服务器

购买服务器 已知服务器大厂商 1 阿里云 点击直接访问 2 华为云点击直接访问 3 腾讯云 点击直接访问 还是比较推荐大公司 不会跑路 这里我购买的是一年的华为云服务器(新用户 64一年) 镜像推荐乌班图18 登陆服务器(需要重置密码!!&…...

SpringBoot2.5.6整合Elasticsearch7.12.1

SpringBoot2.5.6整合Elasticsearch7.12.1 下面将通过SpringBoot整合Elasticseach,SpringBoot的版本是2.5.6,Elasticsearch的版本是7.12.1。 SpringBoot整合Elasticsearch主要有三种方式,一种是通过elasticsearch-rest-high-level-client&am…...

准大一信息安全/网络空间安全专业学习规划

如何规划? 学习需要一个良好的学习习惯,建议刚开始一定要精通一项程序语言,学习其他的就会一通百通。过程中是按步骤学习,绝不半途看见苹果丢了梨,一定要强迫自己抵制新鲜技术的诱惑。 网络安全其实是个广而深的领域…...

WEB:php_rce

背景知识 Linux命令 thinkPHPv5漏洞 题目 打开页面,页面显示为thinkphp v5的界面,可以判断框架为thinkPHP,可以去网上查找相关的漏洞 由题目可知,php rec是一个通过远程代码执行漏洞来攻击php程序的一种方式 因为不知道是php版…...

问题:idea启动项目错误提示【command line is too long. shorten command line】

问题:idea启动项目错误提示【command line is too long. shorten command line】 参考博客 问题描述 启动参数过长,启动项目,错误提示 原因分析 出现此问题的直接原因是:IDEA集成开发环境运行你的“源码”的时候&#xff08…...

xshell连接Windows中通过wsl安装的linux子系统-Ubuntu 22.04

xshell连接Windows中通过wsl安装的linux子系统-Ubuntu 22.04 一、安装linux子系统 1.1、 启动或关闭Windows功能-适用于Linux的Windows子系统 1.2 WSL 官方文档 使用 WSL 在 Windows 上安装 Linux //1-安装 WSL 命令 wsl --install//2-检查正在运行的 WSL 版本:…...

子域名收集工具OneForAll的安装与使用-Win

子域名收集工具OneForAll的安装与使用-Win OneForAll是一款功能强大的子域名收集工具 GitHub地址:https://github.com/shmilylty/OneForAll Gitee地址:https://gitee.com/shmilylty/OneForAll 安装 1、python环境准备 OneForAll基于Python 3.6.0开发和…...

报数游戏、

描述 有n人围成一圈,顺序排号。从第1个人开始报数(从1到3报数),凡报到3的人退出圈子,问最后留下的是原来的第几号的那位。。 输入 初始人数n 输出 最后一人的初始编号 输入样例 1 3 输出样例 1 2 输入样例 …...

规约模式:优雅设计与灵活应用

引言: 规约模式是软件开发中的重要设计原则,它们提供了一种优雅的、灵活的方式来构建高质量的系统。本文将通过实例演示规约模式的具体应用,带你了解这些原则的实战价值。 一、开放封闭原则 // 图形接口 public interface Shape {void dra…...

Ubuntu Server版 之 apache系列 安装、重启、开启,版本查看

安装之前首先要检测是否安装过 apt list --installed | grep tool tool:要检测的名称,如mysql、apache 、ngnix 等 安装 apache sudo apt install apache2 安装apache 默认是开启的 可以通过浏览器 检测一下 service apache stop # apache 停止服务…...

Redis学习路线(4)—— Redis实现项目缓存

一、什么是缓存 (一)概念:缓存就是数据交换的缓冲区(称为Cache),是存储数据的临时区域,一般读写性能较高。 (二)常见缓存: 浏览器缓存,服务器缓…...

【Unity造轮子】实现一个类csgo的武器轮盘功能

文章目录 前言素材导入开始1.放背景和中间的圆圈,调整合适的宽高和位置2.添加选择图像框3.添加一些武器道具选择4.书写脚本RadialMenuManager5.绑定脚本和对象6.运行效果,按tab键开启关闭轮盘7.优化添加显示选中的武器文本8.添加鼠标选中放大的效果9.添加…...

代码随想录算法训练营第三十天 | 单调栈系列复习

单调栈系列复习 每日温度未看解答自己编写的青春版重点题解的代码日后再次复习重新写 下一个更大元素 I未看解答自己编写的青春版重点题解的代码日后再次复习重新写 下一个更大元素II未看解答自己编写的青春版重点题解的代码日后再次复习重新写 接雨水未看解答自己编写的青春版…...

Claude Code 官方回应代码泄漏:这次,他们没有“甩锅人”

这两天,Claude Code 的“代码泄漏”事件在技术圈引发了不少讨论。各种版本的故事层出不穷,甚至还有营销号声称“新员工背锅被开除”。但从官方回应来看,事情的走向,其实完全不一样。👉 Claude Code 团队,正…...

2026网盘风云再起:告别“传不动”,这两款不限速良心网盘实测解析

近些年,网盘市场经历了一轮又一轮的洗牌。从早年各大云盘陆续关停,到后来现有网盘部分服务全面转向收费模式,甚至对非会员进行严苛的网速阉割。用户常常面临「存不下、传不动、下不来」的窘境。 如今已是2026年,网盘市场看似被少…...

Scarab:空洞骑士模组管理的终极解决方案

Scarab:空洞骑士模组管理的终极解决方案 【免费下载链接】Scarab An installer for Hollow Knight mods written in Avalonia. 项目地址: https://gitcode.com/gh_mirrors/sc/Scarab 空洞骑士模组管理工具Scarab是专为《空洞骑士》玩家设计的自动化模组管理器…...

定制化水源热泵技术,实现低品位余热高效捕获

低品位余热的高效回收利用,核心在于能否打造出适配水源特性与工况需求的核心热泵机组,只有实现对余热资源的精准捕获,才能真正将闲置余热转化为可利用的清洁能源。针对鲁西南矿区的水源特性与极端气候工况,瑞冬为当地某铁矿项目针…...

【西工大主办、连续多届稳定检索】第七届机械仪表与自动化国际学术会议(ICMIA 2026)

2026年第七届机械仪表与自动化国际学术会议(ICMIA 2026)定于2026年6月26-28日在中国成都隆重举行。随着科学技术的不断发展和工业化的加速,现代工业生产的自动化程度越来越高。而机械仪表自动化作为现代工业控制的重要组成部分,其…...

收藏必备!小白程序员轻松入门大模型,带你理清AI核心概念全框架

AI浪潮已经刮了一年多,身边越来越多人聊AI,张口就是“agent”“skill”,听得人只能点头附和,似懂非懂?其实不是听不懂,而是没有把这些概念串起来,告诉你它们到底是什么、彼此有啥关系。 咱不聊复…...

图卷积网络代码规范:PyGCN项目Python风格与最佳实践终极指南

图卷积网络代码规范:PyGCN项目Python风格与最佳实践终极指南 【免费下载链接】pygcn Graph Convolutional Networks in PyTorch 项目地址: https://gitcode.com/gh_mirrors/py/pygcn 图卷积网络(Graph Convolutional Networks, GCN)是…...

Pumba在Kubernetes中的实战部署:DaemonSet配置指南

Pumba在Kubernetes中的实战部署:DaemonSet配置指南 【免费下载链接】pumba Chaos testing, network emulation, and stress testing tool for containers 项目地址: https://gitcode.com/gh_mirrors/pu/pumba Pumba是一款强大的容器混沌测试工具,…...

Unity资源提取工具AssetStudio完全指南:从问题解决到专业应用

Unity资源提取工具AssetStudio完全指南:从问题解决到专业应用 【免费下载链接】AssetStudio AssetStudio - Based on the archived Perfares AssetStudio, I continue Perfares work to keep AssetStudio up-to-date, with support for new Unity versions and addi…...

NaViL-9B多模态实战:社交媒体长图理解+争议点识别+评论生成

NaViL-9B多模态实战:社交媒体长图理解争议点识别评论生成 1. 平台简介 NaViL-9B是上海人工智能实验室研发的原生多模态大语言模型,具备强大的文本理解和图像分析能力。与单一模态模型不同,NaViL-9B能够同时处理文字和图片输入,实…...