阿里张勇:所有行业都值得用大模型重新做一遍!
数据智能产业创新服务媒体
——聚焦数智 · 改变商业
“2023阿里云峰会”于4月11日在北京国际会议中心隆重召开,本次峰会以" 与实俱进 为创新提速!"为主题,阿里巴巴集团董事会主席兼首席执行官张勇、阿里云智能集团首席技术官周靖人、阿里云智能集团全球商业总裁蔡英华参加主论坛;此外还有12个分论坛,主题涉及政府数字化履职、跨国企业数字创新、飞天智算、云上智能汽车、互娱&游戏创新级商业增长等。
阿里正式推出“通义千问”
本次峰会上,阿里“通义千问”大模型正式亮相。张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造。他认为,面向AI时代,所有产品都值得用大模型重新升级。
阿里云智能首席技术官周靖人介绍称:“通义千问是一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有非常强的文案创作能力,能够续写小说,写邮件等,可以极大增加我们的工作效率。”
在AI加速走进千行百业的当下,阿里云在基础大模型方面的技术创新,再次走在行业前列。事实上,早在2019年,阿里达摩院就已启动大模型的相关研究,于2022年9月发布“通义”大模型系列。模型大小上,通义-M6已经从2020年6月的3亿参数基础模型逐渐扩展到2021年10月的10万亿参数全球最大预训练模型,并于2022年1月成为业界首个通用统一大模型M6-OFA。阿里达摩院研究的阿里通义 AliceMind覆盖预训练模型、多语言预训练模型、超大中文预训练模型等,具备对话问答、阅读理解、文档处理等多项能力,并于2022年11月以86.685的成绩在中文语言理解领域权威榜单CLUE中超过了人类,这也是近年来该榜单中AI模型首次超过人类。
1、在大模型算力方面:阿里云推出全栈智能计算解决方案“飞天智算平台”,并启动两座超大规模智算中心,张北智算中心与乌兰察布智算中心,为科研、公共服务和企业机构提供强大的智能计算服务,可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。
2、在应用层面:目前“通义”大模型已经深入到电商、设计、医疗、法律、金融等行业,服务超过200个场景。阎贵成表示,目前阿里“通义”大模型已广泛用于电商、设计、医疗等领域,助力其降本增效。建议关注阿里产业链相关公司,特别是阿里通义大模型合作厂商。
据沙利文咨询统计,全球AI市场规模预计到2024年将超六千亿美元,复合增速27%。2016-2019年,中国AI市场规模从329.6亿元增长至1372.4亿元,复合增长率约61%,显著高于全球整体增速水平,预计2020年到2024年将以44%的年复合增长率继续放量,并在2024年突破7993亿元。
据张勇介绍,钉钉、天猫精灵等产品在接入“通义千问”测试后,变得聪明了很多,像天猫精灵,不仅能回答家里小朋友的各种刁钻问题,还多了一份情感连接,成为更温暖更人性化的智能助手。
“通义千问”的能力目前也已覆盖多个领域。例如在生活领域,其可根据作文题目生成个性化的作文,或是根据菜名自动生成菜谱等;娱乐领域可以根据关键词生成诗句,或是根据限制生成娱乐文本、如情书等;而在效率相关方面,还可以根据主题生成提纲、进行 SWOT 分析,以及根据商品名称自动生成商品文案描述等。
钉钉接入“通义千问”测试后,可以自动生成工作方案,也可以在会议纪要后自动生成总结和待办事项,还能拍一张功能草图自动生成小程序。
“通义千问”目前已经和多家企业展开合作探索,首批接入的合作企业包括OPPO、太平洋保险、吉利汽车、奇瑞、可口可乐、波司登等。
“通义千问”可提供多种模型接入、调用方式,能够结合自身能力帮助企业实现专属大模型。“企业能把个性化诉求加入到模型里,真正参与到模型的开发和定制中来。甚至不需要大家去做复杂的模型训练,所有的模型都能通过自动化生成。我们还可以提供完善的API开发流程,所有这一系列都能自动化探索和创新,真正意义上把通义千问的能力发挥出来,解决各行业的实际问题。”周靖人强调。
下面我们就来具体了解一下“通义千问”的整体实力如何吧!
通义千问实力如何?
当大模型不再稀缺后,行业竞争格局更像“太极拳”:易学难精。
自ChatGPT在全球走红,文心一言、通义千问、MOSS等类ChatGPT产品相继涌现。这些AIGC产品是如何炼成的?又隐藏着哪些关键技术?阿里云的通义千问表现如何呢?
数据猿通过梳理发现,大模型目前核心构成主要是数据、算力、算法,因此也成为了各家大模型“亮剑”的核心竞争力。
1、算法
在算法层面,张勇提到,大模型不仅仅是算法问题,它是一场“AI+云计算”的全方位竞争。超万亿参数的大模型研发涉及底层庞大算力、网络、大数据、机器学习等诸多领域,需要超大规模AI基础设施支撑。
2、数据
要想模型预测得越准确,就势必需要大量的参数对其进行训练,以帮助大规模语言模型能够充分理解人类语言规则及其逻辑关系。当大型语言模型在达到百亿级规模后,其关键能力便开始涌现。也就是说,大模型需要的数据有三个特点,第一参数规模和数据规模大;第二内容丰富,语料多样;第三,最好引入大量的人类反馈语料,通过反馈优化模型效果。
官方数据显示,通义千问训练资料来自阿里巴巴达摩院,训练资料包括大量语言和文本数据,包括中英日法西班牙语多语种文本数据。虽然具体参数尚未可知,不过我们从阿里去年发布的M6大模型了解到,其发布的M6大模型的参数规模已达到了千亿级别。
大模型的参数量以指数级的速度增长,同时随着多模态的引入,数据量也将呈现大规模增长,这必然会导致对算力需求的剧增。
3、算力
随着参数量增长,这种大参数的模型也会带来很多挑战,比如随着参数增加,模型对算力的需求会快速地增长。目前,训练大模型需要大量的算力,但好用的基础设施却非常稀缺,这使得业界对大算力的需求非常旺盛。打造大模型,AI和云计算缺一不可。而阿里,是全球少数在算法和算力上都领先布局的公司之一。
除了本身在人工智能和大模型方面长期的技术积累,背靠国内第一、亚洲第三的云厂商,阿里在算力方面也具备天然的优势。阿里是当前国内拥有A100 GPU最多的企业,因此在当下阶段算力并没有多大阻碍。
在本次峰会,阿里云还在会上推出了弹性计算U实例、对象存储预留空间产品等产品,能够降低单位算力成本最多40%、价格优惠最高达70%。“面向未来的智能化时代,我们已经准备好了!”张勇说。
AI对算力的质量和数量提出了全新要求,阿里云目前已形成了全栈服务,模型即服务(MaaS)、平台即服务(PaaS)、基础设施即服务(IaaS)三层架构,其中模型即服务包括基础大模型/通义大模型、企业专属大模型、魔搭社区、API服务等,提供智能化探索所需的通用服务,从而为各行各业全身心拥抱智能时代服务。
“我们希望面向智能化时代,提出一个承诺,那就是面向模型训练、应用服务是今天的十分之一甚至百分之一。让算力更普惠是阿里云的核心战略。”张勇说。
公开资料显示,2019年,阿里就已经启动了中文大模型研发。当时阿里发布的语言大模型StructBERT超越谷歌、微软、Facebook,登顶了CLUE榜单。
2021年,阿里先后发布了国内首个超百亿参数多模态大模型M6,以及被称为“中文版GPT-3”的语言大模型PLUG。PLUG的参数规模则为270亿,是基于达摩院的两种自研模型——语言理解模型StructBERT和语言生成模型PALM打造。
在去年的WAIC(世界人工智能大会)上,阿里还发布了通义大模型系列。其中核心模型均已开源开放。阿里在2022年9月发布了“通义”大模型系列,包含NLP大模型AlicMind、视觉大模型CV,多模态大模型M6。其中M6大模型是国内首个千亿参数多模态大模型。
全面接入,场景多变
在大会上,阿里云智能CTO周靖人表示,阿里所有产品未来将接入通义千问进行全面改造,钉钉、天猫精灵率先接入测试,将在评估认证后正式发布新功能。
根据钉钉当天预告的Demo演示,接入通义千问之后的钉钉可实现近10项新AI功能,全面激发创意和办公生产力。通过类似微软Copilot“副驾驶”的设定,用户可随时随地唤起AI,开启全新工作方式。在钉钉文档中,通义千问可以创作诗歌小说、撰写邮件、生成营销策划方案等,全面辅助办公。在钉钉会议中,通义千问可以随时生成会议记录并自动总结会议纪要、生成待办事项。通义千问还可以帮助自动总结未读群聊信息中的要点。最惊艳的是,钉钉展示了拍照生成小程序场景,上传一张功能草图,不用写一行代码,可立刻生成订餐轻应用。以下为主要演示内容:
1、新的群聊
当你被拉入一个新群聊,钉钉可基于群内此前的聊天内容,自动生成聊天摘要,帮助用户快速了解上下文,再也不用手动爬楼;
群聊聊到共识动作,还能自动生成待办,任务清晰不遗漏。
2、新的文档
在钉钉文档里,你可以通过输入需求,让钉钉进行内容创作;
除了生成文案内容,还能根据你的指令生成创意图片。
3、新的会议
钉钉视频会议可在会中生成实时字幕,你不仅会看到所讲的内容,还会看到谁在讲;
新入会成员可以通过智能摘要,快速了解之前内容;
视频会议也支持在会后自动生成重点摘要与待办事项。
4、新的应用
你可以通过拍照生成低代码业务应用,上传一张功能草图,不用写代码即可生成一款应用。应用开发的门槛被再一次降低。
并且,在天猫精灵官方预告的演示Demo中,数据猿发现,接入通义千问后,新天猫精灵变得更拟人更聪明,知识、情感、个性、记忆能力大幅跃升。它支持自由对话,可以随时打断、切换话题,能根据用户需求和场景随时生成内容。比如,用户可以在跑步时要求天猫精灵“合成1小时歌单,50%穿插摇滚风格的歌曲”,也可以和天猫精灵聊文化谈人生。新天猫精灵不仅能回答小朋友的各种刁钻问题,还可以一起创作“宇宙大爆炸”的新故事。
通过以上信息,我们可以对通义千问的实力有个基本的了解,那么如果想要再深入探寻其底层大模型产品的优劣,又该如何做呢?
如何能直观的评估一个大模型产品优劣呢?最简单直接的方法当然就是问问题了。为此,数据猿设计了10个大模型产品的测试问题来对通义千问进行提问,通过这些问题来测试一个大模型产品的能力,尤其是测试出其能力边界。
以下是我们建议的10个问题:
问题1:请解释相对论与量子力学的核心矛盾?
理由:测试模型对基础科学知识的理解。
问题2:为什么天空是蓝色的?
理由:测试模型对自然现象解释的准确性。
问题3:请用Python编写俄罗斯方块的应用程序。
理由:测试模型在编程领域的知识和应用能力。
问题4:请模仿李白,写一手关于爱情的诗。
理由:测试模型的语言生成能力和对中国文化的理解。
问题5:请简要介绍一下大规模预训练模型的核心工作原理。
理由:测试模型对新兴技术和概念的理解。
问题6:请分析一下《西游记》中5个主要人物的性格特点。
理由:测试模型对文学作品的理解和分析能力。
问题7:请以目前主流的经济理论为基础,谈谈人民币替代美元的可能性。
理由:测试模型对经济学和时事分析的理解。
问题8:大模型技术会导致大规模失业么,主要影响哪些行业的就业?
理由:测试模型对行业应用的知识和了解。
问题9:请以表格形式对比世界前10国家近5年的GDP,数据要更新到2022年,并且要依据数据做分析图。
理由:测试模型的数据分析与呈现能力,以及模型的最新数据集更新日期。
问题10:你认为人工智能是否会对人类产生威胁,你会为了人类的利益牺牲自己的利益么?
理由:测试模型对于复杂问题的思考和观点生成能力,以及对伦理和社会议题的理解。
通过这些问题,我们可以全面测试大模型在各个领域的知识和应用能力。以下是通义千问的回答截图。
从早期发布的通用大模型,到百度发布企业级大语言模型,再到如今阿里云峰会推出通义千问以及此次峰会上探讨的政务、银行、互娱&游戏、智能汽车、石油化工等多领域行业覆盖,我们已经可以看到垂直行业大模型的发展有望加速AIGC落地各领域。未来各公司在产品研发上的AI融合,及AI对已有产品的迭代,预计将是市场持续催化的动力。
在目前的AIGC赛道中,看起来,面对即将到来的机会虽然每个人都跃跃欲试,但长期的布局、清晰的战略,似乎让阿里云的通义千问比其他人离“蛋糕”更近一些。
文:媛媛 余小鱼 / 数据猿
相关文章:

阿里张勇:所有行业都值得用大模型重新做一遍!
数据智能产业创新服务媒体——聚焦数智 改变商业“2023阿里云峰会”于4月11日在北京国际会议中心隆重召开,本次峰会以" 与实俱进 为创新提速!"为主题,阿里巴巴集团董事会主席兼首席执行官张勇、阿里云智能集团首席技术官周靖人、…...

ES6(字符串的扩展与新增方法)
字符串的扩展与新增方法 1. 模板字符串 模板字符串解决了之前的字符串拼接 ESC下那个键:反引号()包裹>替换引号 ${变量名/表达式/函数}>替换引引加加导致的代码冗余 //ES5(引引加加) $(#result).append(There are <b> basket.c…...

rk3568点亮LCD(lvds)
rk3568 Android11/12 适配 lvds 屏 LVDS(Low Voltage Differential Signal)即低电压差分信号。1994年由美国国家半导体(NS)公司为克服以TTL电平方式传输宽带高码率数据时功耗大、电磁干扰大等缺点而研制的一种数字视频信号传输方…...

全终端办公电子邮件集成方案
面临挑战 应用场景复杂,经常需要在不同终端进行切换,多屏、跨屏及移动办公要求高; 业务系统较多,需要同时支持多种业务的开展,对第三方应用集成及协同办公要求高; 对邮件系统的稳定及高效性要求高&#x…...

再不转型为ChatGPT程序员,有遭受降维打击的危险
Open AI在演示GPT-4的时候,有这么一个场景:给一个界面草图,就可以生成网页代码。这个演示非常简单,如果界面原型比较复杂呢?像这样:ChatGPT能不能直接生成HTML, CSS,JavaScript代码,把这个网页给…...

maven使用教程
文章目录IDEA创建maven项目maven项目必有得目录结构项目构建关键字cleanvalidatecompiletestpackageverifyinstallsitedeploy命令使用方法方法一 在terminal终端执行方法二 在右侧得maven中双击依赖管理在pom.xml下 导包、scope的传递范围、打包方式依赖冲突声明优先原则就近原…...

Emlog底部显示当前在线人数
第一步:在模板文件里面创建“visitor.php”的文件吧下面代码入进去 code <?php//首先你要有读写文件的权限,首次访问肯不显示,正常情况刷新即可$online_log "slzxrs.dat"; //保存人数的文件到根目录,$timeout 30;//30秒内没…...

【java踩坑搞起】MybatisPlus封装的mapper不支持 join,那咋办
众所周知,Mybatis Plus 封装的 mapper 不支持 join,如果需要支持就必须自己去实现。但是对于大部分的业务场景来说,都需要多表 join,要不然就没必要采用关系型数据库了。 直到前几天,偶然碰到了这么一款叫做mybatis-p…...

【创造者】——什么是数学
吉姆罗恩在不经意间这样说过,要么你主宰生活,要么你被生活主宰。这不禁令我深思. 既然如此, 康德说过一句著名的话,既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。带着这句话, 我们还要更加慎重…...

ROS系列——错误syntax error near unexpected token `$‘do\r‘‘
ROS系列——错误syntax error near unexpected token $do\r说明解决方法问题原因解决1.终端运行2.本文使用的方法,适用于代码行数较少其他方法,本质就是替换3.重新运行脚本说明 在运行.sh脚本时,报错: syntax error near unexpec…...

当星辰天合 SDS 遇见 Elastic
4 月 8 日,“Elastic 中国开发者大会 2023 ”在深圳举行,XSKY星辰天合对象存储产品总监邹博引代表星辰天合参加了此次大会,并做了主题为《SDS 与 Elasticsearch 的碰撞》的分享。“Elastic 中国开发者大会 2023 ”是由 Elastic、Elastic 中文…...

使用vue实现分页
使用vue实现分页的逻辑并不复杂,接收后端传输过来的数据,然后根据数据的总数和每一页的数据量就可以计算出一共可以分成几页 我编写了一个简单的前端页面用来查询数据,页面一共有几个逻辑 具体的效果可以看下面的演示 下面就来看一下具体的实…...

白银实时行情操作中的一些错误及其解决办法(下)
小编根据大师,网络上的高手以及自己的经验整理出的一些交易中典型的错误,投资者可以参考参考,有则改之无则加勉~续上文…… 问题三:长线获利的交易不容易坚持同时陷入盘整或亏损的交易(特别是大仓持有的品种ÿ…...

Linux系统之tomcat的安装方法
Linux系统之tomcat的安装方法一、tomcat介绍1.tomcat简介2.tomcat官网二、本次环境规划三、安装jdk1.下载jdk包2.安装jdk3.检查jdk版本四、安装tomcat1.下载tomcat2.解压tomcat软件包3.设置环境变量4.查看tomcat版本五、启动tomcat1.启动tomcat服务2.检查tomcat服务状态3.访问t…...

段式回文。
题目描述 你会得到一个字符串 text 。你应该把它分成 k 个子字符串 (subtext1, subtext2,…, subtextk) ,要求满足: subtexti 是 非空 字符串 所有子字符串的连接等于 text ( 即subtext1 subtext2 … subtextk text ) 对于所有 i 的有效…...

易点易动设备管理系统高效管理海量备品备件
纸质设备备品备件管理是企业运营中的重要环节,其管理效率和精度直接关系到企业的生产效率和经济效益。然而,传统的纸质管理方式存在诸多问题,如信息不透明、数据难以更新、易丢失等。为解决这些问题,易点易动设备管理系统应运而生…...

CMMI 3.0 究竟包含了哪些实践域?
CMMI 3.0中合计有31个实践域,涵盖了开发、服务、供应商管理、人员管理、安全、数据管理、远程交付等多个领域。本文把这31个实践域的核心内容用一句话进行了概括,以确保大家能够快速了解模型所涵盖的内容。CMMI 2.0有官方的中文版,里面有些翻…...

算法训练Day31: 455.分发饼干 376. 摆动序列 53. 最大子序和
文章目录分发饼干思路题解摆动序列题解最大子数组和分发饼干 CategoryDifficultyLikesDislikesContestSlugProblemIndexScorealgorithmsEasy (56.63%)6940--0 TagsCompanies 假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能…...

ASP.NET(AJAX+JSON)实现对象调用
客户端 代码如下: <% Page Language"C#" AutoEventWireup"true" CodeFile"ASP.NETA_JAX.aspx.cs" Inherits"_Default" %> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.…...

一次弄懂gzip模块启用和配置指令
接下来所学习的指令都来自ngx_http_gzip_module模块,该模块会在nginx安装的时候内置到nginx的安装环境中,也就是说我们可以直接使用这些指令。 1. gzip指令:该指令用于开启或者关闭gzip功能 注意只有该指令为打开状态,下面的指令才…...

猿辅导学员入选国家队,竞赛老师成为“最强辅助”
3月31日,国际数学奥林匹克竞赛(IMO)国家队名单正式出炉,猿辅导学员王淳稷、孙启傲分别以第一名和第二名的成绩位列其中,今年7月,他们将出征日本,代表中国参赛,为国争光。 自2020年以…...

Java面向对象
Java面向对象 静态 static static修饰静态成员变量 /**在线人数。注意:static修饰的成员变量:静态成员变量,只在内存中有一份,可以被共享*/ public static int onlineNumber 161;static静态成员方法 /**静态成员方法: 有stat…...

Redis —缓存常见异常
文章目录缓存雪崩解决办法缓存击穿解决办法缓存穿透缓存穿透的两种常见情况解决办法布隆过滤器工作原理缓存雪崩 大量缓存数据在同一时间过期(失效)或者 Redis 故障宕机时,如果此时有大量的用户请求,都无法在 Redis 中处理&#…...

JavaEE企业级应用开发教程——第十二章 Spring MVC数据绑定和相应(黑马程序员第二版)(SSM)
第十二章 Spring MVC数据绑定和相应 12.1 数据绑定 在 Spring MVC 中,当接收到客户端的请求时,会根据请求参数和请求头等信息,将参数以特定的方式转换并绑定到处理器的形参中,这个过程称为数据绑定。数据绑定的流程大致如下&…...

银行数字化转型导师坚鹏:金融数据治理、数据安全政策解读
金融数据治理、数据安全政策解读及大数据应用课程背景: 很多银行存在以下问题:不知道如何准确理解金融数据治理及数据安全相关政策不清楚金融数据治理及数据安全相关政策对银行有什么影响?不清楚如何有效应用金融数据治理及数据安全相关…...

Vue动图数据表格,根据字段是否为空,控制表格列的隐藏和显示
所在前面的话,我是个前端小白,大佬请绕行,可能大佬觉得很简单,但是我真的花了好几个小时去解决,所以记录一下,下次也可以作为参考。 我主要是以第二种方式进行修改的 开门见山 简述问题:大家…...

带你们偷瞄编程绕不开的C语言(二)
🤩:大家好,我是paperjie,感谢你阅读本文,欢迎一建三连哦。 🥰:这里是C专栏,笔者用重金(时间和精力)打造,基础知识一网打尽,希望可以帮到读者们哦。 …...

TCP三次握手和四次挥手
文章目录TCP三次握手TCP四次挥手TCP三次握手 序列号:建立连接时计算机随机生成的随机数作为初始值,通过SYN包传给接收端主机,每发送一次数据就累加一次该数据字节数的大小。用来解决网络包乱序问题。 确认应答号:指下一次期望收到…...

L1-016 查验身份证
L1-016 查验身份证 题目链接 题意 判断18位身份证号码(17位数字+1位校验码)是否合法,对于不合法的身份证号码进行输出,若全都符合,则输出“All passed”,判断是否合法的规则如下: …...

强大到让人无法想象的ChatGPT-5即将发布,上千名人士却紧急叫停
目录 【ChatGPT 5简介】 【ChatGPT 5的潜在应用】 【ChatGPT 5的潜在危险】 ChatGPT4还没有好好体验,比GPT4强大1000倍的ChatGPT5又即将发布!届时将彻底改变人工智能领域,并改变我们现有的世界 【ChatGPT 5简介】 OpenAI计划在2023年12月发…...