当前位置: 首页 > news >正文

AI大模型日报#0529:杨红霞创业入局“端侧模型”、Ilya左膀右臂被Claude团队挖走

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE 4.0)、“零一万物”(Yi-34B)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:前字节跳动大语言模型专家杨红霞离职创业,专注开发端侧AI模型,其团队已获数千万美元投资,投后估值达1.5亿美元。端侧模型因成本低、移动性强及数据安全优势,正成为行业新宠。 教育科技方面,网易有道推出了“子曰”教育大模型及三大AI创新应用,包括AI全科学习助手、新一代虚拟人口语教练与知识库问答引擎,强化其在AI商业化领域的领先地位,并积极参与行业大模型标准制定。 在科研领域,香港理工大学等机构联合开发的上下文分子微调方法,为大语言模型在化学任务上的应用提供了新范式,显著提升了模型在分子描述与结构间翻译的能力。 字节跳动研究人员提出的物理引导方法,通过新的扩散模型让蛋白质动起来,填补了AlphaFold3在蛋白质动态行为刻画上的空白,为药物设计和生物过程理解提供了更强大的工具。 此外,OpenAI在经历高层变动后,正致力于开发新一代大模型,并加强安全保障工作,而竞争对手Anthropic则挖角了OpenAI前研究人员,双方在大模型领域的竞争愈发激烈。 另一方面,阿里云开发了首个全生物系统的核酸与蛋白语言融合模型LucaOne,其训练推理代码已开源,并在多种生物任务中表现出色,为AI在生物科学的应用开辟了新路径。 最后,在蚂蚁集团首次对外开放的技术日上,众多基于大模型的创新应用亮相,凸显了AI在智能生活、金融、医疗健康等领域的广泛潜力与落地进展。

标题: 独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元
摘要: 字节跳动前大语言模型专家杨红霞离职创业,专注于开发端侧AI模型,目标是打造AI Agent。她的团队已获得数千万美元投资,估值1.5亿美元。杨红霞曾领导阿里达摩院的M6模型项目,并在字节跳动AI Lab担任要职。随着通用大模型格局收缩,端侧模型因其成本低、移动性强、数据安全等优势,成为行业新热点。
网址: 独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元|ai|杨红霞|端侧模型|视频生成模型|陈伟_手机网易网
 
标题: 持续领跑教育科技,有道再发「子曰」教育大模型全新应用
 


摘要: 网易有道在北京举行了“子曰”教育大模型媒体交流会,展示了其最新技术进展和三大AI创新应用:AI全科学习助手“有道小P”APP、新一代虚拟人口语教练Hi Echo 3.0和新一代知识库问答引擎QAnything。CEO周枫强调了“模型即应用”的时代,并表示有道将聚焦场景开拓和应用落地,提升产品效率和交互体验。有道已推出超10款大模型落地应用,并在AI商业化上取得突破性进展,一季度会员销售额同比增长140%。有道还参与了行业大模型标准制定工作,助力国家大模型产品发展。新应用“有道小P”集成了多种场景下的互动答疑与交互功能,并将在手机端便捷使用。Hi Echo 3.0则针对中国学生学习英语的需求,提供了雅思口语练考服务。QAnything作为企业AI大脑,已服务了20多个行业的上百家客户。有道积极拓展多样化的应用场景,并不断提升模型能力,同步提升模型和产品。
网址: 持续领跑教育科技,有道再发「子曰」教育大模型全新应用 | 机器之心
 
标题: 为百亿参数LLM化学应用提供新范式,香港理工大学提出上下文分子微调
 


摘要: 香港理工大学、上海交通大学和上海人工智能实验室的研究人员联合发表了一篇论文,介绍了他们开发的上下文分子微调(ICMA)方法,这是一种新颖的范式,用于在大语言模型中进行分子-描述翻译。ICMA通过混合模态上下文召回、召回后重排和上下文分子微调三个阶段,提高了模型在分子和分子文本描述之间进行翻译的能力。研究人员在ChEBI-20和PubChem324K数据集上进行了实验,结果显示ICMA能够显著提升性能,甚至接近或达到最新的基准水平。该方法的贡献在于它不需要额外的领域预训练,为大语言模型在化学任务上的应用提供了新的思路,并通过学习上下文例子中分子描述片段与分子SMILES结构的对应关系,精细化了分子描述和分子的对齐。此外,ICMA对模型的大小和类型不那么敏感,即使是较小的模型也能获得性能提升。这项研究表明,大语言模型可以成为上下文分子学习的有效工具,为科学领域的应用提供了新的方法和思路。
网址: 为百亿参数LLM化学应用提供新范式,香港理工大学提出上下文分子微调 | 机器之心
 
标题: 填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来
 


摘要: 科技记者报道: 世界在不断变化,分子也在持续运动,这使得对蛋白质等生物分子的功能研究需要从静态单一结构预测转向动态构象分布的探索。这种转变对于理解蛋白质与其他分子的相互作用、识别潜在药物位点以及设计更具特异性和效力的治疗药物至关重要。然而,传统的分子动力学模拟方法因其昂贵和耗时的特性,难以跨越长的时间尺度来观察重要的生物过程。 近年来,深度学习在蛋白质结构预测领域取得了显著进展,但包括Deepmind的AlphaFold 3在内的模型仍然主要专注于预测静态单一结构,对蛋白质动态行为的刻画还不够充分。 为了解决这一问题,来自字节跳动 ByteDance Research 的研究人员提出了一种名为CONFDIFF的蛋白质构象生成扩散模型。该模型利用物理知识来引导模型与真实世界对齐,同时规避了实时力场和能量计算的复杂性,相比传统方法有巨大的加速。 CONFDIFF模型在SE(3)空间上构建了一个非条件的生成扩散模型,通过预测主链原子坐标和主链朝向来构建蛋白质构象。为了充分利用先验结构和序列信息,CONFDIFF使用目标序列的预训练表示训练了一个基于序列的条件生成模型来引导上述的非条件模型,使生成构象既多样化又符合相应的结构与序列约束。 为了使分布符合能量玻尔兹曼分布,研究者提出了能量与力场引导方法,其中最重要的是计算中间时刻的能量梯度(即力场)。研究者使用神经网络来预测这个量,并创新性提出了两种匹配训练方法并推导了相应公式。 在快速折叠蛋白质和牛胰蛋白酶抑制剂两种包含分子动力学模拟生成构象的蛋白质数据集上,CONFDIFF模型在预测构象分布和预测残基接触等方面表现优于其他模型。力场引导的方法也相对更优于能量引导的方法。 这项研究为扩展蛋白质结构的探索提供了新的工具,有助于更准确地预测蛋白质动态构象,为药物设计和生物过程的理解提供了强有力的支持。
网址: 填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来 | 机器之心
 
标题: 奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了
 


摘要: OpenAI,一家领先的人工智能研究公司,正在开发其下一个前沿模型,预计将显著提升其在实现通用人工智能(AGI)方面的能力。这一消息是在公司经历了一系列高层变动和安全问题争议之后发布的。联合创始人兼首席科学家Ilya Sutskever宣布离职,超级对齐团队也被解散,引发了外界对OpenAI研究安全性的担忧。 为了应对这些担忧,OpenAI董事会宣布成立新的安全与保障委员会,由董事会主席Bret Taylor、董事Adam D’Angelo和Nicole Seligman、以及首席执行官山姆・奥特曼领导。该委员会的任务是在未来90天内评估并进一步发展OpenAI的开发流程和保障措施,并向董事会提出建议。 安全与保障委员会的成立是OpenAI在加强其安全工作方面的一个重要步骤,也是对过去争议的一种回应。前董事会成员Helen Toner在播客节目中透露,前董事会是在Twitter上得知ChatGPT发布的,这表明了董事会与管理层之间存在沟通问题。Toner还讲述了导致董事会成员不再信任奥特曼的原因,以及奥特曼最终如何重回OpenAI。 在安全团队重组的同时,前OpenAI超级对齐团队的共同领导者Jan Leike宣布加入竞争对手Anthropic,继续从事超级对齐研究。Leike的离开是由于他与OpenAI领导层在公司核心优先事项上存在长期分歧。 总体而言,OpenAI在追求技术进步的同时,正努力解决安全和治理问题,以确保其人工智能的发展能够造福全人类。
网址: 奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了 | 机器之心
 
标题: AlphaFold 3不开源,统一生物语言大模型阿里云先开了!
 


摘要: 科技记者报道: 阿里云飞天实验室生物智能计算团队开发了首个全生物系统的核酸语言+蛋白语言的融合基座模型,名为LucaOne。该模型不仅能识别DNA、RNA与相应蛋白质之间的内在联系,还在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中表现出色。LucaOne的训练推理代码及相关数据目前均已开源,与未开源的AlphaFold 3形成鲜明对比。LucaOne在核酸序列和其对应蛋白的正负样本数据集中,预测准确率高达0.85,远超业内最好预训练模型组合。此外,LucaOne在流感H3N2病毒疫苗有效性预测中准确率可达100%。这一突破性进展为AI在生物科学领域的发展开辟了新的篇章。
网址: AlphaFold 3不开源,统一生物语言大模型阿里云先开了! | 量子位
 
标题: Ilya左膀右臂被Claude团队挖走!奥特曼砍掉的超级对齐算力,Anthropic给了
 


摘要: 科技记者报道: 前OpenAI研究人员Jan Leike,在离开OpenAI超级对齐团队后,宣布加入Anthropic,继续致力于AI安全研究。Leike的加入为Anthropic带来了宝贵的经验,他将专注于可扩展监督、泛化能力和自动对齐技术。Anthropic,由前OpenAI员工创立,强调对AI安全的重视,并得到了包括亚马逊在内的多家公司的投资。随着Claude 3的发布,Anthropic已成为OpenAI的有力竞争对手。在国内,类似的人才流动也在发生,如字节跳动前员工杨红霞离职创业,以及微软资深首席研究员段楠加入大模型创业公司阶跃星辰。这些变动预示着大模型领域的竞争将更加激烈。
网址: Ilya左膀右臂被Claude团队挖走!奥特曼砍掉的超级对齐算力,Anthropic给了 | 量子位
 
标题: 蚂蚁技术日首次对外开放,各种大模型应用看花了
 


摘要: 蚂蚁集团首次对外开放技术日,展示了一系列基于大模型的创新应用,包括智能生活、金融、医疗健康管家,以及AI智绘、AI智乐、AIGC数字人等。这些应用通过支付宝小程序即可体验。蚂蚁集团CTO何征宇强调了AI规模化落地的三个关键因素:可靠性、经济性和易用性。蚂蚁正致力于将这些技术融入日常生活中,让AI像扫码支付一样便利每个人的生活。
网址: 蚂蚁技术日首次对外开放,各种大模型应用看花了 | 量子位
 

相关文章:

AI大模型日报#0529:杨红霞创业入局“端侧模型”、Ilya左膀右臂被Claude团队挖走

导读:AI大模型日报,爬虫LLM自动生成,一文览尽每日AI大模型要点资讯!目前采用“文心一言”(ERNIE 4.0)、“零一万物”(Yi-34B)生成了今日要点以及每条资讯的摘要。欢迎阅读&#xff0…...

达梦数据库

达梦数据库 达梦Docker部署 达梦Docker部署 1、下载链接 https://pan.baidu.com/s/1RI3Lg0ppRhCgUsThjWV6zQ?pwdjc62 2、docker启动命令 docker run -d -p 5236:5236 \ --restartalways \ --name dm8 \ -e LD_LIBRARY_PATH/app/dm8/bin \ -e LENGTH_IN_CHAR1 \ -e CASE_SENS…...

什么是Axios

2024年5月23日,周四上午 Axios 是一个基于Promise的HTTP客户端,用于浏览器和node.js环境。它提供了一个简单易用的API来发送HTTP请求,并支持Promise API,这使得异步请求变得容易处理。 Axios的一些主要特点包括: Pro…...

React 其他 Hooks

其他 Hooks useRef 可用于获取 DOM 元素 const ScrollRef useRef(null)ScrollRef.current useContext (先回顾一下之前的 Context 知识,借用之前 ppt 和源码) Hooks 中使用 useContext 来获取 context 的值 // 父组件创建 contextexpor…...

echarts配置记录,一些已经废弃的写法

1、normal,4.0以后无需将样式写在normal中了 改前: 改后: DEPRECATED: normal hierarchy in labelLine has been removed since 4.0. All style properties are configured in labelLine directly now. 2、axisLabel中的文字样式无需使用te…...

电量计量芯片HLW8110的前端电路设计与误差分析校正.pdf 下载

电量计量芯片HLW8110的前端电路设计与误差分析校正.pdf 下载地址: 链接:https://pan.baidu.com/s/1vlCtC3LGFMzYpSUUDY-tEg 提取码:8110...

Redis实践记录与总结

最近生产环境缓存数据库数据过大(如何搭建单服务redis缓存数据库?以及可视化工具Another Redis Desktop Manager使用),导致在对数据库做rdb快照备份时消耗内存过大,缓存数据库宕机一小时。基础运维通过增加虚拟机内存暂…...

持续总结中!2024年面试必问 20 道 Rocket MQ面试题(三)

上一篇地址:持续总结中!2024年面试必问 20 道 Rocket MQ面试题(二)-CSDN博客 五、什么是生产者(Producer)和消费者(Consumer)在RocketMQ中? RocketMQ是一个高性能、高吞…...

Android 自定义Adapter关键函数getView性能最优使用

文章目录 1、自定义Adapter关键函数getView()标准写法2、布局文件list_item_user.xml3、解释3、示例使用4、结果5、进一步优化和扩展5.1. **优化性能:ViewHolder模式**5.2. **处理多种类型的视图**5.3. **使用RecyclerView.Adapter** 6、RecyclerView使用示例7、结果…...

Linux服务上MySQL的启动、重启和关闭

Linux服务上MySQL的启动、重启和关闭 MySQL是一种广泛使用的开源关系型数据库管理系统,常用于各种规模的应用程序中。在Linux服务器上管理MySQL服务是一个基本的运维任务。本文将详细介绍如何在Linux系统上启动、重启和关闭MySQL服务,涵盖不同Linux发行…...

ctfshow web入门 嵌入式 bash cpp pwn

kali转bash shell方法 方便我们本地 bash脚本教程 下面这个代码是bash脚本 #!/bin/bashOIFS"$IFS"IFS"," //表示逗号为字段分隔符set $QUERY_STRING //将参数传入数组Args($QUERY_STRING)IFS"$OIFS" //恢复原始IFS值if [ "$…...

【ONE·Git || 基本用法入门】

总言 主要内容:主要介绍Git中常用的指令。   PS:多人协作与企业开发模型使用,此部分内容不作博文总结。             文章目录 总言1、初识Git1.1、版本控制器1.2、git安装 2、基本操作2.1、Git本地仓库2.1.1、创建Git本地仓库&…...

【运维项目经历|021】Spark大数据分析平台建设项目

目录 项目名称 项目背景 项目目标 项目成果 我的角色与职责 我主要完成的工作内容 本次项目涉及的技术 本次项目遇到的问题与解决方法 本次项目中可能被面试官问到的问题 问题1:项目周期多久? 问题2:服务器部署架构方式及数量和配置…...

装机数台,依旧还会心念i5-12600KF的性能和性价比优势:

近几个月的时间中, 装机差不多4台电脑,由于工作需要,计划年中再增添一台。 目前市场上英特尔CPU促销非常火爆,第12代、第13代以及第14代的产品在年中有适当的优惠。 年中也是装机的旺季,各种相关配件也相对便宜一些。…...

Docker-----emqx部署

emqx通过Docker容器化部署流程 1.创建持久化挂载目录 mkdir -p /home/emqx/etc ------挂载emqx的配置文件目录 mkdir -p /home/emqx/data ------挂载emqx的存储目录 mkdir -p /home/emqx/log ------挂载emqx的日志目录 [root home]# mkdir -p /home/emqx/etc [root home]# mkd…...

三数之和-力扣

这道题在使用哈希表来做时,做的很吃力,对重复的去除很费劲。 首先是对i的去重,不能使用nums[i] nums[i] 这样的条件去判断,这会遗漏掉类似[-1, -1 , 2]这样的解其次是对j的去重, 对j的去重是为了防止类似[-4, 2, 2, …...

2024 五月份国内外CTF 散装re 部分wp

cr3CTF warmup 附件拖入ida main函数无法反汇编,仔细看,有花指令,jnz实际上必定跳转。有非常多处,可以写脚本patch程序去掉花指令,只要匹配指令,再获取跳转地址,nop掉中间的代码就行。但…...

[猫头虎分享21天微信小程序基础入门教程]第21天:小程序的社交分享与消息推送

[猫头虎分享21天微信小程序基础入门教程]第21天:小程序的社交分享与消息推送 第21天:小程序的社交分享与消息推送 📲 自我介绍 大家好,我是猫头虎,一名全栈软件工程师。今天我们继续微信小程序的学习,重…...

aop整理

一、aop基础知识 Spring AOP 详细深入讲解代码示例 二、spring/spring boot/spring cloud中出现的注解/类与概念的对应 Aspect: 标注当前MyAspect是一个切面类,–》对应切面的概念,在切面类中有用Before等注解修饰的方法作为advice,也有用…...

Sublime Text 基础教程(个人总结)

Sublime Text 是一款广受欢迎的代码编辑器,以其简洁的界面和强大的功能而著称。它支持多种编程语言,具有高效的代码编辑和管理功能。本教程将详细介绍如何使用 Sublime Text,从安装到高级使用技巧,帮助你充分利用这款工具。 目录…...

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明:假设每台服务器已…...

使用分级同态加密防御梯度泄漏

抽象 联邦学习 (FL) 支持跨分布式客户端进行协作模型训练,而无需共享原始数据,这使其成为在互联和自动驾驶汽车 (CAV) 等领域保护隐私的机器学习的一种很有前途的方法。然而,最近的研究表明&…...

linux arm系统烧录

1、打开瑞芯微程序 2、按住linux arm 的 recover按键 插入电源 3、当瑞芯微检测到有设备 4、松开recover按键 5、选择升级固件 6、点击固件选择本地刷机的linux arm 镜像 7、点击升级 (忘了有没有这步了 估计有) 刷机程序 和 镜像 就不提供了。要刷的时…...

【HTTP三个基础问题】

面试官您好!HTTP是超文本传输协议,是互联网上客户端和服务器之间传输超文本数据(比如文字、图片、音频、视频等)的核心协议,当前互联网应用最广泛的版本是HTTP1.1,它基于经典的C/S模型,也就是客…...

大数据学习(132)-HIve数据分析

​​​​🍋🍋大数据学习🍋🍋 🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言&#x1f4…...

Web 架构之 CDN 加速原理与落地实践

文章目录 一、思维导图二、正文内容(一)CDN 基础概念1. 定义2. 组成部分 (二)CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 (三)CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 &#xf…...

2023赣州旅游投资集团

单选题 1.“不登高山,不知天之高也;不临深溪,不知地之厚也。”这句话说明_____。 A、人的意识具有创造性 B、人的认识是独立于实践之外的 C、实践在认识过程中具有决定作用 D、人的一切知识都是从直接经验中获得的 参考答案: C 本题解…...

Springboot社区养老保险系统小程序

一、前言 随着我国经济迅速发展,人们对手机的需求越来越大,各种手机软件也都在被广泛应用,但是对于手机进行数据信息管理,对于手机的各种软件也是备受用户的喜爱,社区养老保险系统小程序被用户普遍使用,为方…...

排序算法总结(C++)

目录 一、稳定性二、排序算法选择、冒泡、插入排序归并排序随机快速排序堆排序基数排序计数排序 三、总结 一、稳定性 排序算法的稳定性是指:同样大小的样本 **(同样大小的数据)**在排序之后不会改变原始的相对次序。 稳定性对基础类型对象…...

软件工程 期末复习

瀑布模型:计划 螺旋模型:风险低 原型模型: 用户反馈 喷泉模型:代码复用 高内聚 低耦合:模块内部功能紧密 模块之间依赖程度小 高内聚:指的是一个模块内部的功能应该紧密相关。换句话说,一个模块应当只实现单一的功能…...