当前位置: 首页 > news >正文

AI大模型日报#0529:杨红霞创业入局“端侧模型”、Ilya左膀右臂被Claude团队挖走

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE 4.0)、“零一万物”(Yi-34B)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:前字节跳动大语言模型专家杨红霞离职创业,专注开发端侧AI模型,其团队已获数千万美元投资,投后估值达1.5亿美元。端侧模型因成本低、移动性强及数据安全优势,正成为行业新宠。 教育科技方面,网易有道推出了“子曰”教育大模型及三大AI创新应用,包括AI全科学习助手、新一代虚拟人口语教练与知识库问答引擎,强化其在AI商业化领域的领先地位,并积极参与行业大模型标准制定。 在科研领域,香港理工大学等机构联合开发的上下文分子微调方法,为大语言模型在化学任务上的应用提供了新范式,显著提升了模型在分子描述与结构间翻译的能力。 字节跳动研究人员提出的物理引导方法,通过新的扩散模型让蛋白质动起来,填补了AlphaFold3在蛋白质动态行为刻画上的空白,为药物设计和生物过程理解提供了更强大的工具。 此外,OpenAI在经历高层变动后,正致力于开发新一代大模型,并加强安全保障工作,而竞争对手Anthropic则挖角了OpenAI前研究人员,双方在大模型领域的竞争愈发激烈。 另一方面,阿里云开发了首个全生物系统的核酸与蛋白语言融合模型LucaOne,其训练推理代码已开源,并在多种生物任务中表现出色,为AI在生物科学的应用开辟了新路径。 最后,在蚂蚁集团首次对外开放的技术日上,众多基于大模型的创新应用亮相,凸显了AI在智能生活、金融、医疗健康等领域的广泛潜力与落地进展。

标题: 独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元
摘要: 字节跳动前大语言模型专家杨红霞离职创业,专注于开发端侧AI模型,目标是打造AI Agent。她的团队已获得数千万美元投资,估值1.5亿美元。杨红霞曾领导阿里达摩院的M6模型项目,并在字节跳动AI Lab担任要职。随着通用大模型格局收缩,端侧模型因其成本低、移动性强、数据安全等优势,成为行业新热点。
网址: 独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元|ai|杨红霞|端侧模型|视频生成模型|陈伟_手机网易网
 
标题: 持续领跑教育科技,有道再发「子曰」教育大模型全新应用
 


摘要: 网易有道在北京举行了“子曰”教育大模型媒体交流会,展示了其最新技术进展和三大AI创新应用:AI全科学习助手“有道小P”APP、新一代虚拟人口语教练Hi Echo 3.0和新一代知识库问答引擎QAnything。CEO周枫强调了“模型即应用”的时代,并表示有道将聚焦场景开拓和应用落地,提升产品效率和交互体验。有道已推出超10款大模型落地应用,并在AI商业化上取得突破性进展,一季度会员销售额同比增长140%。有道还参与了行业大模型标准制定工作,助力国家大模型产品发展。新应用“有道小P”集成了多种场景下的互动答疑与交互功能,并将在手机端便捷使用。Hi Echo 3.0则针对中国学生学习英语的需求,提供了雅思口语练考服务。QAnything作为企业AI大脑,已服务了20多个行业的上百家客户。有道积极拓展多样化的应用场景,并不断提升模型能力,同步提升模型和产品。
网址: 持续领跑教育科技,有道再发「子曰」教育大模型全新应用 | 机器之心
 
标题: 为百亿参数LLM化学应用提供新范式,香港理工大学提出上下文分子微调
 


摘要: 香港理工大学、上海交通大学和上海人工智能实验室的研究人员联合发表了一篇论文,介绍了他们开发的上下文分子微调(ICMA)方法,这是一种新颖的范式,用于在大语言模型中进行分子-描述翻译。ICMA通过混合模态上下文召回、召回后重排和上下文分子微调三个阶段,提高了模型在分子和分子文本描述之间进行翻译的能力。研究人员在ChEBI-20和PubChem324K数据集上进行了实验,结果显示ICMA能够显著提升性能,甚至接近或达到最新的基准水平。该方法的贡献在于它不需要额外的领域预训练,为大语言模型在化学任务上的应用提供了新的思路,并通过学习上下文例子中分子描述片段与分子SMILES结构的对应关系,精细化了分子描述和分子的对齐。此外,ICMA对模型的大小和类型不那么敏感,即使是较小的模型也能获得性能提升。这项研究表明,大语言模型可以成为上下文分子学习的有效工具,为科学领域的应用提供了新的方法和思路。
网址: 为百亿参数LLM化学应用提供新范式,香港理工大学提出上下文分子微调 | 机器之心
 
标题: 填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来
 


摘要: 科技记者报道: 世界在不断变化,分子也在持续运动,这使得对蛋白质等生物分子的功能研究需要从静态单一结构预测转向动态构象分布的探索。这种转变对于理解蛋白质与其他分子的相互作用、识别潜在药物位点以及设计更具特异性和效力的治疗药物至关重要。然而,传统的分子动力学模拟方法因其昂贵和耗时的特性,难以跨越长的时间尺度来观察重要的生物过程。 近年来,深度学习在蛋白质结构预测领域取得了显著进展,但包括Deepmind的AlphaFold 3在内的模型仍然主要专注于预测静态单一结构,对蛋白质动态行为的刻画还不够充分。 为了解决这一问题,来自字节跳动 ByteDance Research 的研究人员提出了一种名为CONFDIFF的蛋白质构象生成扩散模型。该模型利用物理知识来引导模型与真实世界对齐,同时规避了实时力场和能量计算的复杂性,相比传统方法有巨大的加速。 CONFDIFF模型在SE(3)空间上构建了一个非条件的生成扩散模型,通过预测主链原子坐标和主链朝向来构建蛋白质构象。为了充分利用先验结构和序列信息,CONFDIFF使用目标序列的预训练表示训练了一个基于序列的条件生成模型来引导上述的非条件模型,使生成构象既多样化又符合相应的结构与序列约束。 为了使分布符合能量玻尔兹曼分布,研究者提出了能量与力场引导方法,其中最重要的是计算中间时刻的能量梯度(即力场)。研究者使用神经网络来预测这个量,并创新性提出了两种匹配训练方法并推导了相应公式。 在快速折叠蛋白质和牛胰蛋白酶抑制剂两种包含分子动力学模拟生成构象的蛋白质数据集上,CONFDIFF模型在预测构象分布和预测残基接触等方面表现优于其他模型。力场引导的方法也相对更优于能量引导的方法。 这项研究为扩展蛋白质结构的探索提供了新的工具,有助于更准确地预测蛋白质动态构象,为药物设计和生物过程的理解提供了强有力的支持。
网址: 填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来 | 机器之心
 
标题: 奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了
 


摘要: OpenAI,一家领先的人工智能研究公司,正在开发其下一个前沿模型,预计将显著提升其在实现通用人工智能(AGI)方面的能力。这一消息是在公司经历了一系列高层变动和安全问题争议之后发布的。联合创始人兼首席科学家Ilya Sutskever宣布离职,超级对齐团队也被解散,引发了外界对OpenAI研究安全性的担忧。 为了应对这些担忧,OpenAI董事会宣布成立新的安全与保障委员会,由董事会主席Bret Taylor、董事Adam D’Angelo和Nicole Seligman、以及首席执行官山姆・奥特曼领导。该委员会的任务是在未来90天内评估并进一步发展OpenAI的开发流程和保障措施,并向董事会提出建议。 安全与保障委员会的成立是OpenAI在加强其安全工作方面的一个重要步骤,也是对过去争议的一种回应。前董事会成员Helen Toner在播客节目中透露,前董事会是在Twitter上得知ChatGPT发布的,这表明了董事会与管理层之间存在沟通问题。Toner还讲述了导致董事会成员不再信任奥特曼的原因,以及奥特曼最终如何重回OpenAI。 在安全团队重组的同时,前OpenAI超级对齐团队的共同领导者Jan Leike宣布加入竞争对手Anthropic,继续从事超级对齐研究。Leike的离开是由于他与OpenAI领导层在公司核心优先事项上存在长期分歧。 总体而言,OpenAI在追求技术进步的同时,正努力解决安全和治理问题,以确保其人工智能的发展能够造福全人类。
网址: 奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了 | 机器之心
 
标题: AlphaFold 3不开源,统一生物语言大模型阿里云先开了!
 


摘要: 科技记者报道: 阿里云飞天实验室生物智能计算团队开发了首个全生物系统的核酸语言+蛋白语言的融合基座模型,名为LucaOne。该模型不仅能识别DNA、RNA与相应蛋白质之间的内在联系,还在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中表现出色。LucaOne的训练推理代码及相关数据目前均已开源,与未开源的AlphaFold 3形成鲜明对比。LucaOne在核酸序列和其对应蛋白的正负样本数据集中,预测准确率高达0.85,远超业内最好预训练模型组合。此外,LucaOne在流感H3N2病毒疫苗有效性预测中准确率可达100%。这一突破性进展为AI在生物科学领域的发展开辟了新的篇章。
网址: AlphaFold 3不开源,统一生物语言大模型阿里云先开了! | 量子位
 
标题: Ilya左膀右臂被Claude团队挖走!奥特曼砍掉的超级对齐算力,Anthropic给了
 


摘要: 科技记者报道: 前OpenAI研究人员Jan Leike,在离开OpenAI超级对齐团队后,宣布加入Anthropic,继续致力于AI安全研究。Leike的加入为Anthropic带来了宝贵的经验,他将专注于可扩展监督、泛化能力和自动对齐技术。Anthropic,由前OpenAI员工创立,强调对AI安全的重视,并得到了包括亚马逊在内的多家公司的投资。随着Claude 3的发布,Anthropic已成为OpenAI的有力竞争对手。在国内,类似的人才流动也在发生,如字节跳动前员工杨红霞离职创业,以及微软资深首席研究员段楠加入大模型创业公司阶跃星辰。这些变动预示着大模型领域的竞争将更加激烈。
网址: Ilya左膀右臂被Claude团队挖走!奥特曼砍掉的超级对齐算力,Anthropic给了 | 量子位
 
标题: 蚂蚁技术日首次对外开放,各种大模型应用看花了
 


摘要: 蚂蚁集团首次对外开放技术日,展示了一系列基于大模型的创新应用,包括智能生活、金融、医疗健康管家,以及AI智绘、AI智乐、AIGC数字人等。这些应用通过支付宝小程序即可体验。蚂蚁集团CTO何征宇强调了AI规模化落地的三个关键因素:可靠性、经济性和易用性。蚂蚁正致力于将这些技术融入日常生活中,让AI像扫码支付一样便利每个人的生活。
网址: 蚂蚁技术日首次对外开放,各种大模型应用看花了 | 量子位
 

相关文章:

AI大模型日报#0529:杨红霞创业入局“端侧模型”、Ilya左膀右臂被Claude团队挖走

导读:AI大模型日报,爬虫LLM自动生成,一文览尽每日AI大模型要点资讯!目前采用“文心一言”(ERNIE 4.0)、“零一万物”(Yi-34B)生成了今日要点以及每条资讯的摘要。欢迎阅读&#xff0…...

达梦数据库

达梦数据库 达梦Docker部署 达梦Docker部署 1、下载链接 https://pan.baidu.com/s/1RI3Lg0ppRhCgUsThjWV6zQ?pwdjc62 2、docker启动命令 docker run -d -p 5236:5236 \ --restartalways \ --name dm8 \ -e LD_LIBRARY_PATH/app/dm8/bin \ -e LENGTH_IN_CHAR1 \ -e CASE_SENS…...

什么是Axios

2024年5月23日,周四上午 Axios 是一个基于Promise的HTTP客户端,用于浏览器和node.js环境。它提供了一个简单易用的API来发送HTTP请求,并支持Promise API,这使得异步请求变得容易处理。 Axios的一些主要特点包括: Pro…...

React 其他 Hooks

其他 Hooks useRef 可用于获取 DOM 元素 const ScrollRef useRef(null)ScrollRef.current useContext (先回顾一下之前的 Context 知识,借用之前 ppt 和源码) Hooks 中使用 useContext 来获取 context 的值 // 父组件创建 contextexpor…...

echarts配置记录,一些已经废弃的写法

1、normal,4.0以后无需将样式写在normal中了 改前: 改后: DEPRECATED: normal hierarchy in labelLine has been removed since 4.0. All style properties are configured in labelLine directly now. 2、axisLabel中的文字样式无需使用te…...

电量计量芯片HLW8110的前端电路设计与误差分析校正.pdf 下载

电量计量芯片HLW8110的前端电路设计与误差分析校正.pdf 下载地址: 链接:https://pan.baidu.com/s/1vlCtC3LGFMzYpSUUDY-tEg 提取码:8110...

Redis实践记录与总结

最近生产环境缓存数据库数据过大(如何搭建单服务redis缓存数据库?以及可视化工具Another Redis Desktop Manager使用),导致在对数据库做rdb快照备份时消耗内存过大,缓存数据库宕机一小时。基础运维通过增加虚拟机内存暂…...

持续总结中!2024年面试必问 20 道 Rocket MQ面试题(三)

上一篇地址:持续总结中!2024年面试必问 20 道 Rocket MQ面试题(二)-CSDN博客 五、什么是生产者(Producer)和消费者(Consumer)在RocketMQ中? RocketMQ是一个高性能、高吞…...

Android 自定义Adapter关键函数getView性能最优使用

文章目录 1、自定义Adapter关键函数getView()标准写法2、布局文件list_item_user.xml3、解释3、示例使用4、结果5、进一步优化和扩展5.1. **优化性能:ViewHolder模式**5.2. **处理多种类型的视图**5.3. **使用RecyclerView.Adapter** 6、RecyclerView使用示例7、结果…...

Linux服务上MySQL的启动、重启和关闭

Linux服务上MySQL的启动、重启和关闭 MySQL是一种广泛使用的开源关系型数据库管理系统,常用于各种规模的应用程序中。在Linux服务器上管理MySQL服务是一个基本的运维任务。本文将详细介绍如何在Linux系统上启动、重启和关闭MySQL服务,涵盖不同Linux发行…...

ctfshow web入门 嵌入式 bash cpp pwn

kali转bash shell方法 方便我们本地 bash脚本教程 下面这个代码是bash脚本 #!/bin/bashOIFS"$IFS"IFS"," //表示逗号为字段分隔符set $QUERY_STRING //将参数传入数组Args($QUERY_STRING)IFS"$OIFS" //恢复原始IFS值if [ "$…...

【ONE·Git || 基本用法入门】

总言 主要内容:主要介绍Git中常用的指令。   PS:多人协作与企业开发模型使用,此部分内容不作博文总结。             文章目录 总言1、初识Git1.1、版本控制器1.2、git安装 2、基本操作2.1、Git本地仓库2.1.1、创建Git本地仓库&…...

【运维项目经历|021】Spark大数据分析平台建设项目

目录 项目名称 项目背景 项目目标 项目成果 我的角色与职责 我主要完成的工作内容 本次项目涉及的技术 本次项目遇到的问题与解决方法 本次项目中可能被面试官问到的问题 问题1:项目周期多久? 问题2:服务器部署架构方式及数量和配置…...

装机数台,依旧还会心念i5-12600KF的性能和性价比优势:

近几个月的时间中, 装机差不多4台电脑,由于工作需要,计划年中再增添一台。 目前市场上英特尔CPU促销非常火爆,第12代、第13代以及第14代的产品在年中有适当的优惠。 年中也是装机的旺季,各种相关配件也相对便宜一些。…...

Docker-----emqx部署

emqx通过Docker容器化部署流程 1.创建持久化挂载目录 mkdir -p /home/emqx/etc ------挂载emqx的配置文件目录 mkdir -p /home/emqx/data ------挂载emqx的存储目录 mkdir -p /home/emqx/log ------挂载emqx的日志目录 [root home]# mkdir -p /home/emqx/etc [root home]# mkd…...

三数之和-力扣

这道题在使用哈希表来做时,做的很吃力,对重复的去除很费劲。 首先是对i的去重,不能使用nums[i] nums[i] 这样的条件去判断,这会遗漏掉类似[-1, -1 , 2]这样的解其次是对j的去重, 对j的去重是为了防止类似[-4, 2, 2, …...

2024 五月份国内外CTF 散装re 部分wp

cr3CTF warmup 附件拖入ida main函数无法反汇编,仔细看,有花指令,jnz实际上必定跳转。有非常多处,可以写脚本patch程序去掉花指令,只要匹配指令,再获取跳转地址,nop掉中间的代码就行。但…...

[猫头虎分享21天微信小程序基础入门教程]第21天:小程序的社交分享与消息推送

[猫头虎分享21天微信小程序基础入门教程]第21天:小程序的社交分享与消息推送 第21天:小程序的社交分享与消息推送 📲 自我介绍 大家好,我是猫头虎,一名全栈软件工程师。今天我们继续微信小程序的学习,重…...

aop整理

一、aop基础知识 Spring AOP 详细深入讲解代码示例 二、spring/spring boot/spring cloud中出现的注解/类与概念的对应 Aspect: 标注当前MyAspect是一个切面类,–》对应切面的概念,在切面类中有用Before等注解修饰的方法作为advice,也有用…...

Sublime Text 基础教程(个人总结)

Sublime Text 是一款广受欢迎的代码编辑器,以其简洁的界面和强大的功能而著称。它支持多种编程语言,具有高效的代码编辑和管理功能。本教程将详细介绍如何使用 Sublime Text,从安装到高级使用技巧,帮助你充分利用这款工具。 目录…...

线程安全 - 笔记

1 程序a调用c.so,程序b也调用c.so c.so加载两次吗? 在这种情况下,通常 c.so 不会被加载两次。 当一个程序调用一个共享对象文件(.so)时,操作系统的动态链接器将该共享对象映射到进程的虚拟内存空间中。后续由不同程序或者同一个程序调用相同的共享对象,都不会导致共享…...

分支机构多,如何确保文件跨域传输安全可控?

随着企业全球化发展,分支机构的分布越来越广泛,跨域文件传输需求也随之增加。然而,跨域文件传输面临的数据安全和传输效率问题,使得构建一个安全、可控的文件交换系统成为迫切需求。FileLink跨网文件交换系统通过综合的技术手段和…...

长安链使用Golang编写智能合约教程(二)

长安链2.3.0的go合约虚拟机和2.3.0以下的不兼容,编译的方式也有差异,所以在ide上做了区分。 教程三会写一些,其他比较常用SDK方法的解释和使用方法 教程一:(长安链2.1.的版本的智能合约) 教程三&#xff…...

jpom linux发布前端 ruoyi

前置条件 辅助安装 安装jdk curl -fsSL https://jpom.top/docs/install.sh | bash -s Server jdkonly-moduledefault 一键安装maven 后端必备 curl -fsSL https://jpom.top/docs/install.sh | bash -s Server mvnonly-moduledefault 一键安装node 前端必备 curl -fsSL http…...

K8S认证|CKA题库+答案| 15. 备份还原Etcd

目录 15、 备份还原Etcd CKA v1.29.0模拟系统 下载试用 题目: 开始操作: 1)、切换集群 2)、登录master并提权 3)、备份Etcd现有数据 4)、验证备份数据快照 5)、查看节点和Pod状态 6&#xff0…...

软件架构设计属性之一:功能性属性浅析

文章目录 引言一、定义二、关键要素1. 需求满足2. 操作性3. 数据处理4. 业务流程支持5. 合规性 三、 设计原则1. 用户中心设计2. 模块化3. 抽象化4. 可扩展性5. 可维护性6. 设计原则的实施策略7. 设计原则的评估 四、实现策略1. 需求分析2. 功能分解3. 接口设计4. 技术选型5. 迭…...

学习Java的日子 Day48 函数,DOM

Day48 1.流程控制语句 if else for for-in(遍历数组时,跟Java是否一样) While do while break 语句用于跳出循环 continue 用于跳过循环中的一个迭代 2.函数 2.1 JavaScript 函数语法 函数就是包裹在花括号中的代码块,前面使用了关键词 function funct…...

Scikit-Learn朴素贝叶斯

Scikit-Learn朴素贝叶斯 1、朴素贝叶斯1.1、贝叶斯分类1.2、贝叶斯定理1.3、贝叶斯定理的推导1.4、朴素贝叶斯及原理1.5、朴素贝叶斯的优缺点2、Scikit-Learn朴素贝叶斯2.1、Sklearn中的贝叶斯分类器2.2、Scikit-Learn朴素贝叶斯API2.3、Scikit-Learn朴素贝叶斯实践(新闻分类与…...

网页设计步骤总结

第一步&#xff1a;css重置 https://blog.csdn.net/BradenHan/article/details/132122504 第二步&#xff1a;媒体查询不同尺寸加载不同的css文件https://blog.csdn.net/Yi_Lesama/article/details/131184469 <!-- link元素中的CSS媒体查询 --> <link rel"styl…...

第十三期Big Demo Day亮点项目:CCarbon重塑碳交易生态,助力全球绿色发展

第十三期Big Demo Day活动即将于2024年5月28日在香港数码港的CyberArena隆重举行。我们荣幸地宣布&#xff0c;利用区块链技术优化全球碳交易CCarbon项目将亮相&#xff0c;参与精彩的项目路演。本次活动由ZeeprLabs、BiKing Exchange、Gather冠名赞助&#xff0c;Central Rese…...