2024年9月AI头条新闻:创新与挑战并存
2024年9月AI头条新闻:创新与挑战并存
9月,人工智能领域继续高速发展,重大产品发布、伦理争议和技术突破交织在一起。让我们回顾一下本月最重要的AI新闻:
OpenAI的o1:更强大的语言模型
OpenAI推出了o1,一个通过强化学习训练的大型语言模型,用于解决复杂的推理任务。与典型的LLM不同,o1在响应之前会生成一个内部思维链,从而能够在给出答案之前“思考”。该模型在竞争性编程挑战中排名第89百分位,并在博士级科学基准测试中超过了人类的准确性。
OpenAI的先进语音功能
OpenAI开始向ChatGPT Plus和Teams用户推出高级语音模式(AVM),提供更自然的语音体验。该功能包括五个新的自然灵感的声音——Arbor、Maple、Sol、Spruce和Vale,总共九种。一个重新设计的蓝色动画球体现在代表AVM,取代了旧的黑点。增强功能还包括改进的口音识别和更流畅的对话。AVM用户还将受益于自定义指令和内存,实现更个性化的交互。
OpenAI CTO Mira Murati离职
OpenAI首席技术官Mira Murati宣布离职,称希望有“时间和空间进行自己的探索”。她的离职紧随ChatGPT和DALL-E等关键AI工具的近期发布,标志着重大领导层变动,因为另外两名高管Bob McGrew(首席研究官)和Barret Zoph(培训后副总裁)也即将离职。首席执行官Sam Altman指出,这些决定是独立做出的,但强调这些过渡发生在OpenAI处于上升期,即将召开开发者日会议。
Google发布Gems和Imagen 3
Google正在推出其Gemini Advanced平台的两个重大更新:Gems和Imagen 3。Gems允许用户创建个性化的Gemini版本,充当各种主题的专家,通过可定制的指令简化任务。用户可以设置语气和响应长度等参数,预制Gems将协助从职业规划到写作和编码支持等一切。与此同时,Imagen 3引入了先进的图像生成能力,使用户能够创建令人惊叹的视觉效果,包括人物图像,尽管最初仅限于Gemini Advanced、Business和Enterprise订阅者。此更新旨在通过解决之前人物生成的问题,确保遵守安全指南,提供更好的用户体验。
阿里巴巴推出Qwen2-VL
阿里云推出了Qwen2-VL,一种先进的视觉语言模型,能够分析超过20分钟的视频,为AI与视觉数据的交互设定了新的基准。该模型擅长识别手写字、区分物体和总结视频内容,甚至可以为实时技术支持场景提供近乎实时的分析。Qwen2-VL在第三方测试中优于Meta的Llama 3.1和OpenAI的GPT-4o,展示了其在从自动化客户服务到复杂决策任务等各种应用中的潜力。Qwen2-VL提供三种变体,包括两个完全开源的模型,旨在与移动设备和机器人集成,利用Naive Dynamic Resolution和Multimodal Rotary Position Embedding等架构创新来增强视觉理解。
Meta发布Llama 3.2
Meta发布了Llama 3.2,这是一套轻量级视觉和纯文本大型语言模型(LLM),专为边缘设备和移动设备设计。新模型的尺寸为1B、3B、11B和90B,支持令人印象深刻的128K令牌上下文长度,非常适合本地任务,如摘要和指令遵循。值得注意的是,11B和90B视觉模型在图像理解方面优于其文本等效物,可以轻松微调以用于自定义应用程序。Llama 3.2还引入了Llama Stack,简化了跨各种环境的部署,并促进了与AWS、Google Cloud和Qualcomm等主要合作伙伴的合作。
Pixtral 12B
Mistral推出了其第一个多模态模型Pixtral 12B,它可以处理图像和文本。Pixtral 12B基于Mistral的文本模型Nemo 12B构建,具有120亿个参数,可以处理图像字幕和对象计数等任务,从任意图像或URL中提取。该模型大小约为24GB,可通过GitHub和Hugging Face等平台以Apache 2.0许可证下载和微调。
Qwen2.5-Math:开源数学LLM的新基准
Qwen2.5-Math是Qwen数学语言模型的最新迭代,为解决英语和中文中的复杂数学问题提供了突破性的改进。该系列包括1.5B至72B参数的模型,集成了思维链(CoT)和工具集成推理(TIR)技术,实现了更高的计算精度和更深入的算法理解。与前代相比,Qwen2.5-Math系列取得了显著进步,特别是其旗舰模型Qwen2.5-Math-72B-Instruct在MATH和AIME等具有挑战性的基准测试中优于开源和领先的闭源模型。
AlphaProteo:设计高强度蛋白质的AI系统
Google DeepMind推出了AlphaProteo,这是一个最先进的AI系统,用于设计用于生物学和健康研究的高强度蛋白质结合剂。与传统方法不同,AlphaProteo可以生成成功结合目标分子的新型蛋白质,显著增强药物开发、疾病理解等。值得注意的是,它对病毒蛋白的结合成功率高达88%,并且在七个测试目标(包括SARS-CoV-2刺突蛋白和与癌症相关的VEGF-A)的结合亲和力方面比现有设计方法高出300倍。AlphaProteo经过广泛的蛋白质数据训练,简化了耗时的蛋白质设计过程,标志着该领域的重要进步,为更有效的生物学研究铺平了道路。
Lionsgate x Runway:AI助力电影制作
Lionsgate与AI初创公司Runway达成协议,使用生成式AI技术作为电影制作工具,旨在节省“数百万”的制作成本。Runway将基于Lionsgate庞大的电影和电视库开发定制AI模型,使电影制作人能够为前期和后期制作生成和增强电影视频。
OpenAI联合创始人推出安全聚焦的AI初创公司SSI
由OpenAI前首席科学家Ilya Sutskever联合创立的安全超级智能(SSI)成功筹集了10亿美元,以推进旨在超越人类能力的安全AI系统的开发。SSI的使命是在对AI安全日益关注的情况下,创建安全的AI解决方案。
Dejaview:预测犯罪的AI系统
韩国电子通信研究院推出了Dejaview,这是一种旨在通过实时CCTV分析预测犯罪发生的AI系统。通过评估位置、时间、历史犯罪数据等因素,Dejaview可以绘制高风险区域,并在个人可能再次犯罪时发出信号,在初步试验中准确率达到82.8%。
想要快速了解当前AI发展?请关注这个专栏,它将带给你最新的AI咨询!
点击进入:AI 瞭望塔
本文为原创内容,未经许可不得转载。
相关文章:

2024年9月AI头条新闻:创新与挑战并存
2024年9月AI头条新闻:创新与挑战并存 9月,人工智能领域继续高速发展,重大产品发布、伦理争议和技术突破交织在一起。让我们回顾一下本月最重要的AI新闻: OpenAI的o1:更强大的语言模型 OpenAI推出了o1,一个…...

[Xshell] Xshell的下载安装使用、连接linux、 上传文件到linux系统-详解(附下载链接)
前言 xshell 链接:https://pan.quark.cn/s/57062561e81a 提取码:TK4K 链接失效(可能被官方和谐)可评论或私信我重发 安装 下载后解压得到文件 安装路径不要有中文 打开文件 注意!360等软件会拦截创建注册表的行为&a…...

count(1)、count(_)与count(列名)的区别?
大家好,我是锋哥。今天分享关于【count(1)、count(_)与count(列名)的区别?】面试题。希望对大家有帮助; count(1)、count(_)与count(列名)的区别? 1000道 互联网大厂Java工程师 精选面试题-Java资源分享网 在 SQL 中,…...

代码随想录训练营第二十七天| 贪心理论基础 455.分发饼干 376. 摆动序列 53. 最大子序和
贪心没有套路,说白了就是常识性推导加上举反例 今天的内容比较简单 简单了解贪心是通过局部最优解反推全局最优解(有经验成分) 455.分发饼干 题目链接:455. 分发饼干 - 力扣(LeetCode) 讲解链接ÿ…...

List直接使用removeAll报错
List直接使用removeAll报错 需要先将list转换才能使用 原因是: removeAll 方法在 Java 中用于从当前列表中删除另一个列表中存在的所有元素。如果直接对 List 接口的一个实现使用 removeAll 方法抛出异常,可能的原因有: 不同的List实现&am…...

Debian环境安装Docker Engine
Debian环境安装Docker Engine 卸载旧版本使用APT工具安装Docker设置存储库安装Docker设置权限 docker compose命令卸载Docker 卸载旧版本 要卸载的非官方软件包是: docker.iodocker-composedocker-docpodman-docker 此外,Docker Engine 依赖 containe…...

Python常用内置函数总结
目录 1. abs() 2. complex() 3. divmod() 4. eval() 5. float() 6. hash() 7. input() 8. int() 9. len() 10. list() 11. oct() 12. open() 13. pow() 14. print() 15. range() 16. reversed() 17. round() 18. sorted()…...

深入了解蓝牙Profile类型与设备的对应关系
在现代技术中,蓝牙作为一种无线通信技术,广泛应用于各种设备之间的短距离通信。不同的设备在连接时使用不同的蓝牙Profile(配置文件),每种Profile都为特定的设备功能提供支持,例如音频流传输、语音通话、文件传输等。在本文中,我们将详细介绍蓝牙Profile的常见类型及其对…...

[bug]java导出csv用Microsoft Office Excel打开乱码解决
[bug]java导出csv用Microsoft Office Excel打开乱码 现象 首先这个csv文件用macbook自带的 "Numbers表格" 软件打开是不乱码的, 但是使用者是Windows系统,他的电脑没有"Numbers表格"工具, 他用Microsoft Office Excel打开之后出现乱码,如下图…...

2023年区块链职业技能大赛——区块链应用技术(一)模块一
模块一:区块链产品方案设计及系统运维: 任务1-1:区块链产品需求分析与方案设计 1.依据给定区块链食品溯源系统的业务架构图,对考题进行业务分析,可能多的去考虑一个业务系统所需要的模块,使用Visio或思维导图工具展现本系统的基本设计概念和…...

4 软件工程——总体设计
一、设计过程 1.两个主要阶段 系统设计阶段:确定系统的具体实现方案结构设计阶段:确定软件结构 2.九个步骤 设想供选择的方案选取合理的方案推荐最佳方案功能分解设计软件结构设计数据库制定测试计划书写文档审查和复审 二、设计原理 1.模块化 模块…...

Elasticsearch:确保业务规则与语义搜索无缝协作
作者:来自 Elastic Kathleen DeRusso 利用查询规则与语义搜索和重新排序相结合的强大功能。 更多阅读: Elasticsearch 8.10 中引入查询规则 - query rules Elasticsearch 查询规则现已正式发布 - query rules 你是否知道查询规则(query ru…...

【大语言模型】ACL2024论文-33 Johnny 如何说服大型语言模型越狱:通过人性化 LLMs 重新思考挑战 AI 安全性的说服技巧
【大语言模型】ACL2024论文-33 Johnny 如何说服大型语言模型越狱:通过人性化 LLMs 重新思考挑战 AI 安全性的说服技巧 目录 文章目录 【大语言模型】ACL2024论文-33 Johnny 如何说服大型语言模型越狱:通过人性化 LLMs 重新思考挑战 AI 安全性的说服技巧目…...

【LuaFramework】LuaFramework_UGUI_V2框架学习
GitHub - jarjin/LuaFramework_UGUI_V2: 基于tolua的热更新框架V2 旧版本是Unity 5.0,这个是新版本支持更高版本的 导入工程后先清除wrap 然后重新生成wrap,你会发现有个报空null,框架的问题总结下所有的框架wrap相关报错问题和修复方法&…...

使用 AOP 在 Spring Boot 中实现跟踪和日志记录
在现代应用程序中,尤其是使用微服务构建的应用程序,跟踪和日志记录在跟踪流经各种服务的请求方面起着至关重要的作用。跟踪可帮助开发人员诊断问题、监控性能并了解用户在多个系统中的旅程。 在此博客中,我们将介绍如何使用traceId从前端生成…...

如何永久解决Apache Struts文件上传漏洞
Apache Struts又双叒叕爆文件上传漏洞了。 自Apache Struts框架发布以来,就存在多个版本的漏洞,其中一些漏洞涉及到文件上传功能。这些漏洞可能允许攻击者通过构造特定的请求来绕过安全限制,从而上传恶意文件。虽然每次官方都发布补丁进行修…...

FPGA远程升级 -- FLASH控制
简介 前文讲到如何实现XILINX芯片程序跳转,但升级程序是事先通过VIVADO工具将两个程序合成一个BIN文件实现升级的,并不能在线更新升级。要实现远程升级的能力需要对FPGA的FLASH进行在线写入升级程序。 FLASH介绍 本次设计FLASH选用的是S25FL128芯片&…...

企业内训|高智能数据构建、Agent研发及AI测评技术内训-吉林省某汽车厂商
吉林省某汽车厂商为提升员工在AI大模型技术方面的知识和实践能力,举办本次为期8天的综合培训课程。本课程分为两大部分:面向全体团队成员的AI大模型技术结构与行业应用,以及针对技术团队的高智能数据构建与Agent研发。课程内容涵盖非结构化数…...

ARM异常处理 M33
1. ARMv8-M异常类型及其详细解释 ARMv8-M Exception分为两类:预定义系统异常(015)和外部中断(1616N)。 各种异常的状态可以通过Status bit查看,获取更信息的异常原因: CFSR是由UFSR、BFSR和MMFSR组成: 下面列举HFSR、MMFSR、…...

(补)算法刷题Day24: BM61 矩阵最长递增路径
题目链接 思路 方法一:dfs暴力回溯 使用原始used数组4个方向遍历框架 , 全局添加一个最大值判断最大的路径长度。 方法二:加上dp数组记忆的优雅回溯 抛弃掉used数组,使用dp数组来记忆遍历过的节点的最长递增路径长度。每遍历到已…...

探索 Bokeh:轻松创建交互式数据可视化的强大工具
探索 Bokeh:轻松创建交互式数据可视化的强大工具 在数据科学和数据分析领域,交互式数据可视化是一项不可或缺的技能。Bokeh 是一个强大的 Python 库,它可以帮助我们快速构建高质量的交互式图表和仪表盘,同时兼具高性能和灵活性。…...

【Rust自学】6.1. 定义枚举
喜欢的话别忘了点赞、收藏加关注哦,对接下来的教程有兴趣的可以关注专栏。谢谢喵!(・ω・) 6.1.1. 什么是枚举 枚举允许我们列举所有可能的值来定义一个类型。这与其他编程语言中的枚举类似,但 Rust 的枚举更加灵活和强…...

【Java基础面试题035】什么是Java泛型的上下界限定符?
回答重点 Java泛型的上下界限定符用于对泛型类型参数进行范围限制,主要有上界限定符和下届限定符。 1)上界限定符 (? extends T): 定义:通配符?的类型必须是T或者T的子类,保证集合元素一定是T或者T的子类作用&…...

0基础学前端系列 -- 深入理解 HTML 布局
在现代网页设计中,布局是至关重要的一环。良好的布局不仅能提升用户体验,还能使内容更具可读性和美观性。HTML(超文本标记语言)结合 CSS(层叠样式表)为我们提供了多种布局方式。本文将详细介绍流式布局、Fl…...

【python高级】342-TCP服务器开发流程
CS模式:客户端-服务端模式 TCP客户端开发流程介绍(五步)(C端) 1.创建客户端套接字对象 2.和服务端套接字建立连接 3.发送数据 4.接收数据 5.关闭客户端套接字 TCP服务端开发流程(七步)…...

《计算机组成及汇编语言原理》阅读笔记:p48-p81
《计算机组成及汇编语言原理》学习第 4 天,p48-p81 总结,总计 34 页。 一、技术总结 1.CISC vs RISC p49, complex instruction set computing For example, a complex instruction set computing (CISC) chip may be able to move a lar…...

AI在传统周公解梦中的技术实践与应用
本文深入探讨了人工智能在传统周公解梦领域的技术实践与应用。首先介绍了传统周公解梦的背景与局限性,随后详细阐述了 AI 技术如何应用于梦境数据的采集、整理与分析,包括自然语言处理技术对梦境描述的理解,机器学习算法构建解梦模型以及深度…...

GIS数据处理/程序/指导,街景百度热力图POI路网建筑物AOI等
简介其他数据处理/程序/指导!!!(1)街景数据获取(2)街景语义分割后像素提取,指标计算代码(绿视率,天空开阔度、视觉熵/景观多样性等)(3…...

ssr实现方案
目录 序言 一、流程 二、前端要做的事情 三、节点介绍 四、总结 序言 本文不是详细的实现过程,是让你最快最直接的理解ssr的真正实现方法,有前端经验的同学,能够很好的理解过程,细节根据具体项目实现 一、前端要做的事情 1.…...

手动修改nginx-rtmp模块,让nginx-rtmp-module支持LLHLS
文章目录 1. 背景2. 开发环境搭建2.1 ffmpeg在ubuntu上安装2.2 nginx-rtmp-module在ubuntu上安装2.3 安装vscode环境2. 修改nginx-rtmp-module2.1 主要更新内容2.2 新增配置项2.3 代码更新3. LLHLS验证方法3.1 配置验证3.2 功能验证4. 注意事项5. 已知问题6. 后续计划1. 背景 …...