Cyber Weekly #18
赛博·新闻
1、Google 狂卷小模型,2B 参数 Gemma 2 赶超 GPT-3.5
Google本周发布了开源的轻量级、高性能模型 Gemma 2 2B。它拥有 20 亿参数,是从更大规模的模型中提炼而来的,在 LMSYS 大模型竞技场的得分超越了 GPT-3.5 和 Mixtral 8x7B。该模型适合在多种硬件环境下运行,包括边缘设备、笔记本电脑以及基于云的部署环境,适用于数据中心、本地工作站和边缘 AI 应用。除了性能优势,Gemma 2 2B 还配备了 ShieldGemma 安全分类器和 Gemma Scope 工具。

2、谷歌推出的Gemini 1.5 Pro Experimental 0801
本周Google也发布了Gemini 1.5 Pro Experimental 0801,Gemini 1.5 Pro 0801在LLM竞技场的综合排名超过了GPT-4o mini变成了第一位。谷歌说这是一个实验版本还不算正式版本,所以只在AI Studio中提供。但是从测试来看Gemini 1.5Pro 0801的多模态能力非常强大,基本超过了GPT-40和Claude 3.5,而且它支持音频以及视频。

3、OpenAI 推出 ChatGPT 高级语音模式
OpenAI 于2024年7月30日推出了面向ChatGPT Plus用户Alpha版本的高级语音模式,该模式允许用户体验GPT-4o的超逼真语音交互。GPT-4o是一个多模态模型,能独立完成语音到文本和文本到语音的转换,降低对话延迟。Alpha版本不包括春季更新的视频和屏幕共享功能,这些将在后续推出。此外,GPT-4o能感知情绪语调,但目前无法模仿特定声音,且有新的版权保护措施。

4、Character.AI创始团队被谷歌「收购」,只要人不要公司
8 月 3 日,Character.ai 内部表示,Google 将以 25 亿美元的估值收购其投资者股票(每股 88 美元),高于此前 10 亿美元的估值,但仍低于去年该公司与早期投资者谈判的 50 亿美元。Google 对 Character.ai “收购”方式,同微软& Inflection 以及亚马逊& Adept 的合作方式,Character.ai 联合创始人 Noam Shazeer 以及总裁 Daniel De Freitas 将重返 Google,加入 DeepMind 研究团队。

5、Kimi联合AIPPT推出PPT助手
Kimi上线PPT助手智能体,可以结合上传的文档和提示词快速生成PPT,体验了下还不错,可以满足一些简单的学习工作汇报。

6、Midjourney v6.1 正式上线,细节更丰富
本周,Midjourney 上线了新版本 v6.1,不少网友直呼和摄影已经几乎没有区别了。此次版本升级如下:
- 更强一致性(比如手臂、腿、身体、动植物等)
- 图像质量更好(减少伪影、增强纹理等)
- 更详细、更精确理解小图像特征(比如眼睛、小的脸等)
- 更好图像/纹理质量
- 更快生成速度,标准图像提升 25%
- 提高文本准确性
- 全新个性化模型
- 个性化代码版本控制:可以将之前版本的代码用在新版本中
- 一个新的-q2模式,可以增加更多纹理,但是需要更长时间(增加 25%),一致性也会下降

7、Meta 推出 AI Studio 工具,用户可创建定制 AI 角色
Meta 公司本周推出了 AI 工具 AI Studio,允许用户创建、定制和分享自己的 AI 角色,目前仅在美国地区提供。据悉,AI Studio 可以创建「创作者 AI(Creator AI)」和「AI 角色(AI character)」两种 AI 角色,前者为基于自己构建的 AI 延伸,可以代替自己和其他用户交流;后者则是用户自己自定义、虚构的 AI 角色。目前该功能已经集成在 Instagram、Messenger、WhatsApp 等 Meta 旗下社交平台之中。

赛博·洞见
1、马斯克最新6万字访谈!8.5小时详解脑机接口、机器人、外星人,以及AI与人类的未来(一)
Elon Musk在与Lex Fridman的8.5小时播客中,深入讨论了Neuralink脑机接口技术、人工智能、人形机器人Optimus、外星生命探索以及人类与AI的未来关系。Musk分享了Neuralink的进展、人类意志的本质、人工智能的安全性、火星殖民的重要性以及对人口问题的担忧。他强调了提高人脑与AI通信速度的重要性,以及通过技术实现人类增强和多星球生存的愿景。

2、万字采访 | Perplexity CEO:我们最大的障碍不是 Google,而是人们天生不擅长提问(下)
Perplexity AI的CEO Aravind Srinivas在与Lex Fridman的深入对话中分享了他对人工智能未来的看法,特别是Perplexity作为知识发现引擎的创新之处。他强调了Perplexity与谷歌的不同之处,以及它如何通过提供更深入的答案来激发人们的好奇心和探索精神。Aravind还讨论了AI在提高用户界面和体验方面的作用,以及AI的伦理问题,包括确保信息的准确性和可靠性。他提出了一个以知识为中心的公司愿景,旨在引导用户发现新知识和深入理解复杂问题。上周分享了了上篇:万字采访 | Perplexity CEO:我们最大的障碍不是 Google,而是人们天生不擅长提问(上)。

3、黄仁勋对谈扎克伯格:Llama 4或将摆脱聊天机器人形态|甲子光年
在第50届SIGGRAPH图形大会上,英伟达CEO黄仁勋与Meta CEO马克·扎克伯格讨论了人工智能的最新进展,包括Meta的开源模型Llama 3.1、AI Studio工具的发布,以及人工智能在虚拟世界中的应用。扎克伯格强调了生成式人工智能在内容推荐中的重要性,并展望了未来人工智能将如何从聊天机器人进化为更复杂的任务执行者。黄仁勋则对Meta的开源哲学表示赞赏,并讨论了人工智能在工业应用中的潜力。

4、AI 打开我们未曾想象的新世界
作者AI炼金术,本文探讨了人工智能在创作和内容生成中的应用,提出了将创造过程分为“提取”和“重新组合”两个步骤,以及利用AI的“多”而非“强”来创造优质内容。文章还讨论了AI在思维模型替代、识别隐藏连接、自我表达和创造需求、以及不同维度抽象和编码的重要性。

5、斯坦福大学赵轩:心理疗愈Agent
斯坦福大学心理学系研究科学家赵轩博士开发了人工智能心理疗愈Agent Sunnie,它基于大语言模型,具备多轮自然对话能力,推荐个性化活动,旨在提升心理健康和幸福感。Sunnie通过结构化交互和反馈循环,提供个性化幸福辅导和活动推荐,已在用户研究中显示出积极效果。赵博士强调了积极心理学在Sunnie设计中的重要性,并展望了其在心理健康领域的应用潜力。

6、LLM经典论文速读版,看完感觉自己通透了
作者皇子,本文为读者提供了31篇关于大型语言模型(LLM)的精选论文速读版,旨在帮助AI爱好者和研究者快速把握LLM领域的核心技术和最新进展。文章涵盖了模型架构、预训练、微调、提示词等多个方面,同时提供了高效阅读中文翻译版原文的方法和一些阅读技巧。

7、27岁,只做toB,估值55亿,不追AGI
加拿大AI大模型公司Cohere完成5亿美元D轮融资,估值达55亿美元,专注于ToB市场,提供定制化AI服务和产品。Cohere由《Attention Is All You Need》论文作者之一Aidan Gomez联合创立,其业务模式以解决企业实际问题为核心,不追求AGI,通过技术创新和资本效率,致力于提升企业运营效率,同时注重数据隐私和安全性。

8、两款头部产品流量下滑50%+,刚找到的AI流量密码失效了?
本文分析了当前AI插件产品流量下滑的现象,指出了Chrome Extensions产品如Liner和Eightify等在经历流量高峰后出现显著下降的问题。文章探讨了流量下滑的原因,包括SEO策略的反噬、产品功能同质化以及用户需求的精准度不足。同时,文章也讨论了Chrome插件开发的优势与限制,并预测了插件产品未来的发展方向。

9、入口之战:AI 时代的「二维码」,在哪里?
作者赛博禅心,本文探讨了AI时代可能的“二维码”——即新的信息交互入口,并分析了二维码在移动互联网时代的成功原因。文章指出,在AI时代,信息处理方式发生了变化,AI能够根据用户输入提供个性化结果。作者通过个人实践和对行业趋势的观察,提出AI应用应更自然地融入用户生活,以实现人与AI的共生。

10、OpenAI投资,前苹果设计师开发的AI应用,拥有超强记忆力成为最懂你的“人”!
本文介绍了由前苹果设计师Jason Yuan开发的AI聊天应用Dot,该应用凭借其超强记忆力和个性化服务获得了OpenAI的投资。文章通过作者的深度体验,展示了Dot在话题引导、记忆能力、情绪价值提供等方面的优势,同时也指出了其在隐私安全方面的争议。

11、十问网红多模态AI应用:胃之书
本文深入分析了一款名为“胃之书”的AI应用,它在过去两个月内迅速走红但面临增长和用户留存挑战。文章从产品设计、创新点、用户增长、数据表现、用户需求、媒体关注、个人体验、产品定位、新产品研发等方面进行了全面探讨,指出了胃之书在满足用户深层次需求和产品持续创新上的不足,并提出了对AI应用发展的思考。

12、3个月成为 AI 魔法师,还是永远当个麻瓜?关键在这里
作者MQ老师,本文探讨了如何成为AI时代的魔法师,即能够有效利用AI技术提升个人能力的人。文章指出,关键在于能够清晰表达隐性经验,并通过与AI的大量交互,将其转化为可操作的步骤或提示词,从而提高思维能力和专业技能。作者认为,终身学习者和大模型的创造者将是这场AI革命的最大受益者。

赛博·工具
1、Luvvoice: 文本转语音
免费的在线文本转语音服务,提供各种语言的超过200种语音。

2、Diffree:图像编辑工具
一个在线图像编辑工具,通过文字指令添加新元素到图片中,比如文字输入"为天空增加几片云"。

3、0v0.ai:图片背景移除工具
一款免费的图片背景移除工具。

4、Apparate:让图片变成说话视频
Proteus 0.1,实时视频生成为您的 AI 注入活力。Proteus 可以大笑、说唱、唱歌、眨眼、微笑、说话等等。只需一张图片。

赛博·资源
1、grammar-club:语法俱乐部书籍
旋元佑老师的语法俱乐部书籍电子版。

2、生成式AI商业落地白皮书(关注公众号【产品老A】回复【生成式AI商业落地白皮书】下载)
本白皮书是一份为企业决策者(CXO)准备的AI转型战术指南,由RollingAI联合InfoQ研究中心撰写。白皮书深入探讨了生成式人工智能(AI)技术在商业领域的应用现状、挑战、应对策略以及未来趋势,并提供了丰富的行业应用案例和实施建议。白皮书强调,生成式AI技术为企业提供了新的生产力和竞争力,企业需要拥抱变革,积极探索AI技术在业务中的应用,重塑组织能力和商业模式。通过构建知识库、优化工作流程和采用新技术,企业可以在AI时代中获得竞争优势。

3、AI视频生成研究报告(关注公众号【产品老A】回复【AI视频生成研究报告】下载)
本报告由量子位智库撰写,深入分析了AI视频生成技术的现状、发展趋势、市场潜力以及行业内主要企业的布局。该研究报告综合考察了AI视频生成技术的发展背景、关键技术、应用场景以及面临的挑战和机遇。报告首先介绍了AI视频生成技术的基本原理和发展历程,随后分析了技术在不同行业中的应用实例,如娱乐、教育、医疗等。此外,报告还探讨了技术发展的驱动因素,包括硬件进步、算法创新以及数据量的增加。最后,报告对AI视频生成技术的市场前景进行了预测,并提出了行业发展的建议。

【推广时间】
欢迎大家关注我的个人公众号【产品老A】。
公众号简介:6年互联网大厂AIPM,专注探索新型人机交互。
老A是谁?——AI领域多年从业经验,见证了AI的沉寂和崛起。 热爱AI技术和产品,更热爱分享,希望将知识传递给更多人。 坚信AI的力量,致力于推动AI技术的应用和普及。
相关文章:
Cyber Weekly #18
赛博新闻 1、Google 狂卷小模型,2B 参数 Gemma 2 赶超 GPT-3.5 Google本周发布了开源的轻量级、高性能模型 Gemma 2 2B。它拥有 20 亿参数,是从更大规模的模型中提炼而来的,在 LMSYS 大模型竞技场的得分超越了 GPT-3.5 和 Mixtral 8x7B。该…...
Open Interpreter - 开放解释器
文章目录 一、关于演示它是如何工作的?与 ChatGPT 的代码解释器比较 二、快速开始三、更多操作1、互动聊天2、程序化聊天3、开始新的聊天4、保存和恢复聊天5、自定义系统消息6、更改模型7、在本地运行 Open Interpreter终端Python上下文窗口,最大令牌 8、…...
“八股文”:程序员的福音还是梦魇?
——一场关于面试题的“代码战争” 在程序员的世界里,“八股文”这个词儿可谓是“如雷贯耳”。不,咱们可不是说古代科举考试中的那种八股文,而是指程序员面试中的那些固定套路的题目。如今,各大中小企业在招聘程序员时࿰…...
数据结构第2天作业 8月3日
单向链表 typedef int datatype; //由于有效数据不一定是正数,所以将数据重命名。typedef struct lklst{ //不能是无名结构体了,因为定义指针域的时候需要使用union{int len; //头结点时候使用;datatype data; …...
设计界的新宠:5款热门UI在线设计软件评测
随着用户界面设计行业的蓬勃发展,越来越多的设计师进入用户界面设计。选择一个方便的用户界面设计工具尤为重要!除了传统的用户界面设计工具,在线用户界面设计工具也受到越来越多设计师的青睐。这种不受时间、地点、计算机配置限制的工作方法…...
github添加ssh密钥,通过ssh方式推送代码
左手编程,右手年华。大家好,我是一点,关注我,带你走入编程的世界。 公众号:一点sir,关注领取python编程资料 很多人在使用github的时候,如果还是使用https的方式推送代码的话,可能会…...
Python设计模式 - 抽象工厂模式
定义 抽象工厂模式是一种创建型设计模式,它提供了一种创建一系列相关或相互依赖对象的接口,而无需指定它们具体的类。 产品等级结构与产品族 为了更好地理解抽象工厂模式,先引入两个概念: 产品等级结构:就是产品的…...
【JavaEE初阶】懒汉模式与饿汉模式及指令重排序问题
目录 📕 单例模式 🌳 饿汉模式 🚩 线程安全 🎍 懒汉模式 🚩 懒汉模式-单线程版 🚩 懒汉模式-多线程版 🎄 指令重排序 📕 单例模式 单例模式是一种经典的设计模式,…...
Vue3使用Cascader 级联选择器如何获取值并提交信息
我写了一个用户对象,有address地址字段,我怎么将用户选择的级联数据selectedValue值传给address,并将对象返回给后端,核心代码实现了该问题。 <script> 核心代码: //获取住址并更新给addresslet selectedValue…...
Python面试整理-第三方库
Python社区提供了大量的第三方库,这些库扩展了Python的功能,覆盖了从数据科学到网络应用开发等多个领域。以下是一些非常流行和广泛使用的第三方库: 1. NumPy ● 用途:数值计算。 ● 特点:提供了一个强大的N维数组对象和大量用于数学运算的函数。 ● 应用场景:科学计算、…...
电脑添加虚拟网卡与ensp互联,互访
一、按照过程 1、打开设备管理器 2、点击网络适配器,点击左上角操作,点击“添加过时硬件” 3、下一页 4、选择“安装我手动从列表选择的硬件”,下一页 5、下拉,选择“网络适配器”,下一页 6、厂商选择“Microsoft”&…...
悬而未决:奇怪的不允许跨域CORS policy的问题
我在本地HBuilderX中进行预览写好的前端网页,它里面用了ajax访问了远程服务器的后端API网址,不出意外地报不允许跨域访问的错了:Access to XMLHttpRequest at ‘http://xxx.com/MemberUser/login’ from origin ‘http://mh.com’ has been b…...
索引优化秘籍:SQL Server数据库填充因子的调优艺术
索引优化秘籍:SQL Server数据库填充因子的调优艺术 在SQL Server的性能优化中,索引起着至关重要的作用。而索引填充因子(Fill Factor)则是控制索引页填充程度的重要参数,它直接影响索引的存储效率和查询性能。本文将深…...
ffmpeg 的内存分配架构
------------------------------------------------------------ author: hjjdebug date: 2024年 08月 01日 星期四 18:00:47 CST descripton: ffmpeg 的内存分配架构1 ------------------------------------------------------------ ffmpeg 的内配分配搞的人晕菜&#…...
Vue+live2d实现虚拟人物互动(一次体验叙述)
目录 故事的开头: 最终的实现效果: 实现步骤: 第一步:下载重要文件 第二步:创建vue项目文件,将刚下载文件拷贝到public目录下 第三步:在index.html文件中引入js 第四步:使用&…...
内联函数的概念和用途以及区别
内联函数(Inline Function)是C(以及C99之后的C语言)中的一个特性,旨在通过减少函数调用的开销来提高程序的执行效率。在正常情况下,当程序调用一个函数时,会发生一系列的操作,包括保…...
rust 桌面 sip 软电话(基于tauri 、pjsip库)
本文尝试下rust 的tauri 桌面运用 原因在于体积小 1、pjsip 提供了rust 接口官方的 rust demo 没编译出来 在git找了个sip-phone-rs-master https://github.com/Charles-Schleich/sip-phone-rs 可以自己编译下pjsip lib库替换该项目的lib 2、创建一个tauri demo 引用 [depe…...
Linux 进程优先级、程序地址空间、进程控制
个人主页:仍有未知等待探索-CSDN博客 专题分栏: Linux 目录 一、进程优先级 1、什么是进程优先级? 2、为什么要有优先级? 3、Linux的优先级特点、查看方式 4、命令行参数和环境变量 1.命令行参数 2.环境变量 获取环境变量的…...
学习笔记一
vector 在创建时指定初始大小和初始值: vector<int> a(5, 1) // 包含 5 个整数的 vector,每个值都为 1 可以使用 push_back 方法向 vector 中添加元素: a.push_back(7) // 将整数 7 添加到 vector 的末尾 可以使用 size(…...
Linux中信号的发送及信号的自定义捕捉方法
预备知识: 信号产生时进程早已知道该信号如何处理。 信号产生时进程可能并不能立即处理信号而是等到合适的时候处理。 信号其他相关常见概念 实际执行信号的处理动作称为信号递达(Delivery) 信号从产生到递达之间的状态,称为信号未决(Pending)。 进程可以选择阻…...
进程地址空间(比特课总结)
一、进程地址空间 1. 环境变量 1 )⽤户级环境变量与系统级环境变量 全局属性:环境变量具有全局属性,会被⼦进程继承。例如当bash启动⼦进程时,环 境变量会⾃动传递给⼦进程。 本地变量限制:本地变量只在当前进程(ba…...
FFmpeg 低延迟同屏方案
引言 在实时互动需求激增的当下,无论是在线教育中的师生同屏演示、远程办公的屏幕共享协作,还是游戏直播的画面实时传输,低延迟同屏已成为保障用户体验的核心指标。FFmpeg 作为一款功能强大的多媒体框架,凭借其灵活的编解码、数据…...
linux arm系统烧录
1、打开瑞芯微程序 2、按住linux arm 的 recover按键 插入电源 3、当瑞芯微检测到有设备 4、松开recover按键 5、选择升级固件 6、点击固件选择本地刷机的linux arm 镜像 7、点击升级 (忘了有没有这步了 估计有) 刷机程序 和 镜像 就不提供了。要刷的时…...
第一篇:Agent2Agent (A2A) 协议——协作式人工智能的黎明
AI 领域的快速发展正在催生一个新时代,智能代理(agents)不再是孤立的个体,而是能够像一个数字团队一样协作。然而,当前 AI 生态系统的碎片化阻碍了这一愿景的实现,导致了“AI 巴别塔问题”——不同代理之间…...
Linux云原生安全:零信任架构与机密计算
Linux云原生安全:零信任架构与机密计算 构建坚不可摧的云原生防御体系 引言:云原生安全的范式革命 随着云原生技术的普及,安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测,到2025年,零信任架构将成为超…...
论文解读:交大港大上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架(一)
宇树机器人多姿态起立控制强化学习框架论文解析 论文解读:交大&港大&上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化学习框架(一) 论文解读:交大&港大&上海AI Lab开源论文 | 宇树机器人多姿态起立控制强化…...
Android15默认授权浮窗权限
我们经常有那种需求,客户需要定制的apk集成在ROM中,并且默认授予其【显示在其他应用的上层】权限,也就是我们常说的浮窗权限,那么我们就可以通过以下方法在wms、ams等系统服务的systemReady()方法中调用即可实现预置应用默认授权浮…...
IP如何挑?2025年海外专线IP如何购买?
你花了时间和预算买了IP,结果IP质量不佳,项目效率低下不说,还可能带来莫名的网络问题,是不是太闹心了?尤其是在面对海外专线IP时,到底怎么才能买到适合自己的呢?所以,挑IP绝对是个技…...
MySQL 知识小结(一)
一、my.cnf配置详解 我们知道安装MySQL有两种方式来安装咱们的MySQL数据库,分别是二进制安装编译数据库或者使用三方yum来进行安装,第三方yum的安装相对于二进制压缩包的安装更快捷,但是文件存放起来数据比较冗余,用二进制能够更好管理咱们M…...
Linux部署私有文件管理系统MinIO
最近需要用到一个文件管理服务,但是又不想花钱,所以就想着自己搭建一个,刚好我们用的一个开源框架已经集成了MinIO,所以就选了这个 我这边对文件服务性能要求不是太高,单机版就可以 安装非常简单,几个命令就…...
