当前位置: 首页 > news >正文

机器学习周刊第六期:哈佛大学机器学习课、Chatbot Ul 2.0 、LangChain v0.1.0、Mixtral 8x7B

date: 2024/01/08

吴恩达和Langchain合作开发了JavaScript 生成式 AI 短期课程:《使用 LangChain.js 构建 LLM 应用程序》

大家好,欢迎收看第六期机器学习周刊

本期介绍10个内容,涉及Python、机器学习、大模型等,目录如下:

  • 1、哈佛大学机器学习课
  • 2、第一个 JavaScript 生成式 Al 短期课程
  • 3、一个地理相关的Python库
  • 4、电脑本地运行大模型聊天软件,支持中文
  • 5、Chatbot Ul 2.0 发布
  • 6、文本嵌入的74年历史
  • 7、LangChain v0.1.0发布
  • 8、一个由Google开发的机器学习工具
  • 9、Mixtral 8x7B 论文发布
  • 10、斯坦福大学开发出一个几乎不会产生幻觉的模型: WikiChat

1、哈佛大学机器学习课

课程简介:https://pll.harvard.edu/course/data-science-machine-learning

注册地址:https://www.edx.org/learn/machine-learning/harvard-university-data-science-machine-learning

首先强烈推荐一下质量上乘,完全免费的哈佛大学机器学习课程,

2024年度课程开始了,目前有两个时段可选

  • 1月9日到6月20日

  • 4月18日到12月19日

授课老师是哈佛大学生物统计学教授拉斐尔·伊里扎里,感兴趣可以去edX注册了

2、第一个 JavaScript 生成式 AI 短期课程!

地址: https://deeplearning.ai/short-courses/build-llm-apps-with-langchain-js/

吴恩达和Langchain合作开发了JavaScript 生成式 AI 短期课程:《使用 LangChain.js 构建 LLM 应用程序》

课程简介如下:

GitHub 最近报告称 JavaScript 再次成为世界上最流行的编程语言。为了支持 Web 开发人员探索和开发生成式 AI,我们刚刚推出了一个新的 JavaScript 短期课程,由 @LangChainAI 的创始工程师 @Hacubu 教授。在使用 LangChain.js 构建 LLM 应用程序中,您将学习人工智能开发中常见的元素,包括:

(i) 使用数据加载器从 PDF、网站和数据库等常见来源提取数据
(ii) 提示,用于提供 LLM 上下文
(iii) 支持 RAG 的模块,例如文本分割器以及与向量存储的集成
(iv) 使用不同的模型来编写不特定于供应商的应用程序
(v) 解析器,提取并格式化输出以供下游代码处理

我对这门课非常感兴趣,但是deeplearning官网还没有字幕,学起来非常困难

已经有up搬运并配了机翻字幕,但是感觉很多地方翻译的不是很准确

所以我准备一边学习一边翻译并上传,但是这个字幕翻译工作还是蛮费功夫的,可能进度不会很快

感兴趣的同学可以关注一下:https://www.bilibili.com/video/BV1Te411m7ys

3、一个地理相关的Python库

地址:https://gist.github.com/alexgleith/dc49156aab4b9270b0a0f145bd7fa0ce

推荐一个地理相关的Python库:

2 个 Python 库、6 行代码和大约 15 秒的时间,就可以从世界任何地方加载卫星数据

4、电脑本地运行,大模型聊天软件,支持中文

地址:https://github.com/janhq/jan

官网:jan.ai/

Jan 是 ChatGPT 的一个开源替代品,最近在GitHub上非常火爆。它能够在电脑上100% 离线运行,支持Nvidia GPU & Apple M。

提供众多开源 AI 模型下载,每次对话选择一个模型后自动切换,很方便。

Jan 能在任何硬件上运行,从个人电脑(Linux、Windows、MacOS)到多 GPU 集群,Jan 支持通用架构:

  • Nvidia GPUs (快速)
  • Apple M 系列 (快速)
  • Apple Intel
  • Linux Debian
  • Windows x64

有X友做了测试,支持中文,效果不错

5、Chatbot UI 2.0 发布

地址:https://github.com/mckaywrigley/chatbot-ui

最近 Chatbot UI 2.0发布了,这是一个面向所有人的开源AI聊天界面。

它不仅支持OpenAI、Claude的API,还支持Gemini、Mistral、Perplexity API、本地Ollama安装的模型。

目前Google 的 Gemini API是免费了,感兴趣可以申请后结合这个工具使用。

关于Gemini,我之前写过一篇文章,详细地介绍了玩法:叫板GPT-4的Gemini,我做了一个聊天网页,可图片输入,附教程

6、文本嵌入的74 年历史

地址:https://jina.ai/news/the-1950-2024-text-embeddings-evolution-poster/

JinaAI绘制的这张高清PNG海报记录了文本嵌入自1950年至今的历史,展示过去 74 年的突破性演变。

网页中还提供了丰富的参考资料,每个技术里程碑都附带一个可供探索的资源列表。

7、LangChain v0.1.0

地址: https://blog.langchain.dev/langchain-v0-1-0/

LangChain是大模型世界最重要的工具之一,本周LangChain 发布了0.1稳定版,完全向后兼容,同时提供 Python 和 JavaScript,并在功能和文档方面都进行了改进。

👀 可观察性:构建复杂的LLM应用程序很困难。为了最好地进行调试,需要知道所采取的确切步骤以及每个步骤的输入/输出。通过与LangSmith的紧密集成,LangChain拥有一流的可观察性

↔️ 集成:近700个集成,无论你想使用什么技术堆栈,LangChain都支持

🔗 可组合性:使用 LangChain 表达式语言,可以轻松(且有趣!)创建任意链,为您带来数据编排框架的所有优势

🎏 流式传输:我们投入了大量资金来确保使用 LangChain 表达式语言创建的所有链以一流的方式支持流式传输 - 包括中间步骤的流式传输

🧱 输出解析:让LLM以某种格式返回信息是使其执行操作的关键。

🔎 检索:为 RAG 添加先进且可用于生产的方法,包括文本分割、检索和索引管道

🤖 工具使用+代理:代理集合(决定采取什么操作),工具集合,定义工具的简单方法

8、Teachable Machine:一个由Google开发的机器学习工具

地址:https://teachablemachine.withgoogle.com

Google 开发机器学习工具Teachable Machine,它允许用户快速、简单地创建自己的机器学习模型,而无需专业知识或编程技能。

你可以用它来教电脑识别图片、声音或人的动作。

使用这个工具的步骤很简单

1、收集数据:你可以上传图片、录制声音或动作视频来作为训练数据。

2、训练模型:用这些数据来训练你的模型,然后测试它能否正确识别新的图片、声音或动作。

3、导出模型:完成训练后,你可以下载这个模型,或者上传到网上,用在其他项目中。

Teachable Machine提供了多种方式来创建机器学习模型,非常灵活和用户友好。

1、使用文件或实时捕捉示例:用户可以选择上传已有的图片、音频文件作为数据,也可以直接通过电脑的摄像头或麦克风实时录制视频、声音作为训练数据。

2、可以在本地完成训练:用户有选项不通过网络发送或处理数据。所有操作,包括数据的收集、模型的训练和应用,都可以在用户自己的电脑上完成,不需要将摄像头或麦克风收集的数据发送到互联网上。这对于隐私保护是非常重要的,特别是当处理敏感信息时。

3、Teachable Machine”生成的模型是真实的TensorFlow.js模型,可以在任何运行JavaScript的地方工作。此外,还可以将模型导出到不同的格式,以便在其他地方使用,如Coral、Arduino等。

9、Mixtral 8x7B 论文发布

论文:https://arxiv.org/abs/2401.04088

Mixtral官网关于MoE的介绍:https://mistral.ai/news/mixtral-of-experts/

本周另一个在X上刷屏的事件(前一个是LangChain v0.1.0的发布)是Mixtral 8x7B 论文发布。

Mixtral模型发布已经一个月了,Mixtral 8x7B 如此令人兴奋的原因在于它探索了一种新的架构范例,即“专家混合”方法,与大多数 LLMs 所遵循的方法形成鲜明对比。尽管这种方法并不新鲜,但尚未在 LLM 领域得到大规模证明。然而,Mixtral 论文表明,Mixtral 8x7B 在各种基准测试中与更大的模型(例如 Llama 2 70B 和 GPT-3.5)相比具有良好的性能。

什么是专家混合 (MoE) 方法?

MoE 方法是一种机器学习技术,结合了多个专家模型的优势来解决问题。与结合所有模型结果的集成技术相比,在 MoE 中,仅使用一名或少数专家来进行预测。

这种方法有两个主要组成部分:
• 路由器:决定对于给定输入信任哪个专家以及如何权衡每个专家对于特定输入的结果。
• 专家:专门研究问题不同方面的个体模型。

在 Mixtral 的案例中,有八位专家,其中两位是被选中的。

10、斯坦福大学开发出一个几乎不会产生幻觉的模型:WikiChat

GitHub:https://github.com/stanford-oval/WikiChat
论文:https://arxiv.org/abs/2305.14292
在线体验:https://wikichat.genie.stanford.edu

大模型的通病是幻觉问题,也即一本正经地胡说八道。来自斯坦福的研究人员发布了WikiChat——被称为首个几乎不产生幻觉的聊天机器人!

WikiChat基于英文维基百科信息,当它需要回答问题时,会先在维基百科上找到相关的、准确的信息,然后再给出回答,保证给出的回答既有用又可靠。

模型在新的基准测试中获得了97.3%的事实准确性,而相比之下,GPT-4的得分仅为66.1%。

这个模型可以在线体验,不过遗憾的是它不支持中文,而且试用次数非常有限。

顺便说一句,斯坦福不但开源了模型,还开源了上面这个聊天应用ovalchat的代码:

https://github.com/stanford-oval/ovalchat

相关文章:

机器学习周刊第六期:哈佛大学机器学习课、Chatbot Ul 2.0 、LangChain v0.1.0、Mixtral 8x7B

— date: 2024/01/08 — 吴恩达和Langchain合作开发了JavaScript 生成式 AI 短期课程:《使用 LangChain.js 构建 LLM 应用程序》 大家好,欢迎收看第六期机器学习周刊 本期介绍10个内容,涉及Python、机器学习、大模型等,目录如下&#xff…...

【算法与数据结构】Java实现查找与排序

文章目录 第一部分:查找算法二分查找插值查找分块查找哈希查找树表查找 第二部分:排序算法冒泡排序选择排序插入排序快速排序 总结 第一部分:查找算法 二分查找 也叫做折半查找,属于有序查找算法。 前提条件:数组数据…...

边缘计算的挑战和机遇(结合RDH-EI)

边缘计算的挑战和机遇 边缘计算面临着数据安全与隐私保护、网络稳定性等挑战,但同时也带来了更强的实时性和本地处理能力,为企业降低了成本和压力,提高了数据处理效率。因此,边缘计算既带来了挑战也带来了机遇,需要我…...

详解IP安全:IPSec协议簇 | AH协议 | ESP协议 | IKE协议_ipsec esp

目录 IP安全概述 IPSec协议簇 IPSec的实现方式 AH(Authentication Header,认证头) ESP(Encapsulating Security Payload,封装安全载荷) IKE(Internet Key Exchange,因特网密钥…...

【图论】树的直径

树的直径即为一棵树中距离最远的两点之间的路径 方法一:DFS 先以任意一点为起点跑一遍dfs,记录离起点距离最远的点p(这个点一定是直径的一个端点,感性理解一下不证明了),然后再以最远点再跑一遍dfs&#…...

制作一个Python聊天机器人

我们学习一下如何使用 ChatterBot 库在 Python 中创建聊天机器人,该库实现了各种机器学习算法来生成响应对话,还是挺不错的 什么是聊天机器人 聊天机器人也称为聊天机器人、机器人、人工代理等,基本上是由人工智能驱动的软件程序&#xff0…...

docker 使用 vcs/2018 Verdi等 eda 软件

好不容易在ubuntu 安装好了eda软件,转眼就发现了自己的无知。 有博主几年前就搞定了docker上的EDA工具。而且更全,更简单。只恨自己太无知啊。 Synopsys EDA Tools docker image - EDA资源使用讨论 - EETOP 创芯网论坛 (原名:电子顶级开发网…...

Git教程学习:01 Git简介与安装

目录 1 版本控制1.1 什么是版本控制系统?1.2 本地版本控制系统1.3 集中式版本控制系统1.4 分布式版本控制系统 2 Git简史3 Git的安装3.1 在Linux上安装3.2 初次运行Git前的配置 1 版本控制 1.1 什么是版本控制系统? 版本控制系统(Version Control Syst…...

写操作系统之开发加载器

这篇文章写的很好是理解操作系统加载部分的基础 https://www.cnblogs.com/chuganghong/p/15415208.html loader的功能是: 从软盘中把操作系统内核读取到内存中。 进入保护模式。 把内存中的操作系统内核重新放置到内存中。 执行操作系统内核。 如果理解不了上面的…...

openlayers [九] 地图覆盖物overlay三种常用用法 popup弹窗,marker标注,text文本

文章目录 简介overlay 实现popup弹窗overlay 实现label 标注信息overlay实现 text 文本信息完整代码 简介 常见的地图覆盖物为这三种类型,如:popup弹窗、label标注信息、text文本信息等。 overlay 实现popup弹窗 方法详解 实例一个 new Overlay()&…...

rabbitmq-java基础详解

一、rabbitmq是什么? 1、MQ定义 MQ(Message Queue)消息队列 主要解决:异步处理、应用解耦、流量削峰等问题,是分布式系统的重要组件,从而实现高性能,高可用,可伸缩和最终一致性的架…...

openssl3.2 - 官方demo学习 - smime - smsign.c

文章目录 openssl3.2 - 官方demo学习 - smime - smsign.c概述笔记END openssl3.2 - 官方demo学习 - smime - smsign.c 概述 从证书中得到X509*和私钥指针 用证书和私钥对铭文进行签名, 得到签名后的pkcs7指针 将pkcs7指向的bio_in, 写为MIME格式的签名密文 BIO_reset() 可以…...

Klocwork—符合功能安全要求的自动化静态测试工具

产品概述 Klocwork是Perforce公司产品,主要用于C、C、C#、Java、 python和Kotlin代码的自动化静态分析工作,可以提供编码规则检查、代码质量度量、测试结果管理等功能。Klocwork可以扩展到大多数规模的项目,与大型复杂环境、各种开发工具集成…...

运筹说 第56期 | 整数规划的数学模型割平面法

前几章讨论过的线性规划问题的一个共同特点是:最优解的取值可以是分数或者小数。然而,在许多实际问题中,决策者要求最优解必须是整数,例如公交车的车辆数、员工的人数、机器的台数、产品的件数等。那么,我们能否将得到…...

vue中内置指令v-model的作用和常见使用方法介绍以及在自定义组件上支持

文章目录 一、v-model是什么二、什么是语法糖三、v-model常见的用法1、对于输入框(input):2、对于复选框(checkbox):3、对于选择框(select):4、对于组件(comp…...

大模型推理引擎面试复习大纲

Transformer原理 基本组成、注意力机制含义 transformer有哪些模块,各个模块有什么作用? transformer的模块可以分为以下几类: Encoder模块:transformer的编码器,它由多个相同的encoder层堆叠而成,每个enc…...

网络安全 | 苹果承认 GPU 安全漏洞存在,iPhone 12、M2 MacBook Air 等受影响

1 月 17 日消息,苹果公司确认了近期出现的有关 Apple GPU 存在安全漏洞的报告,并承认 iPhone 12 和 M2 MacBook Air 受影响。 该漏洞可能使攻击者窃取由芯片处理的数据,包括与 ChatGPT 的对话内容等隐私信息。 安全研究人员发现,…...

C++ 数论相关题目(约数)

1、试除法求约数 主要还是可以成对的求约数进行优化&#xff0c;不然会超时。 时间复杂度根号n #include <iostream> #include <vector> #include <algorithm>using namespace std;int n;vector<int> solve(int a) {vector<int> res;for(int i…...

freeswitch on centos dockerfile模式

概述 freeswitch是一款简单好用的VOIP开源软交换平台。 centos7 docker上编译安装fs的流程记录&#xff0c;本文使用dockerfile模式。 环境 docker engine&#xff1a;Version 24.0.6 centos docker&#xff1a;7 freeswitch&#xff1a;v1.6.20 dockerfile 创建空目录…...

Hologres + Flink 流式湖仓建设

Hologres + Flink 流式湖仓建设 1 Flink + Hologres 特性1.2 实时维表 Lookup1.3 高性能实时写入与更新1.4 多流合并1.5 Hologres 作为 Flink 的数据源1.6 元数据自动发现与更新2 传统实时数仓分层方案2.1传统实时数仓分层方案 1:流式 ETL2.2 传统实时数仓分层方案 2:定时调度…...

Flask RESTful 示例

目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务 中文乱码问题&#xff1a; 下面创建一个简单的Flask RESTful API示例。首先&#xff0c;我们需要创建环境&#xff0c;安装必要的依赖&#xff0c;然后…...

C++初阶-list的底层

目录 1.std::list实现的所有代码 2.list的简单介绍 2.1实现list的类 2.2_list_iterator的实现 2.2.1_list_iterator实现的原因和好处 2.2.2_list_iterator实现 2.3_list_node的实现 2.3.1. 避免递归的模板依赖 2.3.2. 内存布局一致性 2.3.3. 类型安全的替代方案 2.3.…...

【WiFi帧结构】

文章目录 帧结构MAC头部管理帧 帧结构 Wi-Fi的帧分为三部分组成&#xff1a;MAC头部frame bodyFCS&#xff0c;其中MAC是固定格式的&#xff0c;frame body是可变长度。 MAC头部有frame control&#xff0c;duration&#xff0c;address1&#xff0c;address2&#xff0c;addre…...

如何在看板中体现优先级变化

在看板中有效体现优先级变化的关键措施包括&#xff1a;采用颜色或标签标识优先级、设置任务排序规则、使用独立的优先级列或泳道、结合自动化规则同步优先级变化、建立定期的优先级审查流程。其中&#xff0c;设置任务排序规则尤其重要&#xff0c;因为它让看板视觉上直观地体…...

ESP32读取DHT11温湿度数据

芯片&#xff1a;ESP32 环境&#xff1a;Arduino 一、安装DHT11传感器库 红框的库&#xff0c;别安装错了 二、代码 注意&#xff0c;DATA口要连接在D15上 #include "DHT.h" // 包含DHT库#define DHTPIN 15 // 定义DHT11数据引脚连接到ESP32的GPIO15 #define D…...

【C语言练习】080. 使用C语言实现简单的数据库操作

080. 使用C语言实现简单的数据库操作 080. 使用C语言实现简单的数据库操作使用原生APIODBC接口第三方库ORM框架文件模拟1. 安装SQLite2. 示例代码:使用SQLite创建数据库、表和插入数据3. 编译和运行4. 示例运行输出:5. 注意事项6. 总结080. 使用C语言实现简单的数据库操作 在…...

深入解析C++中的extern关键字:跨文件共享变量与函数的终极指南

&#x1f680; C extern 关键字深度解析&#xff1a;跨文件编程的终极指南 &#x1f4c5; 更新时间&#xff1a;2025年6月5日 &#x1f3f7;️ 标签&#xff1a;C | extern关键字 | 多文件编程 | 链接与声明 | 现代C 文章目录 前言&#x1f525;一、extern 是什么&#xff1f;&…...

SpringCloudGateway 自定义局部过滤器

场景&#xff1a; 将所有请求转化为同一路径请求&#xff08;方便穿网配置&#xff09;在请求头内标识原来路径&#xff0c;然后在将请求分发给不同服务 AllToOneGatewayFilterFactory import lombok.Getter; import lombok.Setter; import lombok.extern.slf4j.Slf4j; impor…...

什么?连接服务器也能可视化显示界面?:基于X11 Forwarding + CentOS + MobaXterm实战指南

文章目录 什么是X11?环境准备实战步骤1️⃣ 服务器端配置(CentOS)2️⃣ 客户端配置(MobaXterm)3️⃣ 验证X11 Forwarding4️⃣ 运行自定义GUI程序(Python示例)5️⃣ 成功效果![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/55aefaea8a9f477e86d065227851fe3d.pn…...

pikachu靶场通关笔记22-1 SQL注入05-1-insert注入(报错法)

目录 一、SQL注入 二、insert注入 三、报错型注入 四、updatexml函数 五、源码审计 六、insert渗透实战 1、渗透准备 2、获取数据库名database 3、获取表名table 4、获取列名column 5、获取字段 本系列为通过《pikachu靶场通关笔记》的SQL注入关卡(共10关&#xff0…...