当前位置: 首页 > news >正文

NLP 时事和见解【2023】

一、说明

        AI的新闻当然不是即时的,但作为趋势和苗头,我们不得不做出自己的决定。比如,一些软件的支持是否持续,哪些现成的软件将不再使用,等等。

图片来自中途

以下是NLPlanet为您选择的有关NLP和AI的每周文章,指南和新闻!

二、😎 来自网络的新闻

  • Stack Overflow宣布OverflowAI。Stack Overflow正在通过OverflowAI将生成AI集成到他们的平台中。这包括使用矢量数据库的语义搜索和个性化结果。他们还增强了跨不同平台的搜索功能,并为Stack Overflow for Teams引入了企业知识摄取功能。
  • 稳定性AI宣布稳定扩散XL 1.0。Stability AI 发布了 SDXL 1.0,这是一个开放访问图像模型,具有惊人的 6 亿个参数模型集合管道。此版本在颜色、对比度、照明和阴影方面有重大改进。
  • 介绍Bittensor语言模型 — 适用于移动和边缘设备的最先进的3B参数模型。BTLM 是一种具有 3 亿个参数的语言模型,可在 RAM 有限的移动和边缘设备上高效运行。凭借更高的准确性和较大的上下文窗口,它在基准测试中优于类似大小的模型。BTLM 在准确性上与 7B 模型保持一致,但在内存占用和推理成本方面超过了它们。其目的是在边缘设备上启用AI应用程序,从而减少对集中式云基础架构的需求。
  • 认识FreeWilly,我们庞大而强大的教学微调模型。Stability AI和CarperAI实验室合作发布了FreeWilly,这是一个使用监督微调(SFT)技术微调的LLaMA 2模型。FreeWilly2在某些任务中的表现与GPT-3.5相当,其功能已得到Stability AI研究人员和Hugging Face的验证。这两种型号均在非商业许可下公开提供。
  • OpenAI在“低准确率”上破坏了AI编写的文本检测器。OpenAI决定停用其AI分类器,因为它在检测AI生成的文本方面的准确率较低。大型语言模型的快速发展使得有效识别特征或模式变得具有挑战性。
  • Microsoft的Bing Chat在Chrome和Safari上针对“选定用户”进行测试。Microsoft已经确认,必应聊天将很快在Google Chrome和Safari等浏览器上使用。
  • 前沿模型论坛。Anthropic、Google、Microsoft和OpenAI联手创建了前沿模型论坛,这是一个致力于安全和负责任地开发前沿AI模型的平台。该论坛旨在推进人工智能安全研究,建立安全最佳实践,分享知识,并利用人工智能应对社会挑战。

三、📚 来自网络的指南

  • 使用 Gradio 构建生成式 AI 应用程序。Hugging Face和 DeepLearning.ai 推出了一个新的短期课程,使用Gradio构建生成AI应用程序。该课程侧重于使用开源语言模型创建用户友好的应用程序,项目范围从文本摘要到图像分析和图像生成。
  • 构建一个 AI 图表生成器,只需 50 行即可适应任何数据集类型。开发人员可以使用 GPT-3.5 或 GPT-4 和 Langchain 轻松创建 AI 图表生成器,只需 50 行代码。
  • 自动化网络研究。本文探讨了网络研究代理的发展。该方法涉及使用LLM生成搜索查询,执行搜索,抓取页面,索引文档以及为每个查询查找最相关的结果。
  • 使用 Whisper 和 GPT-4 创建自动会议记录生成器。本指南探讨了会议记录生成工具的开发,该工具利用 Whisper 和 GPT-4 来有效地总结讨论、提取重要细节和分析情绪。

四、🔬 有趣的论文和资料库

  • karpathy/llama2.c:在一个纯C文件中的推理骆驼2。Andrew Karpathy在纯C中发布了LLaMA 2推理的教育实现。该项目允许您在 PyTorch 中训练 LLaMA 2 LLM 架构,然后将权重加载到单个 C 文件中以进行高效推理。
  • FLASK:基于对齐技能集的细粒度语言模型评估。FLASK 是专门为 LLM 绩效评估设计的评估协议。它将评估分解为 12 种不同的技能集,允许根据特定技能(如逻辑稳健性、事实性和理解力)对模型的性能进行详细分析。
  • 对对齐语言模型的通用和可转移攻击。最近的一项研究探讨了对开源和闭源语言模型的对抗性攻击的自动构建,使它们容易受到有害命令的影响。这些攻击转移到广泛使用的聊天机器人,引发了人们对有效修补这些漏洞的担忧。深度学习模型对对抗性攻击的固有敏感性仍然存在不确定性,类似于计算机视觉面临的挑战。
  • WebArena:用于构建自治代理的逼真Web环境。WebArena 是一个逼真的 Web 环境,允许自主代理在与电子商务、社交论坛、软件开发和内容管理相关的任务中发展他们的技能。它提供了评估任务完成情况的基准,并强调了改进代理的必要性,因为即使是像 GPT-4 这样的高级模型的成功率也只有 10.59%。
  • LLaVA:大型语言和视觉助手。LLaVA是一种大型多模态模型,结合了视觉和语言处理,以提高视觉和语言理解。它实现了令人印象深刻的聊天功能,并为科学 QA 设置了新的最先进的准确性。初步实验表明,与 GPT-4 相比,它在合成多模态指令遵循数据集上具有更高的性能。
  • FABRIC:通过迭代反馈个性化扩散模型。研究人员开发了一种称为FABRIC的免训练方法,将用户反馈整合到基于扩散的文本到图像模型中。通过利用自我注意,该模型可以根据迭代用户输入增强其生成过程,从而提高输出质量和更好的用户体验。
  • 3D-LLM:将3D世界注入大型语言模型。一项新的研究引入了3D-LLM,它通过结合3D点云及其特征来增强具有3D理解的语言模型。通过使用 3D 特征提取器和现有的 2D VLM,3D-LLM 在字幕、问答和导航等任务上实现了令人印象深刻的性能,超过了现有的 LLM 和 VLM。
  • 具有规划、长上下文理解和程序综合的真实网络代理。WebAgent是一个LLM驱动的代理,它使用Flan-U-PaLM和HTML-T5来改善真实网站上的自主Web导航和任务完成。通过分解指令、总结 HTML 文档和生成 Python 程序,与以前的模型相比,成功率提高了 50%。
  • STEVE-1:Minecraft 中文本到行为的生成模型。Minecraft中的STEVE-1模型可以理解和响应文本指令,这要归功于其训练过程,包括预先训练的模型和自我监督的行为克隆。它不仅在遵循各种说明方面设定了新的基准,而且还以较低的培训成本实现了卓越的性能,使研究人员可以在预算内使用它。

感谢您的阅读!如果你想了解更多关于NLP的信息,记得关注NLPlanet。您可以在LinkedIn、推特、媒体和我们的 Discord 服务器上找到我们!

 

相关文章:

NLP 时事和见解【2023】

一、说明 AI的新闻当然不是即时的,但作为趋势和苗头,我们不得不做出自己的决定。比如,一些软件的支持是否持续,哪些现成的软件将不再使用,等等。 图片来自中途 以下是NLPlanet为您选择的有关NLP和AI的每周文章&#x…...

Windows 环境下 Python3 离线安装 cryptography 失败

发布Flask Web项目时,报错缺少Cryptography,于是尝试重新安装该库,但本机没有网络,只支持手动离线安装,尝试了pip、setup.py两种方式安装,结果都报错。。最后使用将安装包拷贝至本机(在其他电脑上安装的sit…...

年轻代频繁GC ParNew导致http变慢

背景介绍 某日下午大约四点多,接到合作方消息,线上环境,我这边维护的某http服务突然大量超时(对方超时时间设置为300ms),我迅速到鹰眼平台开启采样,发现该服务平均QPS到了120左右,平…...

在.NET 6.0中自定义接口路由

在本文中,我们将讨论ASP.NET Core中的新路由。我们将了解什么是接口(endpoints)路由,它是如何工作的,它在哪里使用,以及如何创建自己的路由。 本文主题: 探索接口路由创建自定义接口创建更复杂的接口 名词定义&#…...

Kotlin读写分离CopyOnWriteArrayList

Kotlin读写分离CopyOnWriteArrayList 基于读写分离思想Copy-On-Write(COW)设计的线程安全ArrayList变体,读读共享、写写互斥、读写互斥、写读互斥。读时直接读,不用加锁同步,线程安全。写/删/修改数据时复制一个副本,在新的List副…...

centos自动同步北京时间

1、安装ntpdate服务 yum -y install ntpdate 2、加入自动任务计划 查找ntpdate的路径: which ntpdate 复制这个路径。 编辑自动任务计划并加入ntpdate: crontab -e # 每小时第30分钟同步AD域控时间 30 * * * * /usr/sbin/ntpdate -u 192.168.2.8 > …...

element-ui表格跨页多选实现

前言 在我们日常项目开发中,经常会有表格跨页多选的需求,接下来让我们用 el-table 示例一步步来实现这个需求。 动手开发 在线体验 https://codesandbox.io/s/priceless-mcclintock-4cp7x3?file/src/App.vue 常规版本 本部分只写了一些重点代码,心急的彦祖可以直接看 性…...

线性代数(三) 线性方程组向量空间

前言 如何利用行列式,矩阵求解线性方程组。 线性方程组的相关概念 用矩阵方程表示 齐次线性方程组:Ax0;非齐次线性方程组:Axb. 可以理解 齐次线性方程组 是特殊的 非齐次线性方程组 如何判断线性方程组的解 其中R(A)表示矩阵A的…...

学习跨度级交互以提取方面情感三元组

方面情感三元组 方面情感三元组(Aspect Sentiment Triplet)是一种在情感分析中使用的结构,它包含三个部分:方面目标(Aspect Target)、情感(Sentiment)和对应的观点词(Op…...

那些年的Xposed开发经验记录

把之前写的Xposed相关文章合并到一块,方便查阅 目录 多进程App的Hook问题XposedHelper中的静态变量demo的AndroidManifest.xml的测试核心代码结论限制handleLoadPackage被单个进程多次执行的问题 多dex Hook问题为应用增加权限利用Xposed删除权限参考 Hook框架集锦…...

android studio内存分析之Memory profiler的使用

目录 Android Studio中内存分析工具Memory profiler的使用1. 打开Memory Profiler2. 工具使用3. 内存选项说明4. 内存性能分析器概览5. 内存计算方式6. 查看内存分配7. 捕获java/kotlin方式查看内存分配8. 堆转储文件导入和导出 内存性能分析器中的泄漏检测 Android Studio中内…...

Qt下载慢/无法下载解决方式

文章目录 一. Qt在线安装下载二. 安装方式 一. Qt在线安装下载 官网下载:https://www.qt.io/download清华源下载:https://mirrors.tuna.tsinghua.edu.cn/qt/official_releases/online_installers/ 二. 安装方式 进入下载好的目录 在目录栏输入CMD&…...

【UE4 RTS】04-Camera Pan

前言 本篇实现了CameraPawn的旋转功能。 效果 步骤 1. 打开项目设置,添加两个操作映射 2. 打开玩家控制器“RTS_PlayerController_BP”,新建一个浮点型变量,命名为“PanSpeed” 在事件图表中添加如下节点 此时运行游戏可以发现当鼠标移动…...

出现raise NotImplementedError报错

在学习《动手学深度学习》时,实现下面代码时,报出raise NotImplementedError错误。 import collections import torch from d2l import torch as d2l import math from torch import nnclass Seq2SeqEncoder(d2l.Encoder):def __init__(self,vocab_size,…...

第一百二十二天学习记录:C++提高:STL-vector容器(上)(黑马教学视频)

vector基本概念 功能: vector数据结构和数组非常相似,也称为单端数组 vector与普通数组区别: 不同之处在于数组是静态空间,而vector可以动态扩展 动态扩展: 并不是在原空间之后续接新的空间,而是找更大的内…...

《Linux从练气到飞升》No.11 初识操作系统

🕺作者: 主页 我的专栏C语言从0到1探秘C数据结构从0到1探秘Linux菜鸟刷题集 😘欢迎关注:👍点赞🙌收藏✍️留言 🏇码字不易,你的👍点赞🙌收藏❤️关注对我真的…...

什么是 XSS 攻击?

概念 XSS 攻击指的是跨站脚本攻击,是一种代码注入攻击。攻击者通过在网站注入恶意脚本,使之在用户的浏览器上运行,从而盗取用户的信息如 cookie 等。 XSS 的本质是因为网站没有对恶意代码进行过滤,与正常的代码混合在一起了&…...

基于Spring Boot的招聘网站的设计与实现(Java+spring boot+MySQL)

获取源码或者论文请私信博主 演示视频: 基于Spring Boot的招聘网站的设计与实现(Javaspring bootMySQL) 使用技术: 前端:html css javascript jQuery ajax thymeleaf 微信小程序 后端:Java springboot框…...

中级课程——CSRF

文章目录 案例原理挖掘 案例 原理 挖掘 挖掘详情 首先就是对目标敏感部位进行抓包分析,比如修改信息、转账、添加信息等等。通常一个数据包HTTP请求头里边都会有一个Referer,这个需要特别去验证。比如放到Burpsuit Repeater里边去测试:去掉…...

面试热题(岛屿数量)

给你一个由 1(陆地)和 0(水)组成的的二维网格,请你计算网格中岛屿的数量。 岛屿总是被水包围,并且每座岛屿只能由水平方向和/或竖直方向上相邻的陆地连接形成。 此外,你可以假设该网格的四条边均…...

rknn优化教程(二)

文章目录 1. 前述2. 三方库的封装2.1 xrepo中的库2.2 xrepo之外的库2.2.1 opencv2.2.2 rknnrt2.2.3 spdlog 3. rknn_engine库 1. 前述 OK,开始写第二篇的内容了。这篇博客主要能写一下: 如何给一些三方库按照xmake方式进行封装,供调用如何按…...

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能,包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...

解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上,所以报错,到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本,cu、torch、cp 的版本一定要对…...

网络编程(UDP编程)

思维导图 UDP基础编程(单播) 1.流程图 服务器:短信的接收方 创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...

安卓基础(aar)

重新设置java21的环境,临时设置 $env:JAVA_HOME "D:\Android Studio\jbr" 查看当前环境变量 JAVA_HOME 的值 echo $env:JAVA_HOME 构建ARR文件 ./gradlew :private-lib:assembleRelease 目录是这样的: MyApp/ ├── app/ …...

SQL慢可能是触发了ring buffer

简介 最近在进行 postgresql 性能排查的时候,发现 PG 在某一个时间并行执行的 SQL 变得特别慢。最后通过监控监观察到并行发起得时间 buffers_alloc 就急速上升,且低水位伴随在整个慢 SQL,一直是 buferIO 的等待事件,此时也没有其他会话的争抢。SQL 虽然不是高效 SQL ,但…...

uniapp 字符包含的相关方法

在uniapp中,如果你想检查一个字符串是否包含另一个子字符串,你可以使用JavaScript中的includes()方法或者indexOf()方法。这两种方法都可以达到目的,但它们在处理方式和返回值上有所不同。 使用includes()方法 includes()方法用于判断一个字…...

深入理解Optional:处理空指针异常

1. 使用Optional处理可能为空的集合 在Java开发中,集合判空是一个常见但容易出错的场景。传统方式虽然可行,但存在一些潜在问题: // 传统判空方式 if (!CollectionUtils.isEmpty(userInfoList)) {for (UserInfo userInfo : userInfoList) {…...

MySQL的pymysql操作

本章是MySQL的最后一章,MySQL到此完结,下一站Hadoop!!! 这章很简单,完整代码在最后,详细讲解之前python课程里面也有,感兴趣的可以往前找一下 一、查询操作 我们需要打开pycharm …...

比特币:固若金汤的数字堡垒与它的四道防线

第一道防线:机密信函——无法破解的哈希加密 将每一笔比特币交易比作一封在堡垒内部传递的机密信函。 解释“哈希”(Hashing)就是一种军事级的加密术(SHA-256),能将信函内容(交易细节&#xf…...