当前位置: 首页 > news >正文

知乎版ChatGPT「知海图AI」加入国产大模型乱斗,称效果与GPT-4持平

        “2023知乎发现大会”上,知乎创始人、董事长兼CEO周源和知乎合作人、CTO李大海共同宣布了知乎与面壁智能联合发布“知海图AI”中文大模型。

        周源据介绍,知乎与面壁智能达成深度合作,共同开发中文大模型产品并推进应用落地。目前,知乎和面壁智能合作自研的“知海图AI”中文大模型已经运用进了知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测。


“知海图AI”借力知乎语言数据库优势,称与GPT-4效果持平

        在知乎创始人、董事长兼 CEO 周源看来,AI 时代的生产力要素可以分为三层,从上到下依次是应用场景、专有数据、基础模型。“知海图AI”具备必须的生产力要素基因。

        基础模型方面,在知乎与面壁智能合作自研的“知海图AI”中文大模型面世之前,面壁智能已在 2020 年底发布了首个中文大语言模型 CPM-1,之后又陆续发布了 CPM-2、CPM-3 和 CPM-Ant 等模型。在应用场景在上,以问答形式为主,知乎搭建了专业、多元、有价值的“讨论场”。专有数据方面,知乎的运营模式决定了其积累了大量高质量的内容、关系和知识图谱,在当前国内互联网高质量内容匮乏的情况下,知乎的优势得天独厚,的确具备构建一个大模型的数据量。

        目前,知乎和面壁智能合作自研的“知海图AI”中文大模型,已经运用进了知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测。

        在知乎这个场景里面,答主的回答千奇百怪、非常开放,甚至会出现观点跟提问没有关系的情况。这对整个大模型很有挑战。知乎称,“知海图AI”利用超强的语言理解能力对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户,给大家直观清晰的回答。

        面壁智能联合创始人、CTO 曾国洋表示,“在这个场景(知乎凌乱的问答区)下抽了40个提问去做评测。评测以后,发现跟GPT-4在这方面基本持平,我们稍微差一些,但还是蛮不错的。

国产大模型开启乱斗,资源禀赋各不相同

        人工智能激战正酣,当前各个大厂、创业企业开启乱斗,根据统计,目前国内至少有 15 个大大小小的 AI 大模型正在研发,当然各家资源禀赋各不相同。

国内已经宣布AI大模型项目的企业/机构

        阿里系AI大模型“通义”系列,特点在于“借力阿里超强的中间件优势,构建完整生态”,“通义”系列大模型将深入到电商、设计、医疗、法律、金融等行业,服务超过200个场景。阿里通义大模型打造了国内首个AI统一底座,根据研报梳理,阿里大模型相关受益标的主要包括:恒生电子、千方科技、石基信息、众信旅游、卫宁健康、金桥信息、亚康股份、神州数码、易点天下、丝路视觉等。

        腾讯系的混元AI大模型于2022年12月推出,是目前国内首个低成本、可落地的NLP万亿大模型,且登顶自然语言理解任务榜单CLUE。腾讯的数据、人才和硬件储备是布局AIGC领域的三大优势:数据方面,腾讯现有产品或带来多样化、真实度高的数据和应用场景;此外硬件方面腾讯拥有高性能网络平台、成熟的太极机器学习平台,为模型训练提供坚实基础。在生态链方面,腾讯系持股或与腾讯有重要合作标的,其中互联网传媒领域的有:世纪华通、完美世界、三七互娱、巨人网络、掌趣科技、电魂网络等;版权领域的有:华策影视、新媒股份、博纳影业、中文在线、平治信息;计算机领域的有:金山办公、泛微网络、四维图新、博思软件、长亮科技、超图软件等。

        华为系的盘古大模型,首次兼顾了图像判别与生成能力,能同时满足底层图像处理与高层语义的理解需求。盘古NLP大模型的可以赋能智能营销领域,比如,盘古NLP大模型可以通过文本匹配、意图识别等关键技术更好地服务销售环节,取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统,帮助服务人员快速提升业务水平。对于华为盘古大模型生态链,在算力环节主要关注的是给华为做AI芯片服务的整机厂商,主要有神州数码、拓维信息、四川长虹、同方股份、广电运通、紫光股份等。

        百度系的“文心千帆”大模型平台,不仅包括文心一言,还包括百度全套文心大模型、相应的开发工具链。未来,文心千帆还会支持第三方的开源大模型。从平台定位上看,文心千帆为一站式企业级大模型平台,平台作为文心大模型服务的唯一入口,为B端企业用户,提供数据管理、自动化模型定制微调以及推理服务云端部署一站式大模型定制服务,并提供文心一言企业级推理云服务。从应用场景上看,文心千帆可应用于智能对话、智能输入法等通用场景以及电销领域商品介绍、推广文章等特定场景。根据研报梳理,目前百度AI生态链主要受益标的包括三六零、科大讯飞、拓尔思、万兴科技、格灵深瞳、云从科技、淳中科技、海康威视、大华股份等。

        目前,BAT 其中两家 AI 大模型已经进入试用阶段,压力给到其他厂商研发团队。在这场军备竞赛中,不乏有赶这场“AI 淘金热”的队伍,也有想“给淘金者卖水”的组织,训练 AI 大模型需要大量的计算资源和数据进行训练,这时候各家大厂/初创团队便要凭本事吃饭,这些平台将在竞争中重新审视系统性、结构工整的知识类内容,这有利于我国科技和生产力的发展,所以大模型竞争越多越好,最终由用户来做选择。


大厂拿所掌握数据投喂AI模型,引发数据安全担忧

形势一片火热,不乏理中客。

        互联网分析师张京科指出,如今由ChatGPT所引领的大模型浪潮,是科技领域的一次跨时代进步,但也存在巨大的用户隐私安全风险。

        ChatGPT于2022年11月发布后,其母公司OpenAI估值已涨至290亿美元,上线两个月后,用户数量达到1亿。伴随“尝鲜”热潮而来的是潜在安全风险的讨论。ChatGPT是一个生成式预训练变换模型,该模型前期的训练过程是基于人类反馈的监督学习和强化学习,在与用户大量的交互过程中聊天模型本身会将用户“喂”给它的数据作为训练数据,从而不断“进化”。

        “如今,互联网公司正在尝试用自己掌握的大数据投喂AI模型,很多时候厂商会以格式条款的协议获得用户各种隐私信息的授权,面对这些APP签订的协议,用户几乎没有选择的余地。各大互联网巨头源源不断地以用户信息投喂献祭,很多用户也不介意类似的隐私安全风险。”

        张京科指出,这意味着用户所有的隐私、喜好、聊天、关系链,甚至密码等等,未来有可能因为一个小小的安全漏洞或者运营事故,而大白于天下。为此,应制定更严格的用户大数据使用标准等措施提前进行预防。

相关文章:

知乎版ChatGPT「知海图AI」加入国产大模型乱斗,称效果与GPT-4持平

“2023知乎发现大会”上,知乎创始人、董事长兼CEO周源和知乎合作人、CTO李大海共同宣布了知乎与面壁智能联合发布“知海图AI”中文大模型。 周源据介绍,知乎与面壁智能达成深度合作,共同开发中文大模型产品并推进应用落地。目前,知…...

邮件发送配置

QQ邮箱发送和接收配置: POP3/SMTP协议 接收邮件服务器:pop.exmail.qq.com ,使用SSL,端口号995 发送邮件服务器:smtp.exmail.qq.com ,使用SSL,端口号465 海外用户可使用以下服务器 接收邮件服务器…...

【Open CASCADE -生成MFC和QT事例方式】

源代码目录 adm目录:包含编译OCCT的相关工程; adm/cmake目录:包含使用CMake构建OCCT的相关处理脚本; adm/msvc目录:包含window平台 Visual C 2010, 2012, 2013, 2015, 2017 and 2019等版本的32/64平台solutinon文件; data目录: 包…...

python 笔记:PyTrack(将GPS数据和OpenStreetMap数据进行整合)【官网例子解读】

论文笔记:PyTrack: A Map-Matching-Based Python Toolbox for Vehicle Trajectory Reconstruction_UQI-LIUWJ的博客-CSDN博客4 0 包的安装 官网的两种方式我都试过,装是能装成功,但是python import PyTrack包的时候还是显示找不到Pytrack …...

苦中作乐 ---竞赛刷题31-40(15-20)

(一)目录 L1-032 Left-pad L1-033 出生年 L1-034 点赞 L1-035 情人节 L1-039 古风排版 (二)题目 L1-032 Left-pad 根据新浪微博上的消息,有一位开发者不满NPM(Node Package Manager)的做法…...

100种思维模型之人类误判心理思维模型-49

“我们老得太快,聪明得太迟”——查理芒格。 2005年,81岁的查理芒格认为81岁的他能够比10年前做得更好。他决定对1992年2月2日、1994年10月6日和1995年4月24日的三次演讲稿进行修改,于是就有了这个人类误判心理思维模型——25条人类误判心理学…...

【从零开始学Skynet】实战篇《球球大作战》(十三):场景代码设计(下)

1、主循环 《球球大作战》是一款服务端运算的游戏,一般会使用主循环程序结构,让服务端处理战斗逻辑。如下图所示,图中的 balls 和 foods代表服务端的状态,在循环中执行“ 食物生成”“位置更新”和“碰撞检 测” 等功能&#xff0…...

2023年虚拟数字人行业研究报告

第一章 行业概况 虚拟数字人指存在于非物理世界中,由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多种人类特征(外貌特征、人类表演能力、人类交互能力等)的综合产物。虚拟人可分为服务型…...

Oracle 之表的连接类型——舞蹈跳出

嵌套循环(Nested Loops Join) Oracle 中最基本的连接方法,用于处理数据表之间的连接操作。 嵌套循环是通过对其中一个表(外部表)进行全循环操作,然后针对每条记录在另一张表(内部表)…...

深入浅出JS定时器:从setTimeout到setInterval

前言 当谈到 JavaScript 编程语言最基本的概念时,定时器就是一个必须掌握的知识点。在编写网站时,你经常会遇到需要在一定时间间隔内执行一些代码的情况。这时候,JavaScript 定时器就可以派上用场了。 什么是定时器? JS 定时器是…...

CountDownLatch、CyclicBarrier、Semaphore 的原理以及实例总结

文章目录 CountDownLatch、CyclicBarrier、Semaphore 的原理以及实例总结一、CountDownLatch二、CyclicBarrier三、Semaphore总结 CountDownLatch、CyclicBarrier、Semaphore 的原理以及实例总结 在Java多线程编程中,有三种常见的同步工具类:CountDownL…...

企业电子招投标系统源码之了解电子招标投标全流程

随着各级政府部门的大力推进,以及国内互联网的建设,电子招投标已经逐渐成为国内主流的招标投标方式,但是依然有很多人对电子招投标的流程不够了解,在具体操作上存在困难。虽然各个交易平台的招标投标在线操作会略有不同&#xff0…...

SpringCloud之Gateway组件简介

网关的理解 网关类似于海关或者大门,出入都需要经过这个网关。别人不经过这个网关,永远也看不到里面的东西。可以在网关进行条件过滤,比如大门只有对应的钥匙才能入内。网关和大门一样,永远暴露在最外面 不使用网关 前端需要记住每…...

GoNote第三章 主流框架加对比

GoNote第三章 主流框架加对比 Golang主流框架介绍 自从面市以来,Golang成为了程序员在编写API和开发Web服务时的首选之一。近90%的受访者表示会在自己下一组项目中持续使用Golang。与我们熟悉的C和C类似,Go语言也是现有Golang的“灵魂”。而Golang则是…...

Quartz框架详解分析

文章目录 1 Quartz框架1.1 入门demo1.2 Job 讲解1.2.1 Job简介1.2.2 Job 并发1.2.3 Job 异常1.2.4 Job 中断 1.3 Trigger 触发器1.3.1 SimpleTrigger1.3.2 CornTrigger 1.4 Listener监听器1.5 Jdbc store1.5.1 简介1.5.2 添加pom依赖1.5.3 建表SQL1.5.4 配置文件quartz.propert…...

Nginx专题-基于多网卡的主机配置

文章目录 Nginx 基于多网卡的主机实现一、虚拟机前置环境准备ifcfg-ens32配置文件的内容参考ifcfg-ens33配置文件的内容 二、案例演示修改nginx.conf配置文件解决中文乱码 Nginx 基于多网卡的主机实现 一、虚拟机前置环境准备 点击虚拟机右下角的 红色标框按钮,然后…...

4.2和4.3、MAC地址、IP地址、端口

计算机网络等相关知识可以去小林coding进行巩固(点击前往) 4.2和4.3、MAC地址、IP地址、端口 1.MAC地址的简介2.IP地址①IP地址简介②IP地址编址方式③A类IP地址④B类IP地址⑤C类IP地址⑥D类IP地址⑧子网掩码 3.端口①简介②端口类型 1.MAC地址的简介 …...

放弃 console.log 吧!用 Debugger 你能读懂各种源码

很多同学不知道为什么要用 debugger 来调试,console.log 不行么? 还有,会用 debugger 了,还是有很多代码看不懂,如何调试复杂源码呢? 这篇文章就来讲一下为什么要用这些调试工具: console.lo…...

epoll机制解析

一、epoll实现原理 1、实现原理 epoll通过3个方法来实现对句柄的监控操作,要深刻理解epoll,首先得了解epoll的三大关键要素:mmap、红黑树、链表。下面是epoll的框架图,如下: mmap epoll是通过内核与用户空间mmap同一块…...

基于 SpringBoot + Vue 实现的可视化拖拽编辑的大屏项目

今天给小伙伴们分享一个基于 SpringBoot Vue 实现的可视化拖拽编辑的大屏项目; 一、简介 这个是一个开源的一个BI平台,酷炫大屏展示,能随时随地掌控业务动态,让每个决策都有数据支撑。 多数据源支持,内置mysql、el…...

我们为什么要写作?

为什么要写书是一个很难回答的问题,因为从不同的角度,会有不同的答案。 最近ChatGPT很火!诸事不决,先问问ChatGPT,看看它是怎么回答的。 ChatGPT给出的答案还是比较全,虽然没有“一本正经的胡说八道”&…...

设计模式:创建者模式 - 建造者模式

文章目录 1.概述2.结构3.实例4.优缺点5.使用场景6.模式扩展 1.概述 将一个复杂对象的构建与表示分离,使得同样的构建过程可以创建不同的表示。 分离了部件的构造(由Builder来负责)和装配(由Director负责)。 从而可以构造出复杂的对象。这个模式适用于:某…...

String a = new String(“abc“); 创建了几个对象?String a = “abc“; 呢?

String a new String(“abc”); 创建了几个对象?String a “abc”; 呢? 答案:String a new String(“abc”); 创建了1个或2个对象;String a “abc”; 创建了0个或1个都对象 String a new String(“abc”); 创建过程 首先在…...

keepalived+nginx安装

欢迎使用ShowDoc! 1、安装基础包: yum -y install libnl libnl-devel 2、上传包: tar -zxvf keepalived-2.0.20.tar.gz -C /data/imas/base_soft mkdir -p /data/imas/base_soft/keepalived cd /data/imas/base_soft/keepalived-2.0.20 .…...

硬盘格式化工具,强烈推荐这个!

案例:硬盘格式化工具推荐 【我的电脑已经用了好几年了,硬盘存储容量严重不够了,最近想把它格式化,但却不知道怎么操作,大家有什么比较好的硬盘格式化工具可以推荐吗?】 硬盘作为存储设备,我们…...

Python的异常捕获和处理

程序在运行过程当中,不可避免的会出现一些错误,比如:使用了没有赋值过的变量,使用了不存在的索引,一个数字除以0 …… 这些错误在程序中,我们称其为异常。 程序运行过程中,一旦出现异常将会导致…...

oracle学习之rownum和rowid

rownum先百度一波https://www.cnblogs.com/xfeiyun/p/16355165.html rownum是oracle特有的一个关键字。 对于基表,在insert记录时,oracle就按照insert的顺序,将rownum分配给每一行记录,因此在select一个基表的时候,r…...

为什么说过早优化是万恶之源?

Donald Knuth(高德纳)是一位计算机科学界的著名学者和计算机程序设计的先驱之一。他被誉为计算机科学的“圣经”《计算机程序设计艺术》的作者,提出了著名的“大O符号”来描述算法的时间复杂度和空间复杂度,开发了TeX系统用于排版…...

如何用 ModelScope 实现 “AI 换脸” 视频

前言 当下,视频内容火爆,带有争议性或反差大的换脸视频总能吸引人视线。虽然 AI 换脸在市面上已经流行了许久,相关制作工具或移动应用也是数不胜数。但是多数制作工具多数情况下不是会员就是收费,而且替换模板有限。以下在实战的角…...

怎么样成为一名Python工程师?到底要会哪些东西?你会了多少?

目录 重点:爬虫部分项目、源码展示python数据分析可视化大屏看板python爬虫爬取淘宝卤鸭货商品数据python游戏开发python自动化办公 重点: 1、做一名程序员,绝对要耐得住寂寞,并且要一直有点兴趣促进你学习。如果你完全没兴趣&am…...