当前位置: 首页 > news >正文

科大讯飞勾勒生成式AI输入法“模样”,开启下一代输入法革命

回顾国内第三方输入法赛道近十余年的发展,移动互联网的市场红利催生了科大讯飞、百度、搜狗等颇具规模和实力的头部厂商。与此同时,历经多年、多方角逐,第三方输入法市场进入存量阶段,升级技术、优化用户体验来挖掘存量,成为决定竞争胜负的关键。

恰逢ChatGPT引爆AI技术新浪潮,AI大模型浪潮滚滚而来,科技巨头们争相竞逐。10月24日,2023年科大讯飞全球1024开发者节“生成式AI输入法论坛”拉开帷幕,现场讯飞发布面向下一代输入法的生成式AI,并落地于讯飞输入法13.0(行业首款生成式AI输入法),开启生成式AI输入时代。

新产品层出不穷,世事在不断变化。一边是快速变化的用户需求,另一边是快速迭代的技术,传统第三方输入法工具已经不能满足新时代用户需求,新型第三方输入法缓缓站上舞台。

从“打字工具”到“AI生成式表达”

这些年,技术、场景和需求的改变倒逼第三方输入法工具不断演变升级:在9键和26键键盘输入、手写输入等输入方式的基础上,增加语音输入、OCR扫描等多元化的输入方式。第三方输入法用户可以明显感受到,输入方式越来越多,输入效率也在不断提升。

现在,AI新技术涌现,移动互联网快速发展,用户的工作、生活方式发生了很大的变化,所以对输入法产生新的需求——更智能的生成式AI的表达。

一方面,用户希望第三方输入法能够提供更智能化、个性化的功能,以提升输入体验。当代年轻人喜欢社交,热衷于分享图片和视频,高质量文案的需求随之增加,然而很多人没有足够的时间或者写作能力进行创作,且传统输入方式无法满足这种需求,因而对新一代第三方输入法提出了智慧表达的高要求。

另一方面,用户希望第三方输入法智能连接多元服务,以实现智慧的生活方式。试想,通过第三方输入法与其他应用和服务进行无缝连接,例如:从输入法直接访问在线购物平台、社交媒体、地图导航、快递查询等等常用服务,那生活多便捷和美好。

为此,输入法厂商纷纷推出自有的“输入法+AI大模型”的方案,而无论市场风起云涌,还是沉浮低迷,讯飞输入法一直走在行业前沿。今年8月,讯飞输入法率先发布基于大模型的“AI创作助手”,此次发布的13.0版本更是全面进化,让人耳目一新。

渐进的讯飞输入法:三个维度持续创新

为什么说讯飞输入法已经走在了这一趋势的最前沿?因为讯飞持续在产品定位、功能和设计等三个维度上发力,给用户带来了颠覆性的体验。

在定位方面,讯飞输入法立志打造拥有智慧表达、智能连接,可自进化和自适应的新一代“生成式AI输入法”。产品定位关乎目标市场、产品差异化、价值主张、品牌形象和市场位置等多个方面,是企业战略中至关重要的一环,影响着竞争的胜败。

移动互联网时代,人们对输入法的需求是高效率和自然、流畅的人机交互体验,因而讯飞输入法聚焦输入效率和准确性,提供多种输入方式,使得输入更加轻松和高效。特别是在语音输入领域,讯飞输入法解决了方言、语种、离线、噪声、轻声、混输等识别难题,可以说用“语音输入”定义了上一代输入法。

大模型时代,人们在高效率的基础上增加了智能化、个性化、场景化的需求,讯飞输入法专注于更智能化的生成表达和连接服务。具体表现在新版本内置量身定制的输入法认知大模型,该模型是基于讯飞星火大模型发布的聚焦“智慧输入”领域的专业大模型,和常规通用大模型相比,能力更加垂直,服务更加深度,拥有生成化、个性化、场景化和自进化的特点。可以说,在AI基座方面,讯飞为面向下一代的输入法打下了坚实的基础。

显然,在产品定位方面,讯飞输入法不仅仅考虑到了满足当前市场需求,还预测了未来的趋势和需求。

在功能服务方面,讯飞生成式AI输入法以用户为中心,用更高效、更稳定的链接,撬动更多内容和服务;用更自然的人机交互方式,降低学习和使用门槛。

其一,智慧表达能力更强,讯飞生成式AI输入法能够理解和利用上下文信息,例如前文内容、语境和用户意图,进行智能润色、补全、生成用户表达。其二,智能连接范围更广,讯飞生成式AI输入法可根据用户不同场景输入内容和用户输入意图,连接电商、搜索等多元服务。其三,赋能生态内容,讯飞生成式AI输入法加入大模型的多模态能力,可进行个性化定制,满足了不同用户尤其是年轻一代的需求。

在设计方面,讯飞输入法保持设计创新初心,以更好的用户体验为出发点,致力于打造更加符合市场需求、更加实用和美观的产品,摆脱刻板设计印象,实现多维突破。

讯飞生成式AI输入法创新设计“活力视界”界面(点击左上角讯飞键展开菜单面板,再点击“活力视界”即可展示),在屏幕与按键之间采用双行显示,以多个卡片贴的设计,动态化、多元化的展示助手功能,和输入法传统的界面布局相比,更显高效、便捷和新意。

此外,讯飞输入法键盘合理区分输入和推荐,让用户信息查找、浏览更高效,还重新整合电商、搜索、翻译、AI校对等服务,让用户选择和操作更方便。“新布局”“新交互”“新整合”,多维创新下,讯飞输入法整体性能和效果让人眼前一亮。作为全新的设计——“活力视界”支持卡片功能的自由组合,能够让用户获得Feed流式的交互体验。

不得不说,讯飞输入法在智慧创新的路上砥砺前行,通过在产品定位、功能服务和交互设计三个维度的持续创新,勾勒出了生成式AI输入法该有的样子。

击穿产品壁垒,背后是头部厂商“AI力”的全面提升

这一代讯飞输入法的发布,我们看到一个在方方面面都很领先的产品,预示着传统输入法产品壁垒已被击穿,新一代输入法已成型。而这背后是头部输入法厂商多年以来慢慢积累起来的AI技术能力的全面提升。

一来,头部输入法厂商算法、算力、数据等大模型核心能力的提升,促进了“大模型+输入法”方案的成熟,打破了传统输入法产品的“输入边界”。

众所周知,AI大模型是“大数据+大算力+强算法”结合的产物,自AI大模型迎来风口后,大到BAT、华为,小到各大领域的独角兽领域或独立自研、或联合研发大模型产品,算法、算力、数据需求全面爆发。

在这个过程中,以科大讯飞为代表的头部输入法厂商,通过投入大量研发资源,在大模型技术的研发和应用上取得了突破性进展,他们建立多个深度学习计算平台,积累海量的语料数据,开发高效的训练模型,让输入法产品有了更强的技术支撑。

也正因为新一代输入法产品搭载输入法认知大模型,其文本生成、多语言语音、多模态生成等能力全面提升,具备更强大的生成式和多模态协同的AI能力,不仅提高了输入效率和质量,还能够自主学习和适应不同的的语境,令用户体验更好。

二来,头部输入法厂商数据积累和大规模数据分析能力的提升,升级了传统输入法产品的个性化服务体验。

如果把AI大模型比作汽车的话,数据是汽油,没有数据大模型跑不久也跑不远,而且数据量是让大模型更聪明,让产品更智能的关键。在当下,数据量不足是很多大模型厂商共同的难题,不过以讯飞输入法为代表的头部输入法厂商,拥有海量的用户基础和资源,无论是数据分析能力还是数据量都有很大的优势。

头部厂商将积累的大量数据资本用于训练和优化模型,提供更准确和个性化的输入服务,这种个性化的体验将吸引来更多的用户。可以说,头部第三方厂商通过深入研究“大模型+输入法”,将生成式AI输入法的创新应用推向了一个新的高度。

三来,头部输入法厂商打造万物智能的“输入生态”,实现跨设备间的无缝交互和整合,拓宽了输入法产品的商业化空间。

近几年,头部输入法厂商积极与各大应用和内容创作者的合作,构建开放的生态系统,这种万物智能的“输入生态”的建立,不仅提高了用户的使用便利性和效率,也为输入法厂商带来了更多的商业机会。

根据讯飞输入法提供的《输入法内容生态用户年度洞察》可知,输入法的内容消费00后居多,占比甚至超过60%,对他们而言,键盘皮肤、字体、表情包、语录都是他们的个性资产。

一方面,头部输入法厂商不局限于通过原有自产的内容来满足用户,而是搭建内容生态平台,吸引创作者一起带动内容生态的飞轮效应。值得一提的是,像讯飞输入法还让社区里的用户参与到内容生态中,与年轻用户玩在一起。

另一方面,头部输入法厂商通过持续提升产品的底层能力,例如动画能力、交互能力、引擎能力,打造指尖更多创意玩法,像重力感应、摇一摇、语音交互、VR视觉等融入其中,赋以户独特的体验。

总之,头部输入法厂商除了利用先进的大模型技术提供个性化、准确地输入服务,还赋能内容生产方面,构建开放的内容生态系统,满足用户对更多元化输入体验的需求,还将输入法拓展到了更广阔的领域,这使得那些在传统输入法范式下内耗的产品逐渐失去市场竞争力,而那些已经展望未来并取得顺利进展的输入法则处于有利地位。

配图来自Canva可画

产品创新一小步,行业发展一大步

讯飞输入法产品创新的一小步,是行业发展的一大步。

首先,产品创新可以满足不断变化的消费者需求,提高产品的竞争力也刺激消费,推动整个行业的发展。

对于第三方输入法厂商来说,市场竞争激烈,消费者拥有众多选择,只有不断创新,才能在激烈的市场中脱颖而出。它们引入新技术、新设计和新功能来不断改善产品,使其具有更好的性能和用户体验,从而吸引年轻消费者使用和消费,对推动行业发展具有重要意义。

其次,产品创新引入新一代信息前沿技术,实现产品智能化转型和升级,提高了行业的可持续发展能力。

常言道:“科技是第一生产力”,第三方输入法厂商深耕算力、算法、数据,推动相关技术的研究和应用,而技术进步又反过来促进了更多的产品升级,形成良性循环,长此以往有助于提高行业可持续发展能力。

最后,产品创新通常需要联动新的应用和内容提供商,形成良性竞争和协同创新的氛围,将促进整个行业生态链的健康发展。产业链玩家强强联合是获取竞争优势的重要手段和策略之一,双方甚至多方共享资源,可以加快产品创新的速度和效果,无形中促进整个产业链的发展。

当然“谈创新”容易,“做创新”难,讯飞输入法坚持以用户为核心,深耕底层技术、长期持续投入、软硬件深度融合、大模型技术全面赋能以及联合和生态链伙伴,重新定义下一代输入法“生成式AI输入法”,看似容易实则不易。

未来,随着生成式AI输入法的全面普及,以讯飞输入法为代表的行业先行者将获得长足的增长……

相关文章:

科大讯飞勾勒生成式AI输入法“模样”,开启下一代输入法革命

回顾国内第三方输入法赛道近十余年的发展,移动互联网的市场红利催生了科大讯飞、百度、搜狗等颇具规模和实力的头部厂商。与此同时,历经多年、多方角逐,第三方输入法市场进入存量阶段,升级技术、优化用户体验来挖掘存量&#xff0…...

OV-VG: A Benchmark for Open-Vocabulary Visual Grounding

OV-VG: A Benchmark for Open-Vocabulary Visual Grounding 一、Abstract 写在前面 又是一周周末,光调代码去了,都没时间看论文了,汗。   这是一篇关于开放词汇定位的文章,也是近两年的新坑,但是资源也是需要不少。 …...

win10 javaweb 项目8080端口被占用

文章目录 前言出现场景:解决思路: 前言 提示:生活该走向何处?也许你还不知道答案,但是你一定是答案的一部分。 出现场景: 解决思路: 找到运行的进程直接干掉 打开命令窗口(win r…...

C语言每日一题(22)合并两个有序数组

力扣网 88. 合并两个有序数组 题目描述 给你两个按 非递减顺序 排列的整数数组 nums1 和 nums2,另有两个整数 m 和 n ,分别表示 nums1 和 nums2 中的元素数目。 请你 合并 nums2 到 nums1 中,使合并后的数组同样按 非递减顺序 排列。 注意…...

C++学习day--24 推箱子游戏图像化开发

环境要求: 1、VS2015以上 2、成功安装并配置图形库 项目注意事项:代码复制好以后,把下面的字符集改为多字节字符集 第 1 节 项目需求 实现一款推箱子游戏,效果如下图所示 , 具体规则: 1. 箱子只能推动而不能拉动…...

YOLOv8中的After Fuse指的是什么?

Fuse是指模型的一些模块进行融合。常见的就是conv和bn层进行融合,在训练的时候模型是存在conv和bn的,但在推理的过程中,模型在初始化的时候会进行模型fuse,把其中的conv和bn进行融合,通过一些数学转换把bn层融合到conv里面,还有一些例如DBB,RepVGG等等模块支持融合的这些在fuse…...

R-FCN: Object Detection via Region-based Fully Convolutional Networks(2016.6)

文章目录 AbstractIntroduction当前最先进目标检测存在的问题针对上述问题,我们提出... Our approachOverviewBackbone architecturePosition-sensitive score maps & Position-sensitive RoI pooling Related WorkExperimentsConclusion 原文链接 源代码 Abstr…...

Linux服务器部署Spring Boot项目的一些shell命令脚本

1.启动jar包的命令(根据jar包数量创建,并指定相对应的jar包) nohup java -server -Xms64m -Xmx128m -jar 项目jar包的名称.jar --spring.profiles.activeprod > 记录jar包的日志.log 2>&1 &可以写在start.sh文件里&#xff08…...

Youtube DNN:Deep Neural Networks for YouTube Recommendations

1.介绍 本文主要解决的三个挑战: 大规模的推荐场景,能够支持分布式训练和提供有效率的服务。不断更新的新物料。稀疏的用户行为,包含大量的噪声。 2.推荐系统 文章包含推荐系统的两阶段模型:召回和排序。 召回网络根据用户的历…...

Python 入门基础知识点有哪些?

Python是一种高级的、解释性的、面向对象的、动态类型语言,它在机器学习、数据分析、Web开发、科学计算等领域都有广泛的应用。下面是Python入门基础知识点的详细介绍。 1、变量和数据类型 在Python中,可以使用变量来存储数据。Python的数据类型包括整…...

【每日一题】补档 CF487B. Strip | 数据结构杂烩 -> 单调队列 | 困难

题目内容 原题链接 给定一个长度为 n n n 的数组,将这个数组进行拆分成若干个连续子数组, 使得每个子数组的最大值减去最小值小于等于 s s s , 且每个子数组的长度大于等于 l e n len len 。 问最少可以拆分成多少个连续子数组&#xff0…...

向量数据库和普通关系型数据库的区别,LAXCUS支持哪种数据库?

这是一位Laxcus用户在后台的提问,贴出来供大家参考: 1. 向量数据库与传统的关系型数据库主要有以下几个区别: 数据类型:向量数据库专门用于存储和查询向量数据,而传统数据库可以存储各种类型的数据,如文本…...

操作系统 --- 存储器管理

一、简答题 1.存储器管理的基本任务,是为多道程序的并发执行提供良好的存储器环境。请问好的存储器环境”应包含哪几个方面? 答: 2.内存保护是否可以完全由软件实现?为什么? 答:内存保护的主要任务是确保每…...

Python selenium无界面headless

视频版教程:一天掌握python爬虫【基础篇】 涵盖 requests、beautifulsoup、selenium Chrome-headless 模式, Google 针对 Chrome 浏览器 59版 新增加的一种模式,可以让你不打开UI界面的情况下使用 Chrome 浏览器,所以运行效果与 …...

JavaScript 中的负无穷大是什么?

在 JavaScript 中,负无穷大表示为 -Infinity。它是一个特殊的数值,用于表示比任何实数都要小的值。 负无穷大用于表示超出数值范围的情况,例如在进行数学计算时发生了溢出或出现了无法表示的结果。它可以通过将负无穷大赋值给变量或通过某些…...

2023年十大地推和网推拉新app推广接单平台,一手单渠道

做地推最重要的一定是找好项目,找好项目最关键的一定是地推app接任务平台,所以这十大靠谱的地推拉新接单平台,都是我们精心筛选的,2023年从事地推和网推拉新作业。 1:聚量推客 “聚量推客”汇聚了众多市场上有的和没有…...

mybatis-plus的进阶使用

文章目录 自定义xml的sql脚本配置mybaits的全局配置文件mybatis-plus优化&#xff0c;指定select数据库乐观锁mybatis-plus实现数据库乐观锁mybatis-plus实现逻辑删除 自定义xml的sql脚本 这里的使用和mybatis一样 编写mapper.xml文件 <?xml version"1.0" enc…...

centos安装vim编辑器

第一步检查centos的vim编辑器包是否完整 rpm -qa|grep vim //查看Vim编辑器需要安装的四个包是否完整 第二步&#xff1a;一般安装vim编辑器需要一下四个安装包&#xff0c;缺失了之后可对应下载 vim-minimal-7.4.160-2.el7.x86_64vim-common-7.4.160-4.el7.x86_64 v…...

PostgreSQL InvalidMessage Cache 同步机制

文章目录 背景InvalidMessages 基本类型InvalidMessages 数据结构概览共享内存 的 "ring-buffer" 结构Backend 本地的 InvalidMessages管理SharedInvalCatalogMsgSharedInvalCatcacheMsgSharedInvalRelcacheMsgSharedInvalSnapshotMsgSharedInvalSmgrMsgSharedInvalR…...

C#,数值计算——Globals的计算方法与源程序

1 文本格式 using System; using System.Text; namespace Legalsoft.Truffer { public static partial class Globals { //const int FLT_RADIX 2; //const int DBL_MANT_DIG 53; //const int INT_DIGITS 32; //const float FLT_…...

Vue记事本应用实现教程

文章目录 1. 项目介绍2. 开发环境准备3. 设计应用界面4. 创建Vue实例和数据模型5. 实现记事本功能5.1 添加新记事项5.2 删除记事项5.3 清空所有记事 6. 添加样式7. 功能扩展&#xff1a;显示创建时间8. 功能扩展&#xff1a;记事项搜索9. 完整代码10. Vue知识点解析10.1 数据绑…...

Spring Boot 实现流式响应(兼容 2.7.x)

在实际开发中&#xff0c;我们可能会遇到一些流式数据处理的场景&#xff0c;比如接收来自上游接口的 Server-Sent Events&#xff08;SSE&#xff09; 或 流式 JSON 内容&#xff0c;并将其原样中转给前端页面或客户端。这种情况下&#xff0c;传统的 RestTemplate 缓存机制会…...

【机器视觉】单目测距——运动结构恢复

ps&#xff1a;图是随便找的&#xff0c;为了凑个封面 前言 在前面对光流法进行进一步改进&#xff0c;希望将2D光流推广至3D场景流时&#xff0c;发现2D转3D过程中存在尺度歧义问题&#xff0c;需要补全摄像头拍摄图像中缺失的深度信息&#xff0c;否则解空间不收敛&#xf…...

生成 Git SSH 证书

&#x1f511; 1. ​​生成 SSH 密钥对​​ 在终端&#xff08;Windows 使用 Git Bash&#xff0c;Mac/Linux 使用 Terminal&#xff09;执行命令&#xff1a; ssh-keygen -t rsa -b 4096 -C "your_emailexample.com" ​​参数说明​​&#xff1a; -t rsa&#x…...

【AI学习】三、AI算法中的向量

在人工智能&#xff08;AI&#xff09;算法中&#xff0c;向量&#xff08;Vector&#xff09;是一种将现实世界中的数据&#xff08;如图像、文本、音频等&#xff09;转化为计算机可处理的数值型特征表示的工具。它是连接人类认知&#xff08;如语义、视觉特征&#xff09;与…...

Java入门学习详细版(一)

大家好&#xff0c;Java 学习是一个系统学习的过程&#xff0c;核心原则就是“理论 实践 坚持”&#xff0c;并且需循序渐进&#xff0c;不可过于着急&#xff0c;本篇文章推出的这份详细入门学习资料将带大家从零基础开始&#xff0c;逐步掌握 Java 的核心概念和编程技能。 …...

使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台

🎯 使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台 📌 项目背景 随着大语言模型(LLM)的广泛应用,开发者常面临多个挑战: 各大模型(OpenAI、Claude、Gemini、Ollama)接口风格不统一;缺乏一个统一平台进行模型调用与测试;本地模型 Ollama 的集成与前…...

【数据分析】R版IntelliGenes用于生物标志物发现的可解释机器学习

禁止商业或二改转载&#xff0c;仅供自学使用&#xff0c;侵权必究&#xff0c;如需截取部分内容请后台联系作者! 文章目录 介绍流程步骤1. 输入数据2. 特征选择3. 模型训练4. I-Genes 评分计算5. 输出结果 IntelliGenesR 安装包1. 特征选择2. 模型训练和评估3. I-Genes 评分计…...

CSS设置元素的宽度根据其内容自动调整

width: fit-content 是 CSS 中的一个属性值&#xff0c;用于设置元素的宽度根据其内容自动调整&#xff0c;确保宽度刚好容纳内容而不会超出。 效果对比 默认情况&#xff08;width: auto&#xff09;&#xff1a; 块级元素&#xff08;如 <div>&#xff09;会占满父容器…...

【JVM】Java虚拟机(二)——垃圾回收

目录 一、如何判断对象可以回收 &#xff08;一&#xff09;引用计数法 &#xff08;二&#xff09;可达性分析算法 二、垃圾回收算法 &#xff08;一&#xff09;标记清除 &#xff08;二&#xff09;标记整理 &#xff08;三&#xff09;复制 &#xff08;四&#xff…...