当前位置: 首页 > news >正文

科大讯飞勾勒生成式AI输入法“模样”,开启下一代输入法革命

回顾国内第三方输入法赛道近十余年的发展,移动互联网的市场红利催生了科大讯飞、百度、搜狗等颇具规模和实力的头部厂商。与此同时,历经多年、多方角逐,第三方输入法市场进入存量阶段,升级技术、优化用户体验来挖掘存量,成为决定竞争胜负的关键。

恰逢ChatGPT引爆AI技术新浪潮,AI大模型浪潮滚滚而来,科技巨头们争相竞逐。10月24日,2023年科大讯飞全球1024开发者节“生成式AI输入法论坛”拉开帷幕,现场讯飞发布面向下一代输入法的生成式AI,并落地于讯飞输入法13.0(行业首款生成式AI输入法),开启生成式AI输入时代。

新产品层出不穷,世事在不断变化。一边是快速变化的用户需求,另一边是快速迭代的技术,传统第三方输入法工具已经不能满足新时代用户需求,新型第三方输入法缓缓站上舞台。

从“打字工具”到“AI生成式表达”

这些年,技术、场景和需求的改变倒逼第三方输入法工具不断演变升级:在9键和26键键盘输入、手写输入等输入方式的基础上,增加语音输入、OCR扫描等多元化的输入方式。第三方输入法用户可以明显感受到,输入方式越来越多,输入效率也在不断提升。

现在,AI新技术涌现,移动互联网快速发展,用户的工作、生活方式发生了很大的变化,所以对输入法产生新的需求——更智能的生成式AI的表达。

一方面,用户希望第三方输入法能够提供更智能化、个性化的功能,以提升输入体验。当代年轻人喜欢社交,热衷于分享图片和视频,高质量文案的需求随之增加,然而很多人没有足够的时间或者写作能力进行创作,且传统输入方式无法满足这种需求,因而对新一代第三方输入法提出了智慧表达的高要求。

另一方面,用户希望第三方输入法智能连接多元服务,以实现智慧的生活方式。试想,通过第三方输入法与其他应用和服务进行无缝连接,例如:从输入法直接访问在线购物平台、社交媒体、地图导航、快递查询等等常用服务,那生活多便捷和美好。

为此,输入法厂商纷纷推出自有的“输入法+AI大模型”的方案,而无论市场风起云涌,还是沉浮低迷,讯飞输入法一直走在行业前沿。今年8月,讯飞输入法率先发布基于大模型的“AI创作助手”,此次发布的13.0版本更是全面进化,让人耳目一新。

渐进的讯飞输入法:三个维度持续创新

为什么说讯飞输入法已经走在了这一趋势的最前沿?因为讯飞持续在产品定位、功能和设计等三个维度上发力,给用户带来了颠覆性的体验。

在定位方面,讯飞输入法立志打造拥有智慧表达、智能连接,可自进化和自适应的新一代“生成式AI输入法”。产品定位关乎目标市场、产品差异化、价值主张、品牌形象和市场位置等多个方面,是企业战略中至关重要的一环,影响着竞争的胜败。

移动互联网时代,人们对输入法的需求是高效率和自然、流畅的人机交互体验,因而讯飞输入法聚焦输入效率和准确性,提供多种输入方式,使得输入更加轻松和高效。特别是在语音输入领域,讯飞输入法解决了方言、语种、离线、噪声、轻声、混输等识别难题,可以说用“语音输入”定义了上一代输入法。

大模型时代,人们在高效率的基础上增加了智能化、个性化、场景化的需求,讯飞输入法专注于更智能化的生成表达和连接服务。具体表现在新版本内置量身定制的输入法认知大模型,该模型是基于讯飞星火大模型发布的聚焦“智慧输入”领域的专业大模型,和常规通用大模型相比,能力更加垂直,服务更加深度,拥有生成化、个性化、场景化和自进化的特点。可以说,在AI基座方面,讯飞为面向下一代的输入法打下了坚实的基础。

显然,在产品定位方面,讯飞输入法不仅仅考虑到了满足当前市场需求,还预测了未来的趋势和需求。

在功能服务方面,讯飞生成式AI输入法以用户为中心,用更高效、更稳定的链接,撬动更多内容和服务;用更自然的人机交互方式,降低学习和使用门槛。

其一,智慧表达能力更强,讯飞生成式AI输入法能够理解和利用上下文信息,例如前文内容、语境和用户意图,进行智能润色、补全、生成用户表达。其二,智能连接范围更广,讯飞生成式AI输入法可根据用户不同场景输入内容和用户输入意图,连接电商、搜索等多元服务。其三,赋能生态内容,讯飞生成式AI输入法加入大模型的多模态能力,可进行个性化定制,满足了不同用户尤其是年轻一代的需求。

在设计方面,讯飞输入法保持设计创新初心,以更好的用户体验为出发点,致力于打造更加符合市场需求、更加实用和美观的产品,摆脱刻板设计印象,实现多维突破。

讯飞生成式AI输入法创新设计“活力视界”界面(点击左上角讯飞键展开菜单面板,再点击“活力视界”即可展示),在屏幕与按键之间采用双行显示,以多个卡片贴的设计,动态化、多元化的展示助手功能,和输入法传统的界面布局相比,更显高效、便捷和新意。

此外,讯飞输入法键盘合理区分输入和推荐,让用户信息查找、浏览更高效,还重新整合电商、搜索、翻译、AI校对等服务,让用户选择和操作更方便。“新布局”“新交互”“新整合”,多维创新下,讯飞输入法整体性能和效果让人眼前一亮。作为全新的设计——“活力视界”支持卡片功能的自由组合,能够让用户获得Feed流式的交互体验。

不得不说,讯飞输入法在智慧创新的路上砥砺前行,通过在产品定位、功能服务和交互设计三个维度的持续创新,勾勒出了生成式AI输入法该有的样子。

击穿产品壁垒,背后是头部厂商“AI力”的全面提升

这一代讯飞输入法的发布,我们看到一个在方方面面都很领先的产品,预示着传统输入法产品壁垒已被击穿,新一代输入法已成型。而这背后是头部输入法厂商多年以来慢慢积累起来的AI技术能力的全面提升。

一来,头部输入法厂商算法、算力、数据等大模型核心能力的提升,促进了“大模型+输入法”方案的成熟,打破了传统输入法产品的“输入边界”。

众所周知,AI大模型是“大数据+大算力+强算法”结合的产物,自AI大模型迎来风口后,大到BAT、华为,小到各大领域的独角兽领域或独立自研、或联合研发大模型产品,算法、算力、数据需求全面爆发。

在这个过程中,以科大讯飞为代表的头部输入法厂商,通过投入大量研发资源,在大模型技术的研发和应用上取得了突破性进展,他们建立多个深度学习计算平台,积累海量的语料数据,开发高效的训练模型,让输入法产品有了更强的技术支撑。

也正因为新一代输入法产品搭载输入法认知大模型,其文本生成、多语言语音、多模态生成等能力全面提升,具备更强大的生成式和多模态协同的AI能力,不仅提高了输入效率和质量,还能够自主学习和适应不同的的语境,令用户体验更好。

二来,头部输入法厂商数据积累和大规模数据分析能力的提升,升级了传统输入法产品的个性化服务体验。

如果把AI大模型比作汽车的话,数据是汽油,没有数据大模型跑不久也跑不远,而且数据量是让大模型更聪明,让产品更智能的关键。在当下,数据量不足是很多大模型厂商共同的难题,不过以讯飞输入法为代表的头部输入法厂商,拥有海量的用户基础和资源,无论是数据分析能力还是数据量都有很大的优势。

头部厂商将积累的大量数据资本用于训练和优化模型,提供更准确和个性化的输入服务,这种个性化的体验将吸引来更多的用户。可以说,头部第三方厂商通过深入研究“大模型+输入法”,将生成式AI输入法的创新应用推向了一个新的高度。

三来,头部输入法厂商打造万物智能的“输入生态”,实现跨设备间的无缝交互和整合,拓宽了输入法产品的商业化空间。

近几年,头部输入法厂商积极与各大应用和内容创作者的合作,构建开放的生态系统,这种万物智能的“输入生态”的建立,不仅提高了用户的使用便利性和效率,也为输入法厂商带来了更多的商业机会。

根据讯飞输入法提供的《输入法内容生态用户年度洞察》可知,输入法的内容消费00后居多,占比甚至超过60%,对他们而言,键盘皮肤、字体、表情包、语录都是他们的个性资产。

一方面,头部输入法厂商不局限于通过原有自产的内容来满足用户,而是搭建内容生态平台,吸引创作者一起带动内容生态的飞轮效应。值得一提的是,像讯飞输入法还让社区里的用户参与到内容生态中,与年轻用户玩在一起。

另一方面,头部输入法厂商通过持续提升产品的底层能力,例如动画能力、交互能力、引擎能力,打造指尖更多创意玩法,像重力感应、摇一摇、语音交互、VR视觉等融入其中,赋以户独特的体验。

总之,头部输入法厂商除了利用先进的大模型技术提供个性化、准确地输入服务,还赋能内容生产方面,构建开放的内容生态系统,满足用户对更多元化输入体验的需求,还将输入法拓展到了更广阔的领域,这使得那些在传统输入法范式下内耗的产品逐渐失去市场竞争力,而那些已经展望未来并取得顺利进展的输入法则处于有利地位。

配图来自Canva可画

产品创新一小步,行业发展一大步

讯飞输入法产品创新的一小步,是行业发展的一大步。

首先,产品创新可以满足不断变化的消费者需求,提高产品的竞争力也刺激消费,推动整个行业的发展。

对于第三方输入法厂商来说,市场竞争激烈,消费者拥有众多选择,只有不断创新,才能在激烈的市场中脱颖而出。它们引入新技术、新设计和新功能来不断改善产品,使其具有更好的性能和用户体验,从而吸引年轻消费者使用和消费,对推动行业发展具有重要意义。

其次,产品创新引入新一代信息前沿技术,实现产品智能化转型和升级,提高了行业的可持续发展能力。

常言道:“科技是第一生产力”,第三方输入法厂商深耕算力、算法、数据,推动相关技术的研究和应用,而技术进步又反过来促进了更多的产品升级,形成良性循环,长此以往有助于提高行业可持续发展能力。

最后,产品创新通常需要联动新的应用和内容提供商,形成良性竞争和协同创新的氛围,将促进整个行业生态链的健康发展。产业链玩家强强联合是获取竞争优势的重要手段和策略之一,双方甚至多方共享资源,可以加快产品创新的速度和效果,无形中促进整个产业链的发展。

当然“谈创新”容易,“做创新”难,讯飞输入法坚持以用户为核心,深耕底层技术、长期持续投入、软硬件深度融合、大模型技术全面赋能以及联合和生态链伙伴,重新定义下一代输入法“生成式AI输入法”,看似容易实则不易。

未来,随着生成式AI输入法的全面普及,以讯飞输入法为代表的行业先行者将获得长足的增长……

相关文章:

科大讯飞勾勒生成式AI输入法“模样”,开启下一代输入法革命

回顾国内第三方输入法赛道近十余年的发展,移动互联网的市场红利催生了科大讯飞、百度、搜狗等颇具规模和实力的头部厂商。与此同时,历经多年、多方角逐,第三方输入法市场进入存量阶段,升级技术、优化用户体验来挖掘存量&#xff0…...

OV-VG: A Benchmark for Open-Vocabulary Visual Grounding

OV-VG: A Benchmark for Open-Vocabulary Visual Grounding 一、Abstract 写在前面 又是一周周末,光调代码去了,都没时间看论文了,汗。   这是一篇关于开放词汇定位的文章,也是近两年的新坑,但是资源也是需要不少。 …...

win10 javaweb 项目8080端口被占用

文章目录 前言出现场景:解决思路: 前言 提示:生活该走向何处?也许你还不知道答案,但是你一定是答案的一部分。 出现场景: 解决思路: 找到运行的进程直接干掉 打开命令窗口(win r…...

C语言每日一题(22)合并两个有序数组

力扣网 88. 合并两个有序数组 题目描述 给你两个按 非递减顺序 排列的整数数组 nums1 和 nums2,另有两个整数 m 和 n ,分别表示 nums1 和 nums2 中的元素数目。 请你 合并 nums2 到 nums1 中,使合并后的数组同样按 非递减顺序 排列。 注意…...

C++学习day--24 推箱子游戏图像化开发

环境要求: 1、VS2015以上 2、成功安装并配置图形库 项目注意事项:代码复制好以后,把下面的字符集改为多字节字符集 第 1 节 项目需求 实现一款推箱子游戏,效果如下图所示 , 具体规则: 1. 箱子只能推动而不能拉动…...

YOLOv8中的After Fuse指的是什么?

Fuse是指模型的一些模块进行融合。常见的就是conv和bn层进行融合,在训练的时候模型是存在conv和bn的,但在推理的过程中,模型在初始化的时候会进行模型fuse,把其中的conv和bn进行融合,通过一些数学转换把bn层融合到conv里面,还有一些例如DBB,RepVGG等等模块支持融合的这些在fuse…...

R-FCN: Object Detection via Region-based Fully Convolutional Networks(2016.6)

文章目录 AbstractIntroduction当前最先进目标检测存在的问题针对上述问题,我们提出... Our approachOverviewBackbone architecturePosition-sensitive score maps & Position-sensitive RoI pooling Related WorkExperimentsConclusion 原文链接 源代码 Abstr…...

Linux服务器部署Spring Boot项目的一些shell命令脚本

1.启动jar包的命令(根据jar包数量创建,并指定相对应的jar包) nohup java -server -Xms64m -Xmx128m -jar 项目jar包的名称.jar --spring.profiles.activeprod > 记录jar包的日志.log 2>&1 &可以写在start.sh文件里&#xff08…...

Youtube DNN:Deep Neural Networks for YouTube Recommendations

1.介绍 本文主要解决的三个挑战: 大规模的推荐场景,能够支持分布式训练和提供有效率的服务。不断更新的新物料。稀疏的用户行为,包含大量的噪声。 2.推荐系统 文章包含推荐系统的两阶段模型:召回和排序。 召回网络根据用户的历…...

Python 入门基础知识点有哪些?

Python是一种高级的、解释性的、面向对象的、动态类型语言,它在机器学习、数据分析、Web开发、科学计算等领域都有广泛的应用。下面是Python入门基础知识点的详细介绍。 1、变量和数据类型 在Python中,可以使用变量来存储数据。Python的数据类型包括整…...

【每日一题】补档 CF487B. Strip | 数据结构杂烩 -> 单调队列 | 困难

题目内容 原题链接 给定一个长度为 n n n 的数组,将这个数组进行拆分成若干个连续子数组, 使得每个子数组的最大值减去最小值小于等于 s s s , 且每个子数组的长度大于等于 l e n len len 。 问最少可以拆分成多少个连续子数组&#xff0…...

向量数据库和普通关系型数据库的区别,LAXCUS支持哪种数据库?

这是一位Laxcus用户在后台的提问,贴出来供大家参考: 1. 向量数据库与传统的关系型数据库主要有以下几个区别: 数据类型:向量数据库专门用于存储和查询向量数据,而传统数据库可以存储各种类型的数据,如文本…...

操作系统 --- 存储器管理

一、简答题 1.存储器管理的基本任务,是为多道程序的并发执行提供良好的存储器环境。请问好的存储器环境”应包含哪几个方面? 答: 2.内存保护是否可以完全由软件实现?为什么? 答:内存保护的主要任务是确保每…...

Python selenium无界面headless

视频版教程:一天掌握python爬虫【基础篇】 涵盖 requests、beautifulsoup、selenium Chrome-headless 模式, Google 针对 Chrome 浏览器 59版 新增加的一种模式,可以让你不打开UI界面的情况下使用 Chrome 浏览器,所以运行效果与 …...

JavaScript 中的负无穷大是什么?

在 JavaScript 中,负无穷大表示为 -Infinity。它是一个特殊的数值,用于表示比任何实数都要小的值。 负无穷大用于表示超出数值范围的情况,例如在进行数学计算时发生了溢出或出现了无法表示的结果。它可以通过将负无穷大赋值给变量或通过某些…...

2023年十大地推和网推拉新app推广接单平台,一手单渠道

做地推最重要的一定是找好项目,找好项目最关键的一定是地推app接任务平台,所以这十大靠谱的地推拉新接单平台,都是我们精心筛选的,2023年从事地推和网推拉新作业。 1:聚量推客 “聚量推客”汇聚了众多市场上有的和没有…...

mybatis-plus的进阶使用

文章目录 自定义xml的sql脚本配置mybaits的全局配置文件mybatis-plus优化&#xff0c;指定select数据库乐观锁mybatis-plus实现数据库乐观锁mybatis-plus实现逻辑删除 自定义xml的sql脚本 这里的使用和mybatis一样 编写mapper.xml文件 <?xml version"1.0" enc…...

centos安装vim编辑器

第一步检查centos的vim编辑器包是否完整 rpm -qa|grep vim //查看Vim编辑器需要安装的四个包是否完整 第二步&#xff1a;一般安装vim编辑器需要一下四个安装包&#xff0c;缺失了之后可对应下载 vim-minimal-7.4.160-2.el7.x86_64vim-common-7.4.160-4.el7.x86_64 v…...

PostgreSQL InvalidMessage Cache 同步机制

文章目录 背景InvalidMessages 基本类型InvalidMessages 数据结构概览共享内存 的 "ring-buffer" 结构Backend 本地的 InvalidMessages管理SharedInvalCatalogMsgSharedInvalCatcacheMsgSharedInvalRelcacheMsgSharedInvalSnapshotMsgSharedInvalSmgrMsgSharedInvalR…...

C#,数值计算——Globals的计算方法与源程序

1 文本格式 using System; using System.Text; namespace Legalsoft.Truffer { public static partial class Globals { //const int FLT_RADIX 2; //const int DBL_MANT_DIG 53; //const int INT_DIGITS 32; //const float FLT_…...

vscode(仍待补充)

写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用 侧边栏 vscode还能连接ssh&#xff1f; debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...

Opencv中的addweighted函数

一.addweighted函数作用 addweighted&#xff08;&#xff09;是OpenCV库中用于图像处理的函数&#xff0c;主要功能是将两个输入图像&#xff08;尺寸和类型相同&#xff09;按照指定的权重进行加权叠加&#xff08;图像融合&#xff09;&#xff0c;并添加一个标量值&#x…...

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架&#xff0c;支持"一次开发&#xff0c;多端部署"&#xff0c;可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务&#xff0c;为旅游应用带来&#xf…...

MySQL中【正则表达式】用法

MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现&#xff08;两者等价&#xff09;&#xff0c;用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例&#xff1a; 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

python报错No module named ‘tensorflow.keras‘

是由于不同版本的tensorflow下的keras所在的路径不同&#xff0c;结合所安装的tensorflow的目录结构修改from语句即可。 原语句&#xff1a; from tensorflow.keras.layers import Conv1D, MaxPooling1D, LSTM, Dense 修改后&#xff1a; from tensorflow.python.keras.lay…...

Chromium 136 编译指南 Windows篇:depot_tools 配置与源码获取(二)

引言 工欲善其事&#xff0c;必先利其器。在完成了 Visual Studio 2022 和 Windows SDK 的安装后&#xff0c;我们即将接触到 Chromium 开发生态中最核心的工具——depot_tools。这个由 Google 精心打造的工具集&#xff0c;就像是连接开发者与 Chromium 庞大代码库的智能桥梁…...

实战三:开发网页端界面完成黑白视频转为彩色视频

​一、需求描述 设计一个简单的视频上色应用&#xff0c;用户可以通过网页界面上传黑白视频&#xff0c;系统会自动将其转换为彩色视频。整个过程对用户来说非常简单直观&#xff0c;不需要了解技术细节。 效果图 ​二、实现思路 总体思路&#xff1a; 用户通过Gradio界面上…...

SpringAI实战:ChatModel智能对话全解

一、引言&#xff1a;Spring AI 与 Chat Model 的核心价值 &#x1f680; 在 Java 生态中集成大模型能力&#xff0c;Spring AI 提供了高效的解决方案 &#x1f916;。其中 Chat Model 作为核心交互组件&#xff0c;通过标准化接口简化了与大语言模型&#xff08;LLM&#xff0…...

comfyui 工作流中 图生视频 如何增加视频的长度到5秒

comfyUI 工作流怎么可以生成更长的视频。除了硬件显存要求之外还有别的方法吗&#xff1f; 在ComfyUI中实现图生视频并延长到5秒&#xff0c;需要结合多个扩展和技巧。以下是完整解决方案&#xff1a; 核心工作流配置&#xff08;24fps下5秒120帧&#xff09; #mermaid-svg-yP…...

LangChain 中的文档加载器(Loader)与文本切分器(Splitter)详解《二》

&#x1f9e0; LangChain 中 TextSplitter 的使用详解&#xff1a;从基础到进阶&#xff08;附代码&#xff09; 一、前言 在处理大规模文本数据时&#xff0c;特别是在构建知识库或进行大模型训练与推理时&#xff0c;文本切分&#xff08;Text Splitting&#xff09; 是一个…...