当前位置: 首页 > news >正文

【TextIn:开源免费的AI智能文字识别产品(通用文档智能解析识别、OCR识别、文档格式转换、篡改检测、证件识别等)】

TextIn:开源免费的AI智能文字识别产品(通用文档智能解析识别、OCR识别、文档格式转换、篡改检测、证件识别等)

产品的官网:TextIn官网

希望感兴趣以及有需求的小伙伴们多多了解,因为这篇文章也是源于管网介绍才产出的,是智能文档处理的“百宝箱”,提升大家文档处理类工作效率,无论是工作中、学习中还是生活中,希望能成为大家高效的文档处理和识别的小助手!!!

首次官网注册使用享有免费福利哦

【产品福利】
100次通用文档解析
100次通用文字识别
100次智能文档抽取

以下是结合AI大模型实现的当下热门产品,为用户提供智能图像处理、文字表格识别、文档内容提取,保单票据智能抽取,通用文档解析百页pdf仅需2s,快来体验吧!

体验入口

文档解析:
https://cc.co/16YSLE
智能文档抽取:
https://cc.co/16YSLF

一、简介

TextIn是合合信息旗下智能文字识别产品,拥有智能文字识别技术和企业服务经验,产品提供公有云API、私有化部署、端侧SDK、AIoT(支持硬件设备集成,扫描仪、扫描笔等)多种部署方式,可查看详细的API文档:API文档。致力于为企业、开发者及个人用户提供一站式智能文字识别服务。TextIn智能文字识别引擎可以从图像和PDF文档中提取印刷、手写、印章、公式、表格、图片等富文本信息,支持50+多语言识别,众多文档类型,包括商业文件、发票、账单、收据、名片和海报。在财务共享系统中可以从混贴的发票中切分、分类、提取字段信息,支持发票中错行、倾斜、重叠、遮挡、形变、光照不均等复杂场景;在证件识别系统中支持13类国家证件识别,覆盖个人和企业所需的200+种证件识别;在人机结合系统中实现精准100%识别,远超越人类的辨识度;支持华为云、阿里云、腾讯云、百度云、Azure、AWS等云平台部署,同时支持GPU、CPU、NPU、iOS、Android、HarmonyOS、鲲鹏、飞腾、麒麟等主要国内外平台;TextIn识别引擎在通用场景中平均1s处理完一张文本图像。

总结就是:TextIn是合合信息公司旗下结合AI最新最高效的文字识别产品服务一站式平台,无论是企业、用户、还是开发者都可以使用,支持API请求访问、在线平台测试、私有化部署等,我个人用的比较多的场景还是文档解析、文档格式转换等、OCR票据识别等。公司我就不介绍了,旗下以下产品肯定有使用过的小伙伴吧。

在这里插入图片描述

二、背景

智能文字识别(OCR,Optical Character Recognition)技术通过将图像中的文字信息转换为可编辑的数字文本,帮助用户提高工作效率。随着深度学习和计算机视觉技术的快速发展,OCR 技术的准确性和应用范围不断提升。企业希望通过自动化工具减少人力成本,提高数据处理的速度和准确性,从而加速业务决策。目前,市场上已经出现了多种OCR解决方案,覆盖了从基础的文字识别到复杂的文档处理任务。这些解决方案通常依赖于深度学习模型来提升识别精度,适用于不同类型的文档,包括票据、合同、名片等。

然而,很多现有的OCR产品在实际应用中仍面临一些挑战,例如:

  1. 准确率不足:对于复杂排版或低质量图像,识别精度可能受到影响。
  2. 多场景支持不足:许多产品只能适用于特定场景,缺乏灵活性。
  3. 部署方式单一:传统产品往往局限于云端或本地部署,缺乏多样化选择。
TextIn的优势

TextIn以其高精准度和多场景化的产品设计,针对在私有领域的知识问答和企业知识管理领域,使用检索增强型生成模型(Retrieval-Augmented Generation, RAG)大模型(Large Language Model, LLM)已成为一种趋势,但是在RAG的文档预处理和检索阶段会出现由于解析精度不足导致LLM回答专业知识领域并不高效准确,公司自主研发的向量表征模型-acge_text_embedding,针对当前市场的痛点提供了有效解决方案。具体优势包括:

  • 高精准度识别引擎:TextIn采用先进的深度学习技术,经过大量真实场景的数据训练,确保在各种文档类型下均能实现高准确率。
  • 多种部署方式:支持云端、边缘和本地部署,满足不同用户的需求,无论是大企业还是中小型组织都可以根据自身情况选择最合适的部署方式。
  • 场景化产品设计:针对不同的业务场景,TextIn提供了定制化的解决方案,例如发票处理、合同扫描、证件识别等,大幅提升文档处理的效率。

对上述自研技术感兴趣的小伙伴可以访问【文档智能 & RAG】RAG新基建-RAG性能增强关键技术点及通用文档解析工具和开源Embedding模型,有效提升中文语义理解与召回,相信会给研究RAG的小伙伴带来启发!

三、文档解析

直接通过上面的链接进入,如下所示,填写手机号注册即可体验。

在这里插入图片描述

下面是通用文档解析的工作台界面,左边是一个可缩进的菜单,里面有“临时文件”的功能开关按钮,这里可以鼠标光标移动到“临时文件”旁边的圆形感叹号图标查看功能说明。

省流版本:TextIn(在线工作台)默认不存储您上传的任何文件,关闭或者刷新页面会清空文件列表,左下面的上传文件按钮也是可以点击上传文件的。

在这里插入图片描述

这里我们开启开关查看相关功能和说明,临时文件——>我的文件,但是文件数量过多,默认只保留最近30天的文件。上传文件支持的格式有:png、jpg、jpeg、pdf、bmp、tiff、webp、doc、docx、html、mhtml,单个文件大小不超过500MB

在这里插入图片描述

这里我们可以点击中间灰色区域任何地方或者拖拽文件到上面灰色区域即可,左上角还有“API文档、私有化部署、消耗次数0/100”的功能显示。左上角有一个“示例样本”,我们可以点击看看

在这里插入图片描述

这是一个包含了“13页的本科毕业论文排版格式文档”,我们可以清晰的对比左边是pdf格式原始文档和右边转换的markdown结果,原始文档中的表格、公式、图片、手写、原始JSON都会被智能解析出来,我们可以点击想要查看的内容,这里就不一一展示了哈。(tips:左边还有一个目录看到没?点击目录的多级标题中任意标题,中间的原始文档和右边转换的markdown结果会直接定义到你点击的标题内容版面中去,方便你检查文档解析的效果,超级直观好用!!!

接下来我们看看这个样例文本解析后的markdown结果右下角“编辑、高级模式、复制结果、导出结果”四个功能。

编辑:顾名思义就是可以在右侧的markdown结果中在线编辑里面的内容。里面的图片、公式都可以编辑修改,都是markdown语法的方式哦,不熟悉该格式的可以查看markdown教程简单学习下哈!

**高级模式:**里面有pdf密码、文件分辨率、解析起点页码、解析页数、识别标题、等多个参数设置,方便对文档解析有定向要求的用户使用,解码模型支持auto和scan方式,期待小伙伴自行尝试,这里就不一一展示了。

在这里插入图片描述

**复制结果:**就是复制markdown里面的结果。

**导出结果:**支持将解析后的文字导出保存,导出格式主要是md和txt格式,如果想要导出指定公式、图片等,可选择性的导出。记得在markdown里面显示,需要加在行内显示公式,使用单个美元符号;公式单独占一行,可以使用双美元符号。下面演示其中的公式
1 2 π ∫ R e − x 2 2 = 1 。 \frac { 1 } { \sqrt { 2 \pi } } \int _ { R } e ^ { - \frac { x ^ { 2 } } { 2 } } = 1 。 2π 1Re2x2=1

在这里插入图片描述

导出成md格式文件,展示效果如下:

在这里插入图片描述

这里我上传一篇OpenAI官网的《OpenAI ol System Card》的核心技术文档,个人体验感觉识别的很精准,识别速度很快,我这里识别了文档前20页。

在这里插入图片描述

这是上传前面一张md文档截图的识别效果:

在这里插入图片描述

小小总结:真的识别速度又快有准,小伙伴有其他格式的可以自行体验!

四、智能文档抽取

老规矩,体验入口还是我放在了简介前面了,这里你进入在线体验的,时候,会有新手指导,建议第一次使用的人可以看看详细的官方功能介绍。

在这里插入图片描述

这里还是先简单介绍下工作台面板,左边就是几个需要抽取内容的示例图片,中间就是需要文档抽取的文件,需要上传,右边是抽取的结果展示。

在这里插入图片描述

这里先随便使用一张示例图片来测试下效果(原始抽取字段):

在这里插入图片描述

下面是我添加几个字段后的识别内容:

在这里插入图片描述

接下来我会添加一张自己准备的电子保单的jpg图片,看看智能文档抽取的效果

在这里插入图片描述

这是导出结果的文件展示

在这里插入图片描述

这谁JSON显示的结果

在这里插入图片描述

这里我采用我们TextIn的宣传海报截取部分带有表格的海报用来识别,效果如下:

在这里插入图片描述

购物小票的识别,这里简单说明下,因为这个图片是样例小票,小票内容文本字段和默认字段并没有“支付金额”等明确字段名表示,但是还是能够识别出我想要表达的字段信息,还是比较优秀的,根据官网的说明,这里就是使用了依托于垂直领域的语义模型,就是结合了大模型去做的语义理解和高质量的基础数据预料作为模型的通识能力。

在这里插入图片描述

小小总结:识别的是真的快,抽取的字段又很准确!

总结

TextIn是真的挺好用的,上面内容展示了文档解析和智能文档抽取,还有更多更好玩的OCR识别等你们体验,目前合合信息团队也将TextIn ParseX 项目开源了,不仅仅可以在线使用他们的服务,我们也可以本地部署该服务,这个再提供他们开源的github仓库地址:Parsex-Frontend,这里如果本地部署实践是需要我们去TextIn工作台申请API的,需要得到x-ti-app-idx-ti-secret-code两个密钥在打开本地项目-高级设置里面去填写这两个密钥就可以使用了,详细的项目结构就不介绍了,小伙伴可以自行去研究,以上内容是在在线平台上操作使用的,详细可以去TextIn工作台去体验,里面API文档支持在线调试功能等,希望小伙伴们多多分享使用经验,有任何疑问可以直接联系他们官网的客服人员反馈。

如需了解更多文档处理权益,欢迎点击下方链接,加入交流社群,随时获得最新资讯及福利。
百宝箱大礼包

相关文章:

【TextIn:开源免费的AI智能文字识别产品(通用文档智能解析识别、OCR识别、文档格式转换、篡改检测、证件识别等)】

TextIn:开源免费的AI智能文字识别产品(通用文档智能解析识别、OCR识别、文档格式转换、篡改检测、证件识别等) 产品的官网:TextIn官网 希望感兴趣以及有需求的小伙伴们多多了解,因为这篇文章也是源于管网介绍才产出的…...

C++语言有哪些常用语句?

1. 变量定义语句 在 C 中,首先要定义变量才能使用。例如 int a;定义了一个整型变量a。这是很基础的语句,它告诉编译器为变量a分配内存空间,用于存储整数值。 如果要定义多个相同类型的变量,可以写成 int a, b, c;除了基本数据类…...

linux alsa-lib snd_pcm_open函数源码分析(二)

​ 访问原版内容,可直接到博客 linux alsa-lib snd_pcm_open函数源码分析(二) https://blog.whatsroot.xyz/2020/08/12/alsa_snd_open-analysis-2/ 系列文章其他部分: linux alsa-lib snd_pcm_open函数源码分析(一) linux alsa-lib snd_pc…...

机翼的抖振与颤振

机翼的抖振与颤振 1. 机翼颤振:飞机设计的隐形杀手2. 机翼抖振:由气流不稳定性引起的振动3. 两种振动的区分和管理3.1 检测与预防 机翼的颤振和抖振是飞机设计和航空工程师面临的两个重要技术问题。这两种现象虽然都与机翼的振动相关,但它们的…...

React04 State变量 组件渲染

State变量 & 渲染和提交 State 变量state 变量的使用State 是隔离且私有的 组件渲染 State 变量 state 变量的使用 导入 useState import { useState } from react;定义一个 state 变量 const [index, setIndex] useState(0);useState 的唯一参数是 state 变量的初始值…...

【数据库系统概论】第3章 关系数据库标准语言SQL(一)数据查询(超详细)

目录 一、单表查询 1. 简单的数据查询 (1)选择表中若干列 (2)选择表中若干行(元祖) 2. 聚合函数与分组查询 聚集函数 GROUP BY分组查询 二、联接查询 1、连接概述 2. 内联接(INNER JO…...

mysql-恢复数据(日志管理)

前言 在mysql中我们有时候会出现误删除,或者其他的问题,我们可以通过mysql的日志进行恢复 操作 我们可以在mysql里面定义一个错误日志,方便我们可以排查是因为什么原因来解决mysql无法启动问题 ----------------------------------------…...

探索Unity:从游戏引擎到元宇宙体验,聚焦内容创作

unity是实时3D互动内容创作和运营平台,包括游戏开发、美术、建筑、汽车设计、影视在内的所有创作者,借助Unity将创意变成现实。提供一整套完善的软件解决方案,可用于创作、运营和变现任何实时互动的2D和3D内容,支持平台包括手机、…...

自动化测试类型与持续集成频率的关系

持续集成是敏捷开发的一个重要实践,可是究竟多频繁的集成才算“持续”集成? 一般来说,持续集成有3种常见的集成频率,分别是每分钟集成、每天集成和每迭代集成。项目组应当以怎样的频率进行集成,这取决于测试策略&…...

React 中组件通信的几种主要方式

一、父传子&#xff1a; 1. 传递多个属性 父组件可以通过 props 传递多个属性给子组件。 示例 // 子组件 function Son(props) {return (<div>This is Son, {props.name} - Age: {props.age}</div>); }// 父组件 function App() {const name This is App N…...

mint-ui Picker 显示异常

mint-ui Picker 显示异常 现象 最近一个老项目页面显示异常&#xff0c;使用mint-ui Picker显示异常,直接显示成了 数据对象&#xff0c;而不是具体travelName 字段 组件 mint-ui Picker 使用方式(vue方式) // template <mt-picker :slots"slots" value-key…...

深入理解 MySQL 中的日志类型及其应用场景

目录标题 MySQL 中的日志类型这么多,它们都有哪些作用?1.错误日志(Error Log)2.事务日志2.1 InnoDB Redo Log(重做日志)2.2 InnoDB Undo Log (撤消日志)3.查询日志(General Query Log)4.慢查询日志 (Slow Query Log)5.二进制日志(Binary Log)6.中继日志 (Relay Log)总结一下M…...

群控系统服务端开发模式-应用开发-上传配置功能开发

下面直接进入上传配置功能开发&#xff0c;废话不多说。 一、创建表 1、语句 CREATE TABLE cluster_control.nc_param_upload (id int(11) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT 编号,upload_type tinyint(1) UNSIGNED NOT NULL COMMENT 上传类型 1&#xff1a;本站 2&a…...

stm32——GPIO开发

目录 1、什么是GPIO 2、GPIO的作用 3、GPIO的基本结构 4、GPIO引脚的基本结构 5、GPIO端口模式的配置 1. 输入浮空&#xff08;Input Floating&#xff09; 2. 输入上拉&#xff08;Input Pull-Up&#xff09; 3. 输入下拉&#xff08;Input Pull-Down&#xff09; 4. …...

layui 自定义验证单选框必填

对于输入框类型必填验证&#xff0c;只需要在 input 输入框加入 lay-verify "required" 即可。但对于单选按钮这种特殊的该怎么办呢&#xff1f;layui 为我们提供了自定义验证。 1. 在单选按钮上添加自定义验证的名称 2. 验证规则如下 // 单选框自定义验证form.ve…...

Spring 设计模式之策略模式

Spring 设计模式之策略模式 策略模式构成部分java举例 策略模式 策略模式&#xff1a;允许定义一系列算法&#xff0c;并将每一个算法封装起来&#xff0c;使它们可以互相替换&#xff0c;且算法的变化可以独立于使用它们的客户端。 构成部分 Context&#xff08;上下文&…...

苹果开发 IOS 证书生成步骤

前提条件 你手上有一台 Macbook你的苹果账号已被添加到开发人员中 证书创建步骤 打开 XCode 直接生成 p12证书生成后&#xff0c;就可在苹果开发者管理界面中看到你的证书记录登录苹果开发中心&#xff0c;创建 profiles 文件&#xff0c;并下载以上步骤即可&#xff0c;就这…...

DDR2 SDRAM(五)初始化

因为DDR2本质上只是更高级的一种SRAM&#xff0c;底层操作原理和SRAM是一样的&#xff0c;所以很多基础的东西就不再赘述了。 一、原理 在初始化之前&#xff0c;DDR2芯片需要先上电&#xff0c;芯片有多个需要提供的电压&#xff0c;其大小和顺序也有要求&#xff0c;这部分…...

Python工具箱系列(五十七)

图像分割与人脸识别 众所周知图像是由若干有意义的像素组成的&#xff0c;图像分割作为计算机视觉的基础&#xff0c;对具有现有目标和较精确边界的图像进行分割&#xff0c;实现在图像像素级别上的分类任务。图像分割可分为语义分割和实例分割两类&#xff0c;区别如下&#x…...

数据智能驱动金融策略优化:民锋智能分析技术的应用

在现代金融市场中&#xff0c;数据分析与智能化技术的结合为投资策略带来了全新机遇。民锋以智能分析技术为核心&#xff0c;帮助投资者在复杂的市场环境中做出高效决策。本文将深入探讨民锋智能分析技术如何驱动策略优化&#xff0c;为投资者带来更加智能化的支持。 #### 一、…...

docker详细操作--未完待续

docker介绍 docker官网: Docker&#xff1a;加速容器应用程序开发 harbor官网&#xff1a;Harbor - Harbor 中文 使用docker加速器: Docker镜像极速下载服务 - 毫秒镜像 是什么 Docker 是一种开源的容器化平台&#xff0c;用于将应用程序及其依赖项&#xff08;如库、运行时环…...

【WiFi帧结构】

文章目录 帧结构MAC头部管理帧 帧结构 Wi-Fi的帧分为三部分组成&#xff1a;MAC头部frame bodyFCS&#xff0c;其中MAC是固定格式的&#xff0c;frame body是可变长度。 MAC头部有frame control&#xff0c;duration&#xff0c;address1&#xff0c;address2&#xff0c;addre…...

使用分级同态加密防御梯度泄漏

抽象 联邦学习 &#xff08;FL&#xff09; 支持跨分布式客户端进行协作模型训练&#xff0c;而无需共享原始数据&#xff0c;这使其成为在互联和自动驾驶汽车 &#xff08;CAV&#xff09; 等领域保护隐私的机器学习的一种很有前途的方法。然而&#xff0c;最近的研究表明&…...

大模型多显卡多服务器并行计算方法与实践指南

一、分布式训练概述 大规模语言模型的训练通常需要分布式计算技术,以解决单机资源不足的问题。分布式训练主要分为两种模式: 数据并行:将数据分片到不同设备,每个设备拥有完整的模型副本 模型并行:将模型分割到不同设备,每个设备处理部分模型计算 现代大模型训练通常结合…...

让回归模型不再被异常值“带跑偏“,MSE和Cauchy损失函数在噪声数据环境下的实战对比

在机器学习的回归分析中&#xff0c;损失函数的选择对模型性能具有决定性影响。均方误差&#xff08;MSE&#xff09;作为经典的损失函数&#xff0c;在处理干净数据时表现优异&#xff0c;但在面对包含异常值的噪声数据时&#xff0c;其对大误差的二次惩罚机制往往导致模型参数…...

tomcat入门

1 tomcat 是什么 apache开发的web服务器可以为java web程序提供运行环境tomcat是一款高效&#xff0c;稳定&#xff0c;易于使用的web服务器tomcathttp服务器Servlet服务器 2 tomcat 目录介绍 -bin #存放tomcat的脚本 -conf #存放tomcat的配置文件 ---catalina.policy #to…...

抽象类和接口(全)

一、抽象类 1.概念&#xff1a;如果⼀个类中没有包含⾜够的信息来描绘⼀个具体的对象&#xff0c;这样的类就是抽象类。 像是没有实际⼯作的⽅法,我们可以把它设计成⼀个抽象⽅法&#xff0c;包含抽象⽅法的类我们称为抽象类。 2.语法 在Java中&#xff0c;⼀个类如果被 abs…...

向量几何的二元性:叉乘模长与内积投影的深层联系

在数学与物理的空间世界中&#xff0c;向量运算构成了理解几何结构的基石。叉乘&#xff08;外积&#xff09;与点积&#xff08;内积&#xff09;作为向量代数的两大支柱&#xff0c;表面上呈现出截然不同的几何意义与代数形式&#xff0c;却在深层次上揭示了向量间相互作用的…...

网页端 js 读取发票里的二维码信息(图片和PDF格式)

起因 为了实现在报销流程中&#xff0c;发票不能重用的限制&#xff0c;发票上传后&#xff0c;希望能读出发票号&#xff0c;并记录发票号已用&#xff0c;下次不再可用于报销。 基于上面的需求&#xff0c;研究了OCR 的方式和读PDF的方式&#xff0c;实际是可行的&#xff…...

接口 RESTful 中的超媒体:REST 架构的灵魂驱动

在 RESTful 架构中&#xff0c;** 超媒体&#xff08;Hypermedia&#xff09;** 是一个核心概念&#xff0c;它体现了 REST 的 “表述性状态转移&#xff08;Representational State Transfer&#xff09;” 的本质&#xff0c;也是区分 “真 RESTful API” 与 “伪 RESTful AP…...