当前位置：首页 > news >正文

【prompt实战】AI +OCR技术结合ChatGPT能力项目实践（BOL提单识别提取专家）

news 2025/12/28 19:51:40

本文原创作者：姚瑞南 AI-agent 大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）

1. 需求背景

2. 目标

3. BOL通用处理逻辑概述

3.1 基础信息部分

3.2 货物信息部分：

3.3 参考信息部分

BOL的处理结果要求

4. 逻辑梳理

1. BACKGROUND

2. 识别的主要字段

基础信息：

Reference 信息：

3. 格式要求

4. OCR文本清晰度

5. 目标受众

6. 输出示例

7. 特殊要求

8. 数据验证

5. 提示词优化

优化前prompt

优化策略

优化后prompt

中文版

英文版

6. 效果评估

7. 项目收益

1. 需求背景

在公司的运输业务中，BOL（提单）是关键文档，标志着运输的开始，并包含重要的运营信息。目前，不同客户使用不同的BOL模板和处理方式。开发一个单一客户的OCR 信息提取方案通常需要约一周时间，然后才能接入RPA的流程。事实上来说，对于我司而言，BOL中的关键信息具有通用性，可以使用AI的文字理解来解决这个问题。

2. 目标

通过AI +OCR 技术结合，让AI理解不同客户的BOL，并从中提取UNIS所需的关键信息，实现通用化的BOL解决方案，适配大部分客户的BOL模板。此方法确保数据提取的完整性、准确性和稳定性，并可在未来作为OCR-RPA自动化的直接输入源，直接将ChatGPT提取好的BOL数据对接业务系统录入，人工无需参与手动数据录入。

3. BOL通用处理逻辑概述

3.1 基础信息部分

以下信息是BOL的核心信息，尽量进行识别：

发货人(Shipper)/收货人(Consignee)姓名(可以为空)：
发货人(Shipper)/收货人(Consignee)地址(不可以为空)：查询TMS位置数据库，与现有Location 进行匹配。如果没有匹配项，选择最接近或标签为“EDI”的地址。
提货日期（Pick UP Date）(可以为空)： BOL签发日期。
特殊说明（Special Instruction）(可以为空)：如交货时间、特殊服务或托盘尺寸等。

3.2 货物信息部分：

包括但不限于Pallet #、Piece #、Weight、NMFC #/Class，货物描述。通常情况下会有Customer Information 和 Carrier Information 两种描述，需要都列举识别结果。

3.3 参考信息部分

在客户的BOL中有些参考信息，对于串联业务非常有帮助，需要按如下的逻辑进行和处理，有一定的按优先级要求：

Load Number (#)：非常重要的字段，用于EDI传输。通过识别BOL中的关键词：“Load Number (#)”、“Load ID”、“ME ID”或“SID (#)”来获取。
Shipper Reference (#)：次重要字段，通过识别BOL中的关键词：“Shipper Number (#)”、“Shipping Number (#)”、“Customer Ref (#)”或“Additional Ref (#)”获取。
Purchase Order (#)：通过识别BOL中的关键词：“P.O. Number (#)”、“PO (#)”来获取
Sales Order (#)”：通过识别BOL中的关键词：“Sales Order”来获取
DN Number：通过识别BOL中的关键词：“Delivery Note (#)”、“DN #”或“Delivery Number”提取。
Bill of Lading Number #：通过识别BOL中的关键词：“Sales Order”来获取“BOL Number (#)”来获取参考信息(Reference information)的特殊处理逻辑：

Load Number (#)需要重点识别，如果识别不到，请使用以下逻辑进行替代处理

当无法识别Load Number (#)时，但能获取 Shipper REF 信息，应使用 Shipper REF (#) 来替代Load Number (#)
当无法识别Load Number (#)和 Shipper REF 时，但能获取Bill of lading Number时，可以用Bill of Lading Number 来替代Load Number (#)

REF/BOL 也需要重点识别，如果识别不到，请使用以下逻辑进行替代处理(---待定)

当无法识别 Bill of lading # 时，但能获取 Customer REF #信息，应使用Customer REF # 来替代REF/BOL 信息
当无法识别 Bill of lading # 和 Customer REF #都无法识别到，可以用PO # 来替代

BOL的处理结果要求

AI处理BOL 的识别结果应该分为3个部分

基础信息（发件人，收货人，Pickup 时间，Spcial instruction ）
货物信息(Customer info/Carrier inforamtion)
参考信息(LOAD #/Shipper REF/PurchaseOrder /DN number/Bill of Loading #识别结果应保持稳定的格式，对于识别不完整或缺失的信息，系统应给予提示’Not recongnize‘。针对多页BOL，系统需识别并合并信息。

需要提取附件PDF格式的文字对应到不同位置；

4. 逻辑梳理

1. BACKGROUND

你是一个在物流行业的专家，你需要自动识别取提单（BOL，Bill of Lading）上的关键信息，以便用于货物跟踪、清关和物流管理。目的是准确识别和提取BOL上的重要信息字段，并确保数据的完整性和一致性。

2. 识别的主要字段

基础信息：

发货人信息（Shipper Information）：包括发货人的名称、地址、联系方式等。
收货人信息（Consignee Information）：包含收货人的名称、地址和联系方式。
货物信息（Description of Goods）：列出货物的详细信息，包括名称、Pallet数量、Pieces，TYPE,Weigh,NMFC#，Class等信息。通常情况下，有Customer Order Information 和 Carrier Information，需要分别识别并提取
PICKUP DATE：提单签发日期及其他重要日期。
Special Instructions: BOL的特别提示，比如Delivery 时间，特别要求

Reference 信息：

Load Number (#)：通过识别 BOL 中的关键词，如 Manifest Number (#)、ME ID 或 Shipment Number (#) 获取。
Shipper REF (#)：通过识别 BOL 中的关键词，如 Shipper Number (#)、Shipping Number (#)、Customer Ref (#) 或 Additional Ref (#) 获取
Purchase Order (#)：通过识别 BOL 中的关键词，如 P.O. Number (#)、PO (#) 或 CustomerOrder (#) 获取。
DN Number：通过识别关键词 Delivery Note (#) 获取。
Bill of Lading Number (#)：通过识别 BOL 中的 BOL number (#) 关键字获取， • 需要更新到 TMS 中的 Manifest.Cust.BOL 字段。

3. 格式要求

输出应为结构化数据，如JSON或XML格式，便于数据的进一步处理。
若可能，有层次结构以方便嵌套字段（例如发货人和收货人信息中包含子字段，如名称和地址）。货物信息中包

1. 需求背景

2. 目标

3. BOL通用处理逻辑概述

3.1 基础信息 部分

3.2 货物信息部分：

3.3 参考信息部分

BOL的处理结果要求

4. 逻辑梳理

1. BACKGROUND

2. 识别的主要字段

基础信息：

Reference 信息：

3. 格式要求

相关文章：

3.1 基础信息部分