当前位置：首页 > news >正文

Gpt翻译完整版

news 2026/5/19 0:28:13

上一篇文章收到了很多小伙伴的反馈，总结了一下主要以下几点：

1. 说不知道怎么调api

2. 目前只是把所有的中文变成了英文，如果想要做多语言还需要把这些关键字提炼出来成放到message_zh.properties和message_en.properties文件中，否则的话这样的翻译没有意义，后续如果要加俄语或阿拉伯语就没办法进行动态切换了

3. 日志中的中文不需要做多语言，只有返回前端的数据需要做多语言

所以针对上面三点，我又对代码做了些改动，来让整个国际化更加智能。

直接上代码，代码解决了第二个和第三个问题

import json
import os
import re
import tempfile
import shutil
import difflibfrom pydantic import BaseModelfrom OpenAIClient import client# 判断文本中是否包含中文字符（这里只检测实际内容，不包括缩进）
def has_chinese(text: str) -> bool:return bool(re.search(r"[\u4e00-\u9fff]", text))# 调用大语言模型进行翻译的函数
def translate_text(text: str) -> str:return get_completion(text)class TransResult(BaseModel):result: strkey: strvalue_zh: strvalue_en: str# gpt-4o-mini
def get_completion_eng_word(code_segment, model="gpt-4o-mini"):# return 'return Result.error("FILE_UPLOAD_FAILED，" + state.getState());'messages = [{"role": "system","content": ("你是一个专业的代码国际化助手。请将代码中所有的中文提示信息翻译成英文。翻译后的英文应该简短、准确，并且遵循以下规则：""1. 使用单个英文单词来表示中文内容，如果一个中文句子由多个词组成，请用下划线连接多个单词。""2. 所有被翻译的英文单词应全部用小写。未翻译的单词保持原状""3. 请确保替换后的翻译尽量简洁，避免过长的英文描述。""4. 保持代码结构和格式不变，仅替换中文字符串内容。不改变代码的其它部分。"'5. 如果输入的代码中字符串中需要拼接变量的，类似 return Result.succeed("导入数据成功，一共【"+rowNum+"】行"); ,需要把变量提取出来，当成参数传入，输出应为：’''{"result":"return Result.succeed("import_data_success_count", rowNum);", "key":"import_data_success_count", "value_zh":"导入数据成功，一共【"+rowNum+"】行", "value_en":"The data import is successful, and there are a total of ["+rowNum+"] rows"}'"6. 输出的内容为一个json结构, 包含result，为翻译之后完整的结果（结果中可能有双引号需要做转义），key为翻译出来的以下划线连接的那个单词， value_zh为原来的中文，value_en为原来的中文直接翻译的英文的句子""例如:""请翻译以下代码："'@NotEmpty(message = "前置经纬度不能为空")'"输出应为："'{"result":"@NotEmpty(message = "pre_points_is_empty")", "key":"pre_points_is_empty", "value_zh":"前置经纬度不能为空", "value_en":"pre points is empty"}'"请翻译以下代码："'throw new BusinessException("获取分布式锁失败,请稍后再试");'"输出应为："""'{"result":"throw new BusinessException("get_lock_error");", "key":"get_lock_error", "value_zh":"获取分布式锁失败,请稍后再试", "value_en":"Failed to obtain distributed locks, please try again later"}'),},{"role": "user", "content": f"请翻译以下代码：\n{code_segment}"},]response1 = client.beta.chat.completions.parse(model=model,messages=messages,temperature=0,response_format=TransResult,)return response1.choices[0].message.parseddef get_completion(code_segment, model="gpt-4o-mini"):messages = [{"role": "system","content": ("你是一个专业的代码翻译助手。请将代码中的中文文本翻译成英文，""保持代码结构和格式不变，仅替换字符串内容。保持变量名和函数名不变。""你只需要输出翻译之后的内容，不需要添加额外的其它的内容，""输出与输入除了翻译的内容变化，其它应该完全保持完全一致，不要输出markdown的格式。"),},{"role": "user", "content": f"请翻译以下代码：\n{code_segment}"},]response1 = client.chat.completions.create(model=model,messages=messages,temperature=0,)return response1.choices[0].message.content# 定义全局数组来存储翻译结果
translated_values_zh = []
translated_values_en = []# 处理单个文件：逐行读取，遇到中文的行进行翻译替换，同时保留原有缩进
def process_file(file_path: str, max_line_length: int = 2000, special_keywords: list = None
) -> None:temp_file = tempfile.NamedTemporaryFile(mode="w", delete=False, encoding="utf-8")try:with open(file_path, "r", encoding="utf-8") as f:for line in f:# 提取行的前导缩进和实际内容（去除换行符）indent_match = re.match(r"^(\s*)", line)indent = indent_match.group(1) if indent_match else ""content = line[len(indent) :].rstrip("\n")if has_chinese(content):# 如果content中包含Result或包含@NotNull，或包含@Size或包含@NotEmpty，则用另一种方式进行翻译if any(keyword in content for keyword in special_keywords):translated_json = get_completion_eng_word(content)# 提取result, key, value_zh, value_entranslated_line = translated_json.resultkey = translated_json.keyvalue_zh = translated_json.value_zhvalue_en = translated_json.value_entranslated_line = "\n".join(indent + part for part in translated_line.splitlines())line = translated_line + "\n"print(f"Processed: {file_path}, zh: {key} = {value_zh}, en: {key} = {value_en}")translated_values_zh.append(f"{key}={value_zh}")translated_values_en.append(f"{key}={value_en}")else:translated_line = translate_text(content)# 保留每一行的缩进translated_line = "\n".join(indent + part for part in translated_line.splitlines())line = translated_line + "\n"temp_file.write(line)temp_file.close()shutil.move(temp_file.name, file_path)except Exception as e:print(f"Error processing {file_path}: {e}")if os.path.exists(temp_file.name):os.remove(temp_file.name)# 遍历目录，对指定后缀的文件进行处理
def process_directory(root_dir: str,file_extensions: list,special_keywords: list = None,max_line_length: int = 2000,
) -> None:for subdir, _, files in os.walk(root_dir):for file in files:if any(file.endswith(ext) for ext in file_extensions):file_path = os.path.join(subdir, file)process_file(file_path, max_line_length, special_keywords)if __name__ == "__main__":root_directory = "D:\\XX\\xxx\\"special_keywords = ["Result.","@NotNull","@Size","@NotEmpty","@NotBlank","@Pattern","@Min","@Max","Exception","Assert.",]extensions = [".java"]process_directory(root_directory, extensions, special_keywords)# 输出翻译结果到 .properties 文件with open("messages_zh.properties","w",encoding="utf-8",) as f_zh, open("messages_en.properties","w",encoding="utf-8",) as f_en:# 写入中文翻译结果for value in translated_values_zh:f_zh.write(value + "\n")# 写入英文翻译结果for value in translated_values_en:f_en.write(value + "\n")print("翻译结果已写入 translated_values_zh.properties 和 translated_values_en.properties 文件。")

这里使用了 pydantic 对输出的结果进行格式化为了json，相比上一篇的直接输出翻译后的结果优势是：可以让大模型同时提取其中的key和value_zh和value_en，这样可以直接把这两个结果写入properties配置文件，省去了自己生成properties文件的过程。

针对日志和注释不需要做多语言的，直接通过另一个propmt将中文全部翻译成英文即可。

再来看问题1，不知道怎么调api，非常简单

from openai import OpenAIopenai_api_key = "sk-xxxxxxxxxxxxxxxxxx"
openai_api_base = "https://api.gptsapi.net/v1"client = OpenAI(api_key=openai_api_key,base_url=openai_api_base,
)

因为openai需要翻墙到国外，所以我买了国内的代理的api，非常便宜，先冲5刀，一共也就一顿饭钱。我翻译了一整个项目才花了1.5刀，真是便宜哇。下面是我调用的记录，真是很省钱哇。

有了这个便宜的api我感觉我可以干好多事了，后续我也会用这个api来做各种智能化的应用，欢迎关注我。另外，我这边也同步开通了哔站，录了一些视频来更加透彻的带大家来一起学习AI，让AI成为我们最忠实的硅基家人。

哔站主页

魔幻AI人的个人空间-魔幻AI人个人主页-哔哩哔哩视频哔哩哔哩魔幻AI人的个人空间，提供魔幻AI人分享的视频、音频、文章、动态、收藏等内容，关注魔幻AI人账号，第一时间了解UP主动态。魔幻AI人，对AI如此痴迷https://space.bilibili.com/543835355?spm_id_from=333.1387.0.0

Gpt翻译完整版

相关文章：

Gpt翻译完整版

雷池WAF的为什么选择基于Docker

美股回测：历史高频分钟数据的分享下载与策略解析20250305

【文生图】windows 部署stable-diffusion-webui

[Python入门学习记录(小甲鱼)]第3章 Python基础知识

某系统webpack接口泄露引发的一系列漏洞

【计算机网络入门】初学计算机网络（十一）重要

决策树（Decision Tree）基础知识

Nat Mach Intell | AI分子对接算法评测

【自学笔记】Hadoop基础知识点总览-持续更新

【Linux】使用问题汇总

(二十二)趣学设计模式之备忘录模式！

交叉编译openssl及curl

【每日八股】计算机网络篇（三）：IP

Gartner：数据安全平台DSP提升数据流转及使用安全

从vue源码解析Vue.set()和this.$set()

深入浅出：UniApp 从入门到精通全指南

DeepSeek未来发展趋势：开创智能时代的新风口

阻塞队列的实现（线程案例）

http status是什么？常见的http状态码指的是什么意思？

AI应用开发框架nuwax：从快速构建到生产部署全解析

nardeas/ssh-agent：增强版SSH代理工具的设计、部署与实战应用

Linux驱动调试利器：debugfs接口设计与实现详解

IR 召回评测基准（英文数据集）——MS MARCO 实战指南

DDrawCompat v0.6.0：终极指南，让经典游戏在现代Windows系统完美重生

wBlock Safari扩展架构详解：5个内容拦截扩展的协同工作原理

基于改进型PCNN的不规则图像自适应分割算法研究

基于大语言模型构建智能思考伙伴：从原理到本地部署实践

ISO 11452-4 BCI测试补偿系数：从核心原理到工程校准的完整指南

YOLO26 + PySide6 采油井智能检测系统