当前位置: 首页 > article >正文

事件抽取:触发词检测、论元角色填充与篇章级事件理解

点击“AladdinEdu你的AI学习实践工作坊”注册即送-H卡级别算力沉浸式云原生集成开发环境80G大显存多卡并行按量弹性计费教育用户更享超低价。一、引言在人类语言所传递的信息中事件处于核心地位。我们阅读新闻是为了了解发生了什么事件我们讲述故事是在描述一连串事件的经过我们做决策往往基于对过去事件的总结和对未来事件的预测。事件Event是一种特定发生的行为或状态变化通常涉及参与者、时间、地点等要素。例如“2023年10月OpenAI在旧金山举办了首届开发者大会”其中包含一个“举办”事件触发词为“举办”参与者为“OpenAI”地点为“旧金山”时间为“2023年10月”。事件抽取Event Extraction, EE的任务正是从自由文本中自动识别出这样的事件结构信息。具体而言事件抽取通常包含以下子任务触发词检测Trigger Detection识别句子中表示事件发生的核心词或短语并判断其所属的事件类型。例如识别出“举办”是“会议活动”类事件的触发词。事件类型分类Event Type Classification为检测到的触发词分配预定义的事件类型如“出生”“攻击”“并购”“晋升”等。论元抽取Argument Extraction识别事件中充当特定角色的实体或短语即论元角色填充。例如在“举办”事件中“OpenAI”是“组织者”Agent“开发者大会”是“活动名称”Name“旧金山”是“地点”Place。事件共指消解Event Coreference Resolution判断不同句子中提及的事件是否为同一个事件实例。事件关系分类Event Relation Classification识别事件之间的因果、时序、子事件等关系。传统事件抽取研究主要聚焦于句子级别即假定事件的所有要素都在同一个句子中出现。然而现实文本中事件信息往往分布在多个句子甚至整个篇章中。例如某篇报道的第一段交代了会议举办的时间和地点第三段提到了主办方第五段描述了具体活动内容。要将这些分散的信息聚合为一个完整的事件实例就需要篇章级事件理解Document-level Event Understanding能力。事件抽取具有极高的应用价值。在金融领域从财经新闻中自动抽取并购、高管变动、业绩发布等事件可为量化投资和风险预警提供结构化数据支撑在安全领域从海量文本中检测暴恐、灾害、事故等事件有助于应急响应和态势感知在医疗领域从电子病历中抽取症状、诊断、用药等事件可辅助临床决策和流行病监测在知识图谱构建中事件是动态知识的重要载体能够丰富知识库的时序和因果推理能力。然而事件抽取面临诸多技术挑战自然语言表达的歧义性“苹果”可以指水果或公司、同一事件的多样表述“去世”“离世”“逝世”均表示死亡事件、论元角色的隐式表达省略主语或宾语、跨句论元的关联困难等。早期的事件抽取系统依赖于手工编写的模式规则和特征工程耗费大量人力且泛化能力有限。深度学习的兴起为事件抽取带来了端到端的表示学习能力预训练语言模型的爆发则进一步推动了性能的提升。近年来研究者开始将事件抽取转化为机器阅读理解、序列到序列生成等更灵活的形式以更好地利用预训练知识。本文将围绕事件抽取的三大核心主题——触发词检测、论元角色填充与篇章级事件理解——展开系统论述。第二节介绍事件抽取的任务定义与经典数据集第三节详述触发词检测的技术演进第四节深入论元角色填充的方法体系第五节聚焦篇章级事件理解的挑战与前沿模型第六节对比分析不同方法并展望未来方向。力求为读者呈现一幅全面而深入的事件抽取技术图谱。二、事件抽取基础与任务定义2.1 事件的定义与表示在信息抽取领域最广为接受的事件定义来自自动内容抽取Automatic Content Extraction, ACE评测项目。ACE将事件定义为“涉及参与者的特定发生的事”每个事件由触发词Trigger和一组论元Argument构成。触发词是能够清晰指示事件发生的词或短语通常为动词、名词或形容词论元则是事件涉及的实体、时间、地点、数值等填充特定角色的要素。例如在ACE2005数据集中句子“John married Mary in Boston last Sunday.”的事件标注为触发词married事件类型Life.Marry论元Person角色Arg1JohnPerson角色Arg2MaryPlace角色BostonTime角色last SundayACE定义了8种事件大类和33种子类并规定了每个事件类型下可能的论元角色。除了ACE另一个常用的评测基准是TAC KBPKnowledge Base Population的事件抽取任务其事件本体更加丰富且强调跨文档的事件聚合。近年来MAVEN大规模事件检测数据集、RAMS角色标注多句数据集、WikiEvents文档级事件抽取等新数据集的推出极大地推动了事件抽取在更真实、更具挑战性场景下的研究。2.2 事件抽取的传统方法在深度学习成为主流之前事件抽取主要采用基于模式规则和基于统计特征的方法。基于模式的方法依赖于专家构建的词汇-句法模式。例如对于“出生”事件可编写模式[PERSON] 出生于 [LOCATION]、[PERSON] 在 [LOCATION] 出生等。这类方法在垂直领域精确率高但编写和维护成本高昂且难以覆盖自然语言的丰富变化。基于特征工程的机器学习方法将事件抽取分解为分类任务。对于触发词检测对句子中的每个词提取其词法、句法、语义特征使用最大熵或SVM分类器判断其是否为触发词以及事件类型。对于论元抽取则对候选触发词-实体对提取特征判断该实体是否充当某个论元角色。特征通常包括词汇特征词本身、词性、大小写、词干等。句法特征依存路径、短语结构树片段、句法角色等。语义特征实体类型、WordNet上位词、FrameNet框架等。尽管特征工程能够达到一定的性能但其依赖大量外部知识库和解析器存在错误传播问题且难以捕捉深层次的语义关联。2.3 事件抽取的深度学习范式随着深度学习技术的发展事件抽取进入了神经网络时代。主流的深度学习方法可分为以下范式基于序列标注的联合模型将触发词识别和论元抽取统一到序列标注框架中对句子中的每个词分配一个复合标签如B-Trigger、I-Argument等。基于分类的流水线模型先识别触发词再针对每个触发词抽取其论元。CNN、RNN、BERT等模型被广泛用于编码句子表示。基于机器阅读理解的模型将事件抽取转化为问答任务例如提问“事件的触发词是什么”“事件的参与者是谁”。基于生成式的模型利用序列到序列模型直接生成事件的结构化表示如JSON、三元组列表。近年来预训练语言模型PLM如BERT、RoBERTa、BART等在事件抽取任务上取得了统治级表现。通过微调PLM模型能够更好地利用深层语义和外部知识。下面将详细阐述触发词检测、论元角色填充和篇章级事件理解的具体技术。三、触发词检测触发词检测是事件抽取的第一步其目标是在句子中定位触发事件的核心词并分类事件类型。这是一个典型的序列标注或词级别多分类问题。3.1 基于特征和早期神经网络的方法在深度学习早期研究者使用CNN和RNN模型对句子进行编码然后对每个词进行分类。DMCNNDynamic Multi-pooling CNN, Chen et al., 2015是早期经典模型之一。其核心思想是对于一个候选触发词根据其在句子中的位置将卷积特征图切分为两部分词之前和词之后分别进行最大池化以保留触发词的位置结构信息。拼接后的向量送入分类器进行事件类型预测。BiLSTM-CRF框架也被广泛用于触发词检测。BiLSTM捕获双向上下文CRF层对标签序列进行全局归一化避免非法标签转移如I-Trigger紧跟在O之后。然而这些方法仍然依赖词向量和位置嵌入对复杂语境和一词多义的建模能力有限。3.2 基于预训练语言模型的触发词检测BERT等预训练模型的出现极大提升了触发词检测的性能。典型的BERT微调流程如下输入序列[CLS] 句子文本 [SEP]BERT编码得到每个token的上下文表示h i \mathbf{h}_ihi​。对每个token通过一个线性层softmax预测其事件类型标签含非触发词标签“O”。为了充分利用BERT研究者提出了多种改进策略。例如DMBERTWang et al., 2019在BERT的基础上引入了动态池化机制显式地突出触发词周围的关键上下文。BERTCRF则在BERT顶层加上CRF层进行序列标签解码。代码示例基于BERT的触发词检测PyTorch TransformersfromtransformersimportBertTokenizer,BertForTokenClassificationimporttorch# 假设事件类型标签O, B-Attack, I-Attack, B-Transport, I-Transport 等id2label{0:O,1:B-Attack,2:I-Attack,3:B-Transport,4:I-Transport}label2id{v:kfork,vinid2label.items()}tokenizerBertTokenizer.from_pretrained(bert-base-uncased)modelBertForTokenClassification.from_pretrained(bert-base-uncased,num_labelslen(id2label))defpredict_triggers(sentence):inputstokenizer(sentence,return_tensorspt,truncationTrue,paddingTrue)withtorch.no_grad():outputsmodel(**inputs)logitsoutputs.logits predictionstorch.argmax(logits,dim-1)[0]tokenstokenizer.convert_ids_to_tokens(inputs[input_ids][0])triggers[]fortoken,predinzip(tokens,predictions):ifpred.item()!0:# 非Otriggers.append((token,id2label[pred.item()]))returntriggersprint(predict_triggers(The enemy attacked the village at dawn.))# 预期输出: [(attacked, B-Attack)]3.3 触发词检测的挑战与改进方向尽管BERT等方法效果显著触发词检测仍面临若干挑战类别不平衡大多数词不是触发词导致训练时负样本占主导。常用解决方案包括加权交叉熵、Focal Loss或数据增强。隐式触发词有些事件没有明确的触发词如“The company’s CEO stepped down.”中的“stepped down”是多词短语。模型需要能够处理短语级别的触发词识别。一词多触发同一个词在不同上下文中可能表示不同事件如“play”可以是“表演”事件也可以是“运动比赛”事件。需要更精细的语义消歧。域外泛化在新闻领域训练的模型迁移到社交媒体或生物医学领域时性能骤降需研究领域自适应方法。四、论元角色填充在检测到事件触发词之后需要识别句子中哪些实体或短语扮演了该事件的论元角色。论元角色填充Argument Role Filling是事件抽取中最具挑战性的子任务之一因为论元可能远离触发词也可能被省略且论元角色与句法结构密切相关。4.1 基于分类的论元抽取早期神经网络方法将论元抽取视为一个多分类任务对于给定的触发词和候选论元通常是句子中的实体提及判断它们之间是否存在某个论元角色关系。JRNNJoint RNN, Nguyen et al., 2016是一个经典的联合模型它使用双向RNN编码句子然后通过记忆矩阵和注意力机制同时进行触发词预测和论元分类。其核心思想是让触发词检测和论元抽取共享句子表示从而相互促进。DMCNN在触发词检测之后会为每个候选论元生成一个表示将句子表示根据触发词位置和候选论元位置切分为多段进行池化再拼接分类。这种方法显式编码了触发词与论元的相对位置信息对论元抽取至关重要。4.2 基于机器阅读理解的方法机器阅读理解MRC范式的引入为论元抽取带来了新的视角。EEQADu and Cardie, 2020将事件论元抽取转化为问答任务对于每种论元角色构造一个自然语言问题如“事件发生在哪里”针对Place角色模型从句子中抽取答案片段。具体流程针对事件类型和论元角色预先定义问题模板。例如对于Attack事件的Target角色问题为“Who was attacked?”。将问题和句子拼接输入BERT[CLS] 问题 [SEP] 句子 [SEP]。BERT编码后使用两个线性层预测答案的起始位置和结束位置抽取式MRC。这种方法的优势在于充分利用了预训练语言模型的问答能力特别适合处理隐式论元和长距离依赖。可灵活添加新事件类型和论元角色只需增加对应的问题模板。在少样本场景下表现优异因为问题本身携带了任务相关的先验知识。4.3 基于图神经网络的方法论元抽取中实体之间、实体与触发词之间存在着复杂的结构关系。图神经网络GNN被用来显式建模这些关系。Gated GCN for EENguyen and Grishman, 2018构建了一个包含实体提及、触发词、句子节点的异质图边包括句法依存边、共指边、句子-提及归属边等。通过多层门控GCN进行信息传递使得触发词表示能够融入相关实体的信息实体表示也能聚合全局句法上下文从而提升论元分类的准确性。OneIELin et al., 2020是一个端到端的图信息增强模型将信息抽取视为联合结构化预测问题。它构建了一个全局的实体-事件图并使用图注意力和信念传播机制进行全局推理同时优化实体识别、触发词检测、论元抽取和事件共指消解四个任务。OneIE在ACE2005上取得了SOTA性能证明了联合建模和全局推理的有效性。4.4 基于生成式的方法近年来序列到序列Seq2Seq生成模型被应用于事件抽取试图直接输出结构化的结果。TANLPaolini et al., 2021将事件抽取转化为增广自然语言的生成任务。例如对于事件结构(Attack, triggerattacked, Targetvillage)模型需要生成线性化文本[Attack] attacked [Target] village。Text2EventLu et al., 2021则采用T5模型将事件抽取视为从文本到事件记录的生成。给定输入句子模型直接生成形如EventType trigger Arg1 entity1 Arg2 entity2 ...的序列。这种生成式方法可以自然处理多事件、嵌套事件和变长论元且无需复杂的任务特定层设计。代码示例基于生成式的事件抽取简化版使用T5fromtransformersimportT5Tokenizer,T5ForConditionalGeneration tokenizerT5Tokenizer.from_pretrained(t5-small)modelT5ForConditionalGeneration.from_pretrained(t5-small)defextract_event(sentence):# 构造提示前缀input_textfextract event:{sentence}inputstokenizer(input_text,return_tensorspt)outputsmodel.generate(**inputs,max_length128)event_strtokenizer.decode(outputs[0],skip_special_tokensTrue)returnevent_strprint(extract_event(John married Mary in Boston.))# 可能输出: Life.Marry trigger married Person John Person Mary Place Boston4.5 论元抽取的挑战论元抽取的难点包括跨句论元论元可能不在触发词所在句子中。例如“John got married last Sunday. His wife is Mary.” 触发词“married”在第一句论元“Mary”在第二句。这需要模型具备跨句推理能力通常划归篇章级事件抽取范畴。隐式论元与指代消解论元常以代词或零形式出现需要共指消解技术将其链接到显式实体。重叠论元同一实体可能在多个事件中扮演不同角色模型需要准确区分。论元角色多标签性部分事件类型中一个实体可能同时担任多个角色需要多标签分类策略。五、篇章级事件理解传统事件抽取大多假设事件所有要素均在同一句子内但这与真实文本分布不符。据统计在新闻文档中约40%的事件论元分布在触发词所在句子之外Ebner et al., 2020。篇章级事件理解旨在从整篇文档中识别事件、链接跨句论元、消解事件共指并推理事件间关系形成完整的事件图谱。5.1 篇章级事件抽取的任务定义篇章级事件抽取Document-level Event Extraction, DEE包含以下子任务实体抽取与共指消解识别文档中所有的实体提及并将其链接到篇章级实体链。事件检测在文档中检测所有事件触发词并分类事件类型。论元角色填充为每个事件确定其论元论元可能是文档中任意位置的实体包括跨句实体。事件共指消解判断多个事件提及是否指向同一真实世界事件。事件关系分类识别事件之间的时序、因果、子事件等关系。典型的DEE数据集包括RAMS角色标注多句数据集包含9124个事件论元跨句平均2.3句、WikiEvents基于维基百科的文档级事件抽取同时标注了共指和关系以及DocEE中文文档级事件抽取。5.2 基于图神经网络的篇章级建模图神经网络因其对结构化信息的天然亲和性成为篇章级事件抽取的主流框架。文档图通常以实体提及、实体、句子、事件触发词等为节点边表示共指、句法、句子共现、篇章顺序等关系。GITGraph-based Interaction Model, Zhou et al., 2021是早期DEE模型之一。它构建了一个包含实体节点和句子节点的异质图通过多跳信息传播捕捉跨句的实体-事件关联。模型首先进行实体识别和事件检测然后将候选论元与触发词连接利用图网络计算每条边的得分最后解码出论元角色。DCFEEDocument-level Chinese Financial Event Extraction, Yang et al., 2018针对金融公告文档提出了一种基于关键句检测和篇章填充的策略先找出包含事件主要信息的句子再补充跨句论元。DE-PNNDocument-level Event extraction with Path-based Neural Network, Xu et al., 2021则利用依存树中的路径信息来建模跨句论元。对于每个跨句候选论元它提取触发词所在句与论元所在句之间的依存路径使用路径编码器判断关系。5.3 端到端篇章级事件抽取模型近年来研究者致力于开发端到端的DEE模型避免流水线错误传播。DocEETong et al., 2022提出了一种基于序列标注和跨度枚举的联合模型在文档级别直接预测(触发词, 事件类型, 论元角色, 论元实体)四元组。它采用基于Transformer的长文本编码器如Longformer对整个文档进行编码然后使用跨度分类器同时预测触发词和论元。PTPCGPrompt-based Two-stage Document-level Event Extraction, Liu et al., 2023将提示学习引入DEE。第一阶段利用提示模板对文档中的每个句子进行事件检测生成事件触发词候选第二阶段将文档、已检测事件和论元角色查询拼接通过生成式模型输出论元实体。这种方法在WikiEvents上取得了新的SOTA。5.4 事件共指消解与事件关系分类事件共指消解Event Coreference Resolution的目标是将文档中指向同一现实事件的多个事件提及归入同一共指链。例如文档中分别出现“地震发生在周一”“周一的灾难”“这次地震”等表述它们都应被链接到同一事件实例。常用方法包括基于孪生网络的方法对事件提及对进行编码预测二者是否共指。基于图聚类的端到端方法将所有事件提及构建成全连接图边权为共指概率然后使用图分割或谱聚类进行全局推理。事件关系分类主要关注时序关系和因果关系。时序关系Temporal Relation如“before”“after”“overlap”等可基于时间表达式、时态和上下文信息进行推断。因果关系Causal Relation更为复杂通常需要结合常识知识。近年来预训练语言模型在事件关系分类上表现优异但复杂篇章中的长距离因果链仍然是挑战。5.5 篇章级事件理解的挑战篇章级事件理解面临的挑战包括长距离依赖论元可能与触发词相距数句编码器需具备超长上下文建模能力。尽管Longformer、BigBird等模型可以处理长文档但计算开销大且信息可能被稀释。跨句推理某些论元需要多跳推理例如句子1“A公司收购了B公司”句子2“B公司位于北京”推断“A公司位于北京”。这需要模型具备推理链构建能力。信息冗余与缺失文档中可能包含大量无关句子或者事件的关键论元被隐含或省略模型需要去粗取精并进行合理推断。评测指标的局限性当前的DEE评测仍以严格匹配为主未能很好地反映模型在部分正确论元、指代模糊等情况下的真实能力。六、方法对比、应用与未来展望6.1 不同事件抽取方法的对比分析方法维度触发词检测论元角色填充篇章级事件理解主流模型BERT-CRF, DMCNN, MRCJRNN, OneIE, EEQA, Text2EventGIT, DocEE, PTPCG核心思想序列标注或词分类分类、MRC、生成式、图网络文档图建模、长文本编码、提示学习关键挑战隐式触发词、类别不平衡跨句论元、指代消解、角色歧义长距离依赖、多跳推理、篇章稀疏性优势技术成熟性能较高方法多样MRC和生成式灵活性好更贴近真实应用信息完整劣势依赖句子内上下文忽略跨句信息多数方法仍局限于句子级计算开销大数据标注困难6.2 事件抽取的实际应用场景事件抽取技术已在多个垂直行业落地金融情报从上市公司公告、财经新闻中抽取并购、高管变动、股权质押、业绩预告等事件构建事件驱动的投资分析系统。如路透社的金融事件抽取系统每天处理数百万条新闻。公共安全从社交媒体、暗网论坛中抽取暴恐、抗议、灾害、事故等事件支持安全态势感知和应急响应。例如美国国防高级研究计划局DARPA资助的LORELEI项目旨在从低资源语言文本中抽取灾难事件信息。医疗健康从电子病历、医学文献中抽取症状、诊断、用药、手术等事件辅助临床决策支持、药物不良反应监测和流行病学研究。法律科技从裁判文书中抽取案件事实、争议焦点、判决结果等事件辅助律师进行案例检索和法官进行类案推送。6.3 未来展望展望未来事件抽取技术可能在以下方向取得突破统一信息抽取大模型构建能够同时处理命名实体识别、关系抽取、事件抽取、共指消解等任务的统一信息抽取模型。谷歌的USM、DeepMind的Unified-IO等研究已展现统一范式的潜力。大型语言模型的零样本事件抽取ChatGPT、GPT-4等LLM在零样本和少样本事件抽取上表现出惊人的能力。未来研究将聚焦于如何设计有效的提示Prompt和上下文学习In-Context Learning策略充分激发LLM的事件理解能力并降低对标注数据的依赖。多模态事件抽取结合文本、图像、视频、音频等多模态信息进行事件抽取。例如从新闻视频中同时利用字幕文本和视觉帧图像检测事件提高准确性和覆盖面。多模态事件抽取在监控安防、体育赛事分析等领域应用前景广阔。可解释性与可信赖性当前深度模型如同黑箱在金融、法律等高风险领域难以获得用户信任。研发具备可解释性的事件抽取模型能够给出触发词、论元的决策依据和推理路径是未来应用的关键。持续学习与领域自适应现实世界的事件类型和论元角色不断演化模型需具备持续学习能力在不遗忘旧知识的前提下适应新事件类型。领域自适应技术也将使事件抽取模型更易迁移到低资源领域。事件知识图谱与推理将抽取的事件与现有知识图谱融合形成带时序的动态知识图谱并基于事件图谱进行因果推断、未来事件预测等高级推理任务。七、结语事件抽取作为自然语言处理从浅层理解迈向深层理解的关键环节承载着将非结构化文本转化为结构化事件知识的使命。从早期的手工规则到如今的预训练模型与图神经网络事件抽取技术经历了从符号主义到连接主义从句子级到篇章级从单一任务到联合建模的深刻变革。本文系统回顾了事件抽取的核心任务——触发词检测、论元角色填充和篇章级事件理解——的技术演进、经典模型与前沿探索。我们看到触发词检测得益于BERT等预训练模型已相对成熟论元抽取则因MRC和生成式方法的引入而变得更为灵活篇章级事件理解正成为新的研究高地图网络与长文本编码器的结合已初显成效。然而迈向真正的“事件理解”仍有漫漫长路。如何在开放域中识别无限可能的事件类型如何像人类一样综合文档中的只言片语拼凑出完整的事件图景如何让模型知其然更知其所以然这些问题呼唤着研究者们持续探索。事件是世界的脉搏。掌握了事件抽取技术我们便能够从文字的海洋中捕捉世界的每一次心跳为智能决策、知识发现和人类认知边界的拓展提供不竭的动力。期待未来出现更智能、更通用、更可信的事件抽取系统让机器更好地理解人类叙事辅助我们洞察过去、把握现在、预见未来。参考文献主要工作列举ACE (Automatic Content Extraction) Program. https://www.ldc.upenn.edu/collaborations/past-projects/aceChen, Y., Xu, L., Liu, K., Zeng, D., Zhao, J. (2015). Event extraction via dynamic multi-pooling convolutional neural networks.ACL.Nguyen, T. H., Cho, K., Grishman, R. (2016). Joint event extraction via recurrent neural networks.NAACL.Du, X., Cardie, C. (2020). Event extraction by answering (almost) natural questions.EMNLP.Lin, Y., Ji, H., Huang, F., Wu, L. (2020). A joint neural model for information extraction with global features.ACL.Paolini, G., Athiwaratkun, B., Krone, J., Ma, J., Achille, A., Anubhai, R., … Soatto, S. (2021). Structured prediction as translation between augmented natural languages.ICLR.Lu, Y., Lin, H., Xu, J., Han, X., Tang, J., Li, A., … Li, S. (2021). Text2Event: Controllable sequence-to-structure generation for end-to-end event extraction.ACL.Yang, H., Chen, Y., Liu, K., Xiao, Y., Zhao, J. (2018). DCFEE: A document-level Chinese financial event extraction system based on automatically labeled training data.ACL.Zhou, Y., Chen, Y., Zhao, J., Wu, Y., Xu, J., Li, J. (2021). Document-level event argument extraction by graph-based interaction model.EMNLP.Tong, M., Wang, P., Xu, B., Lin, Y., Hou, L. (2022). DocEE: A document-level event extraction dataset and baseline.EMNLP.Liu, J., Chen, Y., Xu, J., Zhao, J. (2023). Prompt-based two-stage document-level event extraction.ACL.Ebner, S., Xia, P., Culkin, R., Rawlins, K., Van Durme, B. (2020). Multi-sentence argument linking.ACL.点击“AladdinEdu你的AI学习实践工作坊”注册即送-H卡级别算力沉浸式云原生集成开发环境80G大显存多卡并行按量弹性计费教育用户更享超低价。

相关文章:

事件抽取:触发词检测、论元角色填充与篇章级事件理解

点击 “AladdinEdu,你的AI学习实践工作坊”,注册即送-H卡级别算力,沉浸式云原生集成开发环境,80G大显存多卡并行,按量弹性计费,教育用户更享超低价。 一、引言 在人类语言所传递的信息中,事件处…...

AppUpdate完整指南:10分钟掌握Android应用更新库

AppUpdate完整指南:10分钟掌握Android应用更新库 【免费下载链接】AppUpdate Android App update library. Android版本更新库,简单、轻量、可随意定制 项目地址: https://gitcode.com/gh_mirrors/app/AppUpdate AppUpdate是一款专为Android开发者…...

Sharetribe Go社区管理技巧:如何运营活跃的交易社区

Sharetribe Go社区管理技巧:如何运营活跃的交易社区 【免费下载链接】sharetribe Sharetribe Go is Sharetribes old source-available marketplace software, which was also available as a hosted SaaS product. Sharetribe Go is no longer actively maintained…...

GO-FLY国际化与多语言支持:面向全球用户的客服系统

GO-FLY国际化与多语言支持:面向全球用户的客服系统 【免费下载链接】goflylivechat 开源在线客服系统GO语言开发GO-FLY,免费在线客服系统/GOFLY LIVE CHAT: open source self-hosted private cloud customer support live chat software by golang 项目地址: http…...

10个必知的Android开源项目:从android-dev-com看Google、Square等大厂技术栈

10个必知的Android开源项目:从android-dev-com看Google、Square等大厂技术栈 【免费下载链接】android-dev-com Some Famous Android Developers Information, 微信公众号:codekk, 网站: 项目地址: https://gitcode.com/gh_mirrors/an/android-dev-com andro…...

Swin-Unet实战:基于纯Transformer的医学图像分割模型解析与应用

1. Swin-Unet:当Transformer遇见医学图像分割 医学图像分割一直是计算机视觉领域的硬骨头。还记得我第一次处理CT扫描数据时,传统卷积神经网络(CNN)在细小血管分割上的表现让我头疼不已——要么漏掉关键病灶,要么把正常…...

第十二节:老旧系统改造——如何安全地让 AI 介入遗留代码(Legacy Code)重构?

引言 承接上一章对自动化编程安全的探讨,本章聚焦企业中最为棘手的遗留代码(Legacy Code)改造难题。面对缺乏文档、结构混乱的老旧系统,直接让AI“重新编写”往往导致更多隐患,本章将探讨如何安全、稳妥地引入AI进行重构。 核心理论 遗留代码大多缺乏设计文档、单元测试…...

如何解决SQL多表查询数据重复问题_使用DISTINCT与JOIN优化

...

Java八股文大全(2026最新版)大厂面试题附答案详解

很多 Java 工程师的技术不错,但是一面试就头疼,10 次面试 9 次都是被刷,过的那次还是去了家不知名的小公司。 问题就在于:面试有技巧,而你不会把自己的能力表达给面试官。 应届生:你该如何准备简历&#…...

爬虫风控实战:当你的代理IP被数美滑块盯上时,如何优雅破解?

爬虫风控对抗新思路:从数美滑块破解到系统性防御策略 滑块验证码已经成为现代爬虫工程师最头疼的障碍之一。当你精心设计的爬虫程序突然陷入"无限滑块"的循环,或是代理IP池被数美系统精准识别时,那种挫败感不言而喻。但真正的挑战不…...

DarkRISCV核心架构深度解析:从哈佛到冯·诺依曼

DarkRISCV核心架构深度解析:从哈佛到冯诺依曼 【免费下载链接】darkriscv opensouce RISC-V cpu core implemented in Verilog from scratch in one night! 项目地址: https://gitcode.com/gh_mirrors/da/darkriscv DarkRISCV是一款从零开始用Verilog实现的开…...

ComfyUI-ControlNet进阶:多模态控制实战(姿势+深度+线稿)

1. ComfyUI-ControlNet多模态控制入门指南 第一次接触ComfyUI的ControlNet功能时,我被它强大的控制能力震撼到了。想象一下,你手里拿着一个魔法画笔,不仅能决定画什么,还能精确控制画面中每个元素的位置、距离和线条风格。这就是C…...

设计模式的本质:封装变化

设计模式的本质:封装变化 在软件开发中,需求和技术环境的变化是常态。如何让代码在面对变化时保持稳定性和可维护性?设计模式给出了答案:**封装变化**。通过将易变的部分隔离并抽象出来,设计模式帮助开发者构建灵活、…...

AI 英语阅读 APP的开发

开发一款 AI 英语阅读 APP 在 2026 年的核心逻辑已从“电子书查词”转变为“内容动态生成与理解增强”。这种应用的核心竞争力在于能根据用户的实时掌握情况,自动调整文本的难度、背景和互动方式。以下是该项目的核心开发流程与关键技术模块:1. 核心功能…...

电子产品PCB热仿真建模与热过孔设计的系统化方法

🎓作者简介:科技自媒体优质创作者 🌐个人主页:莱歌数字-CSDN博客 💌公众号:莱歌数字(B站同名) 📱个人微信:yanshanYH 211、985硕士,从业16年 从…...

PyTorch神经网络入门:aws-machine-learning-university-accelerated-nlp 深度学习实战

PyTorch神经网络入门:aws-machine-learning-university-accelerated-nlp 深度学习实战 【免费下载链接】aws-machine-learning-university-accelerated-nlp Machine Learning University: Accelerated Natural Language Processing Class 项目地址: https://gitco…...

Vue-Awesome:10分钟快速掌握Vue.js最佳SVG图标组件

Vue-Awesome:10分钟快速掌握Vue.js最佳SVG图标组件 【免费下载链接】vue-awesome Awesome SVG icon component for Vue.js, built-in with Font Awesome icons. 项目地址: https://gitcode.com/gh_mirrors/vu/vue-awesome Vue-Awesome是Vue.js生态中最受欢迎…...

Coze (扣子) 开发AI智能体

Coze (扣子) 已经成为连接底层大模型与实际业务场景的核心“零代码/低代码”平台。利用 Coze 开发一个英语学习 AI 智能体(Agent),本质上是将各种原子能力(插件、工作流、记忆)组装进一个“大脑”中。以下是开发一个高…...

Chart.js项目实战:物流运输跟踪系统的终极可视化指南

Chart.js项目实战:物流运输跟踪系统的终极可视化指南 【免费下载链接】awesome A curated list of awesome Chart.js resources and libraries 项目地址: https://gitcode.com/GitHub_Trending/awesome/awesome 在当今快节奏的物流行业中,实时数据…...

ollama部署Phi-4-mini-reasoning效果展示:自动补全缺失推理步骤与依据引用

ollama部署Phi-4-mini-reasoning效果展示:自动补全缺失推理步骤与依据引用 1. 模型简介与核心能力 Phi-4-mini-reasoning是一个专门为推理任务设计的轻量级开源模型,它基于高质量合成数据构建,特别擅长处理需要多步推理的复杂问题。这个模型…...

DeepSeek-OCR-2参数详解:DeepEncoder V2架构与vLLM推理优化实践

DeepSeek-OCR-2参数详解:DeepEncoder V2架构与vLLM推理优化实践 1. 引言:重新定义OCR的智能视觉理解 如果你还在用传统的OCR工具,每次处理复杂文档时都要忍受识别不准、版面混乱的烦恼,那么今天介绍的DeepSeek-OCR-2可能会彻底改…...

10个Storybook最佳实践技巧:LearnStorybook.com核心经验分享

10个Storybook最佳实践技巧:LearnStorybook.com核心经验分享 【免费下载链接】learnstorybook.com Static site and content for Storybook tutorials 项目地址: https://gitcode.com/gh_mirrors/le/learnstorybook.com Learn Storybook是一个专注于教授开发…...

低门槛语音AI落地:SenseVoice-Small ONNX非技术人员使用指南

低门槛语音AI落地:SenseVoice-Small ONNX非技术人员使用指南 你是不是也觉得语音转文字很麻烦?要么得联网上传录音,担心隐私泄露;要么本地工具配置复杂,一堆命令行看得人头疼;要么识别出来的文字没有标点&…...

“无穷套娃素数生成公式”框架下,孪生素数猜想已被证明【乖乖数学】

“无穷套娃素数生成公式”框架下,孪生素数猜想已被证明。 作者:乖乖数学 核心论证如下: 完备性定理 首先,系统已严格证明:对任意 k ,区间 (C_k, C_{k1}) 内的所有奇数均为奇素数。 关键引理&#xff1a…...

Qwen-Image-2512像素艺术生成实战:从提示词设计到风格控制全流程

Qwen-Image-2512像素艺术生成实战:从提示词设计到风格控制全流程 1. 像素艺术创作新选择 最近在尝试用AI生成像素艺术时,发现了一个特别有意思的组合:Qwen-Image-2512模型加上专门优化的Pixel Art LoRA。这个搭配能生成质量惊人的像素风格图…...

避坑指南:Vue3 + Maotu流程图编辑器集成时,Token失效、样式丢失等5个常见问题怎么解决?

Vue3与Maotu流程图编辑器深度集成:5大核心问题解决方案与实战优化 在工业物联网和复杂业务系统开发中,可视化流程编辑器的集成质量直接影响开发效率和系统稳定性。Maotu作为国内领先的流程图编辑组件,与Vue3的深度整合为开发者提供了强大的可…...

PaddleOCR项目实战:PyInstaller打包依赖全收集与体积优化指南

1. 为什么PaddleOCR打包会这么麻烦? 第一次用PyInstaller打包PaddleOCR项目时,我也被各种报错整得焦头烂额。明明本地运行得好好的程序,打包成exe后就各种找不到模块、初始化失败。后来才发现,PaddleOCR这个OCR工具包依赖实在太复…...

我天,Go语言已沦为老二。。

2026年AI行业最大的机会,毫无疑问就在应用层!字节跳动已有7个团队全速布局Agent大模型岗位暴增69%,年薪破百万!腾讯、京东、百度开放招聘技术岗,80%与AI相关……如今,超过60%的企业都在推进AI产品落地&…...

Python如何找局部极值_scipy.signal.argrelextrema找波峰波谷

scipy.signal.argrelextrema 默认要求严格大于/小于邻点,故平台段、噪声或高采样率下易漏峰;需先平滑、确保一维输入、显式指定axis和比较函数,并用order3起调参;波峰波谷可统一用argrelextrema(-data)推导;索引须映射…...

如何确保多个 Goroutine 的结果按启动顺序收集并输出

本文详解如何在 go 中并发执行多个 goroutine,并严格按原始调用顺序收集和输出结果——核心在于为每个 goroutine 分配独立的返回通道,而非共用单个无序通道。 本文详解如何在 go 中并发执行多个 goroutine,并严格按原始调用顺序收集和输…...