
内蒙古科技大学
-
2023年2月12日发(作者:)内蒙古科技大学
本科生毕业设计说明书(毕业论文)
题目:面向机械翻译的随机词汇语义
驱动方法的研究
学生姓名:李某
学号:2002XXXXXX
专业:计算机软件与理论
班级:计2002-2班
指导教师:张某某
内蒙古科技大学毕业设计说明书(毕业论文)
I
面向机器翻译的随机词汇语义驱动方法的研究
摘要
跨越语言的障碍,实现不同语言人们之间的自由交流,是人类自古以来的一个梦
想。机器翻译理论的研究目的在于应用计算机作为智能处理工具,实现异种自然语言
间的自动翻译过程,其技术意义和社会意义都是十分深远的。
然而由于自然语言的复杂性,直至今天机器翻译的研究仍面临着巨大的困难。除
词汇歧义和转换变异映射外,结构歧义一直是机器翻译研究中的主要困难之一。这是
因为,各种机器翻译方法,无论是基于知识的还是基于经验的,都或多或少地依赖于
源语的结构标注信息来完成语言的转换生成过程。
……………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
…………………………………………………………………………………………………
………………………………………………………………………………………。
关键词:自然语言处理;词汇语义驱动;结构消歧;机器翻译;随机语言模型
内蒙古科技大学毕业设计说明书(毕业论文)
II
MachineTranslationOrientedStochastic
LexiclaSemanticDrivenApproach
Abstract
Peopleallovertheworldhavebeeneagerforovercomingthecommunicationdifficulties
earchinmachinetranslation,whichisof
muchimportancebothtothetechnologyandtothesociety,triestosolvetheproblemby
usingcomputerasanintelligentprocesstoll.
However,duetotheinherentcomplexityofthenaturallanguage,machinetranslationis
romthewordsenseambiguityandtransformation
divergencebetweenlanguages,structuralambiguityisanothermainobstacleconfrontingthe
sonisthatalmostallMTsystemsrelyonthestructurlannothation
informationtoaccomplishthelanguagetransformation,nomattertheyareknowledgebased
orexperiencebased.
……………………………………………………………………………………………
…………………………………………………………………………………………………
……………………………………………………………………………………………….
Keywords:naturallanguageprocessing;lexicalsemanticdriven;structuraldisambiguation;
machinetranslation;stochasticlanguagemodel;knowledgeacquisition
内蒙古科技大学毕业设计说明书(毕业论文)
III
目录
摘要.........................................................................................................................................I
Abstract......................................................................................................................................II
第一章引言.............................................................................................................................1
1.1研究背景......................................................................................................................1
1.1.1结构歧义...........................................................................................................1
1.1.2理性主义的研究方法.......................................................................................1
1.1.3经验主义的研究方法.......................................................................................1
1.2问题定义......................................................................................................................1
1.2.1结构化的随机语言模型...................................................................................1
1.2.2基于实例类比的分析策略...............................................................................2
1.3论文结构......................................................................................................................2
第二章自然语言的结构分析...................................................................................................3
2.1自然语言形式文法系统..............................................................................................3
2.1.1合一文法...........................................................................................................3
2.1.2依存文法...........................................................................................................3
2.1.3词汇化文法.......................................................................................................3
2.2自然语言分析算法......................................................................................................3
2.2.1串行分析算法...................................................................................................3
2.2.2并行分析算法...................................................................................................3
………………………………………………………………………………………………
………………………………………………………………………
内蒙古科技大学毕业设计说明书(毕业论文)
1
第一章引言
1.1研究背景
今天,计算机技术和互联网络的飞速发展把社会的信息化进程推向了一个全新的
阶段,信息的传递与交流已经成为整个现代社会生活运作的重要基础,电子可读文本
大量涌现并成为网络时代主要的信息载体和人们的生活中不可缺的一部分。随着信息
化进代的来临,自然语言处理技术已逐渐成为一项大从的迫切需求,计算语言学的研
究也越来越受到人们的重视。
自然语言分析技术(NaturalLanguageParsing)一直是计算语言学领域一个基础性
的研究课题。大部分自然语言处理系统,包括机器翻译,文本理解,信息的检索与过
滤,语音识别与合成,都毫无疑问地会从高质量的分析技术中受益。从科学的观点来
看,计算机的自然语言分析过程是对人类语言理解过程的模拟:即根据一定的语言知
识,通常是一具由规则、树或图组成的形式文法系统,将输入句子的一维线性结构赋
予某种二维平面结构解释;从人工工智能研究的角度来讲,这是一个基于推理的问题
求解过程,分析方法则对应了其推理控制策略。
……………………………………………………………………………………………
……………。
1.1.1结构歧义
然而与形式语言的分析相比,应用计算机进行自然语言的结构分析却远非一件容
易的工作。
……………………………………………………………………………………。
1.1.2理性主义的研究方法
……………………………………………………………………………………。
内蒙古科技大学毕业设计说明书(毕业论文)
2
1.1.3经验主义的研究方法
……………………………………………………………………………………。
1.2问题定义
……………………………………………………………………………………。
1.2.1结构化的随机语言模型
……………………………………………………………………………………。
1.2.2基于实例类比的分析策略
……………………………………………………………………………………。
1.3论文结构
……………………………………………………………………………………。
内蒙古科技大学毕业设计说明书(毕业论文)
3
第二章自然语言的结构分析
……………………………………………………………………………………。
2.1自然语言形式文法系统
……………………………………………………………………………………。
2.1.1合一文法
……………………………………………………………………………………。
2.1.2依存文法
……………………………………………………………………………………。
2.1.3词汇化文法
……………………………………………………………………………………。
2.2自然语言分析算法
……………………………………………………………………………………。
2.2.1串行分析算法
……………………………………………………………………………………。
2.2.2并行分析算法
……………………………………………………………………………………………
……………
………………………………………………………………………………