猜你喜欢
机器翻译

机器翻译

书籍作者:[法] 蒂埃里·波贝 ISBN:9787111627715
书籍语言:简体中文 连载状态:全集
电子书格式:pdf,txt,epub,mobi,azw3 下载次数:5199
创建日期:2021-02-14 发布日期:2021-02-14
运行环境:PC/Windows/Linux/Mac/IOS/iPhone/iPad/Kindle/Android/安卓/平板
内容简介

《机器翻译》主要介绍了机器翻译系统开发过程中的主要问题、机器翻译的发展历程及*新进展。其中着重阐述了机器翻译领域的主要方法:基于规则的方法、基于示例的范式、目前*流行的统计范式和基于分段的方法以及目前*先进的深度学习机器翻译。还讨论了机器翻译的评价问题,以及该领域内的主要参与者和商业化现状。

《机器翻译》可作为机器翻译领域技术人员的参考用书,同时也可供广大计算机科学、人工智能领域对自然语言处理感兴趣的读者阅读。


前言

  译者序
  机器翻译,又称自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。机器翻译技术的发展一直与计算机技术、信息论、语言学等学科的发展密切相关。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,随着计算机计算能力的提升和多语言信息的爆发式增长,机器翻译技术也逐步成熟,并为广大用户提供实时、便捷的翻译服务。
  本书旨在简要概述机器翻译的发展历程。首先介绍了在开发机器翻译系统时必须解决的主要问题。然后详细介绍了机器翻译的发展历程,其中包括从计算机出现之前的机器翻译初期到基于深度学习的最新进展。本书着重分析了自从机器翻译领域创建以来的主要方法:基于规则的方法以及 ALPAC 报告及其影响;推动该领域研究飞速发展的平行语料库、基于示例的范式;目前最主流的统计范式;基于分段的方法和目前最先进的基于深度学习的方法。另外,本书还对机器翻译的质量评价问题进行了深入讨论。最后,介绍了该领域世界范围内的主要参与者以及商业化现状。
  本书作者长期从事机器翻译领域的研究和实践,对机器翻译领域的发展和问题进行了深入总结和归纳。
  全书共 15 章,主要由连晓峰翻译并审校。此外,郭其豪、潘兵、刘鹏华、田恒屹、王焜、贾琦、洪兆瑞、王子天也参与了部
  分翻译工作。
  鉴于译者的水平有限,书中不当或错误之处在所难免,恳请各位业内专家、学者和广大读者不吝赐教。
  译者

目录

译者序
原书致谢
第一章
绪论 / 001
第二章
翻译难点 / 007
翻译的本质是什么 / 007
什么是恰当翻译 / 008
恰当翻译的标准 / 010
机器翻译的影响 / 011
为什么用计算机分析自然语言是非常困难的 / 014
自然语言与歧义 / 014
机器翻译产生的主要问题 / 019
自动翻译系统和人工翻译系统 / 020
第三章
机器翻译发展概述 / 023
基于规则的系统:从直接方法到语际方法 / 023
统计机器翻译系统的变革 / 029
发展历史快速回顾 / 031
第四章
计算机出现之前 / 035
通用语言问题 / 035
历史悠久的传统 / 036
人工语言 / 038
第二次世界大战期间机器翻译系统的发展 / 040
?Artsrouni 机械大脑 / 040
?Smirnov-Trojanskij 辅助翻译环境 / 042
第五章
机器翻译的开端:第一个基于规则的系统 / 045
先驱者 / 046
早期实验 / 046
?Weaver 的备忘录 / 047
机器翻译的真正开端(1950~1960 年) / 055
早期 / 055
第一个基于规则的系统的发展:Turmoil 和 Enthusiasm / 057
美国之外的研究 / 061
觉醒期(1960~1964 年) / 063
?Bar-Hillel 的批评 / 064
讨论 / 066
第六章
1966 年的 ALPAC 报告及其影响 / 069
报告内容 / 070
报告的直接后果 / 074
?1965~1990 年:长期停顿 / 076
更广泛的研究工作 / 076
第一个商用系统 / 079
第七章
平行语料库与语句对齐 / 083
平行语料库或双文本的概念 / 083
平行语料库的可用性 / 087
现有语料库 / 087
平行语料库的自动创建 / 089
语句对齐 / 092
基于语句相对长度的对齐 / 093
词汇法 / 096
混合法 / 098
第八章
基于示例的机器翻译 / 099
基于示例的机器翻译概述 / 101
翻译示例的搜索 / 103
基于示例的机器翻译的优缺点 / 105
第九章
统计机器翻译与词对齐 / 109
一些示例 / 110
机器翻译的“基本方程” / 113
词汇对齐的不同方法:IBM 公司模型 / 118
模型 1 / 119
模型 2 / 124
模型 3 / 124
模型 4 / 125
模型 5 / 126
翻译(或处理)阶段 / 127
返回到研究领域的根源 / 130
第十章
基于分段的机器翻译 / 131
面向分段的机器翻译 / 131
双重对齐 / 132
基于分段的机器翻译一般问题 / 133
在统计模型中引入语言信息 / 138
考虑句法的对齐模型 / 139
考虑语义的对齐模型 / 142
第十一章
统计机器翻译的挑战与不足 / 145
语言多样性问题 / 146
稀有语言的案例与中枢语言的回归 / 147
如何快速开发针对新语言的机器翻译系统 / 152
混合机器翻译系统 / 152
基于规则的系统现状 / 154
当前挑战:新语言对机器翻译系统的快速发展 / 155
是否统计过多 / 156
基于统计的翻译系统的主要局限性 / 156
统计并不排斥语义 / 157
第十二章
深度学习机器翻译 / 161
深度学习机器翻译概述 / 162
深度学习机器翻译当前所面临的挑战 / 168
第十三章
机器翻译系统的评价 / 175
第一次评价活动 / 178
综合评价 / 179
评价小组 / 180
充分性和流畅性 / 181
人工辅助翻译 / 181
寻求自动评测 / 183
?BLEU / 183
?NIST / 184
?METEOR / 185
自动评价方法评述 / 186
评价活动的扩大 / 187
自动评价的经验教训 / 189
根据语言对的任务难度评测 / 189
翻译错误类型 / 194
第十四章
机器翻译产业:专业与大众市场间的应用 / 197
主要市场,难以评价 / 197
市场概览 / 198
免费在线软件 / 202
商业化产品 / 206
?Systran 公司案例 / 208
全球市场 / 210
机器翻译的新应用 / 211
跨语言信息检索 / 213
自动字幕和说明 / 214
多语对话的直译 / 214
手机和通信对象 / 216
翻译辅助工具 / 217
第十五章
结论:机器翻译的未来 / 221
商业化挑战 / 221
机器翻译的认知方法 / 224
附录 / 229
附录 A 术语 / 229
附录 B 推荐与扩展阅读书目 / 238

产品特色