中国有哪些有名的小语种翻译家?

求职招聘网 2023-08-07 14:00 编辑:admin 180阅读

一、中国有哪些有名的小语种翻译家?

俄语的很多:草婴,高莽,顾蕴璞,师哲等。另外,毛主席的长子毛岸英俄语水平也很高。

二、2050年前能搞出全球范围全语种的即时翻译工具吗?

全球有7000多种语言,但其中4000多种仅能书写,无法进行听说交流,像谷歌翻译这样的自动翻译软件也仅能翻译100种语言,目前,科学家最新研究称,未来我们能使用自动翻译软件实现更多语言的交流沟通。

设想一下,当你收到一条可能包含救命的信息,但你一个字也看不懂,你甚至不确定这条信息是用哪种语言书写的,此时你怎么办?

如果该条信息是法语或者西班牙语,把它输入到自动翻译软件中会就立即解开谜团,并给出一个准确的英语版翻译答案,然而,全球许多语言仍无法进行机器翻译,包括数百万人使用的语言,例如:非洲的沃洛夫语、卢干达语、契维语和埃维语。这是因为支持这些翻译软件的算法是基于人类翻译文本,理想情况下,该语言的翻译文本需要达到数百万字。

由于加拿大议会、联合国和欧盟等多语言机构的存在,英语、法语、西班牙语和德语等语言有大量的翻译素材,不同国家的译员人工翻译大量笔录和其他文件,仅欧洲议会在过去10年里,在23种语言中产生了13.7亿个单词的翻译数据。

然而,对于那些使用广泛但翻译内容不丰富的语言,就不存在这样的数据信息库,它们也被称为低资源语言。这些语言的备用机器翻译培训素材包括宗教出版物,例如:翻译数次的《圣经》,但这是匮乏的翻译数据,并不能设计准确、广泛应用的自动翻译软件。

目前,谷歌翻译软件提供了大约108种不同语言的交互翻译功能,而微软“必应翻译”提供了大约70种语言,然而,世界上有7000多种口语,其中至少4000种拥有文字系统。

这种语言障碍对于任何需要快速收集精确全球信息的人而言都是一个难题,甚至包括情报机构,美国情报机构IARPA项目主管卡尔·鲁比诺说:“一个人对了解世界越感兴趣,他就越有能力获得非英语的资源数据,现今我们面临诸多挑战,例如:经济、政治不稳定,新冠病毒肆意传播,全球气候变化,探索地外空间等,这些挑战都将面临着多语言环境。”

培训一名人工译员或者情报分析员学习一门新语言可能需要几年时间,即便如此,它可能也不足以完成当前的任务。鲁比诺说:“例如:在尼日利亚,人们使用的语言超过500种,即使是尼日利亚国内最优秀的语言专家,也可能仅懂得其中部分语言。”

机器翻译工具可以在没有人工翻译的情况下提供重要的交流方向为了突破这一障碍,IARPA投资一项研究,用于开发一种语言系统,能够从任何资源匮乏的语言(无论是文本语言还是语音语言)中寻找、翻译和总结信息。

人们可以想象一下,一种新型搜索软件,用户在搜索框键入英文,就会收到一个英文摘要文档列表,这些文档都是从某种外语翻译过来的,当他们点击其中一个文档,完整的翻译文件就会生成,虽然该研究经费来自于IARPA,但研究是由竞争团队公开进行,其中大部分翻译文件现已发布。人们学习一门语言,并不是用于阅读几年以来的国际议会记录。

美国哥伦比亚大学计算机科学家凯瑟琳·麦基翁带领一支研究团队,致力于研究多语种翻译,她发现该领域带来的益处远超出情报侦察,她说:“我们的最终目标是促进来自不同文化的人们产生更多互动交流,以及获得更多关于他们的信息。”

该研究团队使用神经网络技术来解决这一难题,这是一种模仿人类思维某些方面的人工智能形式,近年来,神经网络模式已经彻底改变了语言处理,他们可以学习单词和句子的含义,而不仅仅是记忆单词和句子,他们结合上下文发现,像英语中的“dog”、“poodle”,与法语中的“chien”表达的概念是相似的,即使它们字母构成相差很大。

然而,要做到这一点,该语言模型通常需要经过数百万页文字翻译训练,其挑战在于让语言模型像人类一样,基于少量数据学习,毕竟人类不需要阅读几年的国际议会记录来学习一门语言。

美国麻省理工学院计算机科学家蕾贾纳·巴尔齐莱是另一支研究团队的成员,她说:“无论你何时学习一种偏门语言,相信你一生之中都不会看到现今机器翻译系统用于学习英法互译的数据量,你能看到非常少量的一部分语言翻译数据,能概括和理解法语。同样地,你也希望看到新一代机器翻译系统,即使没有迫切需要语言翻译数据的需求。”

为了解决这个难题,每个研究团队被分为更小的专家小组,他们致力于完善语言翻译系统,该系统的主要组成部分是:自动搜索、语音识别、翻译和文本概括技术,以上均适用于资源较少的语言。自2017年该项目开始以来,研究团队已经研究了8种不同语言,包括:斯瓦希里语、塔加拉语、索马里语和哈萨克语。

其中一个突破是从网络上获取文本和语音,包括新闻文章、博客和视频内容,由于世界各地网络用户都在使用自己的母语发布信息,许多资源匮乏的语言在线数据也在不断增多。

南加州大学计算机科学家斯科特·米勒说:“如果你搜索互联网,想获取索马里语的相关数据,你会找到上亿个单词,这是没有问题的,你可以在网络上获得几乎所有语言的文本资料。”

以上在线数据通常是单一语言模式,意味着索马里语文章或者视频只能使用母语阅读,没有平行对应的英语翻译。但是米勒表示,神经网络模型可以在许多不同语言的单语数据上进行预训练。

米勒称,在预训练过程中,神经模型学习了人类语言的一般结构和特征,然后可以将这些结构和特征应用到翻译任务中,没有人真正知道这些模型真正学到了什么结构,它们有数百万个参数。

打破语言障碍带来的好处远远超出了情报机构掌握到的信息一旦对多种语言进行预训练,这些神经模型就可以使用极少的双语训练(即并列数据)在不同语言之间进行翻译,几十万字的并行数据就足够了——相当于几本小说的内容。

在这个总结概括过程中,神经模型表现出一些最奇特的方式——它们能产生“幻觉”。

多语言搜索引擎能够梳理文本形式的语言,这将带来另一组复杂的问题,例如:语音识别和转录技术通常会遇到之前未遇到过的声音、名称和位置问题。

英国爱丁堡大学语音技术专家彼特·贝尔是试图解决该问题的小组成员之一,他说:“我举的一个例子中所涉及的国家与西方国家相比不太出名,该国一个政客被暗杀,他的名字现在真的很重要,但在以前,这个名字很晦涩,并不引人关注,那么你如何在音频中找到这位政客的名字呢?”

贝尔和同事采取的一种解决方案是再次检索那些被转录的带有不确定性的单词,翻译软件并不熟悉这些不确定性的单词,如果再次重新检索,很可能就会找到这位鲜为人知的政客的名字。

一旦找到并翻译了相关信息,搜索引擎就会为用户进行汇总,在这个总结的过程中,神经模型会表现出一些最奇怪的特征——产生“幻觉”。

想象一下,当你正在搜索一篇关于星期一抗议者攻击某栋建筑的新闻报道,但搜索结果显示,抗议者的暴力行径是发生在星期四,这是因为神经模型在总结报告时,利用了基于数百万页训练文本的背景知识。在这些文本中,有更多的抗议者在星期四攻击建筑物,因此得出结论。

类似地,语言翻译软件的神经模型可能在摘要概述中插入日期或者数字,计算机科学家称之为“幻觉”。

爱丁堡大学计算机科学家米蕾拉·拉帕塔称,这些神经网络模型非常强大,它们记忆了很多语言,还添加了源程序中没有的单词。据悉,她正在为一支研究团队开发设计语言概述元素。

米蕾拉和同事通常提取每个文档中的关键词来避免该问题,而不是让翻译软件使用句子进行总结,关键词不如句子优雅,但它们限制了该语言模型表达韵文诗歌的倾向。

当新冠病毒大流行时,人们突然要将一些基本的健康提示翻译成多种语言。

虽然语言搜索引擎是为现有语言而设计的,但是该项目包括了一个研究数千年、现无人使用的小语种,这些古老的语言资源非常少,因为许多语言仅以文本片段的形式存在,他们为可应用于现代低资源语言的技术提供了一个有效试验。

麻省理工学院博士生Jiaming Luo和合作者共同开发了一种语言算法,可以计算出某些古代语言是否有现代存留,通过提供这些语言的基本信息,以及语言变化的通常状况,该语言算法获得了一个先行条件,基于以上信息,该语言模型能够独自获得一些发现,期间仅使用少量数据。机器学习可以帮助破译已经灭绝的语言,比如公元前14至12世纪在叙利亚北部使用的乌加里特语

通过这种语言算法,他们发现一种来自近东地区的古老语言乌加里特语与希伯来语密切相关,他们还得出结论称,一种古老的欧洲语言——伊比利亚语,与其他欧洲语言相比,更接近于巴斯克语(但与巴斯克语的关联度并不高)。

麻省理工学院计算机科学家蕾贾纳希望该方法能够激发更广泛的变化,并使神经模型不那么需要数据支持,事实证明,我们对大量并行语言翻译数据的依赖,已成为研发语言翻译系统的一个弱点,因此,如果我们真的研制好的技术,无论是用于解密,还是用于小型语言翻译,它都将推动整个领域向前发展。

研究小组现已成功设计了多语言搜索引擎的基础版本,并用每种新语言对其进行改进,IARPA项目经理鲁比诺认为,这些技术可以改变情报收集的方式,我们确实有机会彻底改变分析师对外语数据的学习方法,使讲英语的单语分析师获得之前无法处理的多语数据。

当情报分析人员试图从外部获取资源稀缺的语言数据时,该语言的母语者们也在积极获得其他语言的重要信息,他们不是为了间谍活动,而是为了改善自己的日常生活。

德国萨尔兰大学计算机科学博士生戴维·伊费奥鲁瓦·阿德拉尼说:“当新冠病毒全球流行时,突然需要将基本的卫生提示翻译成多种语言,由于翻译质量问题,我们无法使用机器翻译模型实现这一点,我认为开发多语言翻译软件教会我们很多东西,拥有适合于资源匮乏语言的技术是非常重要的,尤其是在我们急需的时候。”

阿德拉尼来自尼日利亚,他的母语是约鲁巴语,他一直在创建约鲁巴语-英语互译的数据库,这是名为“打破非洲多语言障碍”的非赢利项目的一部分,他和研究团队通过收集翻译后的电影剧本、新闻、文学作品和公开演讲等资料,创建了一个新的数据集。然后,他们利用这个数据集对宗教文本模型进行微调,以提高该数据集的准确性。在Masakhane等基层团体的帮助下,埃维语、契维语、卢干达语等其他非洲语言也在进行类似的努力。

相信未来有一天,我们所有人都可能在日常生活中使用多语言搜索引擎,只需点击一个按钮,就能解锁世界知识,在此之前,真正理解一种资源匮乏语言的最好方法可能就是学习它,并加入多语言在线人类交流。

三、中山大学商学院和国际翻译学院小语种之间怎么选择?

谢邀,都不建议。

无论是新建的商学院,还是国翻学院,在中大校园内都属于偏弱势的学院。且题主你未来已经确定走商科方向,这两个院系都不是最佳选择。

最优答案是,转专业到岭南学院或管理学院,这是中大商科真正的精华所在,且地理位置在广州市中心,比珠海和深圳光明区都好上不少。

四、女生小语种专业何去何从?

手头不宽裕,建议转行或者跨考国内研究生,跨专业选日语语种的一般学生都会比英语高40多分,跨专业尽早,女生输不起时间,有钱不结婚可以去日本转转,但是回国以后不去日本企业也是浪费钱,而且日企天花板严重,尤其女性

五、用什么软件翻译小语种和少数民族语言最简单方便?

推荐试试火山翻译!目前已支持翻译114个语种,同为小语种学生,用下来感觉翻译精准度很高,译文也亲测流畅地道, 并且支持对话,拍照,文本多种翻译模式。有网页版(官网:http://fanyi.toutiao.com),chrome插件(https://bit.ly/3spjlyD)和微信小程序版,手机或电脑使用都很方便!


六、小语种导游的前景怎样?

个人观点:还不错,现在大部分的家庭经济水平提高,也有出国旅游的欲望,但是不能正常的沟通。所以小语种导游前景广阔!

七、考研 用英语还是小语种?

小语种相比英语比较占优势,很容易得高分。建议用小语种,中国政法大学(招生语种:201英语一或202俄语或203日语或240德语或241法语或242西班牙语或243意大利语)。平时每天做点阅读,积累词汇量,到后期把十年真题做一遍找找感觉,基本也就差不多了。真题的话可以在网上找找,或者参考下往年学姐学长的经验。

八、哪个小语种性价比最高?

如果你关注性价比,那还学泰语干啥呢?

全世界只有一个国家讲泰语,谈不上「用途广」。泰国又死穷,工资待遇没法看。

九、什么小语种最好学呀?

前几天看了个报道:据统计,世界上约有五千多个语种和方言,好庞大的一个数字。但其中有的语言已接近消亡,约有二十种语言几乎无人会说了。

现在世界,英语几乎成为通用语种。对小语种的定义,老百姓通常认为除了英语这个通用语种外,其它语种都是非通用语种,因此英语以外的其它语种都是小语种。

现在很多人已经不满足于只掌握母语(汉语)和英语这两种语言,都想再掌握一门小语种语言。昨天还有人在问:那么,在那么多小语种里,哪种小语种最好学呢?哪种小语种最适合自学呢?

其实任何语言的学习,都是一个模样:枯燥!很枯燥!非常枯燥!但是,多掌握一门语言,对自身的发展却是非常有利的。特别是小语种,在特定的环境可以让我们充分实现自身价值的体现。



我曾经对每一个语种进行了量身研究,听了无数网上关于各小语种免费课程后,列出了各种语种学习的难点。

最后经过一番缜密的研究,西语,德语,法语,韩语,日语等小语种,我首选日语,并自己跟着层层挑选后的优质网课开始坚持学习。


免费课


1、西语:

西班牙语(西班牙语:Español)简称。通常意义上的西班牙语即卡斯蒂里亚语。它是西班牙及整个拉丁美洲各国(除巴西、海地)的官方语言。



西班牙语属于拼读语言,名词有阴、阳性,单词直接拼读,发音相对规范。但它发音有大舌音,卷舌连续抖动的r、rr是学习的难点。而且它的语法相于英语复杂,西班牙的语法事态需要对相应的动词进行各种时态的变位,不同于英语仅是先行词变位。动词的变位是个要死记硬背,熟能生巧的活!

而且很多有英语基础的人,学着学着会发现西语的单词在多数主要单词词干很接近,但是语法却有很大的差别。所以,学习西语到一定阶段的时候,会与英语混淆起来,这是学习西语的另一个难点。

2、德语:

德语(Deutsch)属于印欧语系-日耳曼语族-西日耳曼语支,是德国、奥地利、列支敦士登的唯一官方语言。



很多人说学德语都是哭着学进去的,可见学习德语有多难。

德语的严谨与精确是其它语言无法比拟的。

难点一:名词的词性的记忆。德语的名词分阴性,阳性,中性。
而它词性的划分基本上是不规则的。
难点二:德语里r的发音。r是弹舌音,一般初学者很难发出来,只能檫出来。
难点三:动词的变位,支配的格和介词需要好好记住的,很烦呢!

3、法语:

法语(法文:Français)是属于欧洲印欧语系罗曼语族的独立语言。西班牙语,葡萄牙语和意大利语还有法语都是拉丁语系,其中最难的就是法语。



都说孙悟空七十二变,变化多端。而法语的变数一点不输于孙大圣。天呢!



难点一:法语的动词变位比起英语复杂得多。它的每个动词都和英语中的be动词那样,随着人称、时态、单复数的变化而变化,还多出性的变化。特别是不规则动词,比起英语复杂不是一点点。

难点二:法语的名词有阴、阳性之分。记住词意的同时还必须要记住这个词是阴性还是阳性名词。原因是因为相关的形容词、动词的过去分词都要随之变化。你说,那么多单词背下来已经很不容易,更何况还要背出阴阳性,是不是要人命?

4、韩语:

亦称韩国语(한국어),朝鲜语(조선말),简称韩语(朝语),其自身文字称为谚文。是一种主要为韩民族/朝鲜民族所使用的语言,韩国称韩国语(한국어/韩国语),朝鲜称朝鲜语,(조선어/朝鲜语),分别为韩国标准和朝鲜标准。


全世界人民都知道韩语难学,光看这些韩语字母就开始脑壳痛。韩语最难的是发音,我总感觉怎么我们的舌头和韩国人的舌头好象长得就是很一样似的?

韩语是单词发音[pronunciation],有独特的紧松音区别,而且汉语借词还间接地以韵尾的方式保留了古汉语的部分入声,并且不送气清辅音和浊辅音在某些情况下竟然是一个音位。

5、日语

日语(英语:Japanese),文字、书写方式、书本(纸张等)上的表现方式称为日文,是一种主要为日本列岛上大和民族所使用的语言。

最后我们来说说日语吧,也是我最推荐学习的小语种,没有之一。

因为日语和中文的语法有很多地方相似。平假名、片假名是以汉字为基础创造的表音文字。书写时多用平假名,片假名一般用于书写外来语、拟声词等。

由于两者均来自汉字,了解做为字源的汉字,对正确书写假名很有利。所以,这样作为从小学习汉字的我们,比起世界上其它国家的人们学习日语又简单了很多。

这里呢,给真心信任我也真心想自学日语的朋友们推荐一个宝藏资源:早道网校7天日语免费课。


免费课


如果要想学好日语,五十音图是关键,学好五十音图就相当于一只脚踏进日语的大门。当你五十音学到给你一个假名能够快速读出它的发音,那么你的五十音基本上算是过关了。



五十音学完后开始一系列的单词语法学习,当然这也是一个任重道远的过程。

1、单词学习:

背单词那肯定是需要的。那么怎么背?不要重复的一遍遍背诵,而是第一天背完,第二天梳理一下。把会背的放一边,不会的用红笔标注出来。第三天把第二天新背的单词和第一天标注的单词再梳理。然后一周进行一次复习,一月进行一次总复习。

2、语法学习:

日语的语法可以说是日语学习中最难的部分了。日语不像汉语,主语—宾语—谓语的结构。日语的语法系统是非常庞大的,分支又多。

总结一下日语的语法特征:

助词、助动词的粘着成分来表示词在句中的地位和语法职能。
有四种词有词尾变化。这种变化叫活用,活用有一定的规律。
句子成分有一定的语序。如一般是主语在前,谓语在句子的最后,修饰语在被修饰语之前等等。
有系统的敬语体系,敬语使用范围较宽,用法较复杂。

在这里墙裂推荐两本有用的日语书给大家:

1、《大家的日语》

这本书的内容简单,思路比较清晰,注重口语听力,一般为日语自学者或者对日语又兴趣的学习者使用的,是日本的语言学校使用教材。



2、《新标准日本语》

这套书共有初级上、下两册。中级上、下两册。高级上、下两册。共六本书。书内容结构丰富完整,是对自学者或者初学者来说最为适合的一款教材。既注重打好基础,又不忽略实用性。



经过一段有序学习之后,我开始看动漫、日剧学习日语。这可是个练习阅读和听力的好办法,但是如何挑选呢?个人建议多看校园、职场、生活类,并且要盯着一部非常喜欢,带有双语字幕的反复刷!

第一遍估计我们会被剧情吸引走,第二遍时才能注重字幕进行语言练习,第三遍就是离开字幕考验听力的关键时刻了!

经过一段长时间的坚持,自学教材+看书听剧+网上授课,我最后参加了日语N1的考试,成绩还是令人满意的。


其实,学习任何语言都不是一件容易的事,都需要付出努力和汗水!最后让我们一起加油吧!

十、有木有靠谱的小语种翻译软件推荐?比如英翻德翻西法意?

小语种翻译只有谷歌翻译做的最全,这里有一个在表格中翻译小语种的方法。

小语种翻译谷歌翻译电商翻译