在线配资

  • 股票资讯
  • 股票大盘
  • 股票K线
  • 股票配资
  • 在线配资
  • A股报道
  • 纳斯达克
  • 香港股市
  • 伦敦股市
  • 位置: 首页 > 在线配资 >

    讯飞翻译机3.0 Lite发布:离线翻译识别率达95%,精通7种专业翻译

    2019-09-02 08:11 次阅读 稿源:在线配资

    智东西(公众号:zhidxcom)文 | 李水青

    导语:这款翻译机懂得神曲《生僻字》,不窃取用户的个性特征数据。

    智东西8月8日消息,西班牙当地时间8月5日,科大讯飞发布了讯飞翻译机3.0 Lite。同时,球星武磊签约科大讯飞,成为其首位品牌代言人,讯飞翻译机也成为皇家西班牙人足球俱乐部官方翻译合作伙伴。

    2016年,科大讯飞推出了讯飞晓译翻译机,在国内开辟了这一新品类。2019年5月,讯飞翻译机已更新至3.0,能进行中文与58种外语互译,覆盖全球近200个国家和地区,支持离线翻译、方言翻译、行业AI翻译和拍照翻译等等。其中,离线翻译效果达到大学英语六级水平。讯飞翻译机3.0 Lite则会新增西班牙语的离线翻译,以便于用户在没有网络的情况下也能自由交流。

    今天,在讯飞翻译机的媒体沟通会上,智东西提问了关于“外语译中文”的技术难点和用户数据处理的隐私问题。科大讯飞翻译机业务总经理翟吉博表示,目前主要的技术难点是“小语种数据匮乏”;而在用户隐私方面,讯飞翻译机则利用数据脱敏技术,以大数据集的形式对用户数据的共性进行学习,而不会关注用户数据的个性情况。

    ▲讯飞翻译机的发展历程

    一、离线翻译识别率高达95%,精通7种专业翻译

    科大讯飞翻译机业务总经理翟吉博表示,翻译机的场景是极其多样化的。场景既涉及使用者的语言、语音、习惯,又涉及环境的嘈杂程度,还涉及翻译内容的多样性。根据不同的场景,讯飞翻译机将“听得清”、“听得懂”、“译得准”、“发音美”作为其四大标准。

    从环境的复杂性来说,人们常在国外的展会现场、商场等场所使用翻译机。对此,讯飞翻译机对麦克风和扬声器进行深入优化,新款3.0版本使用4颗阵列式的麦克风和双扬声器,应对声音的干扰。

    从内容的适应性来说,讯飞翻译机对产品进行专业细分和训练,可覆盖到医疗、金融等7个专业领域。比如“Mad doctor”,讯飞翻译机不会将这个医疗词汇错翻为“疯医生”,而会翻译为“精神病医生”。

    从使用者多样性来说,讯飞翻译机独家支持方言和民族语言翻译,满足国人说话习惯。

    在离线翻译方面,科大讯飞推出新一代离线翻译。具体来说,其离线语音识别引擎使用新一代端对端混合离线语音识别神经网络架构,离线识别率高达95%。离线翻译引擎采用自适应低精度翻译模型加速技术,支持的词库规模扩大一倍。讯飞翻译机还将四核处理器升级到八核处理器,使得性能翻倍。

    ▲讯飞翻译机3.0升级离线翻译功能

    在拍照翻译方面,新版本可以解析复杂版面。讯飞翻译机的新一代的拍照翻译,搭载了包揽CPR国际大赛三项大奖的OCR技术,可自动对焦,并采用3.1寸高清视网膜屏幕,使清晰度翻倍。

    二、小语种数据不足是技术难点,数据脱敏以保护用户隐私

    在采访环节中智东西问道,我们知道讯飞翻译机3.0在“中文-外语”方面非常快速和准确,那么在“外语-中文”的翻译效果上,讯飞从那些方面做优化,有什么技术难点?

    科大讯飞翻译机业务总经理翟吉博表示,主要技术难点在于相关外语的可用数据不足。讯飞翻译机通过深度学习技术进行学习,需要相对较多的数据。在“中文译外语”方面,用户基础广泛,数据积累充足。但是,在“外文译中文”方面,用户数据积累仍有挑战。

    比如,各国人说英语的口音不一样,但其只能通过很少的数据来提炼这些“口味英语”的特点,如何将各种口音都涉及到,这是非常难的。

    当智东西接着问,随着用户隐私问题日益受到关注,讯飞翻译机是否会将用户日常产品使用中产生的数据存储下来,用以训练语言处理模型?

    对此,翟吉博介绍,讯飞翻译机处理用户数据的方式和搜索引擎的原理相似,是以大数据汇集方式进行。所有的用户数据都会通过脱敏技术进行处理,以全集形式形成大数据集,对模型进行训练。讯飞翻译机提取的是数据的共性,而非个性。

    ▲科大讯飞翻译机业务总经理翟吉博先生

    部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与旺旺福股票配资进行文章共享合作。