当前位置: 首页 > 云计算

36氪首发-人工智能大数据公司「新译科技」完成5000万元Pre-A轮融资,侧重人工智能文本领域B端

发布日期:2019-05-29 17:40:50 | 编辑:it技术文章网| 阅读次数:

摘要:原标题:36氪开始| 人工智能,大数据公司的新翻译技术“,完成5000万元预-A轮融资,专注于人工智能的B面文本字段,氪36的商业G的结束近日获悉,人工智能大数据公司新的翻译技术获得了5000万元前期A轮融资。这轮融资的厦门市,美国和亚洲的印度投资管理有限公司。有限公司。凯太伯资本和资本投资合作,原来圆形的天使投资机构继续跟进力合。新翻译技术的天使轮在2016年十月融资额完成,截至目前

原标题:36氪出发| 人工智能,大数据公司的新翻译技术“,完成5000万元预-A轮融资,专注于人工智能的B侧的文本字段,G方企业

\

36氪了解到,该公司新的人工智能,大数据转换技术获得了5000万元预-A轮融资。这轮融资的厦门市,美国和亚洲的印度投资管理有限公司。有限公司。凯太伯资本和资本投资合作,原来圆形的天使投资机构继续跟进力合。新翻译技术的天使轮融资在2016年十月建成,为现在前A轮融资资金的已到位。机构投资者轮融资引入主要是为了公司未来的布局和资源整合,资金主要用于拓展市场,引进高端人才,建设硬件资源的投入和研究所。

数据显示,截至6.23%,预计2020年将达到约US $ 52十亿。在2014年和2016年发生的事件,基于基于神经网络的神经网络作为机器翻译(NMT)上,在主流比以前的统计基于模型的统计机器翻译(SMT)全面开始,并迅速成为在线翻译系统标准。

NMT的基本思想的基础上,每一个句子作为一个独立的神经元,从而打破了传统的基于短语的翻译障碍。此外,NMT跳过之间的各种传统的基于短语的机器翻译分步NLP(分词,词性标注,句法分析等。),具有深刻的网络结构来研究源语言拟合目标语言直接监管可以达到训练的概率,不必完全依赖于固定的数据,可以在专业知识等数据稀少地区链接。,以获得更好的翻译结果 。

在人工智能领域的文字,专注于机器翻译R&d和衍生品的开发。目前国际上主要谷歌翻译,微软翻译,国内主要和百度有一个适当的方式,最近加入了阿里,腾讯等企业。目前的机器并把这些机构都是大品牌,高流量,KJV侧重点不同着陆和终端B和G终端应用,产品定位,并以不同的产品定位和服务目标,让这些大公司。

主要依赖于人工智能,大数据的三个方面,和算法计算力。数据显示,新翻译技术的投资,以提高数据的量,从另一方面帮助最终用户建立内部数据B,有些客户的允许获得专有数据的前提下,。算法上利用GPU / FPGA和其他硬件神经网络芯片以及与所述云新的翻译。目前训练接近1 GPU速度。比开源框架Theano,Tensorflow,火炬训练时间快5-2倍。在分布式集群环境中训练,3-5天可以培养1千万双语的数据,在836个字/秒平移速度(GPU)。该算法用于深入学习机学习方法。

现在,新的翻译技术涵盖了包括爱沙尼亚语,保加利亚语,匈牙利语,土耳其语,意大利语,阿拉伯语,荷兰语,法语,越南语,日语,韩语,捷克语,葡萄牙语,德语,西班牙语,英语,俄语,中国和其他主流的37种语言,目前基于不断更新的在线用户的需求。

\

据36氪了解到,新的翻译技术,自2015年至今,从最初的统计混合模型的规则,现在的神经网络模型,三大系统的更新版本。为了测试公众的在线翻译效果(MT。newtranx。COM),联合国的数据技术领域的一个新的翻译使用发表(联合国平行语料库V1.0)()和UM-语料库()做了评价。其中,联合国平行语料库披露V1.0,所有的新翻译技术选择外语为1990年至2014年的数据对中国双语数据(英国,法国和西班牙,阿拉伯语,俄语,中国),除了补充2015--2016年联合国双语的对每种语言的2约300,000和UM-语料库数据。百万英双语数据。测试组选择联合国平行语料库V1.0被设定为开发中所公开的测试集。下图显示了在贝鲁作为评价指标比较图表中的值(共同的机器翻译评价标准国际)。从上图可以看出,翻译质量比以前版本的系统的最新版本已经达到了一个基本升级2 BLEU值,最大起升9%。

\

图:新老版本的新翻译技术NMT比较引擎

那么目前有一个共识是,在双语一定量的数据,机器翻译的比一般效果的垂直领域。新翻译技术已有37种语言共10个。3十亿对的公司现有五个。七亿中国和英语句子分类和整理数据,分为25个区。新闻媒体的最终选择,IT通讯,专利权,货币和金融,生物医学,法律合同,工程与制造,工程机械,石油化工,说话就行主要旅游区。

之所以更喜欢这种类型的区域,因为机器翻译的是叙事文本的良好表现和传达,创意内容(诗歌,散文)是不完美。这与表达的几个方面非常适合相对固定,便于机器“理解”。

目前新的翻译侧重B和G-高端商务,解决的办法是国内需求,公安,国家安全,军队,政府和互联网企业,采取长期合作的模式,定制的数据和专门的引擎和系统目前盈利主要来源。

在合作的过程中,我们将逐步完善内部语言服务生态系统,利用自然语言处理,解决各种在文本中遇到的实际问题。从长远来看,新的翻译技术,在引进资本投资的时间,将集中于资源,如清华力的集成等方面具有良好的大学资源,AIU梧桐具有良好的社会治安和大数据资源,资金有凯泰医疗资源,资金博有很多的旅游资源和财政资源在国内外。

上的形式中,新的翻译技术已定制机器翻译,翻译浏览器,辅助翻译系统,翻译机器人,目前机器翻译的羧基端是主要衍生物,如浏览器插件,文档翻译,办公插件,和其他知识产权翻译APP。

一个新技术的核心优势是技术资源的翻译,公司拥有澳门大学100余人的队伍,为技术人员近2/3,新的翻译技术团队来自清华大学的创始人, ,卡耐基梅隆大学和自然语言处理的世界其他国内和爱丁堡硕士,博士研究人员和实验室顶部。清华投资,并在国内清华大学引进的专业人才和国外在这方面的后。

本文链接:36氪首发-人工智能大数据公司「新译科技」完成5000万元Pre-A轮融资,侧重人工智能文本领域B端

上一篇:36氪独家-新一代数据库「偶数」获红杉中国、红点中国投资,开源技术商业化是个好方向

下一篇:36氪首发-汇医慧影获数亿元B轮融资,人工智能辅助诊断已落地700家医院

友情链接:

心经讲解 大悲咒 普众礼佛网

Copyright © 2017 it技术文章网 版权所有 All Rights Reserved. 网站地图

苏ICP备18043316号