当前位置: 首页 > news >正文

jsp做网站框架半成品网站

jsp做网站框架,半成品网站,衡水网站建设公司哪家比较好,django网站开发视频教程来源#xff1a;大数据文摘作为自然语言处理中一项非常重要的应用#xff0c;现代意义上的机器翻译概念从上世纪40年代提出至今#xff0c;经过了几代革新#xff0c;现已初步实现了多场景的落地和应用。近几年随着机器翻译质量的提高#xff0c;机器翻译代替人工翻译的声… 来源大数据文摘作为自然语言处理中一项非常重要的应用现代意义上的机器翻译概念从上世纪40年代提出至今经过了几代革新现已初步实现了多场景的落地和应用。近几年随着机器翻译质量的提高机器翻译代替人工翻译的声势逐渐浩大起来那么机器翻译对于人工翻译而言是威胁还是可利用工具在多大程度上机器翻译又能帮助普通用户呢在AI Time第六期的辩论中中科院自动化研究所研究员宗成庆、北京外国语大学高级翻译学院副院长李长栓、苏州大学计算机学院副院长国家杰青张民、东北大学计算机学院教授朱靖波、清华大学计算机科学与技术系长聘副教授刘洋一起论道了机器翻译的相关问题。机器翻译历史机器翻译的历史大体可以分为两大阶段第一阶段是从60年代到90年代初期理性主义方法是主流主要是让人类专家观察语言规律把它描述成规则让机器按照既定规则进行翻译。第二个阶段是90年代特别是互联网出现以后开始从事统计机器翻译研究此时数据以及相应的数据驱动方法得到蓬勃发展。统计方法比较经典的模型叫做隐变量对数线性模型它的特点是要设计特征X代表输入Y代表输出Z就代表中间的语言结构通过定义各种特征函数来训练一个参数很多工作都集中在如何设计好的特征来描述翻译规律上。但语言太过复杂穷尽人类智慧也很难把这个特征设计全面其中一个难点称之为调序比如“就中东局势举行了一个小时会谈”这是一个典型的介词短语和动词短语的组合在中文中先说介词短语再说动词短语但在英文中都是反过来的。2015年后深度学习在机器翻译得到应用。深度学习的主要意义在于它可以从数据中自动提取表示就不需要像以前一样设计特征来描述翻译规则只需要设计一个网络让机器自动在数据去寻找表述效果非常好。但还是有难解决的问题它根本不知道数字是什么意思不知道为什么出错不知道怎么去改动它而且很难控制。目前最核心的技术叫做注意力机制希望通过自动计算发现中英文之间的相关性这在整个深度学习里也是非常核心的技术。现在可以利用一些比较新的技术这个是transformer希望能够处理更长的序列。机器翻译旨在弥补人类干不了的场景最近几年出现了一系列机器翻译应用比如翻译机、微信的翻译服务。机器翻译很大程度上是为解决不同国家、不同文化之间的沟通问题如果机器翻译能在一定程度上取代人、帮助人沟通的信道会有一个巨大的释放。那么机器翻译究竟能否代替人呢宗成庆老师认为机器翻译近几年的进步很大可以大幅提高翻译效率但是机器翻译的运用需要基于场景和任务机器翻译在一些场景下确实能帮助人比如旅游问路但是在某些领域比如高层次的翻译要对机器翻译寄予太多的希望还为时过早。张民老师对宗老师的观点表示赞同他补充道机器翻译要从学术界和产业界两个侧面看。学术界一直可以做下去产业界里机器翻译已经蓬勃发展产业对学术界技术需求强烈技术达到了产业低端门坎产业推动技术发展、技术服务行业。李长栓老师也认为虽然机器翻译进步惊人但不会有取代人的一天其主要原因在于机器翻译质量还达不到专业翻译的要求单个句子能理解但通篇没有逻辑。朱靖波老师同意宗老师和张老师的观点并举例说通常假设翻译人员的结果完全正确而技术想要超过100%去达到101%的正确率这在真理上是无法超越的。但是机器翻译在大数据之后蓬勃发展并非意在取代人类比如国家知识产权里几百万个专利文档只能利用机器翻译非人工所为再比如身在国外人工翻译不可能随时在身边只能利用机器翻译这都不能算是代替人工翻译而是去弥补人工翻译干不了的应用场景。是机器翻译的问题还是技术尚未成熟李长栓老师根据自己的使用经验归纳了一下机器翻译中遇到的主要问题以句子为基础翻译忽略上下文中文长句子翻译成英文需要断成几句但断开之后后面的句子就没有主语了这时候要补充主语。而机器翻译根据什么补充主语成迷。同一个词出现多个译文版本比如“诉裁程序”机器翻译给出了十几个译文版本这个问题应该可以解决但是神经网络翻译似乎还没有解决这个问题。机械处理信息机器翻译是依赖于形式的转换遇到歧义时是根据概率决定修饰关系一词多义也是即便给了语料库但是在同一个专业领域一个词也有很多意思。朱靖波老师对此表示部分赞同首先目前基于句子级翻译系统主要因为具体实现机制的问题实际上学术界关于篇章级机器翻译有不少研究工作。基于上下文分析主语省略和指代消解等问题他更倾向于认为是理解问题而非翻译问题但可以将两者结合起来实现更好的翻译结果。其次有些问题应该分成两个环节来考虑比如原文错误人会通过理解对其进行纠正错误后翻译但是对于机器翻译来说它认为这是用户想要表达的意思不能轻易自动修改原文导致错误的翻译。这就引出一点机器翻译是不是和别的技术融合在一起使用的效果更好。最后一词多义跟结构歧义的问题是现在做得不够好不是机器翻译没有能力解决机器翻译建模的核心就是为了解决这两个问题。宗成庆老师指出现在机器翻译的基本假设是只要收集到足够多样本就行。但这个假设是有问题的第一模型能否学成存疑第二不应该只基于样本还有日常生活经历和常识等。现在的模型还不够智能提供足够的样本也无法学成这也是提出基于知识的机器翻译的原因。张民老师从学术界的角度分析了机器翻译存在的两个重大问题。一是篇章问题翻译本来应该根据上下文理解和逻辑分析但目前机器翻译建模方法都是句子对句子在句子层面把翻译看作是纯数学映射因此深度学习的方法如果遇上语料训练缺失的情况急剧下降。二是知识和推理驱动不仅仅是语言学知识还包括常识知识、领域知识、世界知识等。预训练的提出与背景补充构想刘洋老师举了一个例子有高翻在法国为了翻译一本很厚的地铁资料坐了一周的法国地铁向乘务员询问各种信息后来为核电站翻译也是如此要知道设备的用途他认为翻译的绝大功夫都是花在对背景知识的理解。而反观现在的机器翻译还是基于数据没有上升到知识。预训练是一个非常不一样的想法在单语数据上设计相关问题的学习任务这样数据几乎是无限的然后在上面训练模型。过去一年预训练的方法基本刷榜了LP任务普遍提升8-10个点。但是机器翻译还没有这么好的效果因为翻译的输出不是简单的分类而是整个序列这个序列光输出这个词就是指数级的数据同时还要排准数据和阶层复杂度非常高。预训练和机器翻译的结合是一个方向如果提升到基于知识的翻译系统显然是更好的策略。目前比较容易想到的是知识图谱和机器翻译结合但这块没有突破性的进展。李长栓老师也认为专业翻译大部分时间是用来查资料的他举例“某一个先生指出索马里沿海海岛问题联络小组鼓励通过法律允许根据捕获和释放的做法进行起诉”看 完之后不知所云这就是机器翻译的结果。这种时候专业翻译就会去查阅相关资料明白之后再进行翻译“谁谁指出鉴于一些国家存在先抓后放的做法某小组鼓励相关国家通过立法允许起诉”。翻译是一个不断调查、不断获取文字背后意思的过程表达的过程是在理解基础上自然形成的。同时李长栓老师也提供了他对机器翻译的优化思路机器补充知识是机器的优势它有无穷无尽的语料翻译某一句话时就可以利用超链接等方式提供相关背景这样会更有助于翻译的进行。朱靖波老师根据自己的经验列举出好的机器翻译系统需要的三个东西。一是扩大训练数据规模提高品质二是不断创新技术三是根据问题不断打磨三者缺一不可。他把机器翻译技术的概念扩大到两个不同对象之间的等价转换并认为机器翻译与人工智能和NLP不同机器翻译是一个产业机器翻译也是一个产业。宗成庆老师认为虽然现在机器翻译问题很多但是不用悲观从研究角度讲只有发现问题才能改进问题问题代表了进步空间。机器翻译的突破口在于产生新的范式朱靖波老师认为未来机器翻译的突破口在于产学研形成闭环应用需求不断推进机器翻译理论和技术研究。刘洋老师表示必须要在范式上进行革新要找到好的策略和方法充分利用非标注数据。或者能把数据用好或者能够从未标注数据中提炼出知识这两点都非常关键。李长栓老师认为机器翻译在中英文间的切换还是很困难但是在新闻语言等领域机器翻译的质量已经很高。未来的突破还是要回归到范式或者是思维方法的改变上来从句子当中抓取意思再重新表达这是人做翻译时的思维过程未来机器翻译也是这样。宗成庆老师补充道高质量的机器翻译结果并非一定要达到信达雅那是人类翻译的终极目标目前在某些场景的翻译结果已经很好未来还需要解决更细节的问题。从某种意义上讲现在神经网络机器翻译的性能已经接近天花板未来一定是对翻译模型进行改进和提高从技术应用和产业发展的角度讲需要明确具体需求和任务针对性地做定向开发这是推动整个技术真正走向实用的比较可行的路线。张民老师表示机器翻译本身既是一个科学问题又是一个工程问题未来想要突破科学上的突破一定要从科学技术上产生新的范式工程上的突破一定要依赖知识而知识需要在不同的领域、需要全人类来解决。《崛起的超级智能》一书主要阐述当今天人类为人工智能的春天到来而兴奋为人工智能是否超越人类而恐慌的时候一个更为庞大、远超人类预期的智能形态正在崛起种种迹象表明50年来互联网正在从网状结构进化成为类脑模型数十亿人类智慧与数百亿机器智能通过互联网大脑结构正在形成自然界前所未有的超级智能形式。这个新的超级智能的崛起正在对人类的科技产业、经济军事国家竞争产生重要而深远的影响。作者刘锋   推荐专家张亚勤、刘慈欣、周鸿祎、王飞跃、约翰、翰兹未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能互联网和脑科学交叉研究机构。未来智能实验室的主要工作包括建立AI智能系统智商评测体系开展世界人工智能智商评测开展互联网城市云脑研究计划构建互联网城市云脑技术和企业图谱为提升企业行业与城市的智能水平服务。  如果您对实验室的研究感兴趣欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”
http://www.zqtcl.cn/news/883391/

相关文章:

  • 可以建网站的软件南昌seo代理商
  • 手机网站建设宽度中小型企业网站模板
  • 网站开发需要的所有技术中信建设有限责任公司历任董事长
  • 安徽省建设干部学校网站首页做软件是什么工作
  • 图书馆网站设计方案安徽质量工程建设网站
  • 电子商务网站建设效果那个网站可以做链接
  • 怎样做投资与理财网站网页设计优秀案例分析
  • 网站制作需要学什么搜狗网页版入口
  • html源码网seo搜索优化工程师招聘
  • 做的网站在小窗口中怎么保持中间广东省公共资源交易中心地址
  • 合肥做网站汇站网织梦网站广告代码教程
  • 复兴专业做网站wordpress搬家502
  • 代做毕网站淘宝权重查询
  • 有专做高端折扣女装的网站吗大连最好的做网站的公司
  • 网站需求嘉兴seo关键词优化
  • 自己开发微网站上海成品网站
  • 国外对企业网站开发的研究山西住房与城乡建设厅定额网站
  • 国家工信部网站备案postfix wordpress
  • 兴宁电子商务网站建设网站模板在线制作
  • 汕头整站优化营销推广网
  • 云服务器搭建网站教程加盟教育培训机构
  • 建筑网站设置工资单人换了怎么换太原做网站找谁
  • 网站做推广需要什么条件重庆网站推广哪家服务好
  • 怎样做理财网站wordpress做产品页教程视频
  • 官网模板建站塔山双喜北京网站建设兴田德润官网多少
  • 网站优化推广外包深圳专业网站建设定制
  • 网站开发aichengkeji元凤建盏简介
  • 移动端网站怎么制作asp做的网站如何发布
  • 做的网站用户密码在哪里找凡科申请的网站和qq空间一样吗
  • 如何自己做网站发布到服务器上面wordpress没有幻灯片