百姓彩票下载安装

知网成翟天临论文抄袭事件“照妖镜”,比知网更厉害的竟然是它?!

发布时间:2019-02-15

       最近,翟天临论文抄袭事件在网上流传甚广。博士生毕业却说“知网是什么东西”,不禁让广大网友质疑他“学位造假”、“论文不是自己写的”。为找到真相,网友们上天入地、穷尽各种办法找到了他的两篇论文,结果其中一篇论文的查重率竟高达40%,论文抄袭事件在网上持续发酵。


x432.png


       那么,问题来了,翟天临口中不知道的“知网”究竟是何方神圣?

x433.png


       知网可以提供文献检索、数字检索、翻译助手、图形搜索在内的多种知识检索服务。可以说,在中国,每个读过大学以上学历的人,不可能没听说过知网。写论文、交论文、查重,知网都是必备神器

       查重是什么技术原理呢?即把论文导入查重系统知识库,通过与库内收录的文献资料进行数据比对,排查出论文中重复的文字内容,当达到查重软件设置的查重规则上限时,就会被认定重复,计入重复率。

       现如今,社会上流传着不少规避论文查重的方法。常用的词语删减、将英文文献翻译为中文、变更数据图表等取巧方法已大部分能被知网识别,但如果遇到全部改写、改变描述方式、打乱段落顺序、删除关键词、关键句等全盘打乱改写的情况,目前依然很难被认定为重复。

例如:

x434.png


       这种情况在知网上很难被认定为重复,但一套强大的软件组合拳从技术层面能识别出这是两个相同的概念:

       KADB+NLP,强强联合,威力空前!

       KADB是人大金仓自主研发的一款大规模分析型数据库,通过MPP技术可对海量数据进行分析、挖掘和检索,数据处理容量高达PB级(1PB=100万GB)。

       NLP(自然语言处理)是一种人工智能技术,是让机器“理解”人的自然语言。即使面对十分模糊的长长的、晦涩难懂的句子,依然能聪明地进行文字比对、语种比对、语义分析、语义比对、相似度统计及相似度计算等多种应用。同时,NLP还支持无监督下的自我学习,不断提高识别准确度,扩大识别的范围。

       当两个软件联合作业,即使句子被调换语序、改变语法,技术层面依然能分分钟判定其为两个相同的概念。

       论文查重的精准率有望进一步提升,你就说厉不厉害?


微信图片_20190218100246.gif


       目前,KADB和NLP工具被广泛应用于人工智能相关场景。尤其KADB还内置地理信息、图计算、聚类、回归、分类等40+种领域算法,可轻松应对人脸识别、车辆轨迹分析、关联关系分析、时空数据分析等典型人工智能应用,被誉为“更懂AI的MPP数据库”。

       全面打乱改写的重复率认定情况目前仍存在较大漏洞。KADB+NLP目前虽从技术层面能实现概念认定,但整个功能的成熟完善乃至实现商用仍有很长的一段路要走。

       未来,还需相关软件厂商多加努力,在完善技术和应用层面下足功夫,弥补查重领域现存的漏洞,使类似翟天临论文抄袭的事件得到有效遏制,让中国的学术之风更清明、更纯粹。


为祖国学术事业做贡献,

金仓在努力!


中国数据管理与服务领导者   专为需求而生








上一篇:关于百姓彩票下载安装 下一篇:总裁杜胜新年致辞|携手客户 共生共荣