奥菲斯量子比特报告|琼公众号QbitAI
我,一名科技编辑,最近和外国老板互发邮件,感觉通过六级后我的英语写作能力越来越差。
如何使用子句?时态正确吗?看着对面小编锐利的目光,那一刻,我真想问问自己,为什么没有好好学习,一天天起床。
于是,我决定学习英语写作!
如果你想提高自己的技术,不自己写总是有点没有意义。
那么问题来了:我的文笔好不好?谁帮我纠正一下?
其实从小学开始,学英语一直是个难题,小学、初中、四级六级、雅思托福……如何提高英语作文。
尤其是各种考试,都有严格的评分标准,但如何才能一直有经验丰富的阅卷老师在身边帮助有针对性的复习和提高呢?
网易的一个胖友听完我的烦恼后向我招手:你看我手机上这个红色的App。它有一个新推出的人工智能,可以帮助你批改英语论文。
是的,如果AI真的能准确评分,甚至给出复习建议,像我这样的学生不就可以随时随地练习英语作文到成功了吗?
经过一番研究,我发现有不少产品具有英语作文人工智能批改功能:网易有道词典、微软iWriting(小影)、Correction.com、Grammarly……
想到目前宅在家里的大人和孩子可能也有同样的烦恼,我决定亲自测试一下这些AI是否可靠。
哪家公司AI论文审稿比较好?经过初步筛选,我挑选了几款免费好用的播放器参与评测,分别是:网易有道词典AI作文批改、微软爱写作、Grammarly免费版。
那么,话不多说,让我们直接进入游戏吧。
第一轮:手写识别,如中小学英语考试、大学英语四六级、研究生英语考试、雅思、托福考试,实际考试时都需要在纸上书写,所以学生在练习时往往会选择手写。
写完一次之后,再打字就有点麻烦了。如果我拍一张照片,AI就能自己识别出我写的东西,那就方便多了。
有道AI作文批改和微软iWriting均支持图像识别功能。至于Grammarly……由于没有这个功能,这位玩家选择暂时退出游戏。
我尽力用非标准测试字体写了一篇文章来测试两位参赛者。
我们先来看看有道AI作文批改的表现:
识别的还是比较准确的,有修正的地方也没有出现误识别的情况。需要手动修改的地方很少,基本上都是手写体太大时字母之间的空格,所以识别就变成了两个。字。
我们来看看微软小影的结果:
由于我没有写标题,小影被迫承认第一段是标题。如果忽略这一点,识别准确率也是很高的。但标点符号的识别不如有道AI作文批改灵敏(上图中红色标注)。
还有一个小问题:如果你写的两个字间隔较宽,小影会识别出多余的空格。如果不仔细检查,将会影响下一步评分的准确性。
另外,与网页版的微软爱写作相比,手机上的有道词典可以直接拍照识别,无需将照片传输到电脑上,更加方便。
第二轮:纠错能力如果说OCR只是影响用户便利性的一个细节,那么AI批改论文的重点当然是能否准确捕捉到论文中的bug。
有道AI作文批改、微软小影、Grammarly都具有识别文本中语法错误并给出修改建议的功能。
这一轮我们用一些单句来测试谁的调试能力更强。
例一:女孩要走的时候,发现树上有一个老乞丐,眼神愤怒而冰冷。
存在时态错误和拼写错误。
有道发现4处错误:
具体判断为:疑似用词不当,建议将“将离开”更正为“离开”; 怀疑动词时态错误,建议将“fount”更正为“found”; 疑似名词误用,建议将“乞丐”修改为“乞丐”; 介词“at”疑似多余,建议删除。
把问题发给微软小影,它也发现了这4个错误,并给出了单词替换建议。
具体判断为:动词时态错误,将“将离开”改为“离开”; 动词用法错误,将“fount”改为“found”; 单词拼写错误,将“乞丐”改为“乞丐”; 冗余,删除“at”; 建议用“苦”、“硬”、“贱”代替“冷”。
最后我们来看看Grammarly的判断。
Grammarly的免费版本指出了一个单词的拼写错误,并建议我升级到付费版本。
同样,在“但是这种压力并没有阻止我想去参加我们学校的大活动”这句话中,有道和小影都指出了三个错误:
介词“to”改为“about”;动词“attend”改为“attending”; “biggist”拼写错误,改为“biggest”。
Grammarly的免费版本仍然只指出了“biggist”的拼写错误。
看来,就自由体验而言,Grammarly 的语法修改还是比较简单的。
最后额外加试题有道AI作文批改和微软小影。
例2:在一个寒冷的早晨,我看着一个女孩在外面给我买面包和牛奶。
对于AI来说,识别这句话的难点在于同一个物体涉及多个错误。拼写错误“fiont”之后是错误使用介词“for”。
面对这个问题,有道成功识别出了“in the front of”整个单词,不仅指出了拼写错误,还发现了短语介词的错误。
微软小影的修改有点让人摸不着头脑。难道他在这句话中感受到了主角的内心戏?
本轮比赛结束了,我们简单总结一下。
它也是免费的。与中文世界的两位玩家相比,免费版的Grammarly 有着很大的差距。
不过,Grammarly 有一个插件版本。直接写邮件时,可以边写边改正错误。
但如果你想在人工智能的帮助下提高英语写作能力,免费版的Grammarly 可能不是最好的选择。
有道AI作文批改和微软小影都比较符合国内英语学习路径,整体表现还不错。然而,当错误复杂度增加时,有道的性能稍好一些。
第三轮:评分准确性另一个重要的点是评分的准确性。
毕竟,考试有严格的评分标准。能否按照标准给出准确的分数,对于广大需要参加考试的同学来说,仍然是一个非常重要的参考指标。
有道AI作文批改和微软iWriting均支持多个学习阶段的英语作文批改,涵盖小学、初中、高中、四六级、雅思托福和研究生英语。
至于Grammarly,作为一款“进口”应用,不太适合我国应试国家的风格。它不具有评分功能,无法区分学术阶段和考试类型。
不过,使用Grammarly,您还可以根据自己的情况进行一些个性化设置,包括Audience、Formality 和Domain。
问题仍然存在,免费版本的选项有限。
我在网上找到了一篇雅思范文,分数是7.5分。真人老师评价这篇文章:词汇丰富、语法点丰富、论证全面。
那么AI会如何评价这篇文章呢?
我们先来看看有道AI作文批改的答卷。
有道给这篇文章打了8分,并对它的词汇、结构、语法、内容进行了评分。
点击查看评论,还可以看到AI阅卷官从单词、句子、章节入手对作文的整体评价,对一些更高级的词汇的推荐,以及好词的巩固。
.词汇比较丰富.文章比较流畅.词汇基础扎实。
这样的评论与人类教师的判断基本一致。
同一篇文章中,我们来看看微软小鹰是怎么说的。
也给了8分。更特别的是,小英会统计作文中使用的教学大纲词汇、逻辑连词和从句的数量。
与有道给出的总体评价报告不同,小影给出了四个评价指标:文章结构、句子关系、关联度、展开度。
需要注意的是,如果要引用文章内容的相关性指标,必须填写文章标题。至于拓展的指标,我反复尝试过很多作文,从高考作文到雅思作文,都稳定在一星……
结束了这一轮的比赛,我们也做一下总结。
总体来说,有道和小影根据不同考试类型的评分结果与考试评分标准一致,具有参考价值。
在细节方面,有道会根据字数、词汇使用情况、句子逻辑和衔接等方面给出综合评价,而微软小影会给出逐点建议,主要关注文章结构和句间关系。
不过,微软小影在测试过程中出现了一些小bug。
例如,6级作文满分为15分,但评分界面上的最高分是25分。
背后的技术看来,有道词典的AI批改论文确实有两把刷子。
出于技术小编的好奇,我询问了文章开头向我推荐该软件的胖友,想了解一下它背后到底有什么样的技术。
以有道为例,其英语作文批改分为三个核心模块:评分模块+评论模块+纠错模块。
评分模块负责提供总分,以及词汇、语法、结构分数,采用传统方法+深度学习方法。
评论模块提供全文评论、词汇推荐、样文推荐。
纠错模块提供14类语法错误识别与纠正,包括浅层拼写错误、深层语法错误等。
其中,拼写纠正采用了基于BERT的NER实体识别技术。
语法错误纠正被定义为序列到序列的生成问题。核心基于Transformer架构。
核心模型所做的事情其实和翻译类似:将语法错误的句子翻译成语法正确的句子。
此外,迁移学习和对抗性学习也被用于语法纠错。利用真实语料和基于真实用户错误分布生成的海量伪语料不断提升模型能力。
以上是网易有道词典的质量评测结果。 P值是精度,R值是召回率,F0.5是P值和R值的调和平均值。值越高,算法的性能越好。
可以看到,有道AI作文批改的测试结果达到了行业领先水平。
好吧,看完这篇试用报告,如果你正在准备大学英语四六级、雅思、托福、研究生英语考试,你愿意选择人工智能免费批改你的论文吗?
让我们从今天开始吧。如果你还有其他烦恼,需要评估AI工具,也可以在留言区告诉我~
- 超过-
量子比特QbitAI·今日头条签约
关注我们,第一时间了解前沿技术动态