【分布式网络阅卷系统的设计与实现】常见的分布式系统
台州9个县区的学校,高中各年级约2万名考生,参加10科目的统考。自2008年分布式网络评卷系统(以下简称系统)实施以来,台州教育系统对系统进行了多次调整和优化。目前2400人可以同时阅卷6万名高中生的试卷,两天内完成全部阅卷工作,并自动生成相应的学生报表和分析报告。该系统由三部分组成:网络系统、硬件系统和软件系统。
一、网络系统设计
网络系统是实施分布式评卷的基础,用于分布式评卷点的网络接入。因为各个学校的网络接入形式不一致,既有通过县教育城域网导出的学校,也有直接接入互联网的学校。另外,各种考试的保密要求也不一样。比如中考阅卷有保密要求,而高三期末考试没有相应要求。因此,本系统应考虑多种网络接入方式。无保密要求的网络标识可通过互联网接入,有保密要求的网络标识可通过专网接入,可采用MPLS VPN或SDH通过光纤组网,保证系统在运行时与其他网络物理隔离。
首先,我们需要考虑系统网络的稳定性。由于组网后SDH抑制广播风暴能力较弱,泰州中考试卷采用MPLS VPN网络接入,每个县区都有一个接入点用于本地阅卷客户端接入和扫描数据上传。中考期末考试采用MPLS VPN网络和互联网接入的混合方式。
其次,我们需要考虑这个系统的互联网出口带宽和MPLS VPN汇聚带宽。经过多次网络阅卷运行测试,每个阅卷客户端在阅卷时主要传输试卷的分割图片,需要的平均带宽为40Kbps到50Kbps。泰州高级中学一个年级2万名学生所有科目所需带宽约为72Mbps至80Mbps。考虑到本系统的扩展和后期教育资源享受等应用业务的发展,互联网出口采用100Mbps专线,MPLS VPN网络采用100mb PS专线。
二、硬件系统设计
1.服务器系统
服务器系统包括数据库服务器、阅卷服务器和图像服务器,是分布式阅卷软件的基础平台。数据库服务器保证数据库系统的稳定运行,对CPU资源的要求很高。该系统使用ORACLE 9i作为后台数据库。根据实际测试,高中10科在2× 2 CPU、4 G内存的单一服务器平台上同时评测,每科单年级2万条记录。系统运行稳定。阅卷服务器实现网络阅卷界面的登录,主要负责HTTP请求,对服务器的内存和CPU性能要求较高。在单个2× 4 CPU、8 G内存的服务器平台上,可以有超过1500人同时访问。图像服务器实现分段试题图像的分发,主要占用网络资源和磁盘读写。考虑到数据的安全性和系统的稳定性,本系统采用大容量光存储系统作为存储介质。
2.海量存储系统
大容量存储系统用于存储扫描试卷的切片图片。每科2万考生平均数据量为3GB。该系统采用Raid 5构成4TB存储系统,实现了阅卷平台的稳定运行,满足数据备份需求。另外,每张试卷的图片容量级别为40KB到120KB,在磁盘系统中访问小图片存在较大的性能瓶颈。我们可以先把每一张小图按照索引写成一个大文件,阅卷时通过软件检索。这种措施可以提高访问速度,节省数据备份时间。前期这个系统使用小图片存储,传输延迟2分钟到5分钟,每次备份考试数据需要8小时左右。后期对系统进行了调整优化,使用大文件存储。在2400人同时在线阅卷的情况下,图片传输时延小于3秒,每次考试的数据备份时间仅为半小时。
三、软件系统设计
软件系统包括以下子系统:
数据报送系统可以上传阅卷老师信息和考生考场安排数据。中考涉及30多所学校,中考涉及250多所学校。纸张扫描系统实现了从纸张扫描纸到图片格式文档的转换。扫描后,通过预定义的纸张格式,根据分割区域自动分割成相应的阅卷区域。图片格式的文档按科目单位打包成文件,传输到台州市信息中心图像服务器,用于分发试卷。
阅卷软件系统是整个阅卷系统的核心组成部分。采用浏览器/服务器模式适应各种环境,采用J2EE架构保证系统在高并发下的稳定性。经过实际运行测试,使用Java第三方组件作为类库开发系统,单台服务器500并发数会造成中间件崩溃。后期使用Java原生代码后,1500并发运行在同一配置的单台服务器上,非常稳定。
分数合成系统在网络阅卷工作结束后启动,自动合成主客观分数,并以此为基础生成各种分析报告。年级分配制度按照市、县、校三级控制权限。学校管理员用相应的账号登录后,系统会检索相关学校考生的数据,并以Excel文档的形式下载到本地,方便学校对数据进行二次处理。
四、系统运行效果
2011年6月,台州市教育局教研室组织了两次考试:6月1日至6月1日,组织浙江省证书考试,客观题拆包后统一机器阅卷,主观题全省统一手工阅卷;65438+10月17 ~19组织台州市重点高中期末联考,主观题也是以分布式网络的形式阅卷。两次考试后的工作安排及费用见表1。
首先,使用这个系统可以节省很多钱。对比两次考试后的工作安排,考试结束后需要安排专门的车辆运送试卷。收到市级试卷后,15人在试卷拆包流程中需要连续工作7小时,50人在考试结束后的分数录入流程中需要连续工作15小时。各环节人工费、阅卷老师的食宿费用等共计15万元。使用分布式网络阅卷后,最后的试卷由学校扫描,通过网络上传。不需要安排专门的人来拆包文件。阅卷完成后,评分和报告由阅卷软件自动生成。
其次,该系统可以提高阅卷效率。以化学为例:高二学生30523人,主观题30分,改卷老师65438人,连续工作时间16小时。据此,教师平均阅卷速度为37.4整张试卷/小时。高二重点中学期末考试15435人,纸面主观题60分,阅卷老师11,连续工作时间4小时。按此计算,教师平均阅卷速度为每小时32.4份。如果不考虑期末考试的阅卷难度,主观题60分折算成30分后,网上阅卷的平均阅卷速度可以达到每小时64.8份。
第三,系统可以有效地控制误差。高中期末评价采用单项评价,每科安排一名质检员监控阅卷质量,及时提醒给分过高或过低的老师,退回重新评价。中考两次阅卷,和系统保证两次阅卷的老师不一样。引入了仲裁机制。如果同一考生的两个阅卷老师给出的分数之差超过误差限,系统会自动将试卷发送给学科带头人进行处理。这一制度引入中考阅卷以来,在公平公正方面得到了社会的一致肯定。
(作者单位:浙江省台州市教育局教研室)