
李小康正好做志愿者 本文图均为 复旦大学供图
三月初以来,复旦大学发动常态化核酸筛查事业,请求辅导员必需核查弟子“健康云”核酸达成截图,保证“不漏一人”。
人力核查费时费力又易出错,为这,消息科学与工程学院生物医学工程不业余博士生李小康迅速开发一项小程序,几分钟就可以迅速核查数百人的核酸达成截图。
李小康是消息科学与工程学院的一名辅导员,他显示,核查截图这件事单调枯燥又费时,循环性很强,正适合计算机程序的特色。因而,他有了想法,写一种代码程序来源动核查。
李小康开始写程序时和学工同事的聊天
程序一写好,李小康就在本人班级的核酸截图数据上认证,明确率果然很高,甚而检验出了此前人力核查无发觉的难题。程序运转时间很短,80多张图只要要20多秒。
该学院研工组须要核查学院全部探讨生的核酸截图,本来要几私人核对一种多小时。用了李小康的程序后,800幅截图,此刻只要等2分钟就拿到结果,程序日前已在该学院效劳2周。
提起原理,李小康以为其实不繁杂。作为生物医学工程不业余博士生,探讨方向是医学影像与人力智能,他通常会接近好多图像料理方法。得益于长久的科研习惯和代码感性性,面临自动核查核酸截图这件事宜,李小康第一时间料到从前学来过的OCR(Optical Character Recognition,光学字符辩别)技艺。
“OCR可行把图像中的文字辩别出去,转换为文本消息,就方便用以核查了。况且由于核酸截图是打印字体,辩别率十分高,差不多可行做到100%明确。”李小康说。
程序实质运转进程
一张截图中的文本消息好多,包括脱敏料理的姓名、证件类别、证件号码、采样时间、组织机构等内容,但非是全部消息都有效。此中,姓名、采样时间、能否已采样最为要害,是须要检索筛选出的内容。为这,他料到了Python言语中的正则表明式——可行搜索到字符串中的特定形式内容。
“运用正则表明式就能把想要的消息从OCR辩别的文本中筛选出去。最终,确认好每张截图里的姓名、检验时间和能否已采样等消息后,再把全部人的结果输出到Excel文献中,方便人力确认。”通过思考,李小康的程序思路就根本确定为OCR文字辩别+正则表明式筛选。
3月15日晚,他花了一种多小时就写出了初始代码,共130行,发觉切实能够跑通,且运转效能很高。
自然,中间也碰到了几个技艺难题——OCR技艺的实现、弟子提交截图类别不同一、截图数量多时的程序等候焦虑等。李小康逐一尝试用具、剖析图像特色,寻觅到了最好解决方案。
“尽管原理也很容易,只需是会写代码的人第一时间就会清楚是怎样回事,可是不做相干事业的感触不到这件事宜的费时费力,当然还不会想出法子。咱不过用咱学到的常识解决实质事业中的难题。”他说。
为了方便不会编程的老师运用,李小康把程序发展了封装。“大伙须要用的时刻,只需在命令行输入一行代码就能运转,十分容易。”
复旦大学消息办已与李小康对接,正好收集学校各二级单位治理要求,探讨制订相干方案,开发最新小程序归入学校“一网通办”平台。
敲击映入主题:
关心上海新冠疫情
责任编辑:宋文豪 更多国家内部资讯关心咱们。
|
最新评论