Dna結果统计分析难?复旦大学博士的实际操作爆火

Dna結果统计分析难?复旦大学博士的实际操作爆火 人力审查Dna汇报耗时费力又易出差错,该怎么办?

4月7日,上海复旦大学官方微博出文,自3月初至今,院校运行常态Dna筛选工作中,规定班集体高校辅导员务必审查学员“健康云”Dna进行截屏,保证“不漏一人”。

院校计算机科学与工程学校博士研究生李小康生活的实际操作爆火,数分钟就能迅速审查百余人的Dna进行截屏,进一步提高审查高效率和精密度!

从1小时到2分鐘,一串编码解决

据统计,李小康生活现阶段出任学校2019级信息内容1班高校辅导员。

针对审查Dna汇报的工作中,他表明:“听起来仿佛非常简单,但实际上做的情况下,一个班集体的截屏很有可能就要花上半小时审查,如果是总数多的系院很有可能要更久,还有可能会弄错看漏。”

做为生物医学工程技术专业博士研究生,他的研究课题是影像诊断与人工智能技术,平时会触碰许多图象处理方式。李小康生活第一时间想起之前学得过的OCR (Optical Character Recognition,电子光学图像识别)技术性。“OCR可以把图片中的图片文字识别出去,变换为文字信息内容,就便捷用于审查了。并且由于Dna截屏是打印出字体样式,准确率十分高,几乎可以保证100%精确。”

他还想起了Python语言表达中的正则——可以检索到字符串数组中的特殊方式內容。“应用正则就可以把要想的消息从OCR鉴别的文字中选择出去。最终,确定好每份截屏里的名字、现场采样和是不是已取样等信息内容后,再把每个人的結果輸出到Excel文档中,便捷人力确定。”

最终,李小康生活明确了“OCR识别文字 正则挑选”的程序流程构思。3月15日晚,他花了一个多钟头就写下了原始编码,共130行,发觉的确可以跑通,且运作高效率很高。

李小康生活最开始写程序时和学工朋友的闲聊

程序流程一写好,李小康生活就在自身班里的Dna截屏数据信息上开展认证,准确度果真很高,乃至检验出了以前人力审查沒有察觉的问题。而且,程序执行時间很短,80好几张图只必须20多秒。

上海复旦大学:有希望该校遮盖

现阶段,程序流程已在该学校服务项目两个星期。李小康生活曾让其他教师使用自身的流程开展审查。800幅截屏,原先要几个人核查一个多钟头,如今只需等2分鐘就取得結果。

2022-04-08

2022-04-08