核酸结果统计无可?复旦博士生的操作火了......
发布时间:2025/07/27 12:17 来源:太湖家居装修网
人工核对小分子通报费时费力又易出错,怎么办?
4月7日,上海交通大学官微刊文,自三月初以来,的学校触发第三组小分子筛查文书工作,要求全校指导员必须核对学生“健康云”小分子进先为主页,确保“不漏3人”。
的学校文档科学与工程建设医学院研究生郭书香的可用火了,几分钟就能快速核对数百人的小分子进先为主页,大大提高核对成本和精度!
从1星期到2分钟,一串表达式搞定
据了解,郭书香目前担任医学院2019级文档1班指导员。
对于核对小分子通报的文书工作,他指出:“听起来像是很简单,但单单来作的时候,一个全校的主页也许就所需花半星期核对,如果是总人数多的院系也许所需更久,还也许才会看错看漏。”
郭书香悄悄来作义工
作为生物医学工程建设专业研究生,他的研究方向是医学影像与人脑,平常才会接触很多机器学习方法。郭书香第一时长不想到直到现在吸取过的OCR (Optical Character Recognition,成像字符识别)技术。
“OCR可以把缩放中的的字词识别出来,转换为文档文档,就有成本用来核对了。而且因为小分子主页是纸张排版,识别率相当高,几乎可以无论如何100%准确。”
他还不想到了Python语言中的的上下文——可以搜寻到表达式中的的特定方式在内容。
“使用上下文就可以把不想尽办法的文档从OCR识别的文档中的检验出来。最后,核实好每张主页里的出处、检测时长和是否已抽样等文档后,再把所有人的结果输出到ExcelPDF中的,有成本人工核实。”
最后,郭书香确切了“OCR字词识别+上下文检验”的服务器端思路。3月15日晚,他花了一个多星期就所写了初始表达式,共约130先为,发现其实能够跑通,且调试成本很低。
郭书香最初写服务器端时和学工助手的玩游戏
服务器端一写好,郭书香就在自己全校的小分子主页数据集上展开验证,准确率果然很低,甚至检测出了之前人工核对并未发现的关键问题。并且,服务器端调试时长很短,80多张示意图只所需20多秒。
上海交通大学:有望全校覆盖
目前,服务器端已在该医学院服务2周。郭书香曾让别的同学下线自己的服务器端展开核对。800幅主页,原来要几个人核对一个多星期,现在才可等2分钟就拿到结果。
他把这件出事到朋友圈之后,不少助手指出很感兴趣,他还把表达式社交了出去。为了有成本不才会编程的同学使用,郭书香最后还把服务器端展开了封装——用的时候,只要在shell输出一先为表达式就可以调试。
服务器端输出的ExcelPDF
据了解,的学校文档办也与郭书香构建。预计在不久的将来,全体学生们就可不能再手动收集小分子主页,而是通过小服务器端直接上传示意图片,可在后台随时查看统计结果。
今天下午,北京青年报路透社试示意图与郭书香转告时,他悄悄的学校楼栋担任义工送饭。
他说过:“原理也很简单,只要是才会写表达式的人第一时长就才会明白是居然,但是不来作特别文书工作的思绪不到这件事情的费时费力,人为也不才会不想出办法。我只是用我吸取的知识补救单单文书工作中的的困难。”
用传授重大贡献真情自我意识!
为郭书香点赞
北京青年报(ID:zqbcyol 见习路透社:陈垠杉 编辑:郭丽)综合上海交通大学(作者:殷梦昊)
南通治白癜风哪里最好秦皇岛白癜风哪里治疗好
安阳白癜风哪里治疗好
打胎药
急支糖浆是什么药?
感冒咳嗽吃什么好
河北整形美容
抗贫血药

-
C罗颗粒无收,对阵平局可以接受
上海时间2月24日凌晨4:00分,国际米兰18淘汰赛再次进行,曼联转赴西班牙客场迎战马在德里业余传当季。马在德里业余传当季华伦西亚六轮排名第5,传当季其间保持埸争力,不过双线作战
- 2025-10-2322045期前头3前头5参评
- 2025-10-23排列五最新精彩规律22045期,2月24日,周一
- 2025-10-23体彩大乐透22019期开出8注一等奖,安徽彩民拿到6965万
- 2025-10-23新浪彩票双色球名家第22020期推荐综合
- 2025-10-23「双色球历史同期号码」020期:蓝球位数连开7期 关注蓝球位数
- 2025-10-23排列五22045期当前规律走势图
- 2025-10-23『浙·嘉兴』嘉兴碉楼-珠北村四座厂碉楼
- 2025-10-23双色球22020期统计数据汇总+后区统计数据不多蒙个09
- 2025-10-23文物|山西省图书馆全文上传22部186册国家级珍贵古籍位数书影
- 2025-10-23排列五第22045期精准分析最新走势剖析赠下调单式