本文轉自【人民日報微信】
人工核查核酸報告費時費力又易出錯,怎么辦?
4 月 7 日,復旦大學官微發文,自 3 月初以來,學校啟動常態化核酸篩查工作,要求班級輔導員必須核查學生 " 健康云 " 核酸完成截圖,確保 " 不漏一人 "。
學校信息科學與工程學院博士生李小康的操作火了,幾分鐘就能快速核查數百人的核酸完成截圖,大大提高核查效率和精度!
據了解,李小康目前擔任學院 2019 級信息 1 班輔導員。
對于核查核酸報告的工作,他表示:" 聽起來好像很簡單,但實際做的時候,一個班級的截圖可能就需要花上半小時核查,如果是人數多的院系可能需要更久,還可能會看錯看漏。"
李小康正在做志愿者
作為生物醫學工程專業博士生,他的研究方向是醫學影像與人工智能,平常會接觸很多圖像處理方法。李小康第一時間想到以前學到過的 OCR (Optical Character Recognition,光學字符識別)技術。
"OCR 可以把圖像中的文字識別出來,轉換為文本信息,就方便用來核查了。而且因為核酸截圖是打印字體,識別率非常高,幾乎可以做到 100% 準確。"
他還想到了 Python 語言中的正則表達式——可以搜索到字符串中的特定模式內容。
" 使用正則表達式就可以把想要的信息從 OCR 識別的文本中篩選出來。最后,確認好每張截圖里的姓名、檢測時間和是否已采樣等信息后,再把所有人的結果輸出到 Excel 文件中,方便人工確認。"
最后,李小康確定了 "OCR 文字識別 + 正則表達式篩選 " 的程序思路。3 月 15 日晚,他花了一個多小時就寫出了初始代碼,共 130 行,發現確實能夠跑通,且運行效率很高。
程序一寫好,李小康就在自己班級的核酸截圖數據上進行驗證,準確率果然很高,甚至檢測出了之前人工核查沒有發現的問題。并且,程序運行時間很短,80 多張圖只需要 20 多秒。
復旦大學:有望全校覆蓋
目前,程序已在該學院服務兩周。李小康曾讓別的老師試用自己的程序進行核查。800 幅截圖,原來要幾個人核對一個多小時,現在只需等 2 分鐘就拿到結果。
據了解,學校信息辦也與李小康進行了對接。預計在不久的將來,師生們就可不用再手動收集核酸截圖,而是通過小程序直接上傳圖片,就可在后臺隨時查看統計結果。
他說過:" 原理也很簡單,只要是會寫代碼的人第一時間就會明白是怎么回事,但是不做相關工作的感受不到這件事情的費時費力,自然也不會想出辦法。我只是用我學到的知識解決實際工作中的困難。"