“从非结构化数据当中提取信息,是非常重要的工作。非结构化数据可以是影像,也可以是文本。”汉斯说,将来源不同的数据与具体病例关联,进而进行研究。“这些数据需要在机器内部互相理解,比如手术报告,医生会以个性化的语言书写,除了真相外,医生还会写下他怀疑的信息,否定的信息等,如何将这些信息提取出来,进行分门别类的分析呢?”汉斯介绍,很多医疗领域从业者已经建立了很大的知识库,比如联合医疗语言系统,这是一个非常大的知识体系,有22万不同的概念,算是一个小型的“知识图谱”,作为基础架构更待共同完善。

至于二审的开庭时间,厉健预计至少还要等几个月。由于虚假陈述案件原告人数众多,属于重大影响案件,因此在司法实践中审理时限较长,“考虑到一审案卷归档和卷宗移交时间,案件二审结果,最快也要再等半年左右。”