在第16个世界孤独症关注日到来之际,位于中国科学院合肥创新工程院的星元智能AI团队发布了国内首个孤独症垂类大语言模型Starlight。
孤独症是一类先天性的神经发育障碍,患者会出现社会交往障碍、兴趣局限和刻意重复的行为。近年来研究显示,其患病率逐渐上升,根据美国疾控中心(CDC)公布最新的孤独症患病率筛查数据显示,每36名8岁儿童中就有1名为谱系障碍(2.8%),且至今病因不明,症状将伴随终身,孤独症患者的康复程度关乎千万家庭的生活品质。
近些年随着AI技术的不断突破,给孤独症康复难题的攻克带来了更多的可能性。
在一次公益活动的参与中,团队发现了许多孤独症儿童在康复过程中一直存在巨大挑战,由于资源短缺和高昂的费用,许多家庭无法持续为自己的孩子提供专业的康复服务,而在家庭干预中,父母又缺少专业的知识和经验。于是,怀着“用AI(爱)让星星的孩子不再孤独”愿景,这个团队决定为这些孤独症儿童和家庭提供技术支持。
星元智能AI团队经过近两年的研究和实验,于2021年发布了一款基于知识图谱的孤独症家庭干预支持公益平台“星星之心”,为家长及行业从业者免费提供包括居家教学、信息查询、供需对接、前沿研究、社区分享等数字化信息支持,上线3个月迅速累计1万多位忠实用户,获得广泛好评。
在用户的使用反馈过程中,团队发现当前孤独症教育中的一个重要症结,是对疑似孤独症儿童缺乏系统的早期自我筛查体系,集中体现为无法为孤独症儿童提供高效的评估手段。
2022年9月,星元智能发布METASTAR智能评估系统,基于大量的诊断案例、临床数据、历史文献和专家的临床经验,根据DSM-5孤独症谱系障碍诊断标准,对孤独症筛查诊断的指标体系进行循证,基于多模态融合的机器学习算法框架进行建模和训练,研发基于AI技术的数智化评估筛查工具,为孤独症的早期筛查提供更加便捷和可靠的方法,为医生临床诊断提供辅助信息,以实现早期筛查、早期诊断。
评估筛查通过知识提取、知识表示、知识存储和知识检索四个步骤,这里我们用到中文分词、词性标注和命名实体识别,配合Gensim实现主题模型,最终应用ElasticSearch检索。
2023年3月,为迎接第16个世界孤独症关注日,星元智能AI团队发布国内首个孤独症垂直领域的大语言模型——Starlight。基于语言大模型的对话系统,用户可无障碍地向其提问任何有关孤独症谱系障碍的疑问,并得到即时解答。
Starlight利用临床研究中产生的信息汇总成庞大的数据库,对约2.5T的诊断样本进行深度学习,辅以监督微调、反馈自助、强化学习等前沿技术,训练出一套高效的NLP算法,用纯attention搭建出transformer语言大模型。该模型具备强大的自然语言处理能力和高质量对话生成能力,可以和用户进行非常流畅的自然语言沟通,同时在扩展性、可部署性和数据安全性都有很高表现。
谈及大模型未来的应用,团队表示,目前正考虑结合OpenPose可用姿态估计库,通过图像和视频的视觉传达,构建更加完善的多模态模型。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...