人工智能■AI助力新药研发,暗数据与自动化齐飞( 三 )


【人工智能■AI助力新药研发,暗数据与自动化齐飞】药物警戒/投诉处理中的智能案例处理
安全自动化可以说是当今研发领域最受欢迎的用例 , 有几家公司已经开始应用 , 或正在积极评估该领域 。 投诉处理是一个类似的用例 , 尽管投诉处理过程的多变使它变得有些困难 。 质量和药物警戒方面的大部分预算都花在了这些活动上 , 使得该领域成为自动化的理想候选 。
图表3. 科文斯的药物警戒自动化工具与路线图
人工智能■AI助力新药研发,暗数据与自动化齐飞
本文插图

来源:Covance(科文斯)官网 , 中康产业资本研究中心
自动创立eCTD(电子通用技术文档)文件和标签
医药内容构成了制药价值链若干方面的关键 。 通常 , 内容只生产一次 , 并在制药价值链中重复使用 。 例如 , 企业社会责任(CSR)的内容在整个提交文档中使用 , 或者一份公司核心数据表(CCDS)的更新导致多个下游标签的更新 。 CCDS是药物上市许可持有人(MAH)准备的一份文件 , 除药物安全性信息外 , 还包括与适应证、剂量、药理学有关的材料和与产品有关的其他信息 。
许多医学编辑的时间和精力都花在寻找正确的文档、阅读和整理信息 , 以及将内容安排到正确的模板中 。 随着NLP(自然语言处理)和NLG(自然语言生成)技术的发展 , 人们能够让机器搜索正确的内容、跟踪更新、读取内容和整理相关组件来自动创建这些文档 。
文献检索
这是一项费时费力的活动 , 人们已经多次尝试自动获取和监测涵盖医疗事务、监管事务、安全、临床研究的文献文章 , 但是这些尝试比较零碎且迥然不同 。 因此 , 整个文献检索领域是智能自动化的一个很好的候选领域 , 它将利用现有的技术 , 通过将文献合理的聚类来创建一个一站式、端到端的解决方案 。 该解决方案依靠实现单词向量匹配的机器学习算法、基于搜索策略中的趋势和模式的监督/无监督学习、AI/NLP的支持 , 通过逐字文本或上下文匹配进行高级搜索 , 以获得最佳结果 。
03
AI技术分类
以上讨论的应用场景 , 涉及的AI技术主要包括三个主要领域 , 分别为自然语言处理(NLP)、分类算法(classification algorithms)和聚类算法(clusteringalgorithms) 。
自然语言处理(NLP)
自然语言处理是处理自由格式文本、提供结构化信息的技术 。 获取结构化数据并生成人类可读的自由文本的相反过程称为自然语言生成(NLG) 。 核心在于 , 现代的NLP系统将文档中的单词转换成可计算的数字向量表示形式 。 这些向量包括单词和单词的上下文 。 这些系统经过大量文件的训练 。 当前 , 最先进的NLP正在被越来越多地使用处理大型文档集合和创建数字向量的复杂机制的算法所推动 。 NLP技术正在跨多种语言和特定领域的本体和分类法进行培训 , 提供了强大的部署自动化的方法 , 以增强文档创作过程中的信息检索和获取 。 在医疗和监管领域 , NLP能够用正确的文本写出临床术语 , 并且具有很高的准确性 。
图表4. NLP将自然语言转化为数字向量
人工智能■AI助力新药研发,暗数据与自动化齐飞
本文插图

来源:easyai.tech网站 , 中康产业资本研究中心
分类算法(classification algorithms)
分类算法是用于获取结构化数据并生成描述数据的业务领域适当元数据的方法 。 有许多可用的分类算法 , 然而大多数模型是通过监督机器学习创建的 。 在监督机器学习中 , 主题专家用描述性元数据注释历史数据集 , 这些信息用于训练机器 。 这些模型非常善于识别模式并创建模型来预测解析到模型中的新信息的元数据 。 与具有广泛行业应用的NLP不同 , 分类模型更接近于特定的业务问题 。 因此 , 业务和技术层面的主题专业知识是关键 。


推荐阅读