研发中医大模型并非易事,训练过程中涉及的“样本量”需求比较大 。
以天士力为例 。该公司本次与华为云推出的“数智本草”大模型,是由天士力2017年开始打造的“星斗云”系统迭代升级而来 。它们也是天士力做“数智中药”创新的基础 。
【GPT准备替中医把脉了】此次发布的“数智本草”仅中药古籍就吸纳了上千本 , 方剂超过9万份,中成药配方4万多份,此外还有4000万以上的文献摘要、300多万天然产物、2万多个靶点通路信息,以及10万多临床方案和超16万的中药专利、药典政策指南等,整体参数量380亿 。
为了对大模型进行微调,企业又为其提供了350万特有天然产物分子数据 , 进而实现了智能问答、交互计算、生成文档三大应用模式,以及上述提供的整个数智化闭环模式 。

文章插图
现代中药智能制造生产线一角/天士力提供
尽管从参数到训练数据的规模还都无法与GPT等知名大模型,甚至是生物制药领域的大模型相比 , 但是背后的转型之痛,对于传统的中医药企业来说,已经堪比脱胎换骨了 。
要喂养大模型,就需要高质量的数据,这在传统的作坊、车间、产业链里是很难实现 。因此 , 做中医药大模型最关键的一步就是对生产车间、产线、种植基地做数智化升级 。
根据扬州大学马康宁、张斌对中医药企业供应链管理数字化转型模式的研究结果,天士力从2013年的中药材全程质量追溯体系建设开始,已经做了10多年的数字化转型 , 对装备和产线都实行了智能升级,将中药研发、种植、提取、生产、销售全产业链都做了标准化 。
在此基础上,一条生产线,如果想一年采集2.1亿数据,就需要设置2100多个数据采集点 。
为此,2014年至2023年 , 天士力的研发总投入76.3亿元,在中药行业排在第一位 。虽然具体在数智化上的花费占比没有公开,另一家上市公司的数据或许可以提供参考 。
另有某知名上市公司的公开信息显示,他们仅建设一个年产能1万多吨的智能化、数字化中药提取车间 , 就花费了3亿元,相当于该公司此前一年的研发投入的90%以上 。
让药企们 , 对中医大模型“舍得投入”的根本原因是,中医药市场正呈现爆发的趋势 。根据中研普华产业院研究报告 , 预计到2026年中国中药市场的整体规模将达到1.5万亿元以上,整体平均增速12%左右 , 超过同期医药产业整体增速 。
不过,要承接这样的利好也没那么容易 。
急需“救命药”的药企
一个关键的机会窗口来自医药消费趋势的变化:中国医疗体系正从“治疗疾病”转向“健康管理”转变 , 对以“治未病”为特点的中医药来说,也是前所未有的机遇期 。
而中医药本身在市场上“形象”的变化,进一步强化了这个风口 。过去三年,越来越多研究在一定程度上证实了中医药的价值 。比如:张伯礼院士透露,在心脑血管等疾病治疗中,中医药将西医药治疗效果的“天花板”又提高了近30% 。可以说,中医药拓展了疾病治疗的能力边界 。
但面对这个难得的机会窗口,中医产业并没有100%完成热身 。现实是,中药还有很多问题待解决,比如:因原料(主要是中药材)质量波动大而出现的不同批次产品质量不均一,中药方剂本身物质组成复杂,毒副作用认识不足,作用机制不清等,使很多中药产品难以获得市场认可,也无法走得更远 。
以及,周遭因素影响下,一些中成药领域曾经的明星单品,已经风光不再 。比如丹参川芎嗪注射液,曾是年销数十亿的药品,受重点监控、退出医保目录等影响 , 市场逐渐萎缩,后来干脆退市了 。
“单品”压力陡增,导致药企压力也越来越大 。
从2023年年报看,中国中药、华润三九(61.000, -1.14, -1.83%)、大理药业、龙津药业等多家中药上市公司的业绩大幅下滑 。

文章插图
来自:视觉中国
积极推动数智化的天士力也面临转型压力 。
从公司财报数据看,天士力的主营业务收入增长率在2017年达到巅峰后,到2019年已经降到了5.61%,2020年还出现了负增长,到了2023年其同比增幅不到0.5%,主要聚焦的医药工业板块,增幅只有3.22%了 。该公司的核心产品复方丹参滴丸,还在部分地区受到了重点监控、集采降价等影响 。
推荐阅读
- GPT-4o:实现跨越文本与视觉的智能交互
- 类人速度超快语音响应!OpenAI推出新旗舰模型GPT-4o,图文音频手机AI搞定
- ChatGPT-4o,OpenAI的一小步,人类「AI助理」的一大步
- 范冰冰参加国外饭局陪唱照片曝光,参加活动只能坐三轮,网友替她心酸
- 敖犬正式向女友求婚,准备大钻戒诚意十足,空姐女友又瘦又美
- 裸替演员邵小珊炮轰冯小刚:你等着,我要曝光你,让你身败名裂
- 从头到脚皆可替?易烊千玺这个镜头,戳穿了多少流量明星的体面
- 《父母爱情》至今10年无人翻拍:关键人物逝世,六位演员无法替代
- 《清明上河图密码》大结局:赵不尤到死都想不到,赵离是官家替身
- 哪有什么不可替代,离了唐国强,新主席特型演员打出一副王炸
