当前,医学与人工智能的深度融合正迎来历史性发展机遇。华中科技大学同济医学院附属同济医院(以下简称“同济医院”)作为医疗人工智能应用的先行探索者,已在电子病历辅助书写、科研数据分析、医疗合同自动化审核等关键场景完成试点部署。
基于此,由同济医院大数据与人工智能办公室举办的「同济医院人工智能通识系列课程」于 2025 年 3 月正式开讲,旨在通过跨领域专家对话,深度解析技术演进与医疗场景融合的创新路径。和鲸已受邀主讲 2 期课程,聚焦医疗大模型破冰与提示词工程实战,围绕智能体技术、多模态数据融合等前沿方向展开,推动 AI 从辅助工具向深度协作伙伴进化,提升医疗服务效率与质量.
为进一步提升临床数据分析专业能力,推动医学领域数智化转型,同济医院人工智能通识系列课程特设医学数据科学训练营 R 语言专场,训练营前两期课程主要介绍了大模型辅助分析、 R 语言基础语法、R 语言的数据基本类型和数据框的基本操作方法等内容,而本期训练营进一步深入聚焦 R 函数& R 包及绘图基础等内容,为医疗领域从业者构建系统性临床数据能力提升路径。
(往期训练营课程欢迎前往和鲸社区查看详情:训练营第1期:R 语言基础语法、训练营第2期:数据基本类型与数据框操作)
训练营特邀和鲸科技医学行业专家顾问张维拓老师全程指导,张维拓老师作为上海交通大学医学院临床研究中心副研究员,长期深耕临床研究方法学与医学人工智能领域,在机器学习因果推断、真实世界模型评价等方向提出创新性方法;同时,作为上海医学会、上海药理学会多专委会委员及中国医药生物技术协会临床研究专委会常务委员,主导 50 余项临床研究项目统计设计,发表 SCI 论文 30 余篇,实现理论研究与临床实践的深度结合,为训练营提供权威专业支撑。
为兼顾教学互动性与知识吸收效率,训练营采用“线上直播讲解+在线教案学习+作业考核巩固”模式,多维度保障学员“听得懂、学得会、用得上”。基于和鲸旗下数据科学协同平台 ModelWhale 支持的同济医院 DataLab 平台作为本次训练营的核心技术载体,展现出强大的协同分析与算力支持能力。ModelWhale 提供即开即用的云端分析环境和灵活的算力调度,内置数百种 R、Python语言工具包和医学专用镜像,集成了医学研究分析的常用工作包、代码片段库和数百种医学分析项目,适用于基础医学、流行病、预防医学、生物统计、临床研究、 生物信息工程等专业领域的教学实训与科研。
jrhz.info 基于大模型协同开发场景的新一代R语言实战训练营张维拓老师通过 DataLab 平台实时演示,聚焦大模型协同开发新范式,为临床科研人员带来了一场贴合实战的 R 语言教学,助力零基础学员快速掌握数据分析核心流程。本次训练营基于大模型协同开发新范式出发,专为临床科研人员设计,旨在系统培养其利用大模型进行高效协作式 R 语言编程的核心能力,显著提升数据分析的效率与产出质量。
本次课程延续零基础入门路线,围绕三大核心模块展开:
R 函数讲解
张维拓老师强调,R 语言作为数据科学领域的重要工具,其 “函数式语言” 特性决定了函数在数据分析中的核心地位,几乎所有功能均通过函数实现,掌握函数使用是入门 R 语言的关键。
针对临床科研人员在使用新函数时的困惑,张老师重点讲解了 R 语言函数帮助文件的实用解读方法。他通过 mean 函数实例演示,详细拆解了帮助文件中 description(功能说明)、usage(基本用法)、argument(参数解释)、value(输出说明)、reference(参考文献)及 example(使用样例)六大核心模块,指导学员按 “先看用法与示例、再深究参数与输出、最后理解原理” 的步骤高效学习,快速上手新函数。
课程重点讲解了提升科研效率的核心技能——自编函数。临床研究中常需重复特定分析流程,而自编函数可将这些流程模块化、标准化,大幅减少重复编码,提升效率与分析一致性。张老师以“自定义平均值函数”为例,展示了如何封装异常值和缺失值处理逻辑,实现“一次编写,多次调用”。
R 包核心操作讲解
在函数教学基础上,张维拓老师进一步详解 R 包的使用逻辑。基础函数是单个工具,而 R 包则是整合多种高级工具的集合,是实现复杂数据分析的核心支撑。作为开放社区的重要特性,R 包由全球数据分析人员开发上传,用户不仅可使用现有资源,更能自主开发并分享自定义 R 包,充分体现大模型协同开发的开放理念。
课程系统梳理了 R 包从安装、加载到查询的关键流程环节,助力零基础学员快速上手实战。针对临床科研人员易遇的实操痛点,张老师也重点解析了 R 包使用中有关函数名冲突和版本依赖等关键注意事项。
- 函数名冲突问题:不同 R 包可能存在同名函数。可使用包名::函数名(如stats::filter)精准调用。
- 版本依赖问题:建议保持环境版本固化,避免因更新引发的分析中断。
R 语言绘图初步
ggplot2 是 R 语言中绘制发表级别高质量图表的核心工具。课程结合实例介绍了 ggplot2 的核心概念及使用技巧。张老师特别演示了如何利用大模型生成基础绘图代码,再由人工精调,显著提升绘图效率。
- 基本语法概念:绘图的基本三要素为数据、映射和几何图形。通过 ggplot 函数指定数据集,aes 函数定义映射,将数据关联到图形的各个部分,再通过几何图形函数(如 geom_point)绘制具体图形。
- 绘图技巧与应用:在基本图形基础上,可通过加号叠加新的几何图形图层;通过 labs、scale 和 guides 等代码可控制图形的标签、轴范围、颜色图例等;可使用 ggpubr 和 ggSCI 等包中的主题和配色,更符合学术发表要求。
- 扩展绘图包:基于 ggplot2 开发的其他绘图包,如 ggsurvplot,可简化复杂图形的绘制过程。
本期训练营为系列第三期内容,剩余课程将继续聚焦数据载入、清理、统计检验及回归等更多内容,还请持续关注。后续双方将持续深化合作,依托 DataLab 平台推出更多医学数据科学研修项目,助力医疗领域数智化转型进程。
2023 年底,和鲸就曾与张维拓老师以 R 语言医学数据分析训练营为契机,展开过深入交流。训练营面向医学生、临床医生及相关从业人员开展,采用了“线上训练营+线下工作坊”的混合式教学模式,旨在帮助临床领域相关人员快速入门 R 语言,了解临床研究标准分析流程,并能在论文复现的过程中学会做出符合顶刊发表要求的论文图表。
您可前往和鲸社区了解更多训练营详情
2024 年 3 月,和鲸特邀张维拓老师就“如何培养高质量应用型医学人才”举办了“课-训-赛”育人才直播举动。活动聚焦不同背景学生的医学数据分析课程的前沿教学理念、实用教学方法、教学经验及教学案例,吸引了来自全国近 30 所医科类大学的老师共同参与、热烈交流。关于面向医学生的数据科学培养,张老师提出了“接口型人才”教育的观点,着重于让学生掌握利用工具提升解决医学问题的能力,并逐渐转变心态,成为新技术的“高级用户”、“生产者”。
您可前往和鲸社区观看回放,了解更多活动详情
AI 不改变医疗的本质,但将重新定义医疗的生产边界。和鲸深耕智慧医疗与数据科学领域多年,并携手同济医院打造了医院科研管理服务一体化平台,有效降低了科研门槛,减轻了科研负担,加速了科研进程。本次训练营也是同济医院联合和鲸科技在医学数智化人才培养领域的标志性实践,通过同济医院 DataLab 平台技术赋能、行业专家资源导入,为医疗从业者架起从数据能力提升到临床科研创新的桥梁。