随着云端运算、大数据兴起,各行各业都想尽办法在巨量资料里发掘有价值的讯息,生技产业的研究与发展也希望透过生物数据库的加持,加速疾病研究、新药研发的进展。但伴随而来的隐私、人权问题也是各界讨论的焦点,科学家认为作研究是为公共利益,为何屡遭阻拦 ? 而人权、法律专家也认为站在民众的立场保护个人隐私与权利是他们应尽之义务;若谈及“商业利益”,更是人人闻之色变,到底我们该用什么样的心态看待生物数据库的使用 ? 在国家发展、公共利益与个人权利之间如何取得平衡 ? 基因线上很荣幸邀请演译基金会的张苙云执行长 (以下简称张执行长),浅谈生物数据库的价值、使用规范、以及数据库之间串连所面临的困难与可能的解决办法。
好的抽样与自变项挖出大数据里的宝藏
一般人认为,台湾健保数据库最可贵之处在于就医资讯的完整和庞大数量。但我认为,在讲求效率与好用的前提下,抽样的设计就十分关键。目前释出是以单一个人 (individual base) 为单位的机率抽样,从 2300 万人中释出 200 万人就医档。但是对研究来说,在数据库的运用上可研究设计加入特殊的抽样项目,例如:以家族性 (family base) 为单位、或其他准实验设计等,让资讯分析更有深度。其次,健保数据库都是应变项 (dependent variable),除了性别、年龄以外,缺乏其他资讯如教育程度、收入、健康行为、生活方式等的资讯。而没有自变项 (independent variable) 的存在会造成使用有所限制,对此,张执行长指出:“很多人都希望跟人体生物数据库串连,我觉得本意是好的,但也要看人体生物数据库本身资讯的‘浓度’,若其中的资讯都是个人的 biosample、biomarkers 等,却没有自变项,这样串连也无法产生实质效益。”
数据库串连 “心态”是考验
数据库之间要结盟的最大阻碍,除了法规,还有“心态”的部分。目前台湾对于和健保数据库作连结,公部门与学术单位会给予部分优惠,但产业界则完全没有,使得数据库的应用受到侷限。但是,团结的力量总强过孤军奋战,若产业界也能有效运用这些资讯,不仅在实际医疗上能嘉惠民众,对于经济效益、国际竞争力等各方面也会有正面的效果。张执行长认为民众跟医疗机构之间存在一对一的对应关系,在诊疗过程中会产生一些资料,而这些资料就像煤矿山上的煤矿堆,总要有人用知识、资本去开采,才能挖掘出价值连城的钻石。而将公家 / 学术单位分门别类的“排他性”的做法,限制了这些资料的使用与开采,若要跨越这样的障碍,还须各界开诚布公地商讨,找出最佳的解决策略。
隐私权、人权等教育训练课程的反思
针对个人隐私的保护,张执行长认为这是底线,是共识,没有争议之处。重点是实务上,如何在众人对风险的容忍程度以及因为不能容忍风险而承担成本的能耐之间、求取平衡。对风险的容忍和注意义务以及日后研究成果的利益分享,张执行长提出提醒,对于风险的风险,许多时候我们仍处于无知状态,我们并不知道发生风险的机率有多少,只是猜想会有风险;有时我们著于零风险的要求,我们要注意风险管理的边际成本和边际效益。其次,我们应该注意垂直代间的权利义务关系。当代人现今所享有的健康医疗照护,受益于前人,包括受试者、科研人员以及厂商,的参与和努力,强调水平/即时的利益分享,这个带有个人中心主义的思维,有可能忽略了活在当代的人对后代的责任。
过去二十年台湾在各大学和医院推广设立“研究伦理审查委员会”(Institutional Review Board,以下简称 IRB),在申请数据库之前要通过IRB审查,而审查前参与研究人员必须要上 IRB 训练课程。立意是好的。但是,当研究计画涉及数家不同单位,需要得到各单位的 IRB 同意,然,各单位审查委员不同、审查标准未必一致、各单位格式又不同,就要转换成符合该单位格式的写法,实际运作过程,的确无形中增添了不少时间与人力成本。张执行长在担任某些机构 IRB 审查委员期间,时常提醒大家,要合理地判断研究人员在能力范围之内是否有尽到保护当事人隐私的义务,而不是在做科学审查。这其中最重要的就是信赖。张执行长感慨的说:“我相信社会上绝大部分的科学家都是诚实且认真的,但若你不这么认为,所有的负面想像都会出来,社会成本因此不断堆高。”
张执行长认为,如果是去识别化的资料其实民众不用太担心,很多临床实验也是在“双盲”下进行,由第三方负责监控整个过程,当临床数据蒐集足够,或是结果明确后,就会终止实验。当然有可能为著其他用心,主事者的处置或有不同。然,未必会伤害到受试者本人。我们特别关心的是,如果研究结果对当事人有帮助,该不该告诉他 ? 还是仍旧维持全然隐私 ? 这是值得深思的一件事。
延伸阅读:《卫服部许明晖技监》资讯共享拉锯战:公共利益与人权价值谈生物数据库与商业利益的爱恨情仇
其实在生技链中,前端的部分大都属于学术权益,但之后每个环节都可能涉及商业利益,若仅以最终产出来区分,未免有些不合理。当前的台湾社会,任何立意良善的点子只要牵涉到商业利益,就会风云变色,后续连带的法规与人权议题更使得产业发展窒碍难行。但是一个国家的发展是需要产业来扶持的,国外很多大药厂也参与不少研究,例如美国则有生技公司如 23 and me,蒐集很多健康资料并跟医院合作,找到一些新的癌症 biomarker,造福许多人。但当地民众却不会对他们有太多负面的看法,因为他们知道产业界投入所带来整体社会的获益,不只是产品的销售成绩、企业所雇用的员工、创造的工作机会、缴纳的税金、整体社会的安定等等,还有国家竞争力,而这些都是无形却重要的外部效益。因此面对商业利益的课题时,如果能从不同的角度思考,健康产业的发展将不可同日而语。
生物数据库与国际连结的困难点
在台湾要和自己内部的生物数据库作连结,即便已经将个资去识别化,仍会遇到人权团体的质疑和挑战,更遑论和国际生物数据库串连。而做研究是动态的,本就会有许多尝试错误的过程,张执行长提到:“我有个学生在美国念教育,她过去五、六年来的工作就是依研究者和教育政策决策者的需求,将不同来源的教育相关资料进行串连,对他们释出,让他们有更好的资料,做研究。先是在华盛顿州做实验,其他州觉得很有帮助就慢慢扩大,他和我说,老师我们经手的资料量真的很庞大,我们的职责是确保当事人不会受到伤害,但又让资料发挥最大的功能。”这让我思考,台湾为什么要限制研发的能量? 是否有等比例、有效的方法可以让政府内部数据库的使用成本下降,效益增加 ?
此外,演译基金会的美兆生活数据库还无法跟国际生物数据库串连的另一个原因,就是“应变项”无法确认。张执行长说:“受测者告诉我们他有 cancer,但我们没有官方资料确认,甚至当事人过世,也不行,当然当事人过世后也无法再跟我们说是否真的有癌症。所以我们花非常大的力气去确认资料,然,不可否认,自述的资料总没有由官方挂保证的资料,来得说服力高。美国有几批学者来交流,对我们的资料很感兴趣,但他们都很惊讶我们无法用比较省力的方式去确认健康结果资料的完整性,记得其中一位说他们每一年会将自己的资料跟美国的 death registry 定期做比对。但台湾却无法提出受测者的确诊书,造成国际合作的困难。所以希望新政府在法规、制度上能勇敢地去调整,才不会让许多‘小路障’削弱了研发能量。”
生物资料再活化 盼政府能勇于支持
目前演译基金会仍致力于蒐集检体,透过既有的资讯,如问卷资料、biomarker 和生化检验等去找寻新的发现,张执行长提到最近有一些尚未发表的研究成果令人振奋,但因为和与过去认知不同,所以仍在反复查验中。前阵子成立一个工作小组,专门将既有的人体生物数据库中的素材转变成可用的资讯。“在台湾,民间企业做生物数据库是非常 aggressive 的一件事。”张执行长表示,虽然能向国际学习,但生物数据库的进一步开发还是必须在本土得到基础建设、完整规划、充足资金、以及专业技术团队等环境。演译基金会并非财力雄厚的单位,但在这一块知识领域已深耕三年,如果从 2002 年开始,也 14 年了,不论规划或执行,目前都按部就班进行中。期盼政府在未来对于法规、人权、使用上的限制等等都能有更多讨论的空间,相信未来台湾仍是大有可为的。
延伸阅读:人工智能在健康产业的应用:先找到最好的问题!张苙云执行长 小档案
学历
美国约翰霍普金斯大学社会学博士
美国南卡罗莱纳大学社会学硕士
国立台湾大学法学学士现职
财团法人演译基金会 执行长
行政院科技部人文社会司咨议委员
中央研究院社会学研究所兼任研究员
台湾医疗改革基金会董事
国家卫生研究院论坛咨议委员会委员经历
中央研究院研究员,台大社会系教授
台湾医疗改革基金会 董事长
财团法人精神健康基金会 董事
新力股份有限公司“文化教育基金会”董事
财团法人妇女救援基金会 董事
中华心理卫生协会 理事
中华心理卫生协会 祕书长研究领域
组织与社会结构、医疗制度和政策、医疗社会学、社会网络荣誉
1999 行政院国家科学委员会杰出研究奖
1991~2 美国傅尔布莱特访问学者
1991~2 美国哈佛大学哈佛燕京社哈燕学者
2000~ 2002 台湾社会学会理事长
©www.geneonline.news. All rights reserved. 基因线上版权所有 未经授权不得转载。合作请联系:service@geneonlineasia.com