金融科技研究中心主任助理
高级金融风险管理师(FRM),南京大学应用数学硕士。
专注于研究自然语言处理、人工智能技术在金融科技中的应用。
发表论文5篇,申请专利十余项,软件著作权授权1项,牵头负责企业风险预警、智能客服机器人等项目核心算法研发,曾任国家重点研发计划课题负责人。
2020-09-22 08:56
本文由公众号“苏宁金融研究院”原创,作者为苏宁金融研究院研究员李加庆。如果你曾经受过垃圾电话或者垃圾信息的骚扰,那么很可能你的个人信息已经被卖了。个人隐私信息,特别是个人身份、银行账号、人脸/指纹等生物特征信息泄露的危害极大,轻则垃圾短信、垃圾邮件不断,重则诈骗/栽赃找上门。你的隐私值多少钱?据说几毛钱就能买到你在外卖平台的个人信息和账单详情,不到2元就能拿到你在网上购物的详情和偏好以及网络借贷的信息。如果有人向你当面出价购买你的基本信息和消费记录等个人隐私数据,多高的价格你会同意出售呢?可能再高的价格也不会同意吧,甚至出价越高,越会让你感到不安。在旅游景点或者购物中心人员密集的地方,经常有商家免费送礼品,只要留下身份证号、手机号、姓名等信息,或者用微信扫一扫就可以拿走价值几元的礼品,这种时候往往会看到男女老少趋之若鹜的场景。很多人态度上极为关注隐私,然而在做法上又不那么注重隐私,这个现象叫做“隐私悖论”。哈佛大学的研究员Dan Svirsky做过一项调查,当受访者被直接问及是否愿意将Facebook的个人资料以50美分到2.5美元不等的价格出售时,超过64%的人选择拒绝。然而,当Dan Svirsky改变策略,让受访者需要打开一个新的页面来确认该调查是否涉及到个人信息时,拒绝分享数据的人数下降到40%。前些天,李开复的“口误”捅了企业数据隐私这一敏感话题的马蜂窝。在全球创业者峰会(HICOOL)的一个演讲中,李开复提到曾经在“早期帮助旷视科技寻找了合作伙伴,让他们拿到了大量人脸数据……”。这番话很快引来了热议,涉事公司很快做了澄清,李开复本人也随后在微博做了致歉。这个事件很快在网上发酵,各种关于人脸识别应用涉及公众隐私的声讨文章,以及公众该如何注重隐私的文章,一时间如雨后春笋般出现。在共情效应以及人们回避风险的本能驱动下,每当有类似涉及隐私数据泄露的话题,公众对于隐私问题会立刻开始重视起来,并且将舆论热情冲到一个高峰。隐私无价,有法律保护我们身处一个数据时代,在我们每一天的生活当中,无时无刻不在与数据打交道,大量的数据应用围绕着我们人的行为做文章。从早上一睁眼开始,我们每个人都在产生数据,早晨的起床时间、上下班路上骑共享单车去公交地铁站的位置路线、公交地铁或者打车出行的行程信息,在公司吃饭点的外卖、饮食习惯和偏好,以及一整天刷手机的各种浏览Cookie信息等等,这些都是我们的行为产生的数据,并且被商家利用起来推送广告和服务。正如我们开头说的“隐私悖论”,我们大部分人是不愿意出售自己的隐私信息的,讽刺的是,在移动互联网的今天,我们却坦然接受各种APP提供的免费产品和服务,同时免费奉上自己的个人信息,甚至当APP要获取手机定位权限、通讯录权限、相机权限、麦克风权限,甚至读取手机已安装APP信息的权限的时候,眼都不眨一下就点击同意了,更别提APP弹出的冗长晦涩的《用户协议和隐私保护协议》,阅读是不可能阅读的,这辈子都不可能阅读的。移动互联网时代,每天的生活都要跟各种APP产品打交道,想要做到完全隐私,根本不可能,除非不用互联网和智能手机。在数据经济时代,单靠个人的谨慎是很难做到隐私保护的,也不能因噎废食回到没有互联网的旧时代,随着互联网、大数据、人工智能和实体经济深度融合,数据即“石油”,数据也成为很多企业发展的基础。一条条的数据可能会被标上价格在黑市贱卖,而个人的隐私却是无价的,现在隐私数据被滥用的“代价”也的确很高。个人隐私的保护还得依赖法律法规和监管,随着2018年欧洲GDPR的出台,企业不得不正视公司运营涉及的公众隐私数据,如果管理不善可能带来巨额罚款。美国政府和欧盟监管机构已经对互联网公司侵犯隐私权的行为进行调查,美国联邦贸易委员对Facebook包括“英国剑桥分析公司事件”在内的侵犯隐私行为开出了50亿美元的罚款单,创造了美国政府机构企业罚款的历史最高纪录。GDPR是欧洲通用数据保护条例的简称,出台两年多,现在已经是数据各行各业无法绕开的隐私管理规范和准则。GDPR的目标是保护欧盟公民免受隐私和数据泄露的影响。世界各地的公司,无论在地球上哪个地方进行公司数据存储和处理,只要在欧盟成员国境内开展业务,就必须保护欧盟成员国民众的个人资料与隐私,就算公司业务范围不在欧盟境内,但只要公司有任何来自欧盟成员国的客户,也必须遵守GDPR。GPPR保护的范围至少包括与你相关的以下类型的隐私数据:(1)基本的身份信息,如姓名、年龄、家庭地址和身份证号码等;(2)网络数据,如定位信息、IP地址、浏览器Cookie数据等;(3)医疗健康数据;(4)生物识别数据,如人脸、指纹、虹膜等;(5)种族或民族数据;(6)政治观点;(7)性取向。国内对数据安全与隐私保护的重视程度也逐渐向国际接轨,在2020年4月国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》中,数据被纳入生产要素的范畴,《意见》还提到要“加强数据资源整合和安全保护”。今年6月28日,第十三届全国人大常委会第二十次会议审议了《中华人民共和国数据安全法(草案)》(简称《数据安全法》)并随后面向社会征求了意见。《数据安全法》强调总体国家安全观,对国家利益、公共利益和个人、组织合法权益的全面保护。数据安全已成为事关国家安全与经济社会发展的重大议题。相较于《数据安全法》更关注数据安全对于国家安全的意义,即将在2020年10月1日实施的GB/T 35273-2020《信息安全技术 个人信息安全规范》(简称《规范》)则更侧重于对个人信息、隐私等涉及公民自身安全的保护,它是对2018年开始实施的GB/T35273-2017《信息安全技术 个人信息安全规范》的修订,除了对个人信息的收集、储存和使用做了明确的规定,还将重点打击APP的“强制索权、捆绑授权、过度索权、超范围收集”等现象。其实,关于隐私立法早已有之,只不过在数字时代之前,隐私数据问题不突出,相关的法律体系还不成熟。欧洲国家最早开始重视隐私的保护,随着国际化和互联网技术的发展,欧盟对于隐私保护的强烈需求成为世界隐私保护的主要推手,GDPR将隐私保护推到了一个前所未有的高度,目前已经有近百个国家和地区制定了关于隐私保护的法律。隐私安全:“达摩克利斯之剑”从GPPR屡屡开出的巨额罚单,到李开复的“口误”道歉风波,无不暗示了当下隐私安全已经成为悬在企业头上的“达摩克利斯之剑”。随着大众不断觉醒的个人信息保护意识,隐私保护已经不是企业做不做的问题,而是如何做和怎么做好的问题。人工智能、大数据、云计算和5G等新兴科技的发展正在推动很多企业进行数字化转型,数字化转型既带来机遇也带来挑战,隐私保护便是企业数字化转型之路上最严峻的挑战。隐私保护不力将会给企业带来巨大损失,轻则产品下架整改、名誉受损,重则颠覆既有商业模式,甚至导致企业主要负责人承担刑事责任。前不久,工信部便下架了23款APP,原因是侵害用户权益,且未按要求完成整改。从今年开始,对于侵害用户隐私权益的打击力度是空前的。自从工信部去年11月份发布《开展APP侵害用户权益专项整治工作的通知》以来,已经通报下架数批侵害用户权益的APP,具体下架APP的名单在工信部网站上均可以查到。目前,工信部每月开展常态化APP抽查,这些APP主要在四个方面受到工信部的审查和整治:(1)违规收集用户个人信息;(2)违规使用用户个人信息;(3)不合理索取用户权限;(4)为用户账号注销设置障碍。APP是获取用户最直接的入口,从对APP的整治力度可以看出目前国家层面对于数据安全以及用户隐私数据的监管逐渐趋严,从国内国外看,这也是整个数据产业的大趋势。企业作为数据的收集方、使用方、存储方,隐私保护当仁不让的责任主体,为了适应监管,为将来的发展满足合规要求,企业必须提高自身的隐私风险管理能力。隐私风险管理有人将隐私问题归罪于技术,认为是人工智能、大数据等新技术创新带来了隐私泄露、滥用等问题,持这样观点的人认为解决隐私问题需要从限制技术的使用入手。这样的观点是很正常的,然而从历史的进程中我们发现,技术的创新和更迭是一个不断自我完善的过程。汽车刚出现的时候,经常出现安全事故造成人员伤亡,但是人类并没有放弃这项技术,而是通过安全气囊、红绿灯、斑马线、交通法规等技术和管理上的创新,来规避风险和减少伤亡事故。人工智能和大数据等技术创新与隐私保护并非硬币的两面,不是对立的关系,只不过新技术的推动将以前的隐私问题从线下搬到了线上,如果回到十几年前来说隐私问题,你想到的关键词可能是偷窥、狗仔队等等,现在说隐私问题,关键词变成了数据:定位数据、消费数据、生物特征数据、浏览器Cookie数据等等。隐私安全问题恰恰反映技术创新和管理创新的不足。新技术时代,我们对于隐私问题的认识不能停留在以前,不可能通过捂着藏着来解决隐私问题,我们也不需要回到没有互联网的旧时代。现在新技术的创新也正在隐私保护的路上不断探索。技术的创新和迭代需要时间,隐私保护还需要从管理上进行创新,对于企业来说,隐私风险管理其实就是隐私合规风险管理,企业需要将隐私风险管理纳入企业的风险管理框架中,以提升企业的全面风险管理能力。美国国家标准与技术协会(NIST)在今年年初发布了一个针对隐私风险管理的框架:《NIST隐私框架:通过企业风险管理来提升隐私的工具》。该框架不是法律也不是标准,它定位为一个用于企业隐私风险管理的工具,旨在帮助企业定义隐私目标,识别隐私风险,优化个人信息的使用,同时限制侵犯隐私的行为。该隐私框架可适用于各种规模的企业,不局限于特定的技术、行业、法律或司法管辖区域,框架通过采用比较通用的方法(即适用于企业数据处理生态系统中的各种角色)来帮助企业进行隐私风险管理,比如:(1)对于影响个人的系统、产品、服务,在设计和部署时将隐私考虑在内;(2)对于隐私的实践进行沟通;(3)鼓励企业各类人员(比如高管、法务和信息技术人员)在配置开发、实施层级选择以及成果实现的过程中进行协作。该隐私框架分为三个部分:核心、配置以及实施层,每个部分通过业务或任务驱动、组织角色和责任以及隐私保护活动之间的联系来加强企业对于隐私风险的管理。通过沟通和协作机制,来加强企业的隐私管理流程与问责。结语隐私是一个发展的概念,隐私的定义不是一成不变的,隐私始终在随着社会的进步而不断发生变化。不同的技术发展阶段,隐私的内容和形式不相同,对于隐私保护的方法也不同。随着技术手段和管理模式的不断创新,相信对于隐私的保护也越来越完善,企业也只有紧跟潮流,积极主动做好隐私风险管理,才能在“达摩克利斯剑”之下安然无恙。招募公告:苏宁金融于2020年8月启动“苏宁金融APP-财顾频道大V激励方案”,每月按阅读量和发文活跃度,奖励排名前50名大V,奖励金额300元-2000元不等。如果您是财经作者,欢迎入驻苏宁金融APP-财顾频道。入驻方式:关注“苏宁金融研究院”公众号,向后台发送“财顾”二字,小编将第一时间联系您办理入驻事宜。
2020-06-18 09:10
本文由微信公众号苏宁金融研究院(ID:SIF-2015)原创,作者为苏宁金融研究院研究员李加庆,首图来自壹图网。人工智能(AI)技术正在许多行业中产生变革,但只有在医疗领域,AI的影响才有望真正改变我们每一个人的生活。而这样的改变也许正在发生……一疫情肆虐,AI助力防控截至目前,全球确诊人数已超过800万。这次疫情给全球带来了巨大挑战。近年来,人工智能已经开始在医疗卫生领域发挥重要作用。先进的计算和数据分析工具使信息共享和诊断实践成为可能,并加深了医疗行业对疾病和感染的理解。在遏制Covid-19(新型冠状病毒肺炎)的迫切需求推动下,世界各地的政府机构和企业越来越多地将目光投向基于人工智能的技术,以提供对病毒传播的分析,并寻求治疗药物和方法。我国在疫情刚开始传播的时候,就采用AI技术进行疫情防控,在春运期间,火车站、机场、地铁等公共场所的测温压力巨大,各大图像识别技术巨头们很快部署了AI测温解决方案,采用图像识别与红外等结合的方式,有效避免接触式测温带来的病毒传播风险;疫情开始有所缓解、准备复工之时,不少AI公司提供了大数据AI技术,对迁徙人员进行动态跟踪,结合疫情地图,有效及时地跟踪传染源、接触源,为复工保驾护航。国外疫情爆发的要晚一些,各个国家也采用了AI技术在多个环节助力疫情防控:(1)AI疫情辅助控制迪拜采用了图像识别技术来自动判断人们是否遵守了疫情防控规定,比如保持距离,从图像可以看出该AI程序可以自动识别出人与人之间的距离,这样的应用在公共场所可以对人群密集提出预警提示。(2)新冠治疗药物研发总部位于伦敦的药物研发公司Benevolent AI在1月底开始将注意力转向冠状病毒问题。该公司用知识图谱技术来快速分析科学文献和生物医学研究资料,挖掘疾病的遗传和生物特性与药物的组成和作用之间的联系。该公司之前一直专注于慢性疾病,而不是传染病,但通过向其输入关于病毒的最新研究,能够重新调整系统,使其专注于新冠药物的研发。目前该公司已经进行潜在新冠治疗药物的临床试验。(3)新冠病毒结构分析DeepMind正在利用基因组的数据来预测生物体的蛋白质结构,揭示哪些药物有可能对COVID-19起作用。DeepMind是Google母公司Alphabet旗下的人工智能公司,在2016年推出的人工智能围棋程序AlphaGo,战胜了人类围棋选手之后一举成名,在当年将深度学习和人工智能技术直接推向高潮,其最新版本已无对手。DeepMind发布了一个名为AlphaFold的深度学习库,它使用神经网络来预测组成生物体的蛋白质如何根据其基因组变换形状,进而计算出哪些药物可以与新冠病毒生物体细胞结合,用来破坏病毒细胞,破坏它与人类细胞的结合方式,减缓病毒的繁殖速度。(4)COVID-Net加拿大初创公司Darwin AI开发了一个神经网络COVID-Net,可以通过X射线筛查COVID-19感染的迹象。DarwinAI已将COVID-Net作为一个开源系统发布,受到了AI研究人员的热烈追捧,该公司现在正致力于将COVID-Net从一个技术实现变成一个可以被医疗工作者使用的系统。它现在还在开发一种神经网络,用于对感染COVID-19的患者进行风险分层,以此来分离那些可能更适合在家中自我隔离恢复的病毒感染者,和那些最好进医院的病毒感染者。二医疗AI的大机遇这次疫情让各个国家的医疗体系翻了个底朝天,新冠病毒的流行让医疗系统的脆弱暴露在阳光之下。响应不及时、信息流通受阻、医务人员不足、医疗资源分配不均等诸多问题在多数国家都存在。因此,也让整个人类社会意识到医疗体系变革的紧迫性,是时候重新思考医疗体系的升级了,而人工智能技术在这次疫情中的积极表现,让炒了这么多年的医疗AI概念走入大众视野。而且,随着人口老龄化问题越来越突出,老年人口对于医疗的需求也将呈增长态势。根据国家统计局的数据,我国2019年65岁及以上老人已经突破1.7亿人,占人口总数13%。这样的增长趋势对于医疗资源是一个现实而急迫的挑战。将AI应用在医疗中虽不能完全解决医疗资源短缺的问题,但是却可以借助AI快速发展的红利,为医疗领域增添新的动力,刺激医疗事业的发展,拓宽医疗资源的使用范围,使全球各地患者更平等地受益于科学进步。医疗健康领域也切实存在很多需求需要AI来帮助实现,从防范疾病和减轻医护压力角度,至少有以下几个方面需求:(1)基于大数据的疾病或疫情预警;(2)智能读片,辅助医疗影像诊断输出,可以缓解医院的阅片压力;(3)智能诊疗系统,辅助医生做好疾病初步筛查,甚至辅助手术;(4)智能医护辅助系统,帮助护士做好入院评估以及护理监控等工作。从技术供给侧考虑,人工智能技术正逐步走向成熟,各种应用场景也日趋完善,加上软硬件的持续迭代,让AI技术的广泛落地近在眼前。而且,国家对人工智能、大数据、5G等前沿技术的发展从政策上给予了足够的重视,并加入国家“新基建”发展规划,进一步提升其战略地位。医疗AI应用领域在这个浪潮之下,正可以踏上快速发展的新车道。三医疗AI有哪些细分场景医疗AI的应用范围比较广,可以细分为多个应用场景。(1)AI疾病预测主要基于大数据分析技术,对搜索引擎数据、航空数据、交通信息等人类活动数据进行分析,从中发现与传染病相关的蛛丝马迹。举个简单例子,可以通过人们使用搜索引擎搜索疾病相关的某些词项来预测与此相关的传染病在某地区爆发的可能性。当然,要想预测准确,还需结合更多数据进行多维度更广泛的分析,单个方面数据分析往往会高估预测结果。(2)AI医疗影像这是AI助力医疗最热门也是最具有挑战的应用场景之一。将图像识别技术应用在医疗影像的识别中意义重大,一方面医院每天需要应对海量的X光影像、CT影像处理需求,需耗费大量人工长时间读片,容易出现误诊、漏诊情况;另一方面是因为图像识别本身就是AI最热门最具魅力的一个技术方向,并且图像识别已经在多个应用中大规模使用,目前已广泛应用在移动支付和安全监控领域,如果AI能在医疗影像中得到发挥,那将大大减轻医务人员负担。美国IDx公司的IDx-DR就是这样一个AI系统,它是用于视网膜病变检测,不需要临床医生解读就能寻找特定病症的筛查设备。该设备的软件,利用人工智能分析眼睛的图像,判断是否有糖尿病视网膜病变的迹象。IDx的检测系统不仅可以为缺少眼科专家的医院筛查糖尿病视网膜病变提供极大帮助,还可以将医生从一系列的测试中解放出来,而这些测试的结果大多是阴性的,可以让医生有更多的时间来治疗那些真正患有疾病的人。(3)AI新药研发由于新药研发过程极长,成本极高,而AI算法因为在数据挖掘方面以及计算能力方面具有天然优势,可以用在药物、疾病、基因之间关联关系挖掘以及药物的分子结构预测等方面,因此被寄予厚望,近年来该AI新药研发领域的资金投入突飞猛进。下图展示了美国的AI新药研发风投资金近年来大幅增长的趋势。本文开头提到的BenevolentAI公司便是这一领域的佼佼者。(4)AI医疗辅助机器人这些机器人可以代替人工医生来执行一些重复性高或者具有传染性环境的工作。比如医院大堂的导诊机器人可以大大减轻导诊台的工作量,而查房机器人可以让医生不需要接触具有传染病例的患者,减少医务人员的感染。结合5G技术,医生甚至不需要离开办公室,就可以将自己的专业诊疗工作延伸到任何地方,不仅在自己医院内部可以高效地开展诊疗工作,还可以支撑偏远地区医务极度缺乏的地区,进行远程诊断、远程会诊等。有一些微型机器人可以帮助医师更好地进行手术,卡内基·梅隆大学机器人部门开发了Heartlander,这是一个微型移动机器人,旨在方便对心脏进行治疗。在医生的控制下,这个微型机器人通过一个小切口进入胸部,自行导航到心脏的某些位置,附着在心脏表面并进行治疗。(5)AI健康管理随着人们越来越重视健康,越来越多的健康相关产品开始进入大众视野,健康管理是一个范围比较广的概念,包括手机健康APP、可穿戴设备、移动医疗等诸多应用。而AI健康管理往往与互联网、医疗大数据相关,细分场景也很多。比如Apple Watch就提供一项“摔倒检测”功能,关键时刻可以救命,这是Apple Support上对该功能的描述:如果手表检测到您摔得很严重,它会轻触您的手腕、发出警报声并显示提醒。您可以选择联系紧急服务,也可以按下数码表冠并轻点左上角的“关闭”,或者轻点“我没事”来关闭提醒。如果 Apple Watch 检测到您在移动,它会等待您对提醒做出响应,而不会自动拨打紧急服务电话。如果手表检测到您在大约一分钟内没有做出任何动作,它会自动拨打紧急服务电话。智能问诊机器人是近年来比较火的一个智能医疗产品方向,它基于自然语言处理、知识图谱、搜索引擎以及医疗知识库等技术构建的智能对话机器人,可以为用户提供在线实时问诊服务,是互联网在线问诊平台的智能化延伸,可以解决逐日增加的医疗咨询需求,让一些轻症患者免去因小恙而不得不去挂号排队问医生的麻烦,也大大缓解医院的压力。四医疗AI面临的挑战前景是美好的,但是道路是曲折的。在医疗AI逐渐落地的过程中,有诸多困难需要去面对。(1)临床认证难用于临床医疗的产品,需要得到所属国家食品药品监督管理局的认证才能合法临床使用。上文提到的IDx公司的糖尿病视网膜病变检测AI系统是美国食品和药物管理局(FDA)授权认证的第一次AI医疗项目。然而,大部分医疗AI项目都没有这么幸运,医疗临床器械认证流程非常繁琐。在我国要得到国家食品药品监督管理总局(CFDA)的认证,需要同国家的三甲医院合作进行临床测试,需要与接受临床测试的病人签订合同,还需要在国家专业机构做检测和报备,通过一系列测试和评估才能获得CFDA认证,很多医疗AI初创公司往往扛不住这样的时间成本。(2)数据问题数据是AI算法必不可少的“燃料”,很多做AI的公司头脑风暴出好些AI产品原型,大部分都由于无法获取足够多足够好的数据而不得不放弃。数据问题在医疗AI中尤为突出,一方面是数据来源问题,医院内的数据有相当一部分依赖于不同的系统,医院之间的数据也很难共享;另一方面是数据质量问题,医疗过程中产生各种临床数据,这样的数据缺少标准化和结构化处理,而且获取高质量的标注医疗数据也不那么容易。(3)隐私风险隐私是AI技术不得不面对的一个问题。随着AI技术的爆炸式发展,对隐私的保护越来越受到重视。随着欧盟的最严格隐私保护条例GDPR的出台,各国纷纷推出自己的隐私保护规范。AI技术对隐私的侵犯甚至还会成为某些社会问题背后的帮凶,比如种族歧视。就在不久前,一些AI巨头已经开始对这样的应用技术输出进行限制。6月9日,IBM宣布停止提供通用的人脸识别软件,随后不久亚马逊也宣布暂停向警方提供人脸识别监控软件,微软也紧跟其后表示在政府出台相关规定前不会再向警方出售人脸识别技术。虽然这些巨头们可能是迫于舆论压力不得不停止输出人脸识别技术,从侧面也反映出民众开始认识到自己的隐私正受到来自AI技术的侵害。在医疗领域,隐私数据尤其敏感,无论是基因测序数据,还是医疗健康数据,大部分人都不会愿意分享自己的敏感信息。如何在治病救人与保护隐私之间保持平衡,这是医疗AI发展之路无法绕开的问题,是技术与伦理的博弈。(4)AI诊断容易问责难医疗AI还存在一个困境,那就是如果让AI诊断代替医生诊断的话,将无法对诊断失误问责,无法定位责任主体,因为AI技术无法作为民事主体来承担民事责任义务,也不太可能让其背后的AI科学家承担责任。在医学伦理中,医生必须完全对患者负责,而如果让AI技术的锅给医生来背,也不太现实。(5)人才缺乏人工智能领域人才和医学人才是大学阶段培养周期最长的两拨人,也是最稀缺的人才。随着人工智能领域的爆炸式发展,人工智能相关技术人才的缺口越来越大,根据某招聘网站做的统计分析,中国人工智能人才缺口已经超过500万,高校每年培养的AI人才不到一万,杯水车薪。而医药AI需要从业人员不仅精通AI,还要懂医学相关细分领域的知识,能满足条件的凤毛麟角,更遑论建一个医疗AI团队,可想而知其难度之大。五我国医疗AI现状人工智能在我国各项政策的扶持下得到了快速发展,医疗AI也不例外。从下图医疗AI融资轮次的分布情况来看,目前我国医疗AI技术还处在比较初级的阶段,大部分融资还集中在公司比较早期的阶段,也体现了发展潜力巨大。六结语一百多年前的西班牙大流感造成了当时世界人口三分之一被感染,导致至少2000万人的死亡,是历史上最致命的一次全球大流行病。一个世纪后的今天,疫情再次席卷全球,不过今天人类已经有了更多的手段和方法来应对疫情的肆虐。希望人类克服层层困难,让医疗AI早日服务人类健康事业,尽早战胜新冠病毒。
2019-11-18 09:16
AI的飞速发展开启了各科技大国的人工智能“军备竞赛”,而这场竞赛的主战场一定是在边缘计算领域。边缘计算并不是一个新的概念。从“云”开始走进大众视野,继而物联网使我们迈进了后云时代。AI技术的发展使得“云”逐渐向“边缘”过渡。边缘计算是技术发展的必然,它打破了传统云计算的边界,将计算分布到各个边缘设备上进行。随着人工智能技术的兴起,以及5G技术的发展,边缘计算已经成为各国的研究热点,下图展示了各国在边缘计算产、学、研方面的投入比较。作为边缘计算概念的最早提出国,美国在该领域的投入最多,中国次之。本文梳理了几家美国科技巨头企业在边缘计算领域的产品和成果,分为三个类别简单介绍。先让我们了解一下边缘计算与5G有什么关系以及边缘计算能做什么。一5G是边缘计算的引擎边缘计算的技术实施需要考虑三个问题:安全、速度和规模。随着自动驾驶汽车、智能家居和许多其他高带宽应用需求的增加,无线传感器的数量将继续呈几何级数增长。企业级应用和消费级应用将需要更多的带宽,来连接更多的网络设备,还需要更高的安全性来保护和管理数据。而且物联网设备的爆炸式增长意味着彼此之间的设备数量要多得多,现有4G LTE网络标准的挑战之一是连接密度。而安全、速度和规模正是5G无线网络标准的核心要求。4G网络每平方公里最多只能支持2000个活动设备,5G标准的设计目标是在每平方公里内支持多达10万个活动设备。5G网络给边缘计算的应用提供高可靠性、低时延、高速率的传输条件,相当于为边缘计算架构的实施安装上了动力引擎。二边缘计算改变生活搭上5G的顺风车,边缘计算的发展将为以下应用场景带来革命性的升级:1、自动驾驶自动驾驶汽车需要快速且持续不断传入并分析数据,必须在毫秒级时间内处理周围的环境信息,以便采取相应的行动。这种数据量和时间的限制使得数据分析的计算不能依靠云端的计算能力,只能在本地完成,这就对本地设备的计算能力提出更高的要求,下文将提到Google和NVIDIA等芯片厂商在边缘计算芯片领域的布局。另外,边缘计算架构除了使自动驾驶车辆能够实时收集、处理数据来实现自动驾驶功能,还将实时共享车辆之间的数据,并且结合地理位置附近的边缘数据中心,将数据传输到城市网络中,向紧急响应服务和汽车制造商传递关键数据,以提升自动驾驶汽车的可靠性和安全性。2、智慧城市信息爆炸的时代,每个城市正迅速成为庞大的信息收集中心,传感器每天都在收集交通模式、公用事业使用和关键基础设施的数据,传统的云解决方案无法满足海量的计算需求。一个城市就是一个生态系统,交通物流、能源化工、商业通信、水气电生活设施等子系统将借助基于5G的边缘计算实现信息打通。未来的城市通过这些万物互联实现信息共享和协同运作,在城市资源分配、公共事务协调、突发事件预警等方面实现智能决策。整个城市更像一个智能体,生活在其中的人将拥有更舒适的体验。3、工业制造通过将数据存储和计算集成到工业设备中,制造商可以收集数据,以便更好地进行预测性维护和提高能源效率,从而降低成本和能源消耗,同时保持更好的可靠性和生产正常运行时间。通过持续的数据收集和分析,智能制造技术也将帮助公司定制生产和运行。通过部署微型数据中心(比如Edge Micro),制造厂商可以通过边缘计算将生产设备、人和产品的数据进行实时采集和分析,推送到微型数据中心,再根据需要传输到云端。边缘计算将为工业制造提升智能化水平提供性能监控的手段,为生产优化提供决策依据。比如,海上石油钻井平台可以利用边缘计算架构实时收集、监视和处理各种环境因素的数据,而不必依赖于远程数据中心基础设施。4、金融领域在智能手机成为我们每个人生活必需品的时代,银行机构正将边缘计算技术与智能手机应用程序结合起来,以更好地针对客户提供服务,甚至还可以借助边缘计算架构为自动取款机和自助服务台提供收集和处理数据的能力,使它们反应更快以提供更多人性化的服务功能。对于对冲基金等交易型金融机构来说,交易算法计算上一毫秒的延迟可能意味着大量的资金损失。采用边缘计算架构将核心计算放在世界各地证券交易所附近的数据中心,让计算密集型的核心算法尽可能接近数据源,实时获取最准确和最新的信息。5、健康医疗通过边缘设备收集患者数据并将数据发送给医院,让医务人员实时获取到患者的健康数据,可以大大提高医护的效率。特别对于一些长期的或慢性的疾病,如糖尿病和心血管疾病,这样能减少患者频繁赶赴医院的麻烦,也可缓解医疗资源长期紧张的问题。通过建立边缘计算数据中心,还可以将整个医疗过程数据记录下来,形成一个完整连续的医疗数据库,为医疗的诊断分析提供更全面的依据。可以预见,将来每个医院就是一个健康医疗数据中心,只要有足够安全的数据隐私监管和保护措施,边缘计算和智能医疗将为健康医疗领域带来变革。6、增强现实增强现实(AR:Augmented Reality)应该会是5G时代落地最快、商用最广的边缘计算技术。与虚拟现实不同,AR不是生成一个完全的虚拟世界,而是将数字元素覆盖在真实环境之上,通过眼镜和耳机等可穿戴的增强现实设备作为人机接口与人进行互动。因为是直接与人互动,必须做到零延迟,这就要求在设备端处理视觉数据,并实时整合预渲染的视觉元素。如果没有边缘计算架构,这些可视化数据将需要返回到集中的云服务器,在云服务器中进行视觉处理和元素渲染处理,还要再将数据发回设备端,这不可避免地会产生网络延迟,这种延迟会让人感觉到眩晕。边缘计算技术加上5G网络让AR设备可以即时完成视觉处理和视觉合成,让用户在任何地方查看新的AR细节,而不会感受到延迟和眩晕。游戏和娱乐会是增强现实设备常见的应用程序,但增强现实更有意义的应用应该是在医疗领域。增强现实可以帮助外科医生做手术,提供视觉辅助和更高的手术精度,提高手术的成功率。三美国的边缘计算公司下面分三个类别介绍美国边缘计算领域的公司:一是核心计算类,边缘计算的核心在于边缘端的计算能力,该类公司主打产品是芯片和计算框架;二是网络安全类,在这个类别中只介绍在云计算领域CDN的王者Akamai公司,主打边缘计算网络安全;三是平台设备类,主要关注边缘计算平台框架以及与边缘计算相关的微型数据中心。其实,类别之间并没有非常明确的界限,大的公司一般在硬件和软件均有布局。1、核心计算类(1)谷歌(Google)主打产品:Edge TPU和Cloud IoTa EdgeEdge TPU是为边缘计算设计的芯片,用于在边缘设备上运行Tensorflow Lite机器学习模型。因为是为边缘设备提供的,特点是功耗小、体积小、性能也足够好。Edge TPU支持机器视觉、语音识别、机器人等多种智能应用,可以用在上面提到的几乎每个场景中。Cloud IoT Edge有点类似下面要介绍的微软的Azure IoT Edge。Cloud IoT Edge软件将Google Cloud强大的数据处理和机器学习能力扩展到边缘设备端,是Google云服务在边缘设备的一种延伸。结合Edge TPU可以执行在Google Cloud中训练好的机器学习或深度学习模型。(2)英伟达(NVIDIA)主打产品:芯片处理器在智能计算芯片领域,怎么能少得了英伟达。基于Jetson Nano处理器组装的轻型NVIDIA EGX平台可实现每秒5亿次并把功耗维持在几瓦特;搭载NVIDIA T4的EGX边缘服务器可以达到10万亿每秒的运算。芯片的低功耗对人工智能运算很重要,目前传统CPU在这类运算中能耗巨大,EGX目前是少数能够实现低功耗的计算平台。Jetson Nano处理器在最近的一项针对机器学习的基准评测中战胜了Google的EdgeTPU和英特尔的边缘处理器,取得了机器学习计算性能上的领先地位。2、网络安全类(1)Akamai主打产品:智能边缘平台(Intelligent Edge Platform)Akamai是全球最大的CDN巨头,没有之一。Akamai在全球137个国家和地区拥有3900个数据中心,部署了240000台服务器,拥有全球最大的CDN平台。什么是CDN?CDN全称叫内容分发网络,通俗一点可以理解为互联网数据快递员,快递的快慢影响了个人的消费体验,而CDN就是解决数据内容分发的需求。平时用的抖音、快手、B站这些视频网站就非常依赖CDN技术服务。从下面这张图可以看出Akamai在CDN的领导地位。Akamai的智能边缘平台(Intelligent Edge Platform)是一个防御盾牌,它可以将网站、用户、设备、数据中心和云纳入防御网络等。我们知道,随着数据科学技术的发展,网络攻击的手段也在升级,从DdoS攻击发展到撞库攻击、爬虫攻击,边缘设备与云计算设备一样面临着这些攻击的挑战,Akamai是这方面的安全专家,拥有全球90%以上的互联网用户,Intelligent Edge Platform是目前唯一全球性的、大规模分布的、智能的Edge平台,提供边缘计算的安全服务。3、平台设备类(1)微软(Microsoft)主打产品:Azure IoT EdgeAzure IoT Edge是在 Azure IoT 中心上构建的完全托管的服务。可以通过AzureIoT Edge在标准容器中部署AI和第三方服务以及自定义的业务逻辑,进而在边缘设备上运行。Azure IoT Edge不是一个独立的服务,需结合Azure云服务使用,目的是帮助用户将原来运行在云端的分析模块和业务模块轻松的部署到边缘设备端,支持跨平台部署。(2)亚马逊(Amazon)主打产品:AWS Snowball Edge和AWS IoT GreengrassAWS Snowball Edge是一种数据迁移和边缘计算设备。Snowball Edge支持特定的Amazon EC2实例类型以及AWS Lambda函数,因此客户可以在AWS中进行开发和测试,然后在偏远位置的设备上部署应用程序以收集、预处理和返回数据。常见使用案例包括数据迁移、数据传输、图像整理、IoT 传感器流捕获和机器学习。AWS IoT Greengrass 是一个软件,它将AWS云功能扩展到本地设备。AWS IoT Greengrass 使本地设备可以更靠近信息源收集和分析数据,同时在本地网络上安全地相互通信。具体来说就是,使用 AWS IoT Greengrass 的开发人员可以在 AWS 云中编写无服务器代码(Lambda 函数,支持Python语言)。然后,他们就可以很方便地将此代码部署到设备以便本地执行应用程序。(3)Clear Blade主打产品:物联网平台(IoT Platform)和物联网边缘平台(IoT Edge Platform)物联网平台(IoT Platform)可以让企业安全地实时运行和扩展物联网设备,这是唯一一个允许企业根据不同行业定制要求二次开发的物联网平台,部署在云端,支持多租户,每个租户可以创建多个系统,在每个系统中开发者可以根据业务需求,创建各种应用。物联网边缘平台(IoT Edge Platform)则是部署在边缘计算设备端,上与物联网平台连接,下与物联网设备交互。Clear Blade支持可视化的配置界面,支持模块化的服务开发,让开发者很方便地创建边缘计算实例。下图是Clear Blade的平台架构图。(4)Edge Micro主打产品: 低延迟的边缘主机托管数据密集型的边缘计算还需要一定规模的数据中心作为支撑,这样的数据中心需要满足边缘计算的低延迟的需求,微型边缘数据中心应运而生,特别在5G时代,随着边缘计算业务的发展,对于微型数据中心的需求将会大大增加。Edge Micro就是提供这种微型数据中心的一家初创公司,这样的初创公司还有很多,这些公司主要在提供低延迟、低功耗、高可靠性、环境适应性、容灾备份等方面进行竞争。Edge Micro提供边缘主机托管的数据中心服务,将计算、存储和网络资源放在离终端用户更近的地方,以便更快地处理数据。这些微型数据中心一般会搭建在一个集装箱大小的模块中,便于模块化安装部署。四结论可以看到,科技巨头们在边缘计算领域的竞争非常激烈,实际上美国抢占边缘计算这片蓝海的公司特别多,虽然科技巨头们在技术领域具有领导地位,但是美国投入到边缘计算的初创公司和小公司占到了整个产业界近80%,非常具有活力,公司数量更是在全球遥遥领先。本文由“苏宁财富资讯”原创,作者为苏宁金融研究院金融AI研究员李加庆
2019-04-15 09:33
最近有一部叫做“爱死机”的剧火了。全名叫做《爱,死亡和机器人》(Love, Death &Robots),每一集都是独立的动画短片,平均时长只有15分钟,我特别喜欢其中几集关于机器人的科幻短片。套用这部剧的名称,让我们来聊一个现实话题:AI、隐私和机器人。AI的燃料AI技术与隐私保护是近年来越来越倍受关注的话题。从来没有哪个时代像当今一样到处充满了对个人隐私的侵犯,也没有哪个时代像当今这样对隐私看得如此之重。事实上,你的隐私将无处可藏。数据对于AI来说,就像煤炭之于蒸汽机,电能之于灯泡,汽油之于汽车。近年来,AI这台发动机已经再次发动,只有源源不断地喂给它更多的燃料,才能朝着远方前进。这台发动机的能耗很高,燃烧效率有时却不高,必须要足够多的燃料。汽车发动机必须在动力与节能之间寻找更高的平衡点,AI也必须在应用潜能和隐私数据保护(涉及数据的利用效率)之间寻找更适合的平衡点。隐私的隐喻关于隐私保护也在与时俱进,以前关注的个人隐私更多的是自身的私密性。明星在这个问题上是深受困扰的人群,整天被狗仔队跟踪,生怕被偷拍了不雅照片,吊诡的是,其实明星有时候更怕没有狗仔队跟踪。隐私与自身利益永远都存在着一个权衡。随着时代发展和进步,特别是人工智能技术的迭代演进,隐私的关注点也变得更为复杂。AI的发展需要更多数据,每个应用APP在你第一次打开时,会给你一个巨长无比的所谓隐私保护协议,然后你看也不看就点了“接受”,当然其实看了也没用,只是告诉你他们是匿名获取你的隐私数据,并且你的隐私数据不会被利用。其实,这种隐私协议的潜台词无非就是,要么用我们的服务、默许我们收集数据,要么就不要用。天天被电话骚扰的你,有时候也许不介意多接一个骚扰电话。每逢佳节,商场超市促销时,经常有信用卡推销或者房产中介等促销员给你一个小礼物让你“登记”一下个人信息,填个申请表,以得到后续他们“更优质的服务”或者得到“VIP身份”。这里其实更吊诡,明明是为了想要收集我们的信息,却让我们填“申请表”。你想了一下,反正现在每个人的信息都被大量的泄露了,也不差这点吧,反正他们都知道,无所谓,填吧,至少还能得到一个不错的小礼物。实际上,你将“得到”更多。这些商家线下获客,有了联系方式,后面就可以推送给你优惠券、促销券、代金券,发放更多小礼品,后面竟然连你什么时候需要买房、买车、买奶粉都知道了,还无微不至提供各种服务,有没有很意外,有没有很惊喜?也许你会问:我的隐私数据是怎么被偷走的?其实,不是被偷走的。只要你出门,就在泄露你的隐私,你的脸,你的声音,你的背包的颜色,都是暴露在空气中的隐私数据。在AI算法的眼里,你就是一个行走的数据流。你以为不出门就不会泄露数据了?随着智能手机、智能家居、智能手环、智能音响、智能扫地机器人等这些高科技产品横空出世,成为大众娱乐的新热点,AI应用场景甚多,数不胜数。你又会说:哈哈,真扯!我觉得你说的这些信息还好,我身边的人都能看到啊,没你说的那么隐私吧?其实在AI时代,关于人的一切数据都是隐私。你让身边人知道的信息不一定愿意让更多人知道,否则你在网上的网名怎么不用真名呢?天天带着一张身份认证和支付用的脸出门不觉得不安全么?隐私数据关乎的是你的个体信息,因为你是独一无二的。那么,具体有哪些隐私数据呢?基于你的个人身份数据,比如身份证号、手机号、家庭住址、工作地点,AI算法在各个社交平台上挖掘关联关系,建立图谱信息,可以掌握你的社交层面的信息,如朋友圈、亲人圈、同事圈,关系强弱,等等各种社会属性信息,构成一个完整的个人信息画像,这便确定了你这个独一无二的“社会”人。基于你的生物特征数据,各种应用APP收集的面部特征、声音特征,智能手环收集到的心率血压特征、作息习惯、睡眠数据,健身应用中的体重身高、身体柔韧性、体脂含量等等,可以轻松被挖掘被建模,这便构成了人这个实体存在的多维空间信息。上述两类可获得的数据只要足够多,加上你的各种行为数据,AI算法甚至可以推断出你的人格数据(或者叫心智数据)——你的思维方式,你在想什么,你的喜好,你的性格,形成描述人精神层面的内在模型。举个例子,一个很著名的关于人格与人性的模型叫做大五类人格特征模型,一般称为OCEAN,这个模型包含了五类因素:开放性(Openness)、严谨性(Conscientiousness)、外向性(Extraversion)、宜人性(Agreeableness)、神经质(Neuroticism)。机器人,另一个我开头说到AI、隐私和机器人科幻之间可能存在某种关联。这种关联源自于技术的不断发展,科幻为技术的未来提供了某种可能性的遐想。AI的发展需要很多数据来满足场景建模的需要,AI算法可以通过分析每个人的各种行为数据推导出这个人的人格特征。算法通过个人在社交网站中的点赞数据即可分析出这个人的喜好特征,通过协同过滤算法就可以对个人进行精准广告推送,比如给外向的人推送的广告场景相对活跃和充满激情,给内向的人推送的则是相对安静和私密的场景。同样的分析手段甚至被用在选举宣传的过程,能起到影响选民决策判断的作用。通过给不同性格或者意向动摇的选民推送不同版本的选举广告,或者推送对手的负面新闻,左右目标群体的决策,达到“心理操纵”的目的。而不断进化的人脸识别的技术能仅通过面部特征的识别就能判断出一个人的性取向这么私密的信息,准备率能达到80%以上,而我们人类本身很难仅通过一张脸就能判断出一个人的性取向。以色列的一家公司Faception声称可以直接通过面部特征来识别恐怖分子、高智商的人群,分分钟看透你的内心。AI可以不断地从人类的隐私数据中攫取价值,甚至能够再现人的心智模型。有没有想过,有一天,一旦AI掌握了人的足够多的关键数据,建立更加完备的模型,不仅能做到“心理操纵”,甚至可以做到“心灵控制”。人类的实体存在和精神存在被抽象为一个个复杂的画像模型,或者“心灵镜像”,这些模型和镜像包含了我们的所有特征,身份、性格、思维等等。只要将数据拷贝到一个机器人中,就可以生成另一个“我”来,甚至另一批“我”。这里的机器人可以理解为以机器为载体的AI算法和存储机制,加上更为先进的能源和机器进化机制,托管人类只是理所当然的事情,人类的心灵镜像只是被更为高阶的AI算法利用。会发生什么,我现在还不敢往下去想。这或许让你想起了《黑客帝国》《异次元骇客》这样的科幻电影。”爱死机“(Love,Death & Robots)的第一集《桑尼的优势(Sonnie’s Edge)》、第七集《天鹰座裂隙之外(Beyond the Aquila Rift)》和第十五集《盲点(BlindSpot)》也隐含了这样的主题。AI通过不断的迭代和进化,直至让机器人达到与人的心灵模型近乎一致,这是科学家们一直在追求的梦想,也是可怕的未知的未来。已知的未来AI应用的边界、隐私数据保护的度在哪,现在还是未知。社交活动数据、零售数据、金融行为数据、医疗健康数据等被广泛用于AI各种应用场景,的确也朝着为人类带来更多服务的方向发展,但是对于这样的涉及隐私数据利用的监管仍处于探索阶段。任何企业应用与隐私之间需要一个权衡。欧盟去年5月出台的一般数据保护条例(GDPR)中有几条关于隐私数据的保护原则,其中不仅包括隐私数据的处理过程需公正透明,使用场景和保留期限需明确限定,数据需保证完整、准确和保密等要求;而且还要求对隐私数据的获取要满足最小化原则,也即只获取必要的、相关的、限定的隐私数据。GDPR的推出在全球关乎隐私数据的保护方面具有非常强的引领作用。在各种AI算法和模型得到越来越广泛应用的今天,针对上述隐私数据的保护原则,尤其是最小化原则、保密性原则、透明性原则,AI公司或者与AI产品相关的公司必须考虑AI算法的发展方向。可以预见,未来满足下面条件的算法将是主要方向:(1)需要更少隐私数据的AI算法。这样的算法要么可以自己生成观测数据,如生成式对抗网络(GAN);要么通过分布式解决中心化训练对数据量的要求,如分布式机器学习(Federatedlearning)可以实现在边缘设备端进行模型的再训练。(2)基于加密数据的训练算法。将原始隐私数据加密,并且还能通过加密后的数据进行训练,这样不需要减少对隐私数据的获取,也能保证数据的保密性。这样的算法包括差分隐私技术、同态加密以及迁移学习等方法。(3)可解释的AI(Explainable AI,简称XAI)。很多AI算法的黑箱性质让人类担忧。XAI致力于提高算法应用的透明度,构建“玻璃箱”模型,使人类能够轻松理解AI算法,提高AI认知智能在人类活动中的可信度。这将是未来趋势。(作者:苏宁金融研究院金融AI研究员李加庆;来源:苏宁财富资讯;首图来自壹图网)