7月4日,中国数字经济发展和治理学术年会(2023)在清华大学顺利举办。本次大会以“数据要素治理,数据价值释放,数字经济创新”为主题,邀请了国内外40余位数字经济领域著名专家以及在数字产业实践中取得优异成果的机构代表进行主旨演讲和交流。来自清华大学、北京大学、中国人民大学、中国科学院大学、中国社会科学院大学、南开大学、上海交通大学、复旦大学、中山大学、南京大学等高校和数字经济相关科研机构及企业的代表共400余人出席线下会议,会议通过多个平台进行同步直播,当天信息浏览量超过11万人次。
美国普林斯顿大学金融学讲座教授及经济学教授、香港中文大学(深圳)经管学院学术院长熊伟教授以《数据分享与数据资产》为题进行了主旨演讲。本文根据熊伟教授现场发言内容整理。
熊伟教授作主旨演讲
非常荣幸今天能够参加本次数字经济发展及其治理的学术年会。今天我想利用这个机会和大家探讨一下数据分享和数据经济的话题,这个话题已经由之前几位嘉宾提及。数据被确认为中国的五大生产要素之一,与资本、劳动力、土地并列,陆总刚刚也详细讲述了这些要素。然而,我认为数据作为一个生产要素,与其他要素有许多不同,尤其是,它不需要分配。特别是消费者的数据,只有消费者分享了他们的数据,这些数据才能被使用和广泛的商业应用,最终推动实体经济的发展。然而,数据分享背后的一个重要问题是数据隐私。我们都知道,近年来各国出台了许多法律,从欧盟的通用数据保护条例到我们国内的个人数据保护法,都是在两年前通过的,美国、日本和其他一些国家也都有类似的法案。这些法案的目的都是要保护消费者的数据隐私和数据安全。
然而,这里存在一个基本的问题,那就是消费者究竟如何看待隐私,他们关心什么,他们担心什么,以及他们如何选择分享数据。从消费者行为和经济各个方面来看,我们对这些问题了解得还不够。所以,今天我想和大家探讨一下从经济学的角度如何理解消费者对数据隐私的偏好,以及他们如何选择分享数据。
从偏好的角度来看,数据隐私的偏好是什么样的?有各种理论框架,其中一个最简单的观念是,隐私是一种天生的偏好,有些人就是不愿意让自己的事情被别人知道,这是一种天生的偏好。但是,从经济行为的角度来看,数据隐私偏好不仅可能是天生的,还可能是工具性的,因为一旦个人信息被其他人、商家、同事、朋友知道,可能会产生各种影响。换句话说,分享个人数据可能会带来好处,也可能带来成本。
我们知道的好处是显而易见的,例如,你分享数据给各种平台和APP,让它们更好地了解你的偏好,知道你喜欢什么样的短视频,知道你喜欢什么样的商品,这些平台就能快速地向你推送你需要的商品,这无疑是一个便利。但这种便利的成本是什么呢?在经济学的学术文献中,我们考虑了许多因素,我将粗略地提及几个。首先,价格歧视,从消费者的角度来看,如果商家知道我喜欢什么,这是好事,因为他们能快速地把我需要的东西推送给我。但是,如果他们知道我到底有多喜欢这个东西,以及我愿意支付的最高价格,那么我可能会付出比别人更高的价格,这就是价格歧视,也是一种成本。
另外一个可能的问题是所谓的社会歧视。例如,如果你分享了你平时爱看的短视频给你的朋友们,这可能会影响他们心中对你的良好形象。另外,我想强调一下,保护隐私也是为了保护个人的脆弱性。商家都是专业的企业,他们在大数据时代使用众多的算法,这可能会暴露出个人的脆弱点,比如有的人热衷于赌博,有的人嗜酒,虽然他们平时能控制自己的消费欲,但不总是能够保持这种控制。因此,披露个人数据也会把这些脆弱性暴露给商家。商家就可以选择性地推送一些具有诱惑力的广告。消费者可以利用自我控制力来抵御这些诱惑,但并不总是能够成功。因此,保护个人隐私也是为了保护个人的脆弱性,以避免受到商家的诱惑。
过去几年,我也进行了一些关于隐私的研究,我想分享一下我最近进行的一个关于数据分享的理论模型研究。这个模型研究的是在线数据分享和消费者个人自我控制的问题。消费者如何识别自己的弱点,并将数据保护起来,从而保护自己的弱点。将个人数据分享给在线平台,优点是,数据分享可以让这些平台帮你找到你最需要的商品和服务,进行精准的定位。然而,缺点是你的脆弱点也可能被暴露,结果可能是你购买了自己不想买的东西,或者消费超出了个人预算。
通过我们的理论模型分析,我们发现数据分享在宏观层面存在各种外部性,包括正外部性和负外部性。更多的数据分享可以提高效率,因为平台可以更好地帮助消费者匹配到他们最想要的数字服务或商品。换言之,数据分享可以提高匹配的效率。但是,这也引发了所谓的算法不平等问题,因为算法可能会暴露消费者的脆弱点,有的人脆弱点多,有的人脆弱点少。因此,虽然总的来看,数据分享提高了效率,但对不同的人有不同的负面影响,对某些人的影响尤其大,负外部性的分布并不均等,这是一个值得我们深思的问题。
今天我想深入地讨论消费者在进行数据分享时的实际行为。一旦涉及到数据分享,人们立刻会想到数据隐私悖论。许多调查研究发现,消费者在问卷调查中经常表示对数据隐私非常担心,并非常重视数据隐私的保护。尽管他们声称在意,但只要给予一些小小的好处,比如免费午餐,很多消费者愿意将他们的电话号码和住址告诉你。只要平台给予一些小的好处,他们也会毫不犹豫地提供个人信息。消费者到底是在意他们的隐私还是不在意呢?如果他们在意的话,就不应该随意地将个人信息透露给他人。在数字平台上,特别是在许多应用程序需要数据分享的情况下,这种现象非常常见,似乎消费者也乐意分享他们的数据,这就是一个悖论。这个悖论经常在学术界和政策讨论中出现。如何解释这个悖论呢?有不同的解释,有人认为这个悖论表明,尽管消费者声称在意,但实际上可能并不真正在意,如果真的在意的话就不会随意地分享他们的数据。也有人认为,这个悖论表明消费者已经完全放弃了个人数据隐私的保护,因为在当今的数据时代,如果不分享个人数据,很多应用程序就无法使用,所以只能无奈地分享。此外,西方的法律文献中还提到一种说法,即这个悖论的存在可能是因为问卷调查中的问题可能不准确,导致消费者的回答与他们实际的分享行为不完全匹配,就像苹果和香蕉之间的比较一样。
最近,我与阿里罗汉堂的陈龙教授和团队以及我的博士生欧阳书淼在支付宝平台上进行了一项调查。支付宝上有许多第三方小程序,每个小程序在使用之前都需要用户进行数据分享授权。因此,当用户首次登录一个小程序时,就需要进行授权的过程,只有授权之后才能使用该小程序。这是数据经济时代非常常见的选择,每个消费者都必须进行选择,他们的选择行为可以帮助我们了解他们的实际数据分享行为。这项调查是在2020年7月进行的,我们通过支付宝平台向一群用户发送了一个问卷调查,共有1万多名用户完成了调查。调查中涉及了12个与数据隐私分享相关的问题。
其中一个最关键的问题是,在支付宝上和小程序分享数据时,你是否在意你的数据隐私?对于这个问题的回答存在差异,46%的人回答非常在意,39%的人表示在意,还有15%的人表示不在意。
调查结束后,我们与后台数据进行了匹配,了解用户到底与多少个小程序分享了数据,这个结果很有趣。这是一个数据摘要,参与问卷调查的人在平均两年多的时间内登录了46个支付宝小程序,数量相当大,平均授权了34.2个小程序。尽管只有授权数据分享后才能使用这些小程序,这些用户并没有授权所有小程序,实际授权比例只有75%。他们平均拒绝了25%的小程序。可以看出,这些消费者并不是完全无奈地放弃了他们的选择,他们不只是随意地授权所有小程序。这显示了他们在做出选择方面是非常主动的。
我之前提到的关键问题是在问卷调查中,对于分享授权小程序时的数据隐私问题,有三组不同的回答:46%的人非常在意,39%的人在意,还有15%的人不在意。我们对这三组人进行了比较,看看哪类人分享授权的小程序数量最多。我最初的想法是,不在意的人授权的最多,因为他们不在意。相比之下,特别在意和非常在意的人应该分享得更少。我们进行了具体的比较。
这项调查是在2020年7月进行的,我们分别查看了之前一年和之后一年半的数据。右侧的图表显示了问卷调查之前一年的数据,我们可以看到这三组人的情况。蓝色部分代表他们进入了多少个小程序,橙红色部分代表他们最终授权了多少个小程序。可以看出,非常在意的人在一年内进入了15个小程序,授权了11.3个;在意的人平均进入了15.5个小程序,授权了11.5个;不在意的人进入了14.3个小程序,授权了11.2个。授权数量几乎相同,这有点违反直觉。一些人声称非常在意,一些人声称不在意,但他们一年内授权数据分享的数量却几乎相同。这与数据隐私悖论相符。实际上,那些更在意的人实际上进入的小程序数量更多,所以他们的拒绝率也更高,所以最终授权的数量大致一样,这是非常有趣的现象。
我们还研究了调查之后大约一年半的时间内,他们授权的数量是增加还是减少?有时候人们可能不太明白授权会带来什么后果,可能只是模糊地点了授权。调查一年半后的情况反映一个更有趣的图表。在此期间,非常在意的人进入了33.4个小程序,授权了23.8个;在意的人进入了32.8个,授权了24.6个;不在意的人进入了27.8个,授权了22.5个。可以看到,总体的授权数量都有所增加,且差异性更加明显了。在意的人实际上授权了更多,而不在意的人授权的更少。
调查一年半后,那些表示非常在意数据隐私的用户授权数据分享越来越多,这似乎加剧了数据隐私悖论的严重性。尽管之前的研究都是基于对学生的问卷调查,但我们的研究对象是数字平台的用户,而且是中国最大的数字平台,我相信在座的朋友们也都曾经进行过类似的授权,所以这个研究场景非常贴切。我们进行了各种回归分析,控制了用户的背景、年龄和使用支付宝的时间,从统计上来说这个现象是非常稳健的。
如何理解这个现象呢?学术界有人认为这是因为在授权时存在各种行为偏差,因为用户非常想使用这些小程序,不在乎未来的成本,而成本通常发生在很多年后或者很多天后。然而,我刚刚展示了调查一年半后授权的情况,如果仅仅是短期考虑,授权的数量应该会减少。也许他们对授权的后果感到困惑,不知道会带来什么后果,但一年多的时间过去了,授权的数量却越来越多,这种行为本身反映了不仅仅是困惑,没有搞清楚后果。
为什么那些表示担忧的人授权的数量更多,实际上反映了更深层次的问题。我们比较了这三组人,在授权之后谁使用这些小程序更多。我们的数据覆盖这些用户在授权后使用该小程序的活跃天数,每次登录后打开的页数,停留时间等等。我们发现有趣的是,那些表示担忧或非常担忧的用户实际上是活跃用户,而且相对来说更加活跃,这反映了这些用户对数字服务的需求更大,尽管他们更担忧,但对数字服务的需求更迫切。这可以解释为什么他们一方面表示担忧,但另一方面又愿意分享,并且分享了很多。
总言之,刚刚展示的这些图表确实反映了数据隐私悖论,但这个悖论不是简单的行为偏差或者个人放弃隐私保护。实际上,它反映了更深层次的问题,因为数据隐私是数字经济发展的衍生物。在数字经济发展之前,没有隐私担忧。随着数字经济的不断发展,因为需要分享更多的数据,也带来了隐私担忧。然而,之前的演讲嘉宾们都提到了越来越多的数据分享带来的好处,即数字服务的提供变得越来越精确和强大,服务质量也越来越好。这些用户可以享受到更多的便利,因此不能不分享个人数据。这是一个权衡的问题,数据分享会带来隐私担忧,但也带来便利。随着更多的数据分享,便利性会不断增加,与此同时对隐私的担忧也会增长。尽管如此,人们也还会分享更多的数据。