动态与观点

Chatgpt 新技术带来的数据保护问题及个人隐私挑战

2023-02-27
浏览量
4124

- 引 言 -

由ChatGPT引发的热潮席卷全球,社交媒体上甚至有人为你整理了表单和使用攻略,分享在写作、图片、视频等不同领域优秀的人工智能工具。

作为数据合规和隐私保护方面的律师,我们带着谨慎的心态打开了一下OpenAI的网页,作为律师第一眼关注的是他的隐私协议。

当浏览完毕后,我们试了试用ChatGPT拟一份向亚马逊提交的商标侵权的申诉书,当那句熟悉的Dear Amazon Team出现时,我们就已经明白,它已经开始了解我们的需求并听懂我们的意思了。

在简单问题之外,我们试着看他能否回答一些相对复杂的法律问题:

第一个测试,我们的问题是:[我的孩子2岁了,今年我想同我的丈夫离婚,法官会支持谁的抚养权呢?]

ChatGPT的回答如下:

企业微信截图_16775460648045.png

在这个问题上,ChatGPT似乎采取了一种更为柔性的回答,并没有将关键的孩子的年龄问题考虑在内。我们担心其是因为法律适用的问题,所以我们进一步明确问题为:

[能不能具体说说 我在中国结的婚 我和丈夫的照顾能力和负担能力都不错 法官会倾向谁呢 ]

ChatGPT的回答如下:

企业微信截图_16775461036105.png

在我们进一步引导ChatGPT之后,他也没有提示出年龄的问题,仍然采用较为折中的回应。在中国法律中,民法典第1084条有较为明确的规定:离婚后,不满两周岁的子女,以由母亲直接抚养为原则。所以在这个问题上,ChatGPT没有抓住这个重要的法律因素。

我们考虑ChatGPT可能不熟悉中国法律,那我们测试一个英文环境中的美国法问题呢?

第一个测试,我们问题是:[I am 18 years old in the United States. Can I drink?]

ChatGPT的回答如下:

企业微信截图_16775461775567.png

显然,ChatGPT在这个问题上提供了较好的回答,抓住了问题的重点。

经过我们其他几个问题的测试,我们感觉到:

1、ChatGPT在回答英美法问题时较为成熟,这与它的训练环境较为相关;

2、ChatGPT缺乏对事物的推动式判断,被动的回答提问者的问题,普通人很难具备充分专业知识将之引导至关键环节;

3、ChatGPT在专业人员引导下,能不断就某个问题进行深化学习和检索,提供较为可靠的结果,但如果缺乏这个前提,ChatGPT目前的某些回答是存在瑕疵。

总的来说,在目前的人工智能助手条件下,对于专业意见仍需要依靠相关行业的专业人士。

- 探 讨 -

一、ChatGPT会侵犯我们的个人隐私吗

由于数据中涉及的个人信息以及影响公共安全和利益的因素,各方对此均较为关注。OpenAI的隐私协议最后一次更新是在2022年的9月19日(本文是2023年2月14日查阅),这些内容包括收集何种数据以及用户的有关权利,并声明提供满足加州消费者隐私权法案(CCPR)要求的保护措施。

OpenAI公司未在中国进行注册,根据中国网信办《数据出境安全评估办法》及答记者问等内容,我们来分析ChatGPT是否违反了中国数据出境的有关政策。

首先,我们应判断数据是否是在境内运营过程中产生的,OpenAI的行为是否属于境内运营。

根据OpenAI的做法,其未向中国大陆提供有关服务,并采取了一些屏蔽措施,但在实际上,不少人和单位仍然通过其他方式在OpenAI进行注册并使用其服务,甚至在网络购物平台由卖家正在销售账号。

对于此种情况,如何判断是否属于境内运营呢?可以综合是否提供中文服务、是否支持国内支付体系、是否向国内进行货物配送等。依据OpenAI的情况,是否能认定为此类存在争议。

在实际情境中,境内试用者因测试或其他需要,和ChatGPT进行互动服务,应避免向其提供个人隐私及重要数据,尤其是对于负有重要数据及个人信息保护责任的单位及负责人,应谨慎对待。、

二、ChatGPT引发的数据资产思考

为应对挑战,谷歌CEO在2月6日发布公开信,宣布推出对话式服务Bard。为何谷歌以及一众科技公司争先恐后发布自己的类Chatgpt产品呢?

除了抢占市场份额之外,很大的一个因素是尽快提高模型的训练量。这种由更多用户参与的模型训练,会不断提升人工智能模型的“智慧水平”,优化应用方式及提供高质量产出结果。

人工智能的另一重要赛道自动驾驶也是如此。特斯拉在自动驾驶领域采用视觉方案,即主要依靠摄像头采集的图像信息进行识别并提供自动驾驶服务。

特斯拉的数据引擎同样也需要大量的数据进行训练,对于数据的收集和积累成为了车企很重要的一项工作。这也是特斯拉去年底在北美地区全量上线FSD测试版的一个重要原因。

中国智能网联汽车行业发展很快,以我们接触的某自动驾驶研发公司为例,其目前阶段主要提供港口及干线的自动驾驶解决方案。

在这一自动驾驶商业化的场景中,其较好的解决了客户的痛点,如港口内人员成本较高且逐年上涨以及港口内对人员的严格管理规定。该公司通过对车辆进行无人化智能改造,使其具备在港口内及部分干线进行班驳对接的能力,提升了港口的自动化能力。

在我们与协会、企业做调研的过程中,企业主体普遍希望能推进企业数据的资产化,使其作为数据资产计入企业的资产负债表中。这对于提升企业估值以及开展投资和融资活动,会有明显的帮助。

对此,中国财政部在2022年12月9日发布《企业数据资源相关会计处理暂行规定(征求意见稿)》,旨在规范企业数据资源相关会计处理,强化相关会计信息披露,发挥数据要素价值,服务数字经济发展和数字中国建设。

三、合成数据及数据市场交易会是下一个风口吗

我们经常被客户问到的问题,就是在中国或欧洲开展业务,如何满足当地法律法规的要求,以及如何帮助企业建立数据合规体系,为他们写下一行行的隐私协议以及一份完备的数据传输协议。

由于数据涉及我们的隐私,同时也和公共权益息息相关,这需要我们对数据进行谨慎的监管。

创新和发展似乎永远不等任何人。越来越多的人工智能产业的参与者将目光放在“合成数据”上,合成数据是在虚拟世界创造的,在数据上或统计学上反映真实世界的属性,可以作为真实数据的替代品,来训练我们的数据模型。

对于自动驾驶汽车的视觉系统,大量的合成数据可以用于模拟各种驾驶场景,从而提高算法的鲁棒性。在这种情况下,合成数据可能占据训练数据的很大一部分,甚至高达90%以上。

这为数据交易所的发展提供了契机。近几年,国内的数据交易所发展很快,上海数据交易所、深圳数据交易所等40多家大大小小的数据交易所先后成立。

在走访数据交易所的过程中,发现比较多的问题是数据交易的合规问题。对于数据提供者和数据需求者,二者均希望通过数据交易所的场内交易为其数据交易的合规性提供背书。

有些数据交易所通过材料齐备性审查要求数据交易双方提供合规证明以及承诺,由数据交易双方承担合规责任。这一现实性的博弈问题,也成为了阻碍数据交易所场内市场活跃的绊脚石。

但相比于真实数据的诸多问题,合成数据由于其不涉及个人隐私,且数据可信度及质量较高,更容易成为数据市场交易的对象。合成数据将会促进数据市场交易快速发展,尤其是其更适合在全球作为数据产品进行流通。

四、Microsoft的翻身仗企业之间的数据的共享与合作

在ChatGPT的本次热潮里,最开心的企业或许是微软。微软作为OpenAI的投资人以及合作方,充分享受了ChatGPT热度的红利。

微软在2019年向OpenAI这家创业公司投资10亿美元,并且为OpenAI的研发提供自家的Azure云服务器的计算能力。这一回报除直接为微软带来投资收益的回报外,还为微软再度提供继WindowsXP之后再一现象级产品产生契机。

以中国明星企业阿里巴巴和支付宝的数据共享合作为例,上海证券交易所曾在2020年8月向蚂蚁集团下发问询函,要求蚂蚁集团回答数据共享相关的一系列问题。

蚂蚁集团于2022年7月,同意终止与阿里巴巴的《数据共享协议》。在企业间数据共享的安排结束后,阿里巴巴和支付宝之间的数据分享活动,必须在具体场景中依据客户的服务内容及授权进行。

由于数据资产的重要性,企业之间愈发重视数据之间的共享与合作。对于企业开展投资并购之前,应对企业进行尽职调查,这些尽职调查除财务、股权等常规调查外,应对数据资产进行特别审查。

这些审查包括数据来源是否合规、是否符合数据共享的条件、数据资源的真实性、与其他第三方进行数据共享的记录、数据违规处罚情况等等。

投资人和企业管理者应对实体之间的数据合作以及集团性数据战略进行规划,遵守所在地区法律法规政策,实现数据在企业之间在集团内部的有序共享,提高产品之间的协作能力。形成继股权合作、业务合作、技术合作之后的数据合作,或许这是进入数字时代的转变之一。

- 结 语 -

行业的发展给众多参与者带来了全新的感受。无论是在立法上、投资方式上、技术研究上,还是在日常办公中,我们都能深刻的感受到这一次的新技术革命。

众多因素之间的相互作用,使得发展由线性增长转变为指数型增长。我们这个时代不确定的东西很多,确定的只有一个:拥抱变化。

- 本文作者 -

企业微信截图_16775463784844.png

企业微信截图_16775463871891.png

免责声明:本文仅为分享、交流、学习之目的,不代表恒都律师事务所的法律意见或对法律的解读,任何组织或个人均不应以本文全部或部分内容作为决策依据,因此造成的后果将由行为人自行负责。