【鉴定实例】人工智能公司爬取公民个人信息,司法鉴定揭晓其“智能”秘钥
最近,人工智能chatGPT“惊艳”全网,还引发不少人产生了“恐怖谷效应”。许多人联想到,若强大人工智能被应用于犯罪,将制造出极端恐怖。
人工智能并非凭空产生,合理的说法是,人工智能是一系列技术的综合应用和体现。技术不分善恶,利用技术实施犯罪者从来屡见不鲜,本文以2020年前后福建美亚柏科司法鉴定中心受理一著名人工智能公司爬取公民个人信息案为例,揭晓智能背后的“秘钥”,供读者一道探寻人工智能安全防护之道。
2020年前后,某地警方接到举报称有一人工智能公司违法采集大量公民个人信息,并对外提供价值不菲的“高精度查询”、“信用自动评估”服务。接到举报后,警方进行了初步摸排,发现该公司之所以能够实现高精度、高准确率的检索和评估结果,实质是基于其爬虫程序大量爬取了各类金融APP、政务网站数据。对此,该公司负责人称,爬虫爬取的都是公开数据,并无违法违规行为。究竟真相如何?警方找到福建美亚柏科司法鉴定中心对这些爬虫程序以及数据库进行了司法鉴定。 依据《软件功能鉴定技术规范》要求,负责该案的鉴定员使用数据分析工作站设备,搭载IntelliJ IDEA软件对送检的爬虫程序源代码进行了鉴定分析。分析过程中共发现4个代码工程,其中有一工程内包含有对数家运营商的手机APP、商城、WAP、WEB页面页面的数据抓取工具。除运营商外,鉴定员还发现这些爬虫程序还针对性非法爬取了目标地市的公积金、社医保等网站数据。那么,是否真如负责人所说,爬虫程序只是抓取数据没有对数据“动手脚”呢?在对程序源代码的分析过程中,鉴定员同时还发现了具备对运营商平台用户账号密码进行修改的工具达到30余个。随即,鉴定员对这些爬虫工具构建、抓取、修改参数、登录应用、提取账单等行为对应代码都进行了还原固定,将“违法行为”的事实证据客观记录。 针对送检的数据库检材,鉴定员使用数据分析工作站,采用了取证大师等软件进行了分析,查清查明了数据库内不同代码的对应含义并查清了该公司利用该数据库对外提供的智能评估产品共计收费条数达到了2亿条以上。要知道这些数据每一条的单价都价值不菲,合计的违法所得金额巨大。 经司法鉴定,本案中的“人工智能”公司犯罪事实清楚,当地警方依法对该公司进行了惩处。 近年来,我国持续对打着“人工智能”、“大数据”旗号的各类型互联网违法犯罪行为进行了严厉惩治,司法上对于包括爬虫程序在内的各类互联网技术也明确立法,不断精进。无论是爬虫程序还是chatGPT或是未来的“人工智能”进阶应用,“科技向善”始终是要有仗于法律规制其行为及其背后人的意识。