当越来越多的人工智能算法生成材料进入刑事诉讼,律师该如何应对?
从抽样检验规则的扩展,到经侦领域“金析为证”类分析报告的推广,算法生成材料正越来越深地进入刑事诉讼。真正的问题不是技术先进不先进,而是这些材料能否经受住证据法和程序正义的严格审查。
先说结论:算法生成材料可以作为侦查辅助和分析线索存在,但一旦进入刑事诉讼,就绝不能因为披着“智能分析”“模型识别”或“金析为证”的外衣而自动升级为定案根据。律师最重要的任务,不是反技术,而是把技术重新拉回合法性、真实性、关联性与可质证性的审查框架。
这两年,刑事办案中的“技术材料”正在发生一个非常明显的变化。过去律师面对的技术性证据,大多还是传统意义上的鉴定意见、电子数据提取笔录、勘验检查笔录、审计报告、司法会计意见等。现在,越来越多的新型材料正在涌入刑事诉讼:有的是基于大数据碰撞、轨迹分析、关系图谱生成的研判结果;有的是平台系统自动输出的异常交易识别、账户风险评分、网络结构关联模型;还有的是借助人工智能算法,对海量数据进行筛选、分类、聚类、比对后形成的分析报告。
一、为什么这个问题现在格外重要?
因为我们正处在一个非常关键的转折点:算法材料正在从后台工具走向前台证据。
过去,很多系统生成结果只是供侦查机关内部参考,比如哪些账户有异常资金流动、哪些交易链条疑似存在分层转移、哪些对象之间存在高频联系、哪些轨迹发生了碰撞和重叠、哪些经营数据与票据流、资金流、物流之间不匹配。这些材料本来更像“线索发现器”,其功能是帮助办案机关缩小范围、提高效率、形成研判。
但近年来,一个明显变化是:这些分析结果越来越不满足于做“后台线索”,而是在卷宗中被逐渐赋予更高的地位。它们开始被包装成“智能分析报告”“数据碰撞结果”“模型识别结论”“关系图谱分析意见”“资金分析认定报告”,乃至被默认为某种“客观证据”。
问题就在这里:一旦算法生成材料开始真实影响立案判断、强制措施、主观明知推定、涉案金额认定、共犯结构搭建以及经侦类案件中的定性和量刑,律师就不能再把它只当成普通背景材料来看了。
二、抽样检验与“金析为证”背景下,为什么律师更要警惕?
1. 抽样检验、抽样审查的扩大使用,可能让“局部推整体”变得更容易
抽样方法本身并不当然错误。在海量数据、批量交易、数量庞大的票据、电子记录、商品、账册、流水材料面前,完全逐笔逐项核查,现实中确实经常面临成本与效率问题。所以,某些条件下允许抽样,表面上看是程序技术层面的优化。
但律师真正要警惕的是:抽样一旦与算法分析、模型推断结合,极容易形成“双重推断叠加”。
危险链条往往是这样形成的:
- 先抽取部分样本;
- 再由系统对样本进行建模、分类、聚类、识别;
- 然后把模型结论外推到整体;
- 最后再把这种整体性判断拿来证明案件事实。
这实际上会造成一种证明结构上的滑坡:从直接证明,退化为样本证明;再从样本证明,退化为模型证明;最后从模型证明,退化为整体归责。每退一步,事实基础都在变薄;但因为披着“技术”和“统计”的外衣,反而容易让人误以为更加科学、更加可靠。
2. “金析为证”类分析报告的推广,意味着经侦案件中的“分析型证据”正在制度化
如果说抽样问题更多发生在证据方法论层面,那么“金析为证”类分析报告的推广,意义更大。它表明,经侦系统正在更加系统地把金融分析、账户结构分析、资金路径分析、交易网络分析等技术手段,转化为案件中的核心说明材料。
在经侦案件中,这种趋势尤其明显,因为经侦天然面对海量账户、多层嵌套交易、大量票据、合同、流水、发票、平台记录,以及公司、个人、关联方之间复杂的资金往来。办案机关确实比过去更依赖技术分析,但依赖分析,不等于分析本身就能替代证明。
再复杂的图谱,也仍然只是图谱;再漂亮的分析,也仍然只是分析。它们最多能够提示问题、压缩范围、提出假设,但不能自动跨越到刑事证明的终点。
三、律师首先要明白:算法生成材料,不天然等于证据
很多律师面对这类材料时,最容易出现的误区,是一上来就默认它已经是“证据”了,然后直接去争论它准不准、对不对、有没有误差。其实第一步不应该是这样。第一步永远是:先追问它到底是什么。
它究竟属于电子数据、鉴定意见、检验报告、审计报告、专门性问题说明、侦查机关内部分析材料、技术辅助研判结果,还是平台自动生成截图?这个定性问题非常重要。因为只有先把它的法律属性说清楚,后续才能谈它的可采性、质证方式和证明力。
很多所谓的“智能分析报告”其实处在一个尴尬位置:既不像规范提取的电子数据,也不像符合法定程序形成的鉴定意见,而更像是侦查人员、技术人员、分析人员借助系统工具,对原始数据进行再加工、再整合、再解释后形成的说明性材料。
如果它本质上只是对已有材料的再说明、再推断、再归纳,它凭什么在法庭上被当成一种天然客观、几乎不可动摇的“高等级证据”?律师首先要把这一层捅破。
四、面对算法材料,律师的核心任务不是“反技术”,而是把它重新拉回证据法
真正专业的刑事辩护,从来不是反对技术,而是反对技术未经法律过滤地直接进入定罪机制。所以,面对算法生成材料,律师最重要的工作,不是抽象地说“我不相信人工智能”,而是把它重新拉回刑事诉讼最基本的几个问题。
必须追问的几个问题:
- 它是怎么形成的?
- 它依赖哪些原始数据?
- 原始数据是否合法取得?
- 处理过程是否可复核?
- 分析规则是否透明?
- 结论到底证明了什么?
- 它是事实证明,还是概率推断?
- 是否存在其他合理解释?
- 如果剥离这份分析材料,控方证据体系是否仍然成立?
把这些问题问出来,所谓“高科技证据”的神秘感往往就会迅速消退。因为说到底,它仍然是证据问题,不是魔法问题。
五、律师应对算法材料,至少要从五个层面展开
第一层:审查原始数据来源是否合法
任何算法材料都不是凭空生成的,它一定建立在底层数据之上。以经侦案件为例,往往可能涉及银行流水、第三方支付数据、发票数据、税务申报信息、交易平台数据、物流记录、通联记录、公司工商资料、设备识别信息和账户关联信息等。
律师要追问的是:这些数据是谁调取的?基于什么依据调取?是否有审批手续?是否存在超范围调取?是否将与本案无关的大量主体卷入分析?是否在不同案件、不同系统、不同用途之间进行了越界拼接?
如果底层数据本身就来路不明,后面的分析越复杂,问题只会越大,不会越小。
第二层:审查分析过程是否完整、可核、可重复
算法生成材料最大的风险,在于它不是原始证据,而是“处理后的结果”。所以律师一定要盯住中间层:使用了什么系统?系统版本是什么?谁操作的?操作日志是否完整?规则由谁设定?模型参数是什么?阈值如何设置?是否经过人工复核?是否经过第三方验证?是否可以在相同原始数据基础上重复得出同样结果?
如果这些都说不清,那所谓“分析结论”其实更接近一种技术包装下的主观判断,而不是可以稳定信赖的证明材料。
第三层:审查抽样是否科学、合法,能否外推
如果本案涉及抽样检验、抽样核查、抽样比对,律师必须特别谨慎。因为抽样最怕的,不是“抽了样”,而是样本怎么选的没人说清、样本是否具有代表性没人证明、抽样比例没有合理依据、抽样误差没有说明,结果却被直接外推到全部对象、全部期间、全部金额、全部行为。
一旦算法分析建立在抽样基础上,这种风险更大。律师必须反复追问:样本是随机还是选择性抽取?样本量是否足以支撑整体外推?样本结构是否失衡?是否存在明显偏样?局部异常为何能够推出整体违法甚至整体犯罪?
第四层:审查它到底证明“事实”,还是仅仅证明“可疑”
很多算法材料最擅长的,不是证明事实,而是制造一种强烈的“可疑感”。比如资金流异常、交易结构不自然、账户之间存在高频联系、物流票据资金之间匹配度异常、若干节点构成封闭循环、某人长期出现在某些数据链条的关键位置。这些现象当然可能提示问题,但提示问题,不等于证明犯罪。
律师要不断逼问法庭和控方:它究竟证明了什么具体行为?能否直接证明主观明知?能否直接证明共谋意思联络?能否直接证明虚构交易、非法占有、掩饰隐瞒、虚开发票、洗钱转换等具体构成要件事实?还是仅仅说明“看上去很不正常”?
第五层:审查它能否被有效质证
程序正义的核心之一,就是不利于被告人的材料必须能够被理解、被审查、被反驳。如果一份算法材料不披露底层数据、不说明分析规则、不提交关键日志、不解释参数设定、不说明误差率、只给结论不给过程,那么辩方实际上就无法有效质证。
这时候律师必须明确提出:不能让被告人输给一个无法盘问的黑箱。如果控方主张该材料对定罪量刑具有重要作用,就应当承担与之相匹配的披露义务和说明义务。若说不清、拿不出、解释不了,就不能让这种材料承担决定性不利后果。
六、面对“金析为证”类报告,律师尤其要防止三种误区
误区一:把“资金异常”直接等同于“犯罪事实”
资金流异常,可能说明商业安排复杂、财务处理混乱、存在避税动机、民商事关系嵌套,甚至可能说明存在行政违法;但它并不自动等于刑事犯罪,更不自动等于某一个具体罪名已经成立。资金回流不当然等于虚开,多层转移不当然等于洗钱,对公对私混用不当然等于非法经营。
误区二:把“图谱清晰”误当成“事实清楚”
很多报告最有视觉冲击力的地方,就是图谱。账户之间一连线,资金路径一展开,节点一标色,看起来非常“实锤”。但图谱最大的迷惑性恰恰在于:它会让人误以为“结构清楚”就等于“事实清楚”。其实图谱可以清晰呈现流向,却不当然清楚呈现原因;可以显示联系,却不当然证明主观故意。
误区三:把“系统结论”误当成“中立真相”
任何分析系统都有自己的规则、假设与偏好。它不是站在真空中输出答案,而是在预设框架下选择信息、组织信息、解释信息。如果这些预设不被揭示出来,那么所谓“系统结论”就很容易被误读成某种超越人为判断的中立真相。这对辩护最危险,因为一旦系统被神化,律师的质证空间就会被悄悄压缩。
七、律师在法庭上到底该怎么发问?
很多时候,律师不是不会质疑,而是不知道怎么把质疑落到法庭语言里。其实,对算法生成材料,发问的基本方向很清楚。
| 发问对象 | 核心问题 | 辩护目的 |
|---|---|---|
| 侦查人员 | 原始数据有哪些?基于何种手续调取?是否存在大规模碰撞、批量筛查或跨主体拼接?“异常”“高关联”等概念依据什么标准认定? | 审查底层数据合法性与侦查加工痕迹。 |
| 技术人员/分析人员 | 使用何种系统、何种版本、何种算法规则?模型参数与阈值如何设定?是否经过第三方验证?是否存在误报率、漏报率? | 揭示“技术结论”背后的规则依赖与不确定性。 |
| 公诉机关 | 该材料究竟作为侦查线索使用,还是作为定案证据使用?如果排除该分析报告,本案证据体系是否仍足以达到排除合理怀疑的程度? | 切断对算法材料的过度依赖,逼迫控方回到传统证明结构。 |
这些问题的意义,不只是为了“难住对方”,而是为了让法庭看到:算法材料并不是天然透明、天然客观、天然可靠,它同样有非常具体、非常现实、非常致命的审查难题。
八、在这个时代,律师最重要的能力之一,就是学会拆解“技术权威”
算法生成材料进入刑事诉讼,真正改变的不是某一份证据,而是整个办案氛围。过去律师面对的是人的供述、证人的证言、书证的瑕疵、鉴定意见的方法问题;现在,律师越来越多地还要面对数据权威、系统权威、模型权威、图谱权威和分析报告权威。
这种权威最可怕的地方在于,它不像传统证据那样容易被直观看见漏洞。它往往更复杂、更专业,也更容易让法庭在心理上先产生信赖。因此,未来刑事辩护中非常重要的一项能力,就是拆解技术权威。
不是粗暴否定,而是精准拆解;不是情绪化反感,而是程序化审查;不是说“我不信”,而是一步步说明“你为什么不能直接信”。
这其实仍然是刑事辩护的老本行,只不过对象变了。过去拆的是口供,现在拆的是算法;过去拆的是证言,现在拆的是模型;过去拆的是鉴定,现在拆的是系统分析报告。方法论没有变:仍然是回到事实、回到证据、回到程序、回到证明标准。
最后想说:面对算法材料,律师不能退,反而更要向前一步
越是新型、复杂、封闭、难以理解的技术材料,越应当接受更严格的法律审查。尤其是在抽样检验逐渐被承认、分析型报告越来越制度化、经侦领域“金析为证”不断推广的背景下,律师更要防止用分析代替证明、用模式代替事实、用系统结论代替法庭审查。
律师不是反对技术,而是反对技术未经法律驯化就直接变成刑罚权的工具。在刑事诉讼中,再先进的算法也不能替代一条最古老的法治原则:任何人都只能因被依法证明的行为而受审,而不能因被系统推断出的“异常”“风险”或“模式”而被定罪。
这条线,必须有人守;而律师,恰恰就是最应该守住这条线的人。
免责声明:本文系一般法律评论与普法交流,不构成针对任何具体案件的正式法律意见。不同案件应结合具体案卷、证据结构、行业背景、程序进展与适用规范作个案化分析。