两高律师事务所合同纠纷部官方网站!
  • 咨询热线:13681120374
  • 两高律师事务所合同纠纷部
    请在后台添加网站优化关键词!
     
    ——   产品展示   ——
    PRODUCTS  CENTER

    24小时咨询热线
    13681120374
     

    大数据时代下的律师行业




    随着互联网的迅速建设与完善,越来越多的信息被收集到了云端,使人们足不出户便可以搜集到各种各样的海量信息。2008年8月,维克托·迈尔-舍恩伯格在《大数据时代》中首次提出了“大数据”这一概念。随后,在谷歌、IBM、腾讯、阿里巴巴等各大互联网企业的带动下,各行各业的产业均开始了对大数据的分析,从而挖掘到了海量数据所带来的价值,进而推动了产业升级、服务升级。


    2013年8月,也就是“大数据”这一概念提出五年之后,最高人民法院院长周强在最高院全国第四次司法统计工作会议中,第一次提出“大数据、大格局、大服务”的理念,从此才拉开了我国司法大数据的序幕。2014年,最高院上线“中国裁判文书网”,截至目前已收集全国各级法院生效裁判文书4696余万篇,访问量超过164亿次,每日新增近万篇裁判文书,已经成为全球最大的裁判文书网。2017年8月,为了进一步公正司法、统一裁判尺度,最高院又在《最高人民法院司法责任制实施意见(试行)》中,首次规定了法官办理案件时的案例检索制度。在整个司法体系中,法院已经迈出了“大数据”建设的一大步,然而中国律师却还在“大数据0.1”时代的起步阶段徘徊。“大数据”作为新时代产业服务升级的催化剂,必将是未来律师行业发展中必不可缺的一个组成部分。因此,针对“大数据”与律师业务结合的研究是律师行业发展中必不可少的一个环节。


    一、中国律师行业的“大数据0.1”


    (一)大数据的概念。


    对于“大数据”这一概念,研究机构Gartner给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。


    麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。


    国际数据公司(IDC)则更进一步的从大数据的 4 个特征来对“大数据”进行了重新定义:即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)。


    虽然各个机构及专家对“大数据”的定义均有所不同,但无论任何研究机构或专家学者对“大数据”的定义,都体现了数据量“大”的特征。然而,笔者认为在律师行业中,“大数据”的战略意义并不在于掌握庞大的数据量,而是在于对这些海量的数据进行专业化的分析处理。换言之,就是通过迅速对数据进行的搜集、统计、分析,从而挖掘出数据的价值,从而实现法律服务的“增值”,最终实现法律服务的服务升级、消费升级促进律师行业的发展。由于律师业务及大数据本身所包含的范围过大,本文将重点以法院上网公布的裁判文书数据为例,对大数据时代下的法律服务大数据研发和律师业务结合进行剖析。


    (二)中国律师行业的大数据发展现状


    律师的业务主要是提供专业的法律服务,其本质也属于服务业的一种。为了提升法律服务水平,实现法律服务的消费升级,很多律师及相关机构都开始了对律师行业的“大数据”研究分析。但不同于谷歌、阿里巴巴等互联网巨头对数据的研发,法律行业的大数据由于缺少相对固定的表述方式,因此很难将现有其他行业的大数据研发模式照搬使用。笔者通过对比网上发布的各类法律服务类大数据报告,发现现有的研究发展方向主要分为两种:一种为速度优先型,即通过云计算的方式迅速的将大量数据进行关键词(或关键内容)进行提取分类并统计;另一种则为价值优先型,即通过牺牲速度的方式来对数据进行较为精细的分析,来获取更高的价值。


    1.速度优先型


    速度优先型的大数据分析主要以无讼、icourt等技术型公司(特指与律师行业联系密切的公司)或团队为代表。这些大的公司依托庞大的技术团队(以程序员为主),编写出一整套包含数据采集、数据检索、数据分析的计算机算法,然后通过云端开放给使用者,再由使用者勾选相应类别来最终形成数据报告。通过以上流程不难看出,速度优先型的基础是云计算,得益于计算机的数据处理能力,除去编写计算机算法外,生成一份大数据报告的时间仅需5-10分钟。但是,由于语言的不确定性,对于同一事实的表述方式是多种多样的。反映在裁判文书中,法官对于同一犯罪事实或情节的描述也是不尽相同的,因此对于计算机算法的概括能力或关键词拾取能力非常具有挑战性。很遗憾的是,现有的计算机算法仅仅是对裁判文书的框架做了分类,并没有能力做到有较为全面的提炼及高度概括,因此最终的数据报告呈现出来的基本都是大段的“经审理查明”和“本院认为”等文书原文。


    此外,需要说明的是笔者在搜集法律行业大数据报告的时候,发现大量的,特别是律师个人或小团队发布的大数据报告,不论是数据内容还是报告内容,均与无讼或icourt等平台生成的报告类似,只是在表现形式上略有区别。因此,本文中此类大数据报告均归类为速度优先型。


    综上,速度优先型的现状用四个关键词来概括就是:速度够快、价值不足、宏观尚可、微观粗浅。


    2.价值优先型


    价值优先型的大数据报告目前来看是较为稀缺的,主要以一些大型律师事务所或团队不定期发布的大数据报告为代表。价值优先型的大数据报告内容不像速度优先型的一样千篇一律,由于每个团队的研究方向、研究方法及对报告的表现形式理解不一,其内容可谓是千变万化。然而,由于需要深度挖掘数据内容,且又缺少专业技术团队(以程序员为主)的技术支持,一份价值优先型的大数据报告制作周期就长达一周、一个月,甚至更长。漫长的周期带来的是高额的劳动成本,再加之律师行业固有的管理松散、自由散漫,因此造成了价值优先型的研究发展步履维艰。此外,笔者通过对搜集到的大数据报告整理分析,发现即使研究方向是价值优先,但对数据挖掘的深度仍然不够,导致了大数据在应用层面的不足。


    综上,价值优先型的现状也用四个关键词来概括就是:价值仍低、速度太慢、宏观尚可、微观一般。总的来说还不如速度优先型的大数据研究发展的快和好。


    通过上述分析可知不论是速度优先型,还是价值优先型,在现阶段的研发中都存在着致命的缺陷。由此不难得出一个难以启齿的结论,若将谷歌、阿里巴巴等企业对大数据的研发与应用定义为“1.0时代”,那么中国律师行业现有的大数据则仍在“0.1时代”的起步阶段徘徊。


    二、律师行业的大数据研发


    中国律师行业现有的大数据虽然仍在“0.1时代”的起步阶段徘徊,虽然速度优先型与价值优先型在现阶段的研发中都存在着致命的缺陷,但在不远的将来,一但将速度与价值合二为一,那么中国律师行业的大数据也将正式的跨入“1.0时代”。由此,越来越多的社会资本和律师已经关注到了大数据的意义,只是“跨行业、跨专业”的心理障碍阻挡了这些脚步的踏入。因此,笔者将在后文中分享并简要论证笔者现有的研究成果与应用实践。


    (一)大数据的研发方式


    从谷歌、阿里巴巴等互联网科技巨头或其他行业对大数据的研发来看,其数据内容本身大多具有结构简单、内容单一、容错率高的特点,因此对于数据的统计分析难度相对较低。然而不同于其他行业的大数据研发,法律行业的大数据,特别是裁判文书类数据,多为语言类的表述。同样一句话会有不同的意思表示,同样一个意思表示也可以用不同的话来描述。因此,语言的不确定性,就使得法律行业的大数据需要高度概括这一中间程序,从而使得法律行业的大数据无法通过照搬的方式来研发。这也是目前价值与速度不能并存的重要因素,关于这一点笔者期待日后AI(人工智能)时代的来临可以解决这一主要矛盾。


    此外,从网上已发布的各类大数据报告的方式来看,无论速度优先型还是价值优先型的大数据报告,绝大部分都是简单的将各类数据的总占比或同比、环比进行了统计分析。笔者认为,该类数据的统计分析仅仅停留在最基本的数据表层,由此得到的数据报告,更多的也仅仅可以看到研究对象的一个基本状况,无法深入的分析出研究对象之所以呈现出的这些基本状况的内在逻辑。因此,也就直接导致了无论大数据研究的出发方向是速度还是价值,最终得到的数据报告中仍然缺乏价值的体现。


    为了可以最大深度的挖掘数据的价值,就必须找到数据与数据之间的内在联系。由此笔者联想到了大学时期参与“数学建模”比赛时的经验。简单来说,就是当需要从定量的角度分析和研究一个法律问题时,就要在深入调查研究、了解对象信息、作出简化假设、分析内在规律等工作的基础上,用数学的符号和语言作表述来建立所研究的法律问题的数学模型。概括为具体步骤即为数据搜集、数据统计、数据报告。


    (二)大数据的数据搜集


    研究大数据必然需要达到一定数量级的数据,所有的研发成果都是基于数据而来的,因此数据的来源就成为了大数据研发的第一步。不同内容的大数据分析所需要的数据来源也不尽相同,例如分析刑事案件中不起诉、不立案的数据,其来源便是各级公安机关、检查院的年度报告等;分析律师执业风险的数据,其来源便是各级律协、司法局等公布的信息等。因此,数据搜集的重要前提便是根据大数据的研究对象确定数据来源。


    以危险驾驶罪为例,搜集数据的对象则为法院上网公布的裁判文书,因此其主要来源包括但不限于中国裁判文书网、威科先行网、无讼案例网、OpenLaw网、Alpha案例库等。


    (三)大数据的数据统计


    以危险驾驶罪为例,选定相应的数据来源之后便要分解数据,从而确定数据统计的内容。而确定内容则首先要解析危险驾驶罪的构成要件及影响定罪量刑的相关法律规定,也就是数学建模中的“深入调查研究、了解对象信息”。在深入解析危险驾驶罪的构成要件及影响定罪量刑的相关法律规定后,首先要涉及统计类别与关键词(包括高度概括后的关键词),如危险驾驶的方式(酒驾、超速等),酒驾酒精含量、刑期、罚金、是否缓刑等,也就是数学建模中的“作出简化假设”。


    此外,值得一提的是若要统计危险驾驶罪等单一的法律判决或裁定的裁判情况,因当注意数据统计的范围。根据《最高人民法院司法责任制实施意见(试行)》:第三十九条 承办法官在审理案件时,均应依托办案平台、档案系统、中国裁判文书网、法信、智审等,对本院已审结或正在审理的类案和关联案件进行全面检索,制作类案与关联案件检索报告。检索类案与关联案件有困难的,可交由审判管理办公室协同有关审判业务庭室、研究室及信息中心共同研究提出建议。因此,数据统计的范围应当限定为本院及上级法院的裁判文书数据。


    (四)大数据的数据分析


    通过对数据的搜集与统计,下一步便是数据分析。数学建模中常用的分析方法包括图论算法、蒙特卡罗算法、网格算法、数值分析算法等十余种。笔者常用的为数据拟合法,即在建立数学模型时,通过数据拟合求得“最佳”的近似函数式——经验公式,从几何上看就是找一条“最佳”的曲线,使之和给定的数据点靠得最近,即进行曲线拟合。


    以危险驾驶罪为例,及选取对酒精含量与刑期、酒精含量与罚金、罚金与刑期等相对单一的两组数据,通过相应的工具软件,以从小到大等方式排序后进行曲线拟合。最终得出两者直接的对应关系,挖掘数据之间的内在逻辑。


    综上所述,在经过对大数据的数据搜集、数据统计、数据分析之后,将最终的分析结果以大数据报告等呈现方式展示出来,便完成了一次对具体法律问题的大数据研究。


    三、律师行业的大数据应用与实践


    大数据的研发最终是为了促进行业发展、提升服务水平、刺激服务消费。因此,大数据的合理应用则是大数据在律师行业中实现其价值的最终途径。笔者仍以危险驾驶罪为例,通过近两年来对大数据的应用与实践来进行论证。


    (一)预判案件结果


    律师在接待当事人的时候,最经常被问到的便是“我这个事情把握有多大”之类的问题。当遇到此类问题的时候,由于《律师法》及律师职业道德的约束,除了少量律师会违反规定给出承诺之外,大多数律师并不会正面给予答复。有些律师会以自己曾经办理的同类案件进行“擦边球”式的解说;有些律师则会以自己所了解到的同类案件的裁判结果做一个“大概、大约”的判断;还有些经验少、年纪轻的青年律师则直接简单粗暴的搬出《律师法》和当事人“讲法律”。


    然而,在经过大数据研究后,我们则可以直截了当的拿出《大数据报告》展示在当事人面前,让当事人自己在《大数据报告》中找到答案。以危险驾驶罪为例,若当事人询问是否可以被判处缓刑,那么律师只需要在询问当事人管辖地后拿出相应地区的《危险驾驶罪大数据报告》,不论报告中绝大多数被告人最终被判处缓刑还是实刑,当事人都会找到自己想要的答案。


    (二)提高服务收费


    大数据研发的根本目标之一便是提升服务品质、提高服务收费。而服务收费的提升基于服务品质的提升,服务品质的提升则基于服务价值的提升。


    以代书危险驾驶罪的《取保候审申请书》为例。笔者所在的是一座五线城市,一般而言代书一份《取保候审申请书》的服务费用为100-200元。在了解到被告人管辖地等信息后,若经与已统计的大数据对比后,发现酒精含量、车辆种类等影响定罪量刑的关键因素近似的判决绝大数多都被取保候审,那么在代书《取保候审申请书》之后,附上一份《大数据报告》,则可以大大提高取保的成功率。毕竟习总书记也曾经说过:“努力让人民群众在每一个司法案件中都感受到公平正义”,而保证公平正义的一点就是司法尺度的统一。最终,代书的服务费用将收取在1000元以上。与此同时,不仅仅是价格翻了5-10倍,当事人在拿到代书之后,会认为这不是一份任何律师都可以代书法律文书,并且以拿到了这次高质量的法律文书而对律师高度认同。而这一切的源头便是因为这份《大数据报告》为当事人带来了最直接的价值,从而也直接的提高了律师服务的收费。


    (三)其他应用与实践


    1.吸取办案经验、制定服务方案。在办理案件的过程中,经常会遇到难以切入的时候。此时无论是进行一次类案的大数据研究还是直接找到一份相应地区类案的大数据报告,都可以迅速的找到案件切入点,制定服务方案,从而更全面高质量的办理案件。


    2.增加谈判筹码。律师在执业过程中,经常会与公检法等办案机关及对方当事人进行谈判。一份专业的大数据报告,不仅可以提前为委托人进行预判,还可以给谈判对方造成预期结果的压力,由此来增加谈判筹码,促成谈判结果。


    3.拓展案源。通过对某一法律问题的大数据研究,经常会发现该类法律问题的空白点。例如在笔者在进行全市范围内的危险驾驶罪数据分析的过程中,发现c区缴纳罚金之后的缓刑几率接近99%;而z区的缓刑几率则几乎为0;g区和y区凡是因交警例行查酒驾被追究的缓刑几率接近90%,而因交通事故被追究的缓刑几率则不足10%。由此,便可针对性的对案件进行取舍,并有针对性的进行案源的拓展。


    结语


    在大数据时代的大背景下,律师行业的发展与创新也必然离不开对“大数据”的研发。然而中国律师行业的大数据研发却仍处于“0.1时代”的起步阶段,这是律师行业缺失的一环,但同时也是在律师行业中实现弯道超车的机遇。律师的收入所依靠的是提供专业的法律服务,而法律服务的专业与否在于律师给当事人所带来的服务价值,服务价值的提升则在于服务内容的品质,而律师行业的“大数据”则是未来优化服务内容、提升服务价值、提供专业服务必不可缺的部分,大数据的发展必将推动整个律师行业的发展。



  • 上一页:谈夫妻约定财产制下的离婚补偿
  • 下一页:带你了解律师行业
  •  
    24小时咨询热线:
    首页 关于我们 新闻中心 合同律师 劳动律师 公司律师 在线留言 联系我们 网站地图 xml地图
     
     
    深圳电话:+86 755 33890082   传真:+86 755 33890083   地址:深圳市宝安区沙井街道北环路岗头工业区左2栋   
    ©2018 两高律师事务所合同纠纷部 版权所有