<noscript id="q96esg"><strong id="q96esg"></strong><dt id="q96esg"></dt><noscript id="q96esg"></noscript><u id="q96esg"></u></noscript>
    • 智能輔助審判方法、裝置、計算機設備及存儲介質與流程

      文檔序號:19676467發布日期:2020-01-10 23:24
      智能輔助審判方法、裝置、計算機設備及存儲介質與流程

      本發明涉及人工智能技術領域,尤其涉及一種智能輔助審判方法、裝置、計算機設備及存儲介質。



      背景技術:

      隨著社會經濟的發展與法治日趨完善,人民群衆的司法需求日益增長,法院立案的案件越來越多。法官審理案件的案件量逐漸增加,存在工作量超負荷的問題,而且作爲判案依據的法律法規不斷更新,也使得法官判案的難度增大,工作量過大或者審判難度增大均容易導致法官判案出錯率提升。隨著法官審理案件的案件量逐漸增加,書記員參與庭審的案件量也逐漸增加,書記員手動錄入庭審信息的過程中,錄入效率低,使得書記員的工作負荷大。

      有鑒于此,發明人經過深入研究,提出一種可有助于減輕司法工作人員(包括書記員和法官)在案件審判過程中的工作量的智能輔助審判系統和應用在該智能輔助審判系統上的智能輔助判案方法。



      技術實現要素:

      本發明實施例提供一種智能輔助審判方法、裝置、計算機設備及存儲介質,以解決當前司法工作人員判案過程中工作量較大的問題。

      一種智能輔助審判方法,包括:

      從數據庫中獲取待判案件對應的庭審筆錄文件,從所述庭審筆錄文件中提取案件描述信息;

      采用分詞工具對所述案件描述信息進行分詞,獲取目標分詞結果,所述目標分詞結果包括多個目標分詞;

      基于每一所述目標分詞查詢所述關鍵詞庫,將所述關鍵詞庫中存儲的與所述目標分詞相匹配的原始關鍵詞確定爲目標關鍵詞;

      根據所述目標關鍵詞查詢所述案件類型信息庫,獲取與所述目標關鍵詞相匹配的至少一個目標案件類型;

      從先驗知識庫中獲取與至少一個所述目標案件類型相匹配的先驗知識,根據所述先驗知識,獲取目標推送法條;

      采用語義分析模型對所述案件描述信息進行語義分析,獲取標准化信息,基于所述標准化信息查詢審判觀點庫,獲取對應的推薦審判觀點;

      根據所述目標推送法條和所述推薦審判觀點,獲取並顯示審判建議文件。

      一種智能輔助審判裝置,包括:

      案件描述信息獲取模塊,用于從數據庫中獲取待判案件對應的庭審筆錄文件,從所述庭審筆錄文件中提取案件描述信息;

      目標分詞結果獲取模塊,用于采用分詞工具對所述案件描述信息進行分詞,獲取目標分詞結果,所述目標分詞結果包括多個目標分詞;

      目標關鍵詞確定模塊,用于基于每一所述目標分詞查詢所述關鍵詞庫,將所述關鍵詞庫中存儲的與所述目標分詞相匹配的原始關鍵詞確定爲目標關鍵詞;

      目標案件類型確定模塊,用于根據所述目標關鍵詞查詢所述案件類型信息庫,獲取與所述目標關鍵詞相匹配的至少一個目標案件類型;

      目標推送法條獲取模塊,用于從先驗知識庫中獲取與至少一個所述目標案件類型相匹配的先驗知識,采用智能法條推送模型對所述先驗知識進行處理,獲取目標推送法條;

      推薦審判觀點獲取模塊,用于采用語義分析模型對所述案件描述信息進行語義分析,獲取標准化信息,基于所述標准化信息查詢審判觀點庫,獲取對應的推薦審判觀點;

      審判建議文件獲取模塊,用于根據所述目標推送法條和所述推薦審判觀點,獲取並顯示審判建議文件。

      一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中並可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現上述智能輔助審判方法的步驟。

      一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現上述智能輔助審判方法的步驟。

      上述智能輔助審判方法、裝置、計算機設備及存儲介質,在從庭審筆錄文件中快速提取出案件描述信息之後,通過對案件描述信息進行分詞和關鍵詞匹配處理,可快速獲取其對應的目標關鍵詞,利用該目標關鍵詞確定相對應的至少一個目標案件類型,從而可實現從先驗知識庫中篩選與至少一個目標案件類型相匹配的先驗知識,有助于減少後續處理過程的數據量,可根據先驗知識快速獲取其對應的目標推送法條,加快判案建議文件的獲取效率。先采用語義分析模型對案件描述信息進行語義分析,以提取影響案件審判的標准化信息,有助于減少後續數據處理的工作量,提高推薦審判觀點的獲取效率;通過標准化信息查詢審判觀點庫,獲取推薦審判觀點,從而根據目標推送法條和推薦審判觀點,可快速獲取對應的判案建議文件,以有助于減輕法官審判過程中查詢相關資料的工作量,從而加快審判效率。

      附圖說明

      爲了更清楚地說明本發明實施例的技術方案,下面將對本發明實施例的描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。

      圖1是本發明一實施例中智能輔助審判方法的一應用環境示意圖;

      圖2是本發明一實施例中智能輔助審判方法的一流程圖;

      圖3是本發明一實施例中智能輔助審判方法的另一流程圖;

      圖4是本發明一實施例中智能輔助審判方法的另一流程圖;

      圖5是本發明一實施例中智能輔助審判裝置的一原理框圖;

      圖6是本發明一實施例中計算機設備的一示意圖。

      具體實施方式

      下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的範圍。

      本發明實施例提供的智能輔助審判方法,該智能輔助審判方法可應用如圖1所示的應用環境中。具體地,該智能輔助審判方法應用在智能輔助審判系統中,該智能輔助審判系統包括如圖1所示的客戶端、麥克風和服務器,客戶端和麥克風均與服務器通過網絡進行通信,其中,客戶端又稱爲用戶端,是指與服務器相對應,爲客戶提供本地服務的程序。客戶端可安裝在但不限于各種個人計算機、筆記本電腦、智能手機、平板電腦和便攜式可穿戴設備上。該客戶端是用于實現與庭審當事人進行人機交互的終端,該麥克風用于采集庭審當事人的語音數據的設備。本實施例中,法官所在的審判席、原告所在的原告席、被告所在的被告席和第三人所在的坐席上均設有客戶端和麥克風,而書記員所在的坐席上設有客戶端,證人所在的證人席上設有麥克風。服務器可以用獨立的服務器或者是多個服務器組成的服務器集群來實現。

      在一實施例中,該智能輔助審判系統中的客戶端與服務器通過網絡進行通信,用于實現對庭審筆錄文件進行處理,以獲取判案建議結果,以使法官根據判案建議結果進行判案建議結果進行相應的判案處理,從而減輕法官的工作負荷,提高其工作效率。如圖2所示,提供一種智能輔助審判方法,以該方法應用在圖1中的服務器爲例進行說明,包括如下步驟:

      s201:從數據庫中獲取待判案件對應的庭審筆錄文件,從庭審筆錄文件中提取案件描述信息。

      其中,待判案件是指需要進行審判處理的案件。庭審筆錄文件是庭審中一切到庭的庭審當事人所進行的訴訟活動的全程記錄的文件。本實施例中的庭審筆錄文件是上述實施例中形成並存儲在數據庫中的庭審筆錄文件。案件描述信息是指從庭審筆錄文件中提取出來的與待判案件相關的會影響審判結果的描述信息。該庭審筆錄文件是在庭審過程中基于標准法庭審理筆錄模板采集庭審當事人對待判案件的事實和證據等信息的文件。標准法庭審理筆錄模板是預先設置的與庭審過程中各個流程相對應的用于記錄案件信息的筆錄模板。

      由于庭審筆錄文件是各級法院依據標准法庭審理筆錄模板采集到的與待判案件相對應的筆錄文件,因此,該庭審筆錄文件具有標准的格式,可有助于快速提取案件描述信息。例如,庭審筆錄文件中記錄有如下內容:雙方無爭議的事實有……,雙方爭議的焦點有……;在從庭審筆錄文件中獲取案件描述信息過程中,可采用文字匹配算法匹配到“原被告雙方無爭議的事實有”和“雙方爭議的焦點有”這些字段,將這些字段之後的內容分別確定爲法院認定的事實和雙方爭議的焦點,這些內容即爲影響審判結果的描述信息,將其作爲案件描述信息。

      可以理解地,在從庭審筆錄文件中提取出案件描述信息之後,還可將這些案件描述信息填充到判決文書模板的相應位置,在依據本實施例最終確定的判案建議結果獲取最終依據的判案依據(即具體適用法條)和判案觀點後,將該判案依據和判案觀點一並填充到判決文書模板的相應位置,以快速獲取對應的目標判決文件。該目標判決文件是最終形成的待判案件對應的判決文件,如民事判決書和刑事判決書等。

      s202:采用分詞工具對案件描述信息進行分詞,獲取目標分詞結果,目標分詞結果包括多個目標分詞。

      其中,分詞工具是用于實現對文本進行中文分詞的工具。中文分詞(chinesewordsegmentation)指的是將一個漢字序列切分成多個單獨的詞。分詞是指將連續的字序列按照一定的規範重新組合成詞序列的過程。目標分詞結果是指案件描述信息最終形成的多個分詞的結果。目標分詞是指根據案件描述信息最終形成的分詞。

      本實施例中,分詞工具可以爲市面常用的用于實現對中文文本進行分詞的開源工具-結巴分詞。采用結巴中文分詞對案件描述信息進行分詞,其分詞過程可支持三種分詞模式包括:(1)精確模式:試圖將句子最精確地切開,適合文本分析,但效率較低。(2)全模式:把句子中所有的可以成詞的詞語都掃描出來,分詞速度快,但是不能解決歧義問題。(3)搜索引擎模式:在精確模式的基礎上,對長詞再次切分,將長分詞切分後的短分詞放在長分詞之前,效率較快,但這種分詞模式可能出現前面至少兩個短分詞與後續一個長分詞之間存在語義重複,導致分詞准確性不高。爲保證分詞效率,可通過對搜索引擎模式的分詞結果進行優化,以獲取分詞准確率較高的目標分詞結果。因此,步驟s202具體包括如下步驟:

      s2011:采用結巴分詞工具的搜索引擎模式對案件描述信息進行文本分詞,獲取文本分詞結果,文本分詞結果包括n個一級分詞。

      具體地,服務器采用結巴分詞工具的搜索引擎模式對案件描述信息進行文本分詞,以快速獲取文本分詞結果,該文本分詞結果可以理解爲采用常規的搜索引擎模式進行分詞後的結果,是優化之前的分詞結果。一級分詞是構成文本分詞結果的分詞,n爲文本分詞結果中一級分詞的數量。

      例如,若案件描述信息爲:被告無行爲能力;則采用結合分詞工具的搜索引擎模式對該案件描述信息進行文本分詞後,獲取的文本分詞結果包括如下5個一級分詞:1.被告,2.無,3.行爲,4.能力,5.行爲能力。由上述文本分詞結果可知,連續3個一級分詞(從第3個一級分詞到第5個一級分詞)中的第3個一級分詞“行爲”和第4個一級分詞“能力”進行結合後與第5個一級分詞“行爲能力”意義重複,分詞結果不准確若直接基于這一文本分詞結果進行後續的語義分析,可能會影響後續分析的效率和准確率。

      s2012:若任意連續k個一級分詞中連續k-1個一級分詞的疊加等于第k個一級分詞,且連續k-1個一級分詞中存在至少兩個一級分詞的結合等于第k個一級分詞,則僅保留結合等于第k個一級分詞的至少兩個一級分詞作爲目標分詞,獲取目標分詞結果。

      “疊加”是指相鄰的兩個一級分詞中,前一個一級分詞的尾部的至少一個漢字,和後一個一級分詞前端的至少一個漢字重合,也即兩個相鄰的兩個一級分詞可以依據重合的漢字進行拼接,僅保留一個重疊的字或詞形成拼接詞的過程,舉例如下:連續三個一級分詞分別爲:“管理”、“理工”和“工作”中,“管理”和“理工”兩個一級分詞中重疊的漢字爲“理”,“理工”和“工作”重疊的漢字爲“工”。將前述三個一級分詞“管理”、“理工”和“工作”進行疊加後可形成新的拼接詞:“管理工作”。

      “結合”是指將兩個一級分詞直接進行合並,無需去除重複漢字的分詞合並形式。比如,兩個一級分詞分別爲“管理”和“工作”,將前述兩個一級分詞進行合並後可得“管理工作”這一合成詞。

      例如,若案件描述信息爲:被告在開展管理工作過程中,掌握商業秘密;則采用結巴分詞工具的搜索引擎模式對該案件描述信息進行文本分詞後,獲取的文本分詞結果爲:1.被告,2.在,3.管理,4.理工,5.工作,6.管理工作,7.過程,8.中,9.掌握,10.商業,11.秘密,12.商業秘密。其中,“管理”、“理工”和“工作”的疊加等于“管理工作”,而且,“管理”和“工作”的結合等于“管理工作”,因此,僅保留“管理”和“工作”這兩個一級分詞作爲優化後的目標分詞,刪除“理工”和“管理工作”這兩個一級分詞。

      s2013:若任意連續k個一級分詞中連續k-1個一級分詞的疊加等于第k個一級分詞,且任意連續k個一級分詞中不存在至少兩個一級分詞的結合等于第k個一級分詞,則刪除前k-1個一級分詞,保留第k個一級分詞作爲目標分詞,獲取目標分詞結果。

      例如,若案件描述信息爲:本條款僅針對有同業經驗的候選人;則采用結巴分詞工具的搜索引擎模式對該案件描述信息進行文本分詞後,獲取的文本分詞結果爲:1.本,2.條款,3.僅,4,針對,5.有,6,同業,7.經驗,8.同業經驗,9,的,10,候選,11,選人,11,候選人。其中,“候選”與“選人”的疊加等于“候選人”,且不存在結合等于“候選人”的情況,此時,刪除“候選”與“選人”,僅保留“候選人”這個一級分詞。

      s2014:若任意連續k個一級分詞中連續k-1個一級分詞的結合等于第k個一級分詞,則刪除第k個一級分詞,保留前k-1個一級分詞作爲目標分詞,獲取目標分詞結果。

      例如,若案件描述信息爲:被告在開展管理工作過程中,掌握商業秘密;則采用結巴分詞工具的搜索引擎模式對該案件描述信息進行文本分詞後,獲取的文本分詞結果爲:1.被告,2.在,3.管理,4.理工,5.工作,6.管理工作,7.過程,8.中,9.掌握,10.商業,11.秘密,12.商業秘密。其中,“商業”和“秘密”的結合等于“商業秘密”,而不存在疊加的情況,因此,僅保留“商業”和“秘密”這兩個一級分詞作爲優化後的目標分詞,刪除“商業秘密”這一個一級分詞。

      本實施例中,采用分詞工具的搜索引擎分詞模式將案件描述信息進行分詞後,對存在語義重複的連續k個一級分詞進行分析,判定是否存在由連續一級分詞的結合或疊加可構成連續的一級分詞後緊跟的長詞,並依據連續的一級分詞不同的結合或疊加情況對一級分詞或最後的長詞進行處理,可獲得更爲精准的分詞結果,減少重複詞或無用詞,以實現在保證分詞效率的前提下,對分詞結果進行優化,提高分詞准確性。

      s203:基于每一目標分詞查詢關鍵詞庫,將關鍵詞庫中存儲的與目標分詞相匹配的原始關鍵詞確定爲目標關鍵詞。

      其中,關鍵詞庫是預先設置的用于存儲原始關鍵詞的數據庫。該原始關鍵詞是預先設置的用于可能影響案件類型認定的關鍵詞。該關鍵詞庫中存儲原始關鍵詞與至少一個同義詞的對應關系。本實施例中,服務器采用字符串匹配算法或者其他匹配算法,查詢關鍵詞庫中是否存在該目標分詞(可以爲原始關鍵詞也可以是其對應的同義詞),若存在該目標分詞,則將該目標分詞對應的原始關鍵詞確定爲目標關鍵詞。例如,在原始關鍵詞庫中存在a1、a2和a3這一組同義詞組,a1爲原始關鍵詞,若目標分詞與a1、a2和a3中的任一個相同,則將a1確定爲該目標分詞對應的目標關鍵詞。

      在一實施例中,步驟s203具體包括如下步驟:

      s2031:根據目標分詞查詢同義詞庫,獲取與目標分詞相對應的目標同義詞。

      其中,同義詞庫是用于存儲預先設置的用于存儲同義詞關系的數據庫。目標同義詞是記錄在同義詞庫中的與目標分詞具有同義詞關系的同義詞。本實施例中,同義詞庫中預先存儲具有同義詞關系的同義詞組,服務器可采用字符串匹配算法匹配到該目標分詞,然後,獲取與該目標分詞具有同義詞關系的同義詞確定爲目標同義詞。

      s2032:根據目標分詞和目標同義詞查詢關鍵詞庫,判斷是否存在與目標分詞或者目標同義詞相匹配的原始關鍵詞,若存在原始關鍵詞,則將原始關鍵詞確定爲目標關鍵詞。

      例如刑法規定“爲了犯罪,准備工具、制造條件的,是犯罪預備。對于預備犯,可以比照既遂犯從輕、減輕處罰或者免除處罰”,則其中的准備工具、制造條件等關鍵詞是認定是否爲“犯罪預備”這一情形的關鍵詞,而法庭庭審過程中,庭審當事人在口頭論述時,可以采用其他同義詞表述這一意思。因此,服務器需根據目標分詞和目標同義詞查詢關鍵詞庫,判斷關鍵詞庫中是否存在與目標分詞或者目標同義詞相匹配的原始關鍵詞,若存在原始關鍵詞,則將其確定爲目標關鍵詞,以擴大目標分詞的搜索範圍,從案件描述信息中盡可能確定更多的目標關鍵詞,提高後續獲取的判案建議結果的准確性。

      s204:根據目標關鍵詞查詢案件類型信息庫,獲取與目標關鍵詞相匹配的至少一個目標案件類型。

      其中,案件類型信息庫是用于存儲不同案件類型及其對應的關鍵詞的信息庫。由于案件審判過程中,不同案件類型(如刑法中的不同類型的犯罪)可能對應同一關鍵詞,在案件類型信息庫中會將每一關鍵詞及其對應的案件類型以鍵值對的形式存儲,以使服務器在獲取目標關鍵詞之後,可根據該目標關鍵詞查詢案件類型信息表,以將所有包含該目標關鍵詞的案件類型確定爲目標案件類型。

      s205:從先驗知識庫中獲取與至少一個目標案件類型相匹配的先驗知識,根據先驗知識,獲取目標推送法條。

      其中,先驗知識庫是基于曆史判案數據提取出的先驗知識構建的數據庫,每一曆史判案數據具體一具體案件類型。本實施例中,服務器根據至少一個案件類型查詢先驗知識庫,從先驗知識庫中查詢與至少一個目標案件類型相匹配的先驗知識,從而進行先驗知識的篩選。該先驗知識包含與至少一個目標案件類型相對應的曆史判案數據中的案件描述信息及相應的案件判案結果。

      由于先驗知識庫存儲了所有的案例知識,內容太多,若每次判案均全部向量化先驗知識庫中的數據,可能存在執行效率較低的問題,因此,可通過目標關鍵詞確定的至少一個目標案件類型,再利用至少一個目標案件類型對先驗知識庫中先驗知識進行篩選後,以確定其對應的先驗知識,以執行後續的步驟s206和s207,避免對先驗知識庫中所有的先驗知識進行處理,提高執行效率。

      其中,根據先驗知識,獲取目標推送法條,具體是指從所有先驗知識中,提取其案件判案結果中采用的判案依據(即具體應用法條),對所有判案依據的應用次數進行統計並排序,最終形成依據應用次數由多到少的目標推送法條,以便法官了解相關曆史判案數據的判案依據,從而節省判案過程中查閱相關資料的時間,減輕工作量。

      s206:采用語義分析模型對案件描述信息進行語義分析,獲取標准化信息,基于標准化信息查詢與目標案件類型相對應的審判觀點庫,獲取對應的推薦審判觀點。

      其中,語義分析模型是基于nlp(naturallanguageprocessing,自然語義處理)技術構建的用于分析文本語義的模型。標准化信息是指從案件描述信息中提取出來的可能影響案件審判的信息。審判觀點庫是用于記錄曆史判案數據中提取出的曆史描述信息及其對應的曆史審判觀點的關聯關系的數據庫。

      具體地,服務器采用語義分析模型對案件描述信息進行語義分析,以提取其中的標准化信息。例如,在刑事案件審判過程中,被告的年齡是影響判斷其是否具備刑事責任能力的關鍵因素,而是否准備刑事責任能力是影響量刑的關鍵因素,因此,服務器在采用語義分析模型對案件描述信息進行語義分析時,會篩選出與被告年齡相匹配的信息作爲標准化信息。在從案件描述信息中提取出所有標准化信息之後,基于這些標准化信息查詢與目標案件類型相對應的審判觀點庫,采用文本相似度算法對比標准化信息與目標案件類型相對應的所有曆史描述信息的文本相似度,依據文本相似度的大小進行排序,將文本相似度較大的前n個(n的個數可自主設置)曆史描述信息對應的曆史審判觀點,作爲推薦審判觀點,以使法官在判案過程中,及時了解相似案件的曆史審判觀點,並結合待判案件的實際情況,及時作出判決,減輕法官查閱相關資料的工作量。可以理解地,根據標准化信息查詢與目標案件類型相對應的審判觀點庫,可以有效減少標准化信息與審判觀點庫中的曆史描述信息的數據對比量,有助于提高數據處理效率。

      s207:根據目標推送法條和推薦審判觀點,獲取並顯示審判建議文件。

      具體地,服務器將獲取到的至少一條目標推送法條和獲取到的至少一個推薦審判觀點,作爲待判案件對應的審判建議文件,該審判建議文件是系統通過對庭審筆錄文件中提取的案件描述信息進行分析,從與該案件描述信息相關的曆史判案數據中確定的目標推送法條和推薦審判觀點,爲法官審判提供參考,減輕法官查閱相關案件的過程,減少其工作量。

      本實施例所提供的智能輔助方法中,在從庭審筆錄文件中快速提取出案件描述信息之後,通過對案件描述信息進行分詞和關鍵詞匹配處理,可快速獲取其對應的目標關鍵詞,利用該目標關鍵詞確定相對應的至少一個目標案件類型,從而可實現從先驗知識庫中篩選與至少一個目標案件類型相匹配的先驗知識,可根據先驗知識快速獲取其對應的目標推送法條,加快判案建議文件的獲取效率。先采用語義分析模型對案件描述信息進行語義分析,以提取影響案件審判的標准化信息,有助于減少後續數據處理的工作量,提高推薦審判觀點的獲取效率;通過標准化信息查詢審判觀點庫,獲取推薦審判觀點,從而根據目標推送法條和推薦審判觀點,可快速獲取對應的判案建議文件,以有助于減輕法官審判過程中查詢相關資料的工作量,從而加快審判效率。

      在一實施例中,如圖3所示,在步驟s201之前,即在從數據庫中獲取待判案件對應的庭審筆錄文件之前,智能輔助審判方法還包括:

      s301:獲取數據更新任務,數據更新任務包括原始案件類型和任務更新時間。

      其中,數據更新任務是用于更新先驗知識庫和目標判案模型的任務。原始案件類型是指該數據更新任務所針對的案件類型。任務更新時間是指上一次執行數據更新任務的時間。

      s302:若與原始案件類型相對應的判案依據在任務更新時間以後發生變更,則確定變更時間,獲取變更時間和系統當前時間之間的與原始案件類型相對應的曆史判案數據,根據曆史判案數據確定待處理數據。

      其中,與目標案件類型相對應的判案依據具體是指與目標案件類型相對應的法律依據,包括法條、法規和司法解釋等內容。本實施例中,若與原始案件類型相對應的判案依據在任務更新時間以後發生變更,則說明在任務更新時間之後,該原始案件類型對應的判案依據發生變更,後續的案件審判過程中會適用新的法條、法規和司法解釋等判案依據,因此,需更新先驗知識庫及目標判案模型,此時,將判案依據的執行時間確定爲變更時間,獲取變更時間和系統當前時間之間的與原始案件類型相對應的曆史判案數據,根據曆史判案數據確定待處理數據,從而有助于提高後續訓練出的目標判案模型的時效性和准確性。該待處理數據具體爲用于更新先驗知識庫和審判觀點庫的訓練數據。

      s303:若與原始案件類型相對應的判案依據在任務更新時間以後沒有發生變更,則獲取系統當前時間之前預設周期內的與原始案件類型相對應的曆史判案數據,根據曆史判案數據確定待處理數據。

      其中,預設周期是預先設置的用于采集數據的周期,可以設置爲三個月、半年或者1年。本實施例中,若與原始案件類型相對應的判案依據在任務更新時間以後沒有發生變更,說明後續案件審判過程中仍適用舊的審判依據,但隨著時間的變化,這些審判依據的適用標准可能會發生變化,如賠付金額等情況,此時,將系統當前時間之前預設周期內的與原始案件類型相對應的曆史判案數據確定待處理數據,以保證待處理數據的時效性,從而有助于提高後續訓練出的目標判案模型的時效性。

      進一步地,待處理數據包括目標區域,該目標區域可以理解爲曆史判案數據對應的審判法院所在的行政區域,如廣東省或者深圳市等。此時,步驟s302和s303中的根據曆史判案數據確定待處理數據,具體包括如下步驟:

      (1)確定任一目標區域對應的曆史判案數據的目標數據量。

      (2)若目標數據量大于預設數量阈值,則將同一目標區域和原始案件類型對應的曆史判案數據,確定爲待處理數據。

      其中,預設數量阈值是預先設置的數量阈值。若任一目標區域對應的待處理數據的目標數據量大于預設數量阈值,則說明該目標區域內各級法院審判與原始案件類型相對應的案件的數量較多,因此,可將同一目標區域和原始案件類型對應的曆史判案數據確定爲待處理數據,以便後續基于該待處理數據構建與目標區域和原始案件類型相對應的先驗知識庫,並構建與目標區域和原始案件類型相對應的審判觀點庫,以使該先驗知識庫和審判觀點庫對該目標區域內的與目標案件類型相對應的待判案件的借鑒意義更大,更具有針對性。

      (3)若目標數據量不大于預設數量阈值,則將同一原始案件類型對應的曆史判案數據,確定爲待處理數據。

      若任一目標區域對應的待處理數據的目標數據量不大于預設數量阈值,則說明該目標區域內各級法院審判與原始案件類型相對應的案件的數量較少,將同一原始案件類型對應的曆史判案數據確定爲待處理數據,構建與原始案件類型相對應的先驗知識庫,並訓練與原始案件類型相對應的審判觀點庫,使得用于構建先驗知識庫和審判觀點庫的待處理數據不局限于同一目標區域,而僅依據原始案件類型進行劃分。

      s304:從待處理數據中提取先驗信息,基于先驗信息構建與目標案件類型相對應的先驗知識庫。

      該待處理數據爲與原始案件類型相對應的曆史判案數據。服務器從待處理數據中提取先驗信息,具體可以理解爲從待處理數據中提取其案件描述信息和案件判案結果,再從這些案件描述信息和案件判案結果中提取關鍵詞,具體采用鍵值對(key-value)的形式將這些關鍵詞進行限定;然後,利用所抽取的關鍵詞構建與原始案件類型相對應的先驗知識庫,具體是將所有待處理數據所提取的鍵值對存儲在數據庫中,構建與原始案件類型相對應的先驗知識庫。其中,key具體可以是案件描述信息中影響判案結果的關鍵詞,而value是案件判案結果中的判案結果。

      s305:從待處理數據提取曆史描述信息和曆史審判觀點,基于曆史描述信息和曆史審判觀點,構建與原始案件類型相對應的審判觀點庫。

      其中,曆史描述信息是從待處理數據中提取出來的可能影響案件審判的信息,具體是采用語義分析模型從待處理數據的案件描述信息中提取出來的。曆史審判觀點是從待處理數據中提取法官對該曆史案件的審判觀點。服務器在從待處理數據中提取出曆史描述信息和曆史審判觀點之後,將曆史描述信息和曆史審判觀點作爲一組訓練數據,輸入到常見的cnn(卷積神經網絡)或者rnn(循環神經網絡)進行模型訓練,以更新模型參數,從而獲取與原始案件類型相對應的審判觀點庫。

      本實施例所提供的智能輔助審判方法中,根據與原始案件類型相對應的判案依據在任務更新時間之後是否發生變更,以采集不同時間段的曆史判案數據,確定用于構建先驗知識庫和審判觀點庫的待處理數據,以保證待處理數據的時效性,從而實現對先驗知識庫和審判觀點庫的更新,從而保障後續基于先驗知識庫和審判觀點庫分別獲取目標推送法條和推薦審判觀點的時效性和准確性。

      在一實施例中,如圖4所示,在步驟s201之前,該智能輔助審判方法還包括如下步驟:

      s401:在客戶端上顯示與標准法庭審理筆錄模板中當前審判環節對應的審判提示文字,獲取麥克風采集的與審判提示文字相對應的原始語音數據。

      其中,標准法庭審理筆錄模板一般包括開庭前准備、宣布開庭、法庭調查和法庭辯論等階段,在法庭調查階段具體包括當事人陳述、歸納爭議焦點、圍繞焦點舉證質證、證人出庭作證、宣讀鑒定意見和勘驗筆錄、申請鑒定等環節,每一環節均設有相應的引導話術。該引導話術一般爲法官引導其他庭審當事人(如原告、被告或者證人)進行回複的引導問題對應的話術,如“首先由原告圍繞你的訴訟請求向法庭陳述”等。審判提示文字是指該標准法庭審理筆錄模板中與當前審判環節相對應的引導話術。其中,當前審判環節是指法庭審理案件過程中正在進行的環節,如當事人陳述或者其他環節。

      原始語音數據是實時采集到的庭審當事人針對審判提示文字進行回複時采集到的語音數據。一般來說,法官在庭審過程中,會基于審判提示信息對庭審當事人(如原告、被告或者證人)進行引導或者提問,此時,庭審當事人需要進行回複,此時,麥克風采集到的語音數據爲原始語音數據。本實施例中,該智能輔助審判系統包括與服務器相連的至少一個麥克風,每一麥克風對應的麥克風標識,該麥克風標識是用于唯一識別不同麥克風的標識。在麥克風實時采集原始語音數據時,其原始語音數據與相應的麥克風標識關聯。

      s402:對原始語音數據進行聲紋識別,獲取聲紋識別結果,根據聲紋識別結果確定原始語音數據對應的對象標識。

      其中,對原始語音數據進行聲紋識別,獲取聲紋識別結果,具體是指服務器采用預先設置的聲紋特征提取算法對原始語音數據進行聲紋特征提取,再根據提取出的聲紋特征進行聲紋識別,以確定原始語音數據對應的說話人的身份的過程。該對象標識是用于唯一識別庭審過程不同庭審當事人的標識。具體地,服務器采用聲紋特征提取算法對原始語音數據進行聲紋特征提取,獲取目標聲紋特征,判斷是否存在與目標聲紋特征相對應的標准聲紋特征,以獲取相應的聲紋識別結果。該聲紋識別結果包括存在標准聲紋特征和不存在標准聲紋特征這兩個結果。

      在一實施例中,步驟s402具體包括如下步驟:

      s4011:采用聲紋特征提取算法對原始語音數據進行聲紋特征提取,獲取目標聲紋特征,判斷是否存在與目標聲紋特征相對應的標准聲紋特征。

      其中,聲紋特征提取算法是用于對語音數據進行聲紋特征提取,以確定原始語音數據對應的聲紋特征的算法。該聲紋特征提取算法包括但不限于mfcc提取算法,所提取的目標聲紋特征爲mfcc特征。mfcc(mel-scalefrequencycepstralcoefficients,梅爾倒譜系數)是在mel標度頻率域提取出來的倒譜參數,mel標度描述了人耳頻率的非線性特性。目標聲紋特征是從原始語音數據中提取出的聲紋特征。

      標准聲紋特征是根據開庭前准備過程中采集到的庭審當事人的語音數據所提取出來的聲紋特征。該標准聲紋特征也是采用mfcc提取算法提取出來的mfcc特征。一般來說,在開庭前准備過程中,會將庭審當事人所采集的標准聲紋特征與其對應的身份標識關聯存儲在數據庫中,以使後續識別處理。

      本實施例中,服務器采用余弦相似度算法或者其他相似度算法對目標聲紋特征和服務器中預先存儲的每一標准聲紋特征進行相似度計算,獲取目標相似度;若目標相似度大于預設相似度阈值,則認定存在標准聲紋特征;若目標相似度不大于預設相似度阈值,則認定不存在標准聲紋特征。其中,預設相似度阈值是用于評估相似度是否達到認定爲同一說話人的標准的阈值。

      s4012:若存在標准聲紋特征,則根據標准聲紋特征對應的身份標識,確定原始語音數據對應的對象標識。

      具體地,若服務器中存儲有與目標聲紋特征相對應的標准聲紋特征,則根據與該標准聲紋特征相對應的身份標識,確定該原始語音數據對應的對象標識,從而快速確定該原始語音數據對應的對象標識。該身份標識是用于區分庭審當事人在庭審過程中的身份的標識,如原告、被告和證人等。該對象標識是用于唯一識別庭審過程不同庭審當事人的標識。該對象標識可以是在身份標識的基礎上增加序號標識,如在多個原告的情況下,可以采用原告01和原告02這種形式的對象標識進行區分。該序號標識可以根據開庭前准備過程中采集標准身份特征的先後順序確定,也可以根據其在法庭庭審過程中發言的先後順序確定,以使每一庭審當事人均有唯一識別其身份的對象標識。

      s4013:若不存在標准聲紋特征,則根據原始語音數據對應的麥克風標識,確定原始語音數據對應的對象標識。

      具體地,若服務器不存儲有與目標聲紋特征相對應的標准聲紋特征,則說明該說話人在開庭前准備過程中沒有預先采集到標准聲紋特征,此時,可根據原始語音數據所攜帶的麥克風標識查詢麥克風信息表,獲取麥克風標識對應的身份標識,基于身份標識生成相應的對象標識。其中,麥克風信息表是用于根據麥克風的擺放位置確定其說話人對應的身份標識的信息對照表,該麥克風信息表將麥克風標識與其對應的身份標識關聯存儲。以擺放在證人席上的麥克風爲例,其麥克風標識對應的身份標識爲證人,基于身份標識生成相應的對象標識,具體是指根據證人這一身份標識加上發言先後順序形成的序號標識,獲取其對應的對象標識,如證人01,證人02等。

      本實施例所提供的智能輔助審判方法中,根據原始語音數據提取出的目標聲紋特征,判斷是否存在相對應的標准聲紋特征的聲紋識別結果,以決定是根據標准聲紋特征還是麥克風標識確定相對應的對象標識,以保證確定的身份標識的唯一性。

      s403:對原始語音數據進行文本翻譯,獲取與對象標識相對應的原始文本數據,將對象標識和原始文本數據關聯存儲在標准法庭審理筆錄模板的相應位置。

      其中,對原始語音數據進行文本翻譯,是指將原始語音數據翻譯成文本形式的數據的過程。原始文本數據是指原始語音數據翻譯成的文本數據。在一實施例中,服務器可采用但不限于靜態解碼網絡對原始語音數據進行文本翻譯,由于靜態解碼網絡已經把搜索空間全部展開,因此其在進行文本翻譯時,解碼速度非常快,從而可快速獲取與對象標識相對應的原始文本數據。可以理解地,服務器接收麥克風采集到的原始語音數據,再采用靜態解碼網絡對原始語音數據進行文本翻譯,以快速獲取其對應的原始文本數據,而無需書記員進行手動輸入,從而加快原始文本數據的錄入效率。

      具體地,服務器在對原始語音數據進行文本翻譯,以獲取對應的原始文本數據之後,將該原始文本數據與其對應的對象標識關聯存儲在標准法庭審理筆錄模板的相應位置,即將原始文本數據填充在標准法庭審理筆錄模板的當前審判環節中與對象標識相對應的位置。例如,原始語音數據是針對“原告對你的起訴還有補充嗎”這一審判提示文字進行回複的語音數據,其對應的對象標識爲原告,則可以將這一原始語音數據所翻譯形成的原始文本數據填充在標准法庭審理筆錄模板中與審判提示文字相對應的位置,以提高原始文本數據的錄入效率,減輕書記員的工作負擔。

      s404:基于原始文本數據查詢在先文本數據庫,判斷是否存在與原始文本數據相對應的在先文本數據。

      其中,在先文本數據是指在麥克風采集到該原始語音數據之前已經形成並記錄在標准法庭審理筆錄模板相應位置的文本數據。由于法庭庭審是庭審當事人針對同一事件進行博弈的過程,在庭審過程中,庭審當事人針對同一事件會從不同角度進行論述,其論述內容可能有相關性,此時,在先文本數據可以理解爲在采集到該原始語音數據之前與原始語音數據所論述內容相對應的文本內容。以時間爲例,在刑事案件中,案發過程的時間節點是影響案件形成的證據鏈或者量刑輕重的關鍵因素,原告、被告和證人可能會基于這些時間節點發表不同的原始語音數據,依據其形成時間的先後順序,從而確定在先文本數據和原始文本數據。或者,在民事案件中,與待判案件相關的各個時間節點(如承諾的撤回時間、承諾的撤銷時間、合同成立時間和合同生成時間)是影響違約責任的認定的關鍵因素,原告、被告和證人可能會基于這些時間節點發表不同的原始語音數據,依據其形成時間的先後順序,從而確定在先文本數據和原始文本數據。

      在一實施例中,步驟s404具體包括如下步驟:

      s4041:采用關鍵詞提取算法對原始文本數據進行關鍵詞提取,獲取文本關鍵詞。

      其中,文本關鍵詞是從原始文本數據中提取出來的關鍵詞。關鍵詞提取算法是用于實現從文本數據中提取關鍵詞的算法。本實施例中,采用但不限于textrank、lda、tpr-textrank等關鍵詞提取算法對原始文本數據進行關鍵詞提取,以獲取該原始文本數據對應的文本關鍵詞。

      s4042:基于文本關鍵詞查詢同義詞庫,獲取與文本關鍵詞相對應的文本同義詞。

      其中,同義詞庫是用于存儲預先設置的用于存儲同義詞關系的數據庫。文本同義詞是記錄在同義詞庫中的與文本關鍵詞具有同義詞關系的同義詞。本實施例中,同義詞庫中預先存儲具有同義詞關系的同義詞組,這些同義詞組具體可以爲與案件審判過程中涉及到的同義詞組,以便服務器可根據原始文本數據中提取出的文本關鍵詞查詢到相應的文本關鍵詞,從而有助于後續查詢過程擴大查詢範圍。

      s4043:根據文本關鍵詞和文本同義詞查詢在先文本數據庫,判斷是否存在包含文本關鍵詞或者文本同義詞的在先文本數據。

      其中,在先文本數據庫是用于存儲在在采集到該原始語音數據之前所形成的所有在先文本數據的數據庫。本實施例中,根據文本關鍵詞和文本同義詞查詢在先文本數據庫,判斷在先文本數據庫中是否存在與該文本關鍵詞相對應的在先文本數據,或者是否存在與該文本同義詞相對應的在先文本數據,以擴大在先文本數據的查找範圍。

      s4044:若存在包含文本關鍵詞或者文本同義詞的在先文本數據,則認定存在與原始文本數據相對應的在先文本數據。

      具體地,若在先文本數據庫中存在包含文本關鍵詞或者文本同義詞的在先文本數據,則認定存在與原始文本數據相對應的在先文本數據,說明在庭審當事人說出原始語音數據時,已經有人在先提及過包含文本關鍵詞或者文本同義詞的語音數據,該語音數據經文本翻譯後形成在先文本數據存儲在先文本數據庫中,以便後續基于原始文本數據和在先文本數據進行語義分析,以確定兩者表述的意思是否相同,即後續執行步驟s405的步驟。

      s4045:若不存在包含文本關鍵詞或者文本同義詞的在先文本數據,則認定不存在與原始文本數據相對應的在先文本數據。

      具體地,若在先文本數據庫中不存在包含文本關鍵詞或者文本同義詞的在先文本數據,則認定不存在與原始文本數據相對應的在先文本數據,說明在庭審當事人說出原始語音數據時,沒有其他庭審當事人在先提及包含文本關鍵詞或者文本同義詞的語音數據,此時需執行後續的步驟s405。

      可以理解地,先根據原始文本數據所提取出的文本關鍵詞查詢同義詞庫,以確定其對應的文本同義詞,再基于文本關鍵詞和文本同義詞查詢在先文本數據庫,以確定其包含文本關鍵詞或者文本同義詞在先文本數據,從而擴大在先文本數據的確定範圍,避免出現遺漏。

      s405:若存在在先文本數據,則對原始文本數據和在先文本數據進行語義分析,確定語義分析結果,根據語義分析結果對原始文本數據進行突出顯示處理,顯示與語義分析結果相對應的審判提示文字,重複執行獲取麥克風采集的與審判提示文字相對應的原始語音數據。

      具體地,在確定存在與原始文本數據相對應的在先文本數據時,對原始文本數據和在先文本數據進行語義分析,確定語義分析結果,具體包括:采用語義分析工具對原始文件數據和在先文本數據進行語義分析,以確定原始文件數據和在先文本數據的語義是否相同或者相異,獲取相應的語義分析結果。該語音分析結果包括相同的語義分析結果和相異的語義分析結果。該語義分析工具可以采用但不限于nlp(naturallanguageprocessing,自然語義處理)技術創建的分析工具。

      例如,庭審當事人a對應的在先文本數據中記錄“我在3月10日向b購買一批價值爲10萬的産品”,而庭審當事人b對應的原始文本數據中記錄“我在3月10號將一批價值爲10萬的産品賣給a”,雖然這句話表述不相同,但涉及的當事人、時間、標的和價格等因素均相同,在采用語義分析工具對原始文件數據和在先文本數據進行語義分析時,認定兩者描述的意思相同,則獲取相同的語義分析結果。又例如,庭審當事人a對應的在先文本數據中記錄“我在3月10日向b購買一批價值爲10萬的産品”,而庭審當事人b對應的原始文本數據中記錄“我在3月8號將一批價值爲15萬的産品賣給a”,這兩句話中,雖然涉及的當事人和標的這兩個因素相同,但時間和價格這兩個因素不相同,認定兩者描述的意見不相同,獲取相異的語義分析結果。

      具體地,根據語義分析結果對原始文本數據進行突出顯示處理,顯示與語義分析結果相對應的審判提示文字,具體是指根據語義分析結果原始文本數據與在先文本數據中語義是相同還是相異,從而確定針對雙方認定的事實、雙方爭議的焦點和描述是否前後矛盾等特殊情況,對當前審判環節對應的原始文本數據進行不同的突出顯示處理,以使法官在庭審過程中根據突出顯示處理結果了解上述情況,有助于減少法官庭審過程中的工作量,從而降低工作負擔,並顯示與該語義分析結果相對應的審判提示信息,有助于加快法庭庭審的庭審進度。

      在一實施例中,步驟s405具體包括如下步驟:

      s4051:若語義分析結果爲相同,且原始文本數據與在先文本數據對應的對象標識爲同一標識,則不對原始文本數據進行突出顯示處理,顯示標准法庭審理筆錄模板對應的下一審判環節對應的審判提示文字。

      具體地,若語義分析結果爲相同,且原始文本數據與在先文本數據對應的對象標識爲同一標識,則說明說出原始文本數據和在先文本數據的說話人爲同一人,而且原始文本數據和在先文本數據表述的語義相同,不存在前後表述相互矛盾的問題,可以理解爲無特殊情況的論述,因此,不對原始文本數據進行突出顯示處理,顯示標准法庭審理筆錄模板對應的下一審判環節對應的審判提示文字,重複執行步驟s401中的獲取麥克風采集的與審判提示文字相對應的原始語音數據及其以後的步驟。

      s4052:若語義分析結果爲相異,且原始文本數據與在先文本數據對應的對象標識爲同一標識,則采用第一突出顯示模式對原始文本數據進行突出顯示處理,顯示包括矛盾提示信息的審判提示文字。

      其中,第一突出顯示模式是預先設置的用于對同一說話人論述前後矛盾的內容進行突出顯示的模式,該第一突出顯示模式可以采用字體顔色、背景顔色、加粗、傾斜或者加下劃線等形式進行突出顯示。

      具體地,語義分析結果爲相異,且原始文本數據與在先文本數據對應的對象標識爲同一標識,則說明說出原始文本數據和在先文本數據的說話人爲同一人,而且原始文本數據和在先文本數據表述的語義相異,存在前後表述相互矛盾的問題,極有可能是因爲說話人說謊這一特殊情況而産品的,因此,需采用第一突出顯示模式對原始文本數據進行突出顯示處理,以顯示包含矛盾提示信息的審判提示文字,以使法官在庭審過程中了解到說話人論述存在前後矛盾的地方,進而更好地把控庭審過程中的引導問題,保障庭審過程中的公平公正,有助于減少法官庭審過程中的工作量,從而降低工作負擔。

      s4053:若語義分析結果爲相同,且原始文本數據與在先文本數據對應的對象標識不爲同一標識,則采用第二突出顯示模式對原始文本數據進行突出顯示處理,顯示包括無爭議提示信息的審判提示文字。

      其中,第二突出顯示模式是預先設置的用于對不同說話人論述無矛盾的內容進行突出顯示的模式,可以理解地,該第二突出顯示模式是區別于第一突出顯示模式的模式,同樣可以采用字體顔色、背景顔色、加粗、傾斜或者加下劃線等形式進行突出顯示。

      具體地,若語義分析結果爲相同,且原始文本數據與在先文本數據對應的對象標識不爲同一標識,則說明說出原始文本數據和在先文本數據的說話人不爲同一人,而且原始文本數據和在先文本數據的語義相同,即這兩個說話人對所論述內容無異義,即不存在爭議的內容,因此,需采用第二突出顯示模式對原始文本數據進行突出顯示處理,顯示包括無爭議提示信息的審判提示文字,有助確定法庭庭審過程中的無爭議的事實,進而更好地把控庭審過程中的引導問題,有助于減少法官庭審過程中的工作量,從而降低工作負擔。

      s4054:若語義分析結果爲相異,且原始文本數據與在先文本數據對應的對象標識不爲同一標識,則采用第三突出顯示模式對原始文本數據進行突出顯示處理,顯示包括爭議焦點提示信息的審判提示文字。

      其中,第三突出顯示模式是預先設置的用于對不同說話人論述有矛盾的內容進行突出顯示的模式,可以理解地,該第三突出顯示模式與前面的第一突出顯示模式和第二突出顯示模式不相同的模式,同樣可以采用字體顔色、背景顔色、加粗、傾斜或者加下劃線等形式進行突出顯示。

      具體地,若語義分析結果爲相異,且原始文本數據與在先文本數據對應的對象標識不爲同一標識,則說明說出原始文本數據和在先文本數據的說話人不爲同一人,而且原始文本數據和在先文本數據的語義相異,即這兩個說話人對所論述內容有爭議,一般爲雙方爭議焦點所在,因此,可采用第三突出顯示模式對原始文本數據進行突出顯示處理,顯示包含爭議焦點提示信息的審判提示文字,有助確定法庭庭審過程中的爭議焦點,進而更好地把控庭審過程中的引導問題,有助于減少法官庭審過程中的工作量,從而降低工作負擔。

      進一步地,服務器在獲取麥克風采集到的與審判提示文字相對應的原始語音數據之後,還可以采用服務器上預先設置的語音測謊模型對原始語音數據進行處理,獲取說謊概率,若該說謊概率大于預設概率阈值,則采用謊言顯示模式對原始文本數據進行突出顯示處理,以使法官庭審過程中及時了解各方庭審當事人是否說謊,以保證案件公平公正地審理。其中,該語音測試模型可以是應用在當前市面公開的語音測試儀上使用的模型,以便根據原始語音數據中包含的語音頻率或者語音基調等信息確定說話人說出的原始語音數據是謊言的概率。預設概率阈值是預先設置的用于評估是否達到判定爲謊言的概率的阈值。謊言顯示模式是預先設置的用于對較大概率爲謊言的原始文本數據進行突出顯示的模式。

      s406:若不存在在先文本數據,則重複執行在客戶端上顯示與標准法庭審理筆錄模板中下一審判環節對應的審判提示文字,獲取麥克風采集的與審判提示文字相對應的原始語音數據,直至不存在下一審判環節對應的審判提示文字時,獲取庭審筆錄文件,並將庭審筆錄文件存儲在數據庫中。

      具體地,在確定不存在與原始文本數據相對應的在先文本數據時,可依據標准法庭審理筆錄模板,判斷是否存在下一審判環節對應的審判提示文字;若存在下一審判環節對應的審判提示文字時,重複執行獲取麥克風采集的與審判提示文字相對應的原始語音數據及其之後的步驟(即步驟s402、s403);若不存在下一審判環節對應的審判提示文字時,認定法庭審理過程結束,則根據標准法庭審理筆錄模板中相應位置填充的所有原始文本數據,形成庭審筆錄文件,並將該庭審筆錄文件存儲在數據庫中,以便法官基于該庭審筆錄文件制作裁判文書。

      本實施例所提供的智能輔助審判方法中,通過麥克風實時采集與當前審判環節對應的審判提示文字相對應的原始語音數據之後,根據對原始語音數據進行聲紋識別的聲紋識別結果,確定其對象標識,從而確定該原始語音數據對應的說話人身份;將原始語音數據文本翻譯所獲取的原始文本數據與對象標識關聯存儲在標准法庭審理筆錄模板的相應位置,從而提高原始文本數據的錄入效率,無需書記員逐字錄入,減輕書記員的工作負擔。在存在與原始文本數據相對應的在先文本數據時,根據原始文本數據與在先文本數據的語義分析結果,對原始文本數據進行突出顯示處理,並顯示與語義分析結果相對應的審判提示文字,可使法官在庭審過程中根據突出顯示處理結果了解不同語義分析結果對應的特殊情況,有助于減少法官庭審過程中的工作量,從而降低工作負擔,顯示與該語義分析結果相對應的審判提示信息,有助于加快法庭庭審的庭審進度,提高庭審效率。

      應理解,上述實施例中各步驟的序號的大小並不意味著執行順序的先後,各過程的執行順序應以其功能和內在邏輯確定,而不應對本發明實施例的實施過程構成任何限定。

      在一實施例中,如圖5所示,提供一種智能輔助審判裝置,該智能輔助審判裝置與上述實施例中智能輔助審判方法一一對應。該智能輔助審判裝置的各功能模塊詳細說明如下:

      案件描述信息獲取模塊501,用于從數據庫中獲取待判案件對應的庭審筆錄文件,從庭審筆錄文件中提取案件描述信息;

      目標分詞結果獲取模塊502,用于采用分詞工具對案件描述信息進行分詞,獲取目標分詞結果,目標分詞結果包括多個目標分詞;

      目標關鍵詞確定模塊503,用于基于每一目標分詞查詢關鍵詞庫,將關鍵詞庫中存儲的與目標分詞相匹配的原始關鍵詞確定爲目標關鍵詞;

      目標案件類型確定模塊504,用于根據目標關鍵詞查詢案件類型信息庫,獲取與目標關鍵詞相匹配的至少一個目標案件類型;

      目標推送法條獲取模塊505,從先驗知識庫中獲取與至少一個目標案件類型相匹配的先驗知識,根據先驗知識,獲取目標推送法條;

      推薦審判觀點獲取模塊506,用于采用語義分析模型對案件描述信息進行語義分析,獲取標准化信息,基于標准化信息查詢審判觀點庫,獲取對應的推薦審判觀點;

      審判建議文件獲取模塊507,用于根據目標推送法條和推薦審判觀點,獲取並顯示審判建議文件。

      優選地,在案件描述信息獲取模塊之前,智能輔助審判裝置還包括:

      原始語音數據獲取模塊,用于在客戶端上顯示與標准法庭審理筆錄模板中當前審判環節對應的審判提示文字,獲取麥克風采集的與審判提示文字相對應的原始語音數據;

      對象標識獲取模塊,用于對原始語音數據進行聲紋識別,獲取聲紋識別結果,根據聲紋識別結果確定原始語音數據對應的對象標識;

      原始文本數據獲取模塊,用于對原始語音數據進行文本翻譯,獲取與對象標識相對應的原始文本數據,將對象標識和原始文本數據關聯存儲在標准法庭審理筆錄模板的相應位置;

      在先文本數據判斷模塊,用于基于原始文本數據查詢在先文本數據庫,判斷是否存在與原始文本數據相對應的在先文本數據;

      突出顯示處理模塊,用于若存在在先文本數據,則對原始文本數據和在先文本數據進行語義分析,確定語義分析結果,根據語義分析結果對原始文本數據進行突出顯示處理,顯示與語義分析結果相對應的審判提示文字,重複執行獲取麥克風采集的與審判提示文字相對應的原始語音數據;

      筆錄文件獲取模塊,用于若不存在在先文本數據,則重複執行在客戶端上顯示與標准法庭審理筆錄模板中下一審判環節對應的審判提示文字,獲取麥克風采集的與審判提示文字相對應的原始語音數據,直至不存在下一審判環節對應的審判提示文字時,獲取庭審筆錄文件,並將庭審筆錄文件存儲在數據庫中。

      優選地,對象標識獲取模塊,包括:

      聲紋特征提取判斷單元,用于采用聲紋特征提取算法對原始語音數據進行聲紋特征提取,獲取目標聲紋特征,判斷是否存在與目標聲紋特征相對應的標准聲紋特征;

      第一對象標識確定單元,用于若存在標准聲紋特征,則根據標准聲紋特征對應的身份標識,確定原始語音數據對應的對象標識;

      第二對象標識確定單元,用于若不存在標准聲紋特征,則根據原始語音數據對應的麥克風標識,確定原始語音數據對應的對象標識。

      優選地,在先文本數據判斷模塊,包括:

      文本關鍵詞獲取單元,用于采用關鍵詞提取算法對原始文本數據進行關鍵詞提取,獲取文本關鍵詞;

      文本同義詞獲取單元,用于基于文本關鍵詞查詢同義詞庫,獲取與文本關鍵詞相對應的文本同義詞;

      在先文本查詢判斷單元,用于根據文本關鍵詞和文本同義詞查詢在先文本數據庫,判斷是否存在包含文本關鍵詞或者文本同義詞的在先文本數據;

      第一判斷處理單元,用于若存在包含文本關鍵詞或者文本同義詞的在先文本數據,則認定存在與原始文本數據相對應的在先文本數據;

      第二判斷處理單元,用于若不存在包含文本關鍵詞或者文本同義詞的在先文本數據,則認定不存在與原始文本數據相對應的在先文本數據。

      優選地,突出顯示處理模塊,包括:

      第一顯示處理單元,用于若語義分析結果爲相同,且原始文本數據與在先文本數據對應的對象標識爲同一標識,則不對原始文本數據進行突出顯示處理,顯示標准法庭審理筆錄模板對應的下一審判環節對應的審判提示文字;

      第二顯示處理單元,用于若語義分析結果爲相異,且原始文本數據與在先文本數據對應的對象標識爲同一標識,則采用第一突出顯示模式對原始文本數據進行突出顯示處理,顯示包括矛盾提示信息的審判提示文字;

      第三顯示處理單元,用于若語義分析結果爲相同,且原始文本數據與在先文本數據對應的對象標識不爲同一標識,則采用第二突出顯示模式對原始文本數據進行突出顯示處理,顯示包括無爭議提示信息的審判提示文字;

      第四顯示處理單元,用于若語義分析結果爲相異,且原始文本數據與在先文本數據對應的對象標識不爲同一標識,則采用第三突出顯示模式對原始文本數據進行突出顯示處理,顯示包括爭議焦點提示信息的審判提示文字。

      優選地,目標分詞結果獲取模塊,包括:

      文本分詞處理單元,用于采用結巴分詞工具的搜索引擎模式對案件描述信息進行文本分詞,獲取文本分詞結果,文本分詞結果包括n個一級分詞;

      第一優化處理單元,用于若任意連續k個一級分詞中連續k-1個一級分詞的疊加等于第k個一級分詞,且連續k-1個一級分詞中存在至少兩個一級分詞的結合等于第k個一級分詞,則僅保留結合等于第k個一級分詞的至少兩個一級分詞作爲目標分詞,獲取目標分詞結果;

      第二優化處理單元,用于若任意連續k個一級分詞中連續k-1個一級分詞的疊加等于第k個一級分詞,且任意連續k個一級分詞中不存在至少兩個一級分詞的結合等于第k個一級分詞,則刪除前k-1個一級分詞,保留第k個一級分詞作爲目標分詞,獲取目標分詞結果;

      第三優化處理單元,用于若任意連續k個一級分詞中連續k-1個一級分詞的結合等于第k個一級分詞,則刪除第k個一級分詞,保留前k-1個一級分詞作爲目標分詞,獲取目標分詞結果。

      優選地,目標關鍵詞確定模塊,包括:

      目標同義詞獲取單元,用于根據目標分詞查詢同義詞庫,獲取與目標分詞相對應的目標同義詞;

      目標關鍵詞確定單元,用于根據目標分詞和目標同義詞查詢關鍵詞庫,判斷是否存在與目標分詞或者目標同義詞相匹配的原始關鍵詞,若存在原始關鍵詞,則將原始關鍵詞確定爲目標關鍵詞。

      優選地,在案件描述信息獲取模塊之前,智能輔助審判裝置還包括:

      更新任務獲取模塊,用于獲取數據更新任務,數據更新任務包括原始案件類型和任務更新時間;

      第一數據獲取模塊,用于若與原始案件類型相對應的判案依據在任務更新時間以後發生變更,則確定變更時間,獲取變更時間和系統當前時間之間的與原始案件類型相對應的曆史判案數據,根據曆史判案數據確定待處理數據;

      第二數據獲取模塊,用于若與原始案件類型相對應的判案依據在任務更新時間以後沒有發生變更,則獲取系統當前時間之前預設周期內的與原始案件類型相對應的曆史判案數據,根據曆史判案數據確定待處理數據;

      先驗知識庫構建模塊,用于從待處理數據中提取先驗信息,基于先驗信息構建與原始案件類型相對應的先驗知識庫;

      審判觀點庫構建模塊,用于從待處理數據提取曆史描述信息和曆史審判觀點,基于曆史描述信息和曆史審判觀點,構建與原始案件類型相對應的審判觀點庫。

      優選地,待處理數據包括目標區域;

      根據曆史判案數據確定待處理數據,包括:

      確定任一目標區域對應的曆史判案數據的目標數據量;

      若目標數據量大于預設數量阈值,則將同一目標區域和原始案件類型對應的曆史判案數據,確定爲待處理數據;

      若目標數據量不大于預設數量阈值,則將同一原始案件類型對應的曆史判案數據,確定爲待處理數據。

      關于智能輔助審判裝置的具體限定可以參見上文中對于智能輔助審判方法的限定,在此不再贅述。上述智能輔助審判裝置中的各個模塊可全部或部分通過軟件、硬件及其組合來實現。上述各模塊可以硬件形式內嵌于或獨立于計算機設備中的處理器中,也可以以軟件形式存儲于計算機設備中的存儲器中,以便于處理器調用執行以上各個模塊對應的操作。

      在一個實施例中,提供了一種計算機設備,該計算機設備可以是服務器,其內部結構圖可以如圖6所示。該計算機設備包括通過系統總線連接的處理器、存儲器、網絡接口和數據庫。其中,該計算機設備的處理器用于提供計算和控制能力。該計算機設備的存儲器包括非易失性存儲介質、內存儲器。該非易失性存儲介質存儲有操作系統、計算機程序和數據庫。該內存儲器爲非易失性存儲介質中的操作系統和計算機程序的運行提供環境。該計算機設備的數據庫用于存儲執行智能輔助審判方法過程中使用或者生成的數據。該計算機設備的網絡接口用于與外部的終端通過網絡連接通信。該計算機程序被處理器執行時以實現一種智能輔助審判方法。

      在一個實施例中,提供了一種計算機設備,包括存儲器、處理器及存儲在存儲器上並可在處理器上運行的計算機程序,處理器執行計算機程序時實現上述實施例中智能輔助審判方法,例如圖2-圖4所示,爲避免重複,這裏不再贅述。或者,或者,處理器執行計算機程序時實現上述智能輔助審判裝置的各模塊/單元的功能,如圖5所示的各模塊,爲避免重複,這裏不同贅述。

      在一個實施例中,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,計算機程序被處理器執行時實現上述實施例中智能輔助審判方法,例如圖2-圖4所示,爲避免重複,這裏不再贅述。或者,該計算機程序被處理器執行時上述智能輔助審判裝置的各模塊/單元的功能,如圖5所示的各模塊,爲避免重複,這裏不同贅述。

      本領域普通技術人員可以理解實現上述實施例方法中的全部或部分流程,是可以通過計算機程序來指令相關的硬件來完成,所述的計算機程序可存儲于一非易失性計算機可讀取存儲介質中,該計算機程序在執行時,可包括如上述各方法的實施例的流程。其中,本申請所提供的各實施例中所使用的對存儲器、存儲、數據庫或其它介質的任何引用,均可包括非易失性和/或易失性存儲器。非易失性存儲器可包括只讀存儲器(rom)、可編程rom(prom)、電可編程rom(eprom)、電可擦除可編程rom(eeprom)或閃存。易失性存儲器可包括隨機存取存儲器(ram)或者外部高速緩沖存儲器。作爲說明而非局限,ram以多種形式可得,諸如靜態ram(sram)、動態ram(dram)、同步dram(sdram)、雙數據率sdram(ddrsdram)、增強型sdram(esdram)、同步鏈路(synchlink)dram(sldram)、存儲器總線(rambus)直接ram(rdram)、直接存儲器總線動態ram(drdram)、以及存儲器總線動態ram(rdram)等。

      所屬領域的技術人員可以清楚地了解到,爲了描述的方便和簡潔,僅以上述各功能單元、模塊的劃分進行舉例說明,實際應用中,可以根據需要而將上述功能分配由不同的功能單元、模塊完成,即將所述裝置的內部結構劃分成不同的功能單元或模塊,以完成以上描述的全部或者部分功能。

      以上所述實施例僅用以說明本發明的技術方案,而非對其限制;盡管參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換;而這些修改或者替換,並不使相應技術方案的本質脫離本發明各實施例技術方案的精神和範圍,均應包含在本發明的保護範圍之內。

      再多了解一些
      當前第1頁1 2 3 
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1
      X-POWER-BY FNC Vbeta FROM ZZtest