news 2026/4/23 19:24:22

项目实训博客——功能篇2

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
项目实训博客——功能篇2

本次调试完全实现了rag检索服务与chormaDB存储
本次新加功能:法律文书智能生成

实际案例参考

  • 青山湖区法院系统:20秒批量生成,效率提升7倍

  • 朔州法院智能生成机:20-30秒完成,效率提升超90%

该功能旨在提高人们撰写法律文书的效率,通过语言模型+关键词写出严谨的起诉状、答辩状、强制执行申请书、判决书等法律文书。通过陈述既定事实,阅读之选取关键词来快速生成一份完整的法律文书,往往能将写字的时间从30-60min降低至2min以内。

举例:

北京市西城区人民法院

行政判决书

(2024)京0102行初89号

原告:某某科技有限公司,住所地北京市西城区XX路XX号。

法定代表人:孙某,总经理。

被告:北京市西城区市场监督管理局,住所地北京市西城区XX大街XX号。

原告某某科技有限公司不服被告北京市西城区市场监督管理局作出的京西市监罚字〔2023〕第XXX号行政处罚决定,于2024年1月20日向本院提起行政诉讼。本院于同日立案后,依法组成合议庭,公开开庭审理了本案。

原告诉称:被告于2023年12月作出的行政处罚决定认定事实不清、适用法律错误、处罚过重。原告在经营过程中虽存在部分标签标注不规范的情况,但已及时整改,未造成实际危害后果。被告处以20万元罚款明显过重,请求法院撤销该行政处罚决定。

被告辩称:原告生产销售的产品标签不符合《食品安全法》相关规定,经调查核实后依法作出行政处罚,事实清楚、证据充分、程序合法、处罚适当。

经审理查明:原告某某科技有限公司生产的三款食品产品标签存在营养成分表标注不准确、生产日期标注位置不符合规定等问题。被告经立案调查、现场检查、抽样检验后,依据《食品安全法》第一百二十五条之规定,作出罚款20万元的行政处罚决定。

本院认为,被告作出行政处罚决定的事实认定清楚,证据确凿,程序合法。但考虑到原告违法行为的性质、情节及社会危害程度,原告系初次违法且已积极整改,涉案产品未造成食品安全事故,被告处以20万元罚款未充分考虑比例原则,处罚幅度偏重。

争议焦点:行政处罚的幅度是否适当。

判决如下:

一、撤销被告北京市西城区市场监督管理局作出的京西市监罚字〔2023〕第XXX号行政处罚决定中关于罚款20万元的部分;

二、责令被告北京市西城区市场监督管理局在本判决生效之日起六十日内重新作出行政处罚决定。

如不服本判决,可在判决书送达之日起十五日内向本院递交上诉状,上诉于北京市第二中级人民法院。

审判长 马一

审判员 钱二

审判员 郑三

二〇二四年五月二十日

书记员 冯四

以下为输出内容:

既定事实:行政处罚决定的事实认定清楚,证据确凿,程序合法。初次违法且已积极整改,涉案产品未造成食品安全事故

生成内容:上诉状

【标题】行政上诉状

【上诉人(原审被告)】
北京市西城区市场监督管理局,住所地北京市西城区XX大街XX号。
法定代表人:XXX,局长。

【被上诉人(原审原告)】
某某科技有限公司,住所地北京市西城区XX路XX号。
法定代表人:孙某,总经理。

【上诉请求】
1. 请求撤销(2024)京0102行初89号行政判决第一项;
2. 请求维持原行政处罚决定中罚款20万元的部分;
3. 请求判决被上诉人承担本案一、二审诉讼费用。

【事实与理由】
上诉人不服北京市西城区人民法院(2024)京0102行初89号行政判决,现提出上诉。

一、原审判决认定事实错误
被上诉人生产销售的三款食品产品标签存在多处不符合《食品安全法》规定的情形,涉及产品数量较多,违法行为持续时间较长,并非"初次违法、已积极整改"所能完全覆盖。

二、原审判决适用法律错误
《食品安全法》第一百二十五条规定罚款幅度为"货值金额五倍以上十倍以下",上诉人处以20万元罚款已属法定幅度内的最低标准,不存在"处罚过重"的情形。

三、食品安全事关重大公共利益
食品安全违法行为具有高度危险性,行政处罚应当体现惩戒与威慑功能。原审判决以比例原则为由撤销罚款部分,将严重削弱行政处罚的震慑效果。

综上所述,原审判决认定事实和适用法律均有错误,请求二审法院依法改判。

此致
北京市第二中级人民法院

上诉人:北京市西城区市场监督管理局
2024年X月X日
核心代码实现:

数据模型定义:

class CaseInfo(BaseModel): """案件基本信息""" case_number: str # 案号 court_name: str # 法院名称 case_type: str # 案件类型 judgment_date: datetime # 判决日期 class PartyInfo(BaseModel): """当事人信息""" name: str # 名称 type: str # 原告/被告/上诉人/被上诉人 address: str # 住所地 legal_representative: Optional[str] # 法定代表人 class JudgmentInfo(BaseModel): """判决信息""" claims: List[str] # 诉讼请求 facts: str # 经审理查明的事实 reasoning: str # 本院认为 judgment_result: str # 判决结果 legal_basis: List[str] # 法律依据 dispute_focus: str # 争议焦点 class ExtractedElements(BaseModel): """提取的完整要素""" case_info: CaseInfo plaintiff: PartyInfo defendant: PartyInfo judgment: JudgmentInfo appeal_deadline: Optional[str] # 上诉期限 appellate_court: Optional[str] # 上诉法院

要素提取:

import re from typing import Dict, Any from datetime import datetime from app.services.llm_service import get_llm_service class ElementExtractor: """案件要素提取器""" def __init__(self): self.llm = get_llm_service() async def extract_from_judgment(self, text: str) -> Dict[str, Any]: """从判决书中提取关键要素""" # 1. 使用正则表达式提取结构化信息 basic_info = self._extract_basic_info(text) # 2. 使用LLM提取复杂语义信息 semantic_info = await self._extract_semantic_info(text) return {**basic_info, **semantic_info} def _extract_basic_info(self, text: str) -> Dict[str, Any]: """使用正则提取基本信息""" patterns = { "case_number": r'((\d{4})[京沪粤苏浙][\u4e00-\u9fa5]{0,2}\d+[行民刑]\d+号)', "court_name": r'^(.*?人民法院)', "judgment_date": r'二〇(\d+)年(\d+)月(\d+)日', "plaintiff": r'原告[::](.*?)[,。]', "defendant": r'被告[::](.*?)[,。]', "dispute_focus": r'争议焦点[::](.*?)[。\n]', } result = {} for key, pattern in patterns.items(): match = re.search(pattern, text, re.MULTILINE) if match: result[key] = match.group(1) if match.groups() else match.group() return result async def _extract_semantic_info(self, text: str) -> Dict[str, Any]: """使用LLM提取语义信息""" prompt = f""" 请从以下判决书中提取关键信息,输出JSON格式: 判决书内容: {text[:3000]} 请提取: 1. facts: 经审理查明的事实(精简到200字以内) 2. reasoning: 本院认为的核心裁判理由 3. judgment_result: 判决结果的具体内容 4. legal_basis: 引用的法律条文(数组格式) 5. case_summary: 一句话概括案件核心 只输出JSON,不要有其他内容。 """ response = await self.llm.chat([ {"role": "system", "content": "你是一个专业的法律文书分析专家。"}, {"role": "user", "content": prompt} ]) import json if "```json" in response: response = response.split("```json")[1].split("```")[0] return json.loads(response)

调用示例:

# 测试代码
import asyncio
from app.services.element_extractor import ElementExtractor
from app.services.document_generator import DocumentGenerator

async def test():
judgment_text = """
北京市西城区人民法院
行政判决书
(2024)京0102行初89号
...
"""

# 提取要素
extractor = ElementExtractor()
elements = await extractor.extract_from_judgment(judgment_text)
print("提取的要素:", elements)

# 生成强制执行申请书
generator = DocumentGenerator()
enforcement = await generator.generate_enforcement_application(elements)
print("强制执行申请书:", enforcement)

# 生成案件分析报告
analysis = await generator.generate_case_analysis_report(elements)
print("案件分析报告:", analysis)

asyncio.run(test())

五大技术要点:

正则提取re模块提取案号、法院、日期等固定格式信息
LLM语义提取DeepSeek API提取事实认定、裁判理由等复杂信息
模板引擎Pythonstr.format()规范文书格式
LLM生成Prompt工程生成上诉状、分析报告等复杂文书
后处理正则替换 + 格式校验确保输出格式规范

本次心得:

要素提取的质量直接决定文书生成的可用性,需要精心设计提取规则和补充机制。模板保证了下限(格式规范),LLM提升了上限(内容质量)法律文书智能生成不是要替代法律专业人员的判断,而是将重复性、规范性的工作自动化,让专业人士能够更专注于创造性的法律工作。技术应当服务于人,而不是取代人。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 19:24:22

边走边聊 Python 3.8:迭代器协议高级应用(Python 3.8 + Windows 7 环境)

迭代器协议高级应用(Python 3.8 + Windows 7 环境) 迭代器协议是 Python 3.8 中非常核心且强大的特性,通过实现 __iter__() 和 __next__() 方法,可以实现惰性求值、内存高效、无限序列、数据管道等高级场景。在 Windows 7 + Python 3.8 环境下完全兼容,无需额外安装任何包…

作者头像 李华
网站建设 2026/4/23 19:23:18

基于STM32的伺服电机FOC控制系统设计与实现

1. 伺服电机与FOC控制基础 伺服电机作为工业自动化领域的核心执行元件,其控制精度直接影响设备性能。传统六步换相控制虽然简单,但存在转矩脉动大、效率低等问题。磁场定向控制(Field-Oriented Control, FOC)通过将三相电流解耦为…

作者头像 李华
网站建设 2026/4/23 19:21:10

竹飞N30电机取名那点事儿,误会大了!

关于逐飞N30电机取名带来的“误会”逐飞的N30陷阱 N30电机取名的那点事01 【N30电机取名那点事】 哈喽宝子们,今儿咱唠唠竹飞N30电机那点糟心事儿, 简直是平地起波澜,纯属一场美丽的误会, 弄的咱又好气又好笑, 我了个老…

作者头像 李华
网站建设 2026/4/23 19:20:21

如何利用HTTrack实现网站完整离线备份:从零开始的终极指南

如何利用HTTrack实现网站完整离线备份:从零开始的终极指南 【免费下载链接】httrack HTTrack Website Copier, copy websites to your computer (Official repository) 项目地址: https://gitcode.com/gh_mirrors/ht/httrack 你是否曾遇到过这样的困境&#…

作者头像 李华
网站建设 2026/4/23 19:16:39

机器人应用-高空立面清洁

随着城市化推进,城市中高层建筑幕墙、公共空间设施等外立面的清洁维护 长期面临着三大难题:人工高空作业安全风险高、效率低且难以处理复杂和异形 作业场景、综合作业成本高。 高空立面清洗系统通过整合无人机智能清洗机器人水处理系统,可颠覆…

作者头像 李华