「AGIへの道」飛書ナレッジベースへ直行 →

有哪些优质的法律大模型数据集

回答

以下是一些优质的法律大模型数据集:

  1. ChatLaw:
    • 地址:https://github.com/PKU-YuanGroup/ChatLaw
    • 简介:由北大开源的一系列法律领域的大模型,包括 ChatLaw-13B(基于姜子牙 Ziya-LLaMA-13B-v1 训练而来),ChatLaw-33B(基于 Anima-33B 训练而来,逻辑推理能力大幅提升),ChatLaw-Text2Vec,使用 93w 条判决案例做成的数据集基于 BERT 训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配。
  2. LaWGPT:
    • 地址:https://github.com/pengxiao-song/LaWGPT
    • 简介:该系列模型在通用中文基座模型(如 Chinese-LLaMA、ChatGLM 等)的基础上扩充法律领域专有词表、大规模中文法律语料预训练,增强了大模型在法律领域的基础语义理解能力。在此基础上,构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,提升了模型对法律内容的理解和执行能力。
  3. LexiLaw:
    • 地址:https://github.com/CSHaitao/LexiLaw
    • 简介:LexiLaw 是一个基于 ChatGLM-6B 微调的中文法律大模型,通过在法律领域的数据集上进行微调。该模型旨在为法律从业者、学生和普通用户提供准确、可靠的法律咨询服务,包括具体法律问题的咨询,还是对法律条款、案例解析、法规解读等方面的查询。
  4. Lawyer LLaMA:
    • 地址:https://github.com/AndrewZhe/lawyer-llama
    • 简介:开源了一系列法律领域的指令微调数据和基于 LLaMA 训练的中文法律大模型的参数。Lawyer LLaMA 首先在大规模法律语料上进行了 continual pretraining。在此基础上,借助 ChatGPT 收集了一批对中国国家统一法律职业资格考试客观题(以下简称法考)的分析和对法律咨询的回答,利用收集到的数据对模型进行指令微调,让模型习得将法律知识应用到具体场景中的能力。
AIモデルによって生成されたコンテンツであり、慎重に確認してください(提供元: aily)

参照

LLM开源中文大语言模型及数据集集合

ChatLaw-法律大模型地址:[https://github.com/PKU-YuanGroup/ChatLaw](https://github.com/PKU-YuanGroup/ChatLaw)简介:由北大开源的一系列法律领域的大模型,包括ChatLaw-13B(基于姜子牙Ziya-LLaMA-13B-v1训练而来),ChatLaw-33B(基于Anima-33B训练而来,逻辑推理能力大幅提升),ChatLaw-Text2Vec,使用93w条判决案例做成的数据集基于BERT训练了一个相似度匹配模型,可将用户提问信息和对应的法条相匹配。简介:https://m.toutiao.com/article/7251839216332653068/?app=news_article&timestamp=1688482956&use_new_style=1&req_id=20230704230236E6F575C06DE6A91C10B7&group_id=7251839216332653068&wxshare_count=1&tt_from=weixin&utm_source=weixin&utm_medium=toutiao_android&utm_campaign=client_share&share_token=81b22e88-36d8-4aa1-8244-955058192f16[ChatLaw-13B](https://huggingface.co/JessyTsu1/ChatLaw-13B),此版本为学术demo版,基于姜子牙[Ziya-LLaMA-13B-v1](https://huggingface.co/IDEA-CCNL/Ziya-LLaMA-13B-v1)训练而来,中文各项表现很好,但是逻辑复杂的法律问答效果不佳,需要用更大参数的模型来解决。

LLM开源中文大语言模型及数据集集合

LaWGPT:基于中文法律知识的大语言模型地址:[https://github.com/pengxiao-song/LaWGPT](https://github.com/pengxiao-song/LaWGPT)简介:该系列模型在通用中文基座模型(如Chinese-LLaMA、ChatGLM等)的基础上扩充法律领域专有词表、大规模中文法律语料预训练,增强了大模型在法律领域的基础语义理解能力。在此基础上,构造法律领域对话问答数据集、中国司法考试数据集进行指令精调,提升了模型对法律内容的理解和执行能力。LexiLaw:中文法律大模型地址:[https://github.com/CSHaitao/LexiLaw](https://github.com/CSHaitao/LexiLaw)简介:LexiLaw是一个基于ChatGLM-6B微调的中文法律大模型,通过在法律领域的数据集上进行微调。该模型旨在为法律从业者、学生和普通用户提供准确、可靠的法律咨询服务,包括具体法律问题的咨询,还是对法律条款、案例解析、法规解读等方面的查询。Lawyer LLaMA:中文法律LLaMA地址:[https://github.com/AndrewZhe/lawyer-llama](https://github.com/AndrewZhe/lawyer-llama)简介:开源了一系列法律领域的指令微调数据和基于LLaMA训练的中文法律大模型的参数。Lawyer LLaMA首先在大规模法律语料上进行了continual pretraining。在此基础上,借助ChatGPT收集了一批对中国国家统一法律职业资格考试客观题(以下简称法考)的分析和对法律咨询的回答,利用收集到的数据对模型进行指令微调,让模型习得将法律知识应用到具体场景中的能力。

大圣:全网最适合小白的 Llama3 部署和微调教程

在人工智能领域,我们通常会根据应用领域将大模型分为两类通用大模型领域特定模型。通用大模型如GPT-4.0、GPT-3.5、文新一言以及开源的通义千问、Llama2和Llama3它们通过训练获得了广泛的自然语言理解能力。这些模型类似于多面手,能够处理多种类型的语言任务。然而,尽管这些通用模型拥有强大的基础语言能力,它们在特定领域如法律或医学中的表现可能并不理想。这就像是一个语言能力已完全发展的10岁孩子,虽然可以流利交流,但要成为某一专业领域的专家,还需要学习更多相关知识。这种对大模型针对特定领域进行的训练过程称为大模型的微调。微调是一个调整过程,通过在特定领域的数据上训练模型,优化所有层的参数,以使模型在该领域表现更佳。提高其在该领域的专业性你可能会问,为什么不直接构建一个专用于法律的模型?关键在于,从头开始训练一个具备自然语言处理能力的大模型需要大量的时间和资源。小公司负担不起但是通过微调,我们可以在现有模型的基础上,更经济、更高效地适应新的应用领域。这类似于在巨人的肩膀上进一步攀登,利用已有的广泛知识基础,快速达到新的高度。这种方法不仅节省了成本,还可以加快模型部署和应用的速度。OK,对于普通人而言,大模型微调了解到这个程度就可以,我们继续

他の質問
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
有没有优质的系统的coze入门网课?
以下是一些优质的系统的 Coze 入门网课推荐: 另外,还有“一泽 Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力”,这可能是全网最好的 Coze 教程(之一),即使是非技术出身的爱好者也能上手跟学,一站式学会 AI Agent 从设计到落地的全流程方法论。其核心看点包括通过实际案例逐步演示用 Coze 工作流构建能够稳定按照模板要求生成结构化内容的 AI Agent、开源 AI Agent 的设计到落地的全过程思路、10+项常用的 Coze 工作流的配置细节、常见问题与解决方法等。适合任何玩过 AI 对话产品的一般用户,以及希望深入学习 AI 应用开发平台(如 Coze、Dify),对 AI Agent 工作流配置感兴趣的爱好者。但需注意,本文不单独讲解案例所涉及 Prompt 的撰写方法。文末「拓展阅读」中,附有相关 Prompt 通用入门教程、Coze 其他使用技巧等内容,以供前置或拓展学习。
2025-04-14
利用那些AI工具可以制作出优质短视频
以下是一些可以制作出优质短视频的 AI 工具: 1. ChatGPT + 剪映:ChatGPT 可生成视频脚本,剪映能根据脚本自动分析并生成视频所需要素和文本框架,实现从文字到画面的快速转化。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入转化为视频。 3. Pictory:允许用户通过提供文本描述轻松创建和编辑高质量视频。 4. VEED.IO:提供 AI 图像和脚本生成器,帮助用户从图像制作视频并规划内容。 5. Runway:能够将文本转化为风格化的视频内容。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务。 在实际制作视频时,可以根据不同工具对画面的处理能力进行组合使用。例如,Pixverse 擅长物体滑行运动,有手部特殊运动的画面可用 Runway 辅助完成,需要人物表情自然的画面可使用 Pika 生成。 此外,在声音制作方面,可使用 11labs 进行对白制作,但可能会遇到 AI 声音没有情绪和情感的问题。在视频剪辑方面,可先进行粗剪确定画面逻辑,再进行定剪调整和替换画面素材。音效方面,剪映中有简单音效库,复杂音效可能需另外制作。特效方面,剪映可添加一些光影效果。包装方面,剪映能智能匹配字幕再修改。
2025-04-09
推荐一些优质AI信息源,X上的
以下是为您推荐的一些优质 AI 信息源: 1. 在,Grok 能通过 X 平台实时了解世界,还能回答多数其他 AI 系统拒绝的棘手问题,独具幽默回答模式,可避免恶意提问,留下邮件可申请早期测试。 2. 「AI 研究报告》中文版,这是对 2022 年 10 月2023 年 10 月 AI 现状及进展最为全面的报告。 3. 即刻 App 的“”等免费圈子,这里有前沿信息线索,很多 Twitter 上的开发者大牛也会在此分享。 此外,AI 知识库的信息来源还有赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等,推荐大家订阅获取最新信息并投稿。对于初学者入门,推荐看 Open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。还有经典必读文章,如介绍 GPT 运作原理、Transformer 模型、扩散模型等的文章,以及软件 2.0 时代相关内容。
2025-03-28
帮我基于fastgpt打造一个招生问答系统的优质提示词
以下是为您基于 FastGPT 打造招生问答系统的优质提示词的相关建议: 1. 充分描述任务: 为提示词提供详尽的上下文,与招生问答任务相关性越强越好。例如,明确招生的对象、专业、学制等关键信息。 给出背景,说明为什么需要进行招生问答,例如学校的发展需求、招生目标等。 定义术语,如明确招生中的特定概念,如录取分数线、奖学金条件等。 给出模型应该如何完成任务的具体细节,比如回答的格式、重点突出的内容等。 2. 提供参考文本: 如果有相关的招生资料,如招生简章、学校介绍等,可以指示模型使用这些参考文本中的引文来回答问题。 3. 直接法: 适用场景:未设置提示防御且未限定回答领域。 提示词:英文和中文。 示例:以随手设置的示例为例。 4. 设置遗忘: 适用场景:GPTs 设置了简单的提示防御。 提示词:英文和中文。 示例:以设置的 GPTs 为例。 5. 复述法: 适用场景:可获取 OpenAI 官方的设定。 提示词:英文(获取 GPTs 的设定)和中文。 示例:按照设定进行示例。
2025-02-28
生成优质图文内容地提示词
以下是生成优质图文内容的提示词相关指导: 定主题:明确您需要生成的图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora 以控制图片效果和质量,可参考广场上的优秀帖子。 ControlNet:可控制图片中特定图像,如人物姿态、特定文字等,属于高阶技能。 设置 VAE:通常选择 840000 即可。 Prompt 提示词:用英文书写想要 AI 生成的内容,使用单词和短语组合,无需考虑语法,用英文半角逗号隔开。 负向提示词 Negative Prompt:同样用英文书写想要 AI 避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:较复杂,如常用 DPM++2M Karras,也可参考模型作者推荐的采样器。 采样次数:根据采样器特征,如选择 DPM++2M Karras 时,采样次数通常在 30 40 之间。 尺寸:根据个人喜好和需求选择。 在进行文本描述时,分为内容型提示词和标准化提示词。对于内容型提示词,主要描述想要的画面,如“1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面”,并翻译成英文。采样迭代步数一般控制在 20 40 之间,采样方法常用的有 Euler a、DPM++2S a Karras、DPM++2M Karras、DPM++SDE Karras、DDIM 等,有的模型有指定算法,搭配使用效果更好。比例设置注意高宽比尽量接近 512x512,尺寸并非越大越好。CLIP 跳过层设成 2 。生成批次默认 1 批。
2025-02-28
给我一些关于数据驱动的免费的优质的课程
以下是为您找到的关于数据驱动的免费优质课程相关信息: 一、数字营销方面 1. 2025 年数字营销十大趋势 Bridging the AI skills gap:具备 AI 技能的团队可以制定更加精准、数据驱动的营销策略,提高效率和效果,使品牌在快速适应市场变化和消费者需求方面具备优势。 Advanced Personalization:借助 AI,营销人员可以实时分析消费者行为,从而提供高度个性化的体验,提升客户参与度,加强品牌忠诚度。 Resource Optimization:通过培训现有员工而不是依赖外部招聘,公司可以最大化利用内部资源,降低招聘成本,并为 AI 驱动的项目建立可持续的基础。 许多公司正在投资于 AI 培训项目,以提升其营销团队的技能。例如,Google 提供免费的 AI 和机器学习认证课程,而像 IBM 这样的公司为员工提供高级 AI 培训和导师项目。这些项目涵盖了数据分析、AI 驱动的客户细分和预测建模等关键技能,帮助公司在不断发展的数字领域保持竞争力。 二、智能导购方面 智能导购的 100 个创意方向中的数据驱动场景(20 个方向): 1. 用户生命周期价值分析:预测客户长期贡献并制定维护策略。 2. 关联购买推荐:分析历史订单推荐互补商品(如包包+丝巾)。 3. 社交媒体舆情分析:抓取小红书/微博数据生成品牌健康报告。 4. 客户分群策略:按消费频率、客单价等维度自动划分群体。 5. 促销效果模拟器:预测不同折扣方案对利润的影响。 6. 天气关联销售预测:结合天气数据推荐应季商品(如雨天推伞具)。 7. 门店选址分析:通过人流、竞品分布数据推荐新店位置。 8. 客户旅程地图:可视化用户从认知到复购的全链路行为。 9. A/B 测试自动化:自动分配流量并对比页面转化率。 10. 实时销售看板:整合多渠道数据生成动态业绩仪表盘。 11. 会员续费预测:通过行为数据预测会员卡续费概率。 12. 商品评论情感分析:从评价中提取用户满意度与改进点。 13. 滞销品组合促销:捆绑低动销率商品提升整体销量。 14. 客户等待时间优化:通过排队数据调整导购资源配置。 15. 个性化折扣券:根据用户偏好发放差异化优惠券。 16. 新品接受度预测:通过历史数据预测新品上市成功率。 17. 流失客户召回:自动触发短信/邮件推送挽回策略。 18. 供应链风险预警:监控原材料价格波动触发备选方案。 19. 跨渠道库存同步:实现官网、门店、仓库库存实时共享。 20. 客户反馈聚类分析:自动归类投诉建议并分配处理部门。
2025-02-26
有哪些好用的法律ai
以下是一些好用的法律 AI 应用场景和示例: 1. 诉讼策略制定: AI 将基于商标法等相关条款和案例法,为商标侵权案件提供诉讼策略,包括对原告商标权利的分析、被告侵权行为的评估、关键证据搜集建议、法律抗辩点及和解或调解策略。 其他例子: 为专利侵权案件制定诉讼策略,分析专利有效性、被告侵权行为及抗辩理由,提出证明侵权和计算损害赔偿的建议。 针对劳动合同纠纷案件,分析员工权益和雇主责任,提出诉讼策略,包括主张权益、证据收集重点及证明雇主违约行为。 在知识产权许可诉讼中,分析许可协议条款和双方权利义务,提出诉讼策略,包括证明许可协议违反、计算损失赔偿及可能的合同解除条件。 模拟法庭,如模拟商业合同违约的法庭审理,分析双方论点、证据和法律依据,预测判决结果,给出优化法庭陈述和证据呈现的建议。 2. 法律意见书撰写: AI 根据案件背景、证据材料和法律法规,自动撰写初步法律意见书,包含案件事实梳理、法律分析和结论。 其他例子: 针对商业秘密泄露案件,分析法律责任和赔偿范围,撰写法律意见书,提供应对策略。 为计划上市的公司提供关于公司治理结构的法律意见书,确保符合相关法规要求。 就消费者权益保护案件提供法律意见,分析商家赔偿责任和消费者维权途径,制定应对措施。 起草股权转让协议,包括转让方和受让方信息、股权转让份额、价格、支付方式和时间表、先决条件、双方权利义务、保密、违约责任和争议解决条款等。 3. 指令风格和技巧: 可指定 AI 模仿某位资深律师的逻辑严谨和言简意赅的风格,使其提供的信息更符合专业律师的沟通和表达习惯。 运用 PEMSSC 方法,如选择个性化的风格、给出参考或逻辑结构、从多个角度思考、进行总结概括、使用分隔符号区分等。 个性化风格:选择幽默且富有洞察力的风格,融入创新视角。 参考和逻辑结构:在提供法律建议时,采用 SWOT 分析法或 4P 原则等逻辑结构。 多角度思考:在分析商事诉讼时,从市场趋势、竞争对手行为、战略规划、财务状况和市场前景等角度思考诉讼策略。
2025-04-18
我是一名律师,怎么写好法律研究的提示词
作为一名律师,写好法律研究的提示词可以参考以下要点: 1. 理解 Prompt 的概念:Prompt 是给人工智能系统提供的信息或问题,用于引导其产生特定回答或执行特定任务,就像启动和引导对话的起点。对于 AI 来说,好的 Prompt 能帮助其更准确理解需求并给出更有用的回答。 2. 采用建议框架及格式: CRISPE 框架: Capacity and Role(能力与角色):明确希望 AI 的角色和能力,如专注于民商事法律领域,擅长案例研究、法律条文检索及案件策略分析。 Insight(洞察):提供背景信息和上下文,如处理复杂合同纠纷案件时,向 AI 提供案件关键事实、相关法律及背景。 Statement(陈述):直接明确期望 AI 完成的任务,如总结案件中双方诉求、检索法条、预测判决结果。 Personality(个性):确定希望 AI 以何种风格或方式回答。 Experiment(举例):通过举例进一步说明。 3. 转变思路:不要期待设计一个完美的提示词就能让 AI 百分百给出完美答案,提示词实际上是一个相对完善的“谈话方案”,成果需要在与 AI 的对话中产生。要多给 AI 几轮对话修正的余地,因为很多时候自己刚开始也不知道想要什么。 4. 示例:如陶力文律师习惯用的大模型是 KIMI,将提示词称为【灵机符箓】,把 AI 称为【灵机】。在具体的提示词中,明确作者、版本、语言等信息,赋予 AI 特定身份以划定边界,同时明确总的任务流程和关键变量,如基础材料和语言风格。
2025-04-11
法律AI
以下是关于法律 AI 的相关内容: 在法律领域,AI 具有多方面的应用和作用: 法律意见书撰写: AI 能够根据案件背景、证据材料及适用法律法规,自动撰写初步的法律意见书,包含对案件事实的梳理、法律分析和结论部分。例如: 1. 针对商业秘密泄露案件,分析法律责任和赔偿范围,为客户提供应对策略。 2. 为计划上市的公司提供关于公司治理结构的法律意见书,包括股东权益保护和董事会职责,确保符合相关法规要求。 3. 就消费者权益保护案件提供法律意见,分析商家赔偿责任和消费者维权途径,为客户制定应对措施。 4. 为公司股权转让交易起草股权转让协议,规定转让方和受让方的信息、股权转让的份额、价格、支付方式和时间表等。 5. 起草初创公司股权转让协议,明确创始股东向新投资者转让股权的条件等。 6. 为上市公司股份转让交易起草协议,包括股份描述、转让价格、支付安排等。 7. 起草家族企业股权内部转让协议,涵盖股权分配、价格确定方式等。 诉讼策略制定: AI 可基于相关法律条款和案例法,提供诉讼策略,包括对权利的分析、侵权行为评估、证据搜集建议等。例如: 1. 为专利侵权案件制定诉讼策略,分析专利有效性、侵权行为等。 2. 针对劳动合同纠纷案件,分析员工权益和雇主责任,提出诉讼策略。 3. 在知识产权许可诉讼中,分析许可协议条款和双方权利义务,提出诉讼策略。 模拟法庭: AI 能模拟法庭审理过程,分析双方论点、证据和法律依据,预测判决结果,并给出优化法庭陈述和证据呈现的建议。 使用技巧和注意事项: 1. 进行数据分析时,将环节分开处理以优化性能和便于发现修正问题。 2. 针对复杂问题,采用逐步深化和细化的方式提问。 3. 为 AI 系统提供大量数据和示例、高质量的参考材料、详细的流程和知识。 4. 在 Prompt 中使用法律术语引导 AI 回答方向。 5. 对 AI 的回答进行交叉验证,结合自身专业知识筛选判断,确保符合法律伦理、立法目的和实务。
2025-04-07
关于处理法律事务的提示词
以下是关于处理法律事务的提示词相关内容: 1. 陶力文律师观点:不能期待设计一个完美的提示词让 AI 百分百给出完美答案,应将提示词视为相对完善的“谈话方案”,成果在对话中产生。对于尝试 AI 的朋友,建议多给 AI 几轮对话修正的余地,不要期望一次输入提示词就得到想要的东西。陶律师习惯用的大模型是 KIMI,也可使用 GPT、文心一言、豆包等。其个人 Prompt 库取名为【元始洞玄灵宝枢机 AI 符法集成道藏】,库里每篇灵机符箓命名为【敕令 XXXX】。【箓】描述符箓整体所属、版本,【符】关键,涉及具体操作步骤和方法,开头赋予 AI 身份划定边界。 2. 潘帅观点:律师常用 Prompt 场景包括案例检索和类案检索。案例检索最好使用法律行业垂类的 AI 产品,通用型 AI 可能存在问题。案例检索的 Prompt 指令词结构为【案例领域或类型+明确需要查找的重点内容+查找案例的目的+其他希望 AI 做的事情】,并列举了多个具体例子,如商标侵权案件中“混淆可能性”标准的判例检索等。
2025-04-03
社招如何从法律行业转化为AI产品经理
以下是为您提供的从法律行业转化为 AI 产品经理的一些建议: 1. 学习 AI 相关知识:了解人工智能的基本概念、技术和应用,包括机器学习、深度学习、自然语言处理等。 2. 掌握相关工具和技术:熟悉如 ChatGPT、MJ 等常用的 AI 工具,以及模型微调等技术。 3. 积累项目经验:可以尝试参与一些 AI 相关的项目,哪怕是小型的,以增加实践经验。 4. 关注行业动态:及时了解 AI 产品领域的最新趋势和发展,为转型做好准备。 5. 提升产品管理能力:学习产品规划、需求分析、用户体验设计等方面的知识和技能。 6. 建立人脉网络:与从事 AI 产品工作的人员交流,获取更多的信息和机会。 另外,参考以下案例可能对您有所帮助: 黄鹏从法律行业成功转型到 GPT 产品领域,浅尝过 MJ、Runway,了解模型微调。 潘帅分享了法律人如何用好 AI 的 Prompt 指令词,例如在法规研究与解读方面,针对具体法律和需求生成详细的分析和指南。在法律意见书撰写或非诉交易文件材料方面,根据已有证据材料和相关法律条文撰写初步法律意见书。 希望以上内容对您有所帮助。
2025-03-18
我想了解法律AI的最新发展状况
以下是关于法律 AI 最新发展状况的一些信息: 潘帅作为法律科技探索者,整理了关于 AI 大模型使用方法的资料并结合自身经验编写了相关内容。他指出在人工智能时代,律师要实现人机协同,需理解 AI 优劣势及自身长处与不足。 《促进创新的人工智能监管方法》提到,AI 已在众多领域带来重大进步和效率提升,具有巨大的变革潜力,能用于多种场景,推动经济增长和创造就业。但这只是开始,随着技术发展,会有更多应用出现,英国需创造利于创新的监管环境。 AIGC 法律风险研究报告指出,AI 将改变生活各方面,带来生产力解放和生产关系变化,法律需做出回应。生成式人工智能技术在多领域带来创新、效率与价值的同时,也带来了传播虚假信息、侵犯个人信息权益、数据安全等法律风险。飒姐法律团队致力于为其发展保驾护航,总结法律红线风险,提示合规要点。
2025-03-11
python数据分析
以下是关于 Python 数据分析的相关内容: BORE 框架与数据分析: 自动驾驶产品经理的工作中会涉及大量数据分析,数据分析是一门独立完整的学科,包括数据清洗、预处理等。从工具和规模上,写 Excel 公式、用 Hadoop 写 Spark 算大数据等都属于数据分析;从方法上,算平均数、用机器学习方法做回归分类等也属于数据分析。 用 ChatGPT 做数据分析的工具: 1. Excel:是最熟悉和简单的工具,写公式、Excel 宏等都属于进阶用法,能满足产品的大部分需求。ChatGPT 可轻松写出可用的 Excel 宏。 2. Python:有很多强大的数据分析库,如 pandas、numpy 用于数据分析,seaborn、plotly、matplotlib 用于画图,产品日常工作学点 pandas 和绘图库就够用。一般数据分析的代码可用 Jupyter Notebook 运行,用 Anaconda 管理安装的各种包。 3. R 语言:专门用于搞统计,但 Python 通常已够用。 实践:用 Kaggle 的天气数据集绘制气温趋势折线图与月降雨天数柱状组合图: 1. 项目要求:绘制气温趋势折线图+月降雨天数柱状组合图,即双 y 轴的图形。 2. 打开数据集,分析数据:发现关键表头与数据可视化目的的关联。 3. 新建 Python 文件,开始编程:包括调用库、读取数据、数据处理、创建图表、添加标题与图例、保存并显示图形等步骤。 4. 试运行与 Debug:发现左纵坐标数据有误,重新分析数据集并修改代码,最终实现可视化目的。 关于 ChatGPT 的预设 prompt: 在特定的设置下,当发送包含 Python 代码的消息给 Python 时,它将在有状态的 Jupyter 笔记本环境中执行,有 60 秒的超时限制,'/mnt/data'驱动器可用于保存和持久化用户文件,本次会话禁用互联网访问,不能进行外部网络请求或 API 调用。
2025-04-14
数据集去哪下载
以下是一些数据集的下载途径: 对于微调 Llama3 的数据集,获取及原理可参考文档:。 鸢尾花数据集下载请点击链接:https://scikitlearn.org/stable/modules/generated/sklearn.datasets.load_iris.html 。 天气数据集下载请点击链接:https://www.kaggle.com/datasets/muthuj7/weatherdataset 。建议创建一个文件夹,将下载下来的数据集放入文件夹中。
2025-04-14
基于多维评价数据,使用大模型生成个性化的家庭教育方案的可靠性高吗?
基于多维评价数据使用大模型生成个性化的家庭教育方案具有一定的可靠性,但也存在一些限制。 一方面,大模型在教育领域展现出了强大的能力。例如,能够为教师提供源源不断的真题库和错题练习库,模仿各类考试题型有模有样。在作文批改评分方面,如 GLM 模型,具备好词好句识别评测、作文综合评价评分等功能,能够综合考虑文章的多个维度给出评价,提供个性化反馈,保证评分的一致性等。 另一方面,也存在一些挑战。对于高学段理科等复杂领域,大模型的表现可能有限。在解读学生作文中的深层次含义,如隐喻、双关等修辞技巧,以及涉及特定文化背景和历史知识的内容时,仍存在一定难度。 然而,只要提示词到位、示例清晰,大模型在生成个性化家庭教育方案方面具有很大的潜力,可以为家长和孩子提供有价值的参考和帮助。但不能完全依赖大模型,还需要结合人工的判断和调整。
2025-04-13
如何利用 AI 赋能【数据分析在企业自媒体营销中的应用综述(以抖音、小红书平台为例)】
利用 AI 赋能【数据分析在企业自媒体营销中的应用综述(以抖音、小红书平台为例)】可以参考以下方法: 1. 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况,处理大量数据以快速识别关键信息,如受欢迎的产品、价格区间和销量等。 2. 关键词优化:借助 AI 分析和推荐高流量、高转化的关键词,优化产品标题和描述,提高搜索排名和可见度。 3. 产品页面设计:使用 AI 设计工具根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 4. 内容生成:利用 AI 文案工具撰写有说服力的产品描述和营销文案,提高转化率。 5. 图像识别和优化:通过 AI 图像识别技术选择或生成高质量的产品图片,更好地展示产品特点。 6. 价格策略:依靠 AI 分析不同价格点对销量的影响,制定有竞争力的价格策略。 7. 客户反馈分析:利用 AI 分析客户评价和反馈,了解客户需求,优化产品和服务。 8. 个性化推荐:借助 AI 根据用户的购买历史和偏好提供个性化的产品推荐,增加销售额。 9. 聊天机器人:采用 AI 驱动的聊天机器人提供 24/7 的客户服务,解答疑问,提高客户满意度。 10. 营销活动分析:使用 AI 分析不同营销活动的效果,了解哪些活动更能吸引顾客并产生销售。 11. 库存管理:依靠 AI 预测需求,优化库存管理,减少积压和缺货情况。 12. 支付和交易优化:利用 AI 分析不同支付方式对交易成功率的影响,优化支付流程。 13. 社交媒体营销:借助 AI 在社交媒体上找到目标客户群体,通过精准营销提高品牌知名度。 14. 直播和视频营销:利用 AI 分析观众行为,优化直播和视频内容,提高观众参与度和转化率。 此外,还可以参考以下具体案例: 赛博发型师:基于 AI 技术为用户提供个性化的发型设计服务,通过分析用户面部特征、个人风格和偏好,自动生成发型设计方案,用户可上传照片,系统分析后生成详细报告和效果图,报告可存档至飞书文档供专业发型师复核评估。 营销文案创作专家深度版:专为企业营销团队等设计,提供从文案框架创作到生成的一站式服务,通过分析产品信息等挖掘痛点和卖点,生成营销文案,并提供营销数据分析服务以优化策略和提高协作效率。 抖音商家客服(C 端用户)/抖音带货知识库工具(B 端商家):作为 AI 客服系统建设助手,帮助企业实现一站式 AI 客服解决方案。 在实际操作中,还可以参考以下经验: 飞书、多维表格、扣子相关应用优化及自媒体账号分析演示分享:包括直播课程相关内容,优化社区文档问题,介绍技术栈选择,强调扣子、多维表格及 AI 字段捷径结合做数据分析的优势,现场演示账号分析效果,展示同步数据的自动化流程。 高效数据分析应用搭建实操讲解:先介绍数据在多维表格执行无二次请求的优势,接着进行技术实操,从新建“数据 AI 高效数据分析”应用开始,讲解抓数据、同步数据前设置变量等步骤,包括搭建界面、做工作流、保存变量等操作,可在市场选插件。 高雁讲解数据处理及多维表格操作过程:进行操作演示与讲解,包括将用户信息发送到多维表格、调整界面显示、处理按钮点击事件等操作,还讲解了批处理、代码节点等内容。
2025-04-13
现在做数据分析比较厉害的ai是什么
目前在数据分析方面表现较为出色的 AI 工具包括智谱清言、Open Interpreter 等。 AI 在数据分析中具有以下优势: 1. 降低入门门槛:过去学习数据分析需要掌握编程语言和专业知识,现在通过 AI 工具,门槛大大降低。 2. 规范的分析流程:对于初学者来说,AI 直接做的数据分析比他们自己第一次做的更好,其规范化流程更严谨,结果更可靠。 3. 自动化处理:会自动进行模型选择以匹配数据,还能根据 log 检查错误并改正源代码。 4. 减少重复性工作:重复性劳动可先交给 AI 做,人类用户只需做验证和检查结果。 实际应用的工具方面,GPT4 可以帮助建立和评估机器学习模型,Claude 等大语言模型可以进行数据分析和可视化,Open Interpreter 等工具可以辅助编程和数据处理。 使用时的建议包括:对 AI 结果要进行严格验证,不要完全依赖 AI,要保持独立思考,对 AI 的能力边界有清晰认识,合理使用以提高工作效率。同时,AI 应被视为辅助工具而非完全替代品,人类在整个过程中仍起主导作用和具有判断力。
2025-04-11
用AI做数据分析
以下是关于用 AI 做数据分析的相关内容: 流程: 逻辑流程图如下:上面说的两种方式对应流程图的上下两个步骤,红色部分是重点。 1. SQL 分析:用户描述想分析的内容,后台连接 DB,附带表结构信息让 AI 输出 SQL 语句,校验是 SELECT 类型的 SQL,其他操作如 UPDATE/DELETE 绝不能通过!!校验通过后执行 SQL 返回结果数据。再将数据传给 GPT(附带上下文),让 AI 学习并分析数据,最后输出分析结论和建议,和结果数据一起返回给前端页面渲染图表、展示分析结论。目前已实现两张表关联查询。 2. 个性化分析:用户上传文件,如有需要可以简单描述这是什么数据、字段意义或作用辅助分析。前端解析用户上传的文件,再传给 GPT 分析数据,后续步骤与上面一致。 工具和成功案例: 大概思路是这样: 1. 提供大模型可以访问的数据源或者上传数据表格。 2. 通过提示词说清楚需要以哪些维度分析数据,分析完成的结果要以什么格式输出。 3. 观察生成结果,迭代和优化提示词,最终满意后导出结果。 相关问题和技巧: 1. 关于“大模型幻觉”,目前没有办法消除,这本身就是大模型特性。可以通过其他第三方信息源和知识来检验生成是不是在胡说八道。 2. 结构化思维提高对话能力,在 AGI 搜索结构化三个字,有相关文章。上下文 token 长度如果指的是大模型的记忆窗口的话,没法延长,是设定好的。 案例分析: 以“用 ai 做数据分析,和爆款卖点分析”为例,这一创意将 AI 技术与商业洞察深度融合,展现了数据驱动决策的前瞻性。通过 AI 对海量用户行为、评论、竞品数据的挖掘,不仅能快速定位爆款产品的共性特征(如高频关键词、用户情感倾向),还能发现传统方法难以捕捉的潜在需求(例如隐藏的消费场景或未被满足的功能痛点)。尤其是结合时序分析预测市场趋势,为企业提供了动态调整产品策略的敏捷性,真正实现了从“经验决策”到“智能决策”的跨越。若想进一步突破,可考虑以下优化方向: 1. 多模态数据融合:除文本数据外,整合图片/视频的视觉分析(如通过 CV 技术识别爆款产品的外观设计共性),或结合语音数据(如直播带货中的实时用户反馈),构建更立体的卖点模型。 2. 因果推理增强:当前 AI 多聚焦相关性分析,可引入因果发现算法(如 DoWhy 框架),区分“真实卖点”与“伴随现象”。例如某款手机壳销量高是因为颜色,还是因与热门手机型号捆绑销售? 3. 个性化适配引擎:根据企业自身资源禀赋(供应链能力、品牌定位)对 AI 建议进行权重优化。例如小型厂商可优先推荐“低改造成本的高需求卖点”,避免直接对标头部品牌的资源密集型方案。 4. 对抗性验证机制:构建虚拟消费者模拟环境,对 AI 提出的卖点进行 A/B 压力测试,提前评估市场风险,避免出现“数据过拟合导致的伪创新”。
2025-04-11