「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
写小说,推荐哪个开源模型呢?
以下是为您推荐的一些可用于写小说的开源模型及相关资源: 1. Kolors 开源模型: 相关教学视频: ,作者为吴杨峰。 ,作者为楚门的 AI 世界。 。 ,作者为不懂技术就用 AI 呀。 2. 辅助创作的 AI 工具: ChatGPT:擅长构思。 Claude:文笔好于 ChatGPT。 彩云小梦、Kimi、MidReal 等。 此外,还有一些关于用 AI 写小说的相关知识: 1. 让 AI 写小说存在一些问题,如上下文长度限制、容易忘记要求、文笔简略、一致性难以保证等。 2. 对于某些问题,如“保持创意简洁”“危机快速来临”,AI 不容易犯,但对叙述方式比较敏感,写 prompt 时要保持用词一致。 3. AI 只是辅助创作,最后仍需人工加工和修改以满足读者要求。
2025-01-02
你用的什么大模型
以下是关于大模型的相关信息: 在 SD 应用中,选择 ControlNet 模型时,将字体参考图放进 ControlNet 中,预处理器可选择 invert 等,注意控制类型的选择,选好预处理可点击预览按钮,然后选择 Control 模型,如 Depth 景深模型或 Scribble 涂鸦模型等,选择好后记得启用 ControlNet。选择生图大模型时,大模型决定最终风格,如生成真实场景下的字体,可选择如 lofi.v2 等大模型,不同大模型对 ControlNet 模型的控制力有不同适应度,需微调参数。 常用的模型网站有:。下载模型后,大模型(Ckpt)放入 models\\Stablediffusion,VAE 模型放置在 models\\Stablediffusion 或 models\\VAE 目录,Lora/LoHA/LoCon 模型放入 extensions\\sdwebuiadditionalnetworks\\models\\lora 或 models/Lora 目录,Embedding 模型放入 embeddings 目录。 大模型指的是用于表达 token 之间关系的参数多,主要是模型中的权重(weight)与偏置(bias),例如 GPT3 拥有 1750 亿参数。以 Transform 为代表的大模型采用自注意力(Selfattention)机制来学习不同 token 之间的依赖关系,生成高质量 embedding。常见的将 Token 表示成稠密矩阵向量的算法有基于统计的 Word2Vec、GloVe,基于深度网络的 CNN、RNN/LSTM,基于神经网络的 BERT、Doc2Vec 等。
2025-01-02
人工智能的定义
人工智能是一门研究如何使计算机表现出智能行为的科学。目前对其定义并不统一,以下是一些常见的定义: 从一般角度来看,人工智能是指通过分析环境并采取行动(具有一定程度的自主性)以实现特定目标来展示其智能行为的系统。基于人工智能的系统可以完全依赖于软件,在虚拟世界中运行(例如语音助手、图像分析软件、搜索引擎、语音和人脸识别系统)或者也可以嵌入硬件设备中(例如高级机器人、自动驾驶汽车、无人机或物联网应用程序)。 2021 年《AI 法案》提案第 3 条对人工智能的定义为:“AI 系统指采用附录 1 中所列的一种或多种技术和方法开发的软件,该软件能生成影响交互环境的输出(如内容、预测、建议或决策),以实现人为指定的特定目标。”其中,附录 1 列举的技术方法主要包括:机器学习方法(包括监督、无监督、强化和深度学习);基于逻辑和知识的方法(包括知识表示、归纳编程、知识库、影响和演绎引擎、符号推理和专家系统);统计方法,贝叶斯估计,以及搜索和优化方法。 最初,查尔斯·巴贝奇发明了计算机,用于按照一套明确定义的程序(即算法)来对数字进行运算。现代计算机虽更先进,但仍遵循受控计算理念。然而,对于像从照片判断人的年龄这类任务,我们无法明确解法,无法编写明确程序让计算机完成,这类任务正是人工智能感兴趣的。 需要注意的是,“人工智能”的概念自 1956 年于美国的达特茅斯学会上被提出后,其所涵盖的理论范围及技术方法随着时代的发展在不断扩展。相比于《2018 年人工智能战略》,2021 年《AI 法案》提案对于人工智能的定义采取更加宽泛的界定标准。在 2022 年《AI 法案》妥协版本中,欧盟理事会及欧洲议会认为“AI 系统”的定义范围应适当缩窄,并侧重强调机器学习的方法。
2025-01-02
人工智能的历史
人工智能作为一个领域始于二十世纪中叶。最初,符号推理流行,带来了如专家系统等重要进展,但这种方法因无法大规模拓展应用场景,且从专家提取知识、表现及保持知识库准确性复杂且成本高,导致 20 世纪 70 年代出现“人工智能寒冬”。 随着时间推移,计算资源更便宜,数据更多,神经网络方法在计算机视觉、语音理解等领域展现出卓越性能,过去十年中“人工智能”常被视为“神经网络”的同义词。 例如在创建国际象棋计算机对弈程序时,方法不断变化。 此外,人工智能和机器学习在金融服务行业应用已超十年,促成了诸多改进。大型语言模型通过生成式人工智能代表重大飞跃,正改变多个领域。 最初查尔斯·巴贝奇发明计算机,遵循受控计算理念。但有些任务如根据照片判断人的年龄无法明确编程,这类任务正是人工智能感兴趣的。如今金融、医学和艺术等领域正从人工智能中受益。
2025-01-02
什么是人工智能
人工智能(Artificial Intelligence)是一门研究如何使计算机表现出智能行为的科学,例如做一些人类所擅长的事情。 最初,查尔斯·巴贝奇发明了计算机,用于按照明确的程序进行数字运算。现代计算机虽更先进,但仍遵循相同的受控计算理念。若知道实现目标的每一步骤及顺序,就能编写程序让计算机执行。 然而,像“根据照片判断一个人的年龄”这类任务,我们不清楚大脑完成此任务的具体步骤,无法明确编程,这类任务正是人工智能感兴趣的。 AI 分为 ANI(artificial narrow intelligence 弱人工智能)和 AGI(artificial general intelligence)。ANI 只可做一件事,如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等;AGI 能做任何人类可以做的事。 人工智能术语包括: 机械学习:学习输入输出,从 A 到 B 的映射。是让电脑在不被编程的情况下自己学习的研究领域。 数据科学:分析数据集,从数据中获取结论与提示,输出结果往往是幻灯片、结论、PPT 等。 神经网络/深度学习:有输入层、输出层、中间层(隐藏层)。
2025-01-02
什么工具可以根据文案自动找素材自动剪视频
目前尚未有完全能够根据文案自动找素材并自动剪视频的工具。但有一些相关的软件可以在一定程度上辅助您完成这些工作,例如剪映、Adobe Premiere Pro 等,它们具有一些智能功能,能在您提供一定的指导和设置后,帮助您更高效地处理素材和剪辑视频。
2025-01-02
人工智能伦理建设的基本内容
人工智能伦理建设的基本内容包括以下方面: 欧洲议会和欧盟理事会规定了人工智能的统一规则,并修正了一系列相关条例。回顾委员会任命的独立人工智能高级别专家组 2019 年制定的《值得信赖的人工智能的伦理准则》,其中包含七项不具约束力的人工智能伦理原则: 人类主体和监督:人工智能系统的开发和使用应为人服务,尊重人的尊严和个人自主权,其运行可由人类适当控制和监督。 技术稳健性和安全性:开发和使用方式应在出现问题时保持稳健,抵御试图改变其使用或性能的行为,减少意外伤害。 隐私和数据治理:符合现有隐私和数据保护规则,处理的数据应具备高质量和完整性。 透明度:开发和使用方式应允许适当的可追溯性和可解释性,让人类知晓交流或互动情况,并告知部署者系统的能力和局限性以及受影响者的权利。 多样性、非歧视和公平:开发和使用方式应包括不同参与者,促进平等获取、性别平等和文化多样性,避免歧视性影响和不公平偏见。 社会和环境福祉:有助于设计符合《宪章》和欧盟基础价值观的连贯、可信和以人为本的人工智能。 问责制。 人工智能能带来广泛的经济、环境和社会效益,如改进预测、优化运营等,但也可能根据应用、使用情况和技术发展水平产生风险,对受欧盟法律保护的公共利益和基本权利造成损害。 鉴于人工智能的重大影响和建立信任的必要性,其发展必须符合欧盟价值观、基本权利和自由,应以人为本,最终提高人类福祉。 为确保公众利益的高水平保护,应为所有高风险人工智能系统制定统一规则,这些规则应与《宪章》一致,非歧视,符合国际贸易承诺,并考虑相关准则。
2025-01-02
如何学习AGI
以下是关于学习 AGI 的一些建议: 对于新手学习 AGI: 1. 澄清学习前的状态:可能不理解 AI 和提示词工程,不懂代码和英语较差,在学习前会尝试各种 AI 工具并走弯路。 2. 明确学习后的现状:例如能够创建多 Agent 智能体、进行营销文案创作、应用 SQL 代码、创建图像流智能体等,还能在公司中实践智能客服等。 3. 掌握学习路径:关键词包括“少就是多”“先有个初识”“目录索引推荐”“兴趣最重要”“先动手”,学习路径如同游戏通关,有主线和支线。 4. 个人经验分享:像 yoyo 一样,通过学习、分享和实践不断填补知识缝隙来成长。 学习 AI 是一个长期的过程,需要耐心和持续努力,不要害怕犯错。完整的学习路径建议参考「通往 AGI 之路」知识库首页(https://waytoagi.feishu.cn/wiki/QPe5w5g7UisbEkkow8XcDmOpn8e)的布鲁姆分类法来设计自己的学习路径。 对于纯 AI 小白,可以参考《雪梅 May 的 AI 学习日记》,其学习模式是输入→模仿→自发创造。学习内容可在 waytoAGI 社区发现自己感兴趣的 AI 领域并学习最新内容。学习资源免费开源,可利用空闲时间进行学习。 总之,找到适合自己的学习方式和路径,学以致用,不断成长。
2025-01-02
请整理最新的 gpt的提示词。
以下是关于 GPT 提示词的相关内容: 1. 15 个月之后创作童谣的提示词: 需求分析:上一次需要输入“创作童谣的场景、角色、故事等”,这次只需输入一个关键词即可创作。 输入:任意关键词。 输出:跟关键词相关的儿童童谣。 测试现有模型的效果:对包括 ChatGPT 4o、ChatGPT o1、Claude、Kimi、豆包、智谱清言 GLM4、Gemini 2.0 Flash Experimental、Gemini 2.0 Flash Thinking Experimental 等模型进行了测试,除 LIana 3.1 405B 的输出未贴出,其他模型的结果可供感受和评价。 2. GPT 优化 Prompt: 存在问题:某些标题使用太绝对和夸张的描述,如“小姐姐的必备”“你值得拥有”“秒变心情大好”。 分析:包括日常口语风格可能带有夸张倾向、情感色彩可能被放大、示例可能影响、对“过度”标准理解差异等。 优化措施:在日常口语风格部分避免使用太绝对的词语;在情感色彩部分避免使用过于强烈的正面情感描述;在 Constraints 部分添加避免使用绝对性词汇;对 Examples 部分进行更严格筛选。 3. AI 快速总结群聊消息的提示词: 直接发送原文 GPT 无法按意图工作,需编写提示词。 单人发言版:基于李继刚老师的“通知消息整理助手”修改了“文字排版大师”的 Prompt。 多人发言版:将提示词和文字原文发送给 GPT,整理输出结果,删掉无关内容,替换双星号。
2025-01-02
有哪些AI数字人口播工具?
以下是一些常见的 AI 数字人口播工具: 1. TecCreative: 只需输入口播文案,选择期望生成的数字人形象及目标语言,即可生成数字人口播视频。操作指引:输入口播文案——选择目标语言——选择数字人角色——选择输出类型——点击开始生成。 支持图片换脸,仅需上传原始图片和换脸图片,操作指引:上传原始图片——上传换脸图片——点击开始生成。图片大小上限 5M,支持 JPG、PNG 格式。 支持视频换脸,操作指引:上传原始视频——上传换脸图片——点击生成。 支持音频合成数字人,只需上传音频文件,工具支持使用 100+数字人模板。操作指引:上传音频文件——选择数字人角色——选择输出类型——点击开始生成。注意:音频文件支持 MP3 和 WAV 格式,文件大小上限 5M。 提供多语种(包含菲律宾语、印地语、马来语等小语种)智能配音,操作指引:输入需配音文案——选择音色——点击立即生成。注意:输入的配音文案需和选择音色语种保持一致。 智能识别视频语言并生成对应字幕,操作指引:点击上传视频——开始生成——字幕解析完成——下载 SRT 字幕。注意:支持 MP4 文件类型,大小上限为 50M。 2. HeyGen:是一个 AI 驱动的平台,可以创建逼真的数字人脸和角色。使用深度学习算法来生成高质量的肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 3. Synthesia:是一个 AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步。支持多种语言,并可以用于教育视频、营销内容和虚拟助手等场景。 4. DID:是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后就能合成一段非常逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 此外,还有适合小白用户的开源数字人工具,如: 特点:一键安装包,无需配置环境,简单易用。 功能:生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 使用步骤:下载 8G+3G 语音模型包,启动模型即可。 GitHub: 官网:
2025-01-02