Navigate to WaytoAGI Wiki →
Home/All Questions
perplexity
Perplexity 是一个与自然语言处理相关的指标。 首先,文章提到作者因项目需要关注 transformer 相关进展,并计划从算法(包括 NLP、CV、多模态下的 transformer 网络结构)、训练(transformer 的分布式训练)、部署(transformer 的 tvm 量化与推理)五个方面介绍 transformer,本系列的第一篇侧重介绍 NLP 中常用的 perplexity 指标的含义。 文中会先从熟悉的 entropy 指标开始,逐步介绍针对自然语言的改进版 Ngram Entropy 指标,最后介绍 perplexity 指标。 关于 perplexity 指标是否越低越好,在 XLNet 论文中提到越低的 perplexity 可能会损害下游任务的精度,而在 RoBERTa 论文中则指出对于像 RoBERTa 这样 encoderonly 结果的网络,perplexity 越低在 NLU 任务表现就越好。因此,perplexity 是不错的引领性指标,但最终的判别标准还是得结合下游任务表现一起考察。 总的来说,Perplexity、CrossEntropy、Bits Per Character 都是围绕熵来刻画语言模型的信息量和复杂度。最后作者强烈推荐阅读《Evaluation Metrics for Language Modeling》,并表示自己刚上手 transformer 相关内容,难免有错,欢迎指正。如果想了解更多关于 transformer 的知识,可以关注作者。
2025-01-22
我需要一个能帮助写年终报告的AI
以下是一些关于利用 AI 帮助写年终报告的信息: 在金融服务业中,生成式 AI 能够帮助金融服务团队改进内部流程,简化财务团队的日常工作。它可以从更多数据源获取数据,并自动化突出趋势、生成预测和报告的过程。例如,在预测方面,能帮助编写公式和查询,发现模式并为预测建议输入;在报告方面,能自动创建文本、图表等内容,并根据不同示例调整报告。此外,在会计和税务、采购和应付账款方面也能提供帮助,如综合总结税法和潜在扣除项,自动生成和调整合同等。 安迪分享了一个实战案例,通过将过去写的文章发给 AI 总结写作特点,编写提示词来克隆自己的写作风格,从而让 AI 代替自己写“手写信”,大大提高了效率。 对于个人博客,在接触 AI 之前输出困难,而 AI 提供了不同的思路和视角,让写作变得可执行可操作。当 AI 能在几分钟内生成详细报告时,能节省大量时间和精力。但在与 AI 合作中也会面临一些问题,如如何掌控 AI 使其成为得力助手,如何应对超出理解范围的解决方案等。
2025-01-22
什么软件能把扫描件中的签字抹除
目前在 AI 领域,暂时没有专门针对扫描件中签字抹除的特定软件。但一些图像处理软件如 Adobe Photoshop 可能具备相关的功能,不过这需要一定的图像处理技能和知识。另外,需要注意的是,未经授权擅自抹除扫描件中的签字可能涉及法律问题,请在合法合规的前提下进行相关操作。
2025-01-22
本地部署大模型
以下是关于本地部署大模型的详细步骤: 1. 部署大语言模型: 下载并安装 Ollama: 根据电脑系统,从 https://ollama.com/download 下载 Ollama。 下载完成后,双击打开,点击“Install”。 安装完成后,将 http://127.0.0.1:11434/ 复制进浏览器,若出现相关字样则表示安装完成。 下载 qwen2:0.5b 模型(若设备充足可下载更大模型): Windows 电脑:点击 win+R,输入 cmd 点击回车。 Mac 电脑:按下 Command(⌘)+Space 键打开 Spotlight 搜索,输入“Terminal”或“终端”,选择“终端”应用程序。 复制相关命令行,粘贴进入并回车,等待自动下载完成。 2. ComfyUI ollama 本地大模型部署: 先下载 ollama 安装,安装完成后可在电脑桌面右下角或隐藏图标中找到。 下载对应的模型,选择模型并复制对应的命令。 打开命令行界面,输入对应的模型获取命令,等待下载完成。 模型下载后会保存到 D:\\ollama\\blobs 。 进行 docker 安装,安装会下载一些文件,安装后更改目录,不要放在 C 盘。 进行 Open webui 安装,输入相关命令,安装成功后回到 docker,点击会自动打开网页,第一次使用需注册账号,选择下载好的模型即可开始使用。 3. 错误解决: 端口占用问题,在 Windows 上可能出现,运行相关两条命令可解决。 4. 相关链接: comfyuiollama:https://github.com/stavsap/comfyuiollama?tab=readmeovfile Ollama:https://ollama.com/ docker:https://www.docker.com/ Open webui:https://openwebui.com/ 此外,还有一篇思路来源于视频号博主黄益贺的相关内容,作者按照其视频进行了实操并附加了一些关于 RAG 的额外知识。文中提到读完本文可以学习到如何使用 Ollama 一键部署本地大模型、通过搭建本地聊天工具了解 ChatGPT 信息流转、RAG 的概念及核心技术、通过 AnythingLLM 软件搭建完全本地化的数据库等内容。虽然大多数人不需要自己部署大模型,但期望通过本文的指导能够折腾一遍,从而做到知其然且知其所以然。
2025-01-22
如何做一款专属某行业的AI
要开发一款专属某行业的 AI ,可以参考以下要点: 1. 学习模式:AI 应像人类一样学习,例如在医疗保健领域,创建具有潜在空间层次结构的堆叠 AI 模型,反映对每个基本元素的理解或预测能力,可能会以与人脑皮层类似的方式发展,并针对特定任务专门设计神经架构。 2. 特定领域专家 AI:创建特定领域的专家 AI 比创建全能 AI 更容易,预计会创造许多专家 AI ,它们在编码、数据和测试方面采用多样化方法,并提供多种意见。 3. 现实世界互动:让熟练的人类专家配备可穿戴设备,收集现实世界的互动供 AI 学习,同时避免复制危险的偏见。 4. 模型生态系统:以医疗保健为例,应投资创建像优秀医生和药物开发者那样学习的“专家”AI 模型生态系统。成为顶尖人才通常从多年密集信息输入和正规教育开始,再通过学徒实践,AI 学习也应如此,通过堆叠模型训练,而非仅依靠大量数据。 5. 行业调研报告: 步骤:让 AI 阅读学习优秀行业调研报告,总结方法论和操作框架;询问收集行业数据时所用的一手和二手数据及靠谱资料收集网站;要求 AI 推荐行业信息网站和微信公众号,并输出行业调研报告框架;丰富框架每一章节内容。 注意事项:使报告有深度可通过自身对行业的了解整理深度洞察和见解,或深度咨询 AI 并借助其知识学习、研究和总结。 以上是关于如何做一款专属某行业的 AI 的相关内容。
2025-01-22
想写网络小说如何找到合适的AI工具
如果您想写网络小说并找到合适的 AI 工具,以下是一些建议和相关信息: 将小说制作成视频的流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 相关工具及网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。 网址:https://github.com/StabilityAI 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。 网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。 网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。 网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。 网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。 网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。 网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。 网址:https://www.aihub.cn/tools/video/gushiai/ 关于用 AI 写出更好文字的方法: 1. 通过 prompt 中的描述与词语映射到预训练数据中的特定类型的文本,从而得到想要的相似样本。直接点出这种东西常常出现在什么地方,是什么。比如,要写的小说可能是“充满张力的女性复仇文,可能会出现在晋江文学城或者起点中文网的古代言情分类中”。 2. 对于短剧剧本创作这类困难任务,可以让模型写一种特殊格式的网络小说,剩下的尽量显式地描述想要的东西的特征。 3. 往 prompt 里面塞例子,这是一个暴力但是管用且流行的办法。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-01-22
chatgpt如何使用
以下是关于 ChatGPT 的使用方法: 1. 英文学习使用: 推特博主分享的 GPT 工作流,先将特定 prompt 喂给 ChatGPT(建议开新对话专门用于学习英文)。 ChatGPT 会扮演美国好朋友,对输入的英文和中文表达返回更地道的表达,对俚语部分加粗,还会举一反三给出更多例子。 输入特定语句,ChatGPT 会输出对话回顾并建议 3 个任务强化记忆。 建议使用方式:开一个窗口复制 prompt,手机端打开历史记录,点右上角耳机图标打电话,既能练口语又能练听力,结束后看回顾帮助阅读。 群友在讯飞上做了类似尝试,效果不错。 2. 苹果系统安装、订阅使用: 在 AppleStore 下载 ChatGPT,中国区需切换到美区,美区 AppleID 注册教程参考知乎链接: 。 支付宝购买苹果礼品卡:打开支付,地区切换到美区任意区,找到品牌精选 折扣礼品卡,点击大牌礼品卡,下滑找到 App Store&iTunes US 礼品卡,按需购买,建议先买 20 刀。 支付宝购买礼品卡后,在 apple store 中兑换礼品卡,然后在 chatgpt 中购买订阅 gpt plus,中途不想订阅可在订阅列表中取消。 3. 使用 ChatGPT 4o: 开启对话:打开 ChatGPT 应用或网页,点击开始对话,会员在苹果或安卓手机购买的,电脑上能登录。 体验最新语音对话功能:版本切到 ChatGPT 4o,点击右下角“耳机?”图标,选择一个声音即可体验流畅的语音对话。
2025-01-22
将段落文字转为图形的工具叫什么?
以下是一些可以将段落文字转为图形的工具: LayerStyle 副本:从文字生成图片以及遮罩。支持字间距、行间距调整,横排竖排调整,可设置文字的随机变化,包括大小和位置的随机变化。具有多种节点选项,如 size_as、font_file、spacing、leading 等。 Cartwheel:文本转 3D 动画工具,输入文字提示即可生成适用于多种用途的 3D 动画角色,支持指定动作,可以导出到任何 3D 程序中编辑。目前处于早期阶段,还在测试阶段,需排队。
2025-01-22
flux inpainting 是怎么基于diffusersion train的inpainting
Flux inpainting 基于 diffusion train 的 inpainting 通常涉及以下方面: 训练扩散模型在特定的表示上,能够在降低复杂度和保留细节之间达到最优平衡点,显著提高视觉保真度。在模型架构中引入交叉注意力层,使其成为强大且灵活的生成器,能够处理诸如文本和边界框等一般条件输入,实现基于高分辨率卷积的合成。 关于 Midjourney 的训练 prompt 方面: Midjourney 会定期发布新的模型版本以提高效率、连贯性和质量。最新模型是默认的,但也可以通过 version 或 v 参数或使用 /settings 命令选择其他模型版本。不同模型在不同类型的图像上表现出色。Midjourney V5 模型是最新且最先进的模型,于 2023 年 3 月 15 日发布。使用该模型可在 prompt 末尾添加 v 5 参数,或通过 /settings 命令选择 MJ Version 5。该模型具有很高的连贯性,擅长解释自然语言 prompt,分辨率更高,并支持诸如 tile 等高级功能。V5 基础模型具有更广泛的风格范围、对 prompt 响应更灵敏、图像质量更高(分辨率提高 2 倍)、动态范围改进、图像细节更丰富且更准确、文本干扰更少等新特点,还支持 tile 参数实现无缝平铺(实验性)、支持大于 2:1 的 ar 宽高比(实验性)、支持 iw 权衡图像 prompt 与文本 prompt 以及特定的风格和 prompt 方式。
2025-01-22
mj提示词
以下是关于 MJ 提示词的相关内容: 1. MidJourney 图片生成大师能够根据您的故事内容创作出全面的分镜提示词,包括分镜描述、人物描述、环境描述、氛围描述、灯光描述、色彩描述、构图描述、风格描述等。还会考虑您所使用的相机类型、摄影风格和镜头位置,您分享故事内容和具体需求即可获得专业服务。 2. 在提示词中,文本前置、后置等效果相近,过长的文本难以控制文本出现的位置,建议只要求 AI 生成部分主要文本内容,自行嵌字仍是当前最佳方法。加入引号“”包裹文本能达到 MJ 生成文字的效果,不必要特殊说明“生成一段文本......”等内容。MJ 能够自行判断文本应当存在的位置,会将文本安排在符合逻辑的位置上。后续有机会可进一步测试【局部重绘】能否控制文本在规定位置出现。总结来说,MJ 进行文本输出任务,提示词没有特别固定的语法结构,只需要认识其文本生成的能力范围和使用场景,即可高效应用 V6 模型生成有趣画面内容。 3. 让 Claude 出 MJ 提示词的提示词结构是:让大模型告诉你如何出 MJ 提示词效果会更好+让大模型出提示词+加上一些要求。先让大模型告诉你如何出 MJ 提示词效果会更好,因为大模型输出的过程也是思考的过程,所以对大模型循循善诱效果更好。对于有名的产品,如奔驰 E300L,每个出图的提示词都需包含“奔驰 E300L”。再加上一些要求,比如参数“ar 16:9”是要求 MJ 生成比例图片 16:9 的宽频图片,“q 2”是画面质量最高的参数。出 MJ 提示词还有更方便好用的办法,就是使用 chatgpt 里面的 gpts,如“Mid Journey V6 Prompt Creator”。可以理解为:chatgpt 是手机安卓系统,gpts 就是手机里的 app,不同的 gpts 能实现不同的功能,有的能绘画,有的能帮您总结文献,有的能生成更专业的 MJ 提示词。
2025-01-22