Chat with Wiki - WayToAGI

Navigate to WaytoAGI Wiki →

Home/All Questions

我想做一个专用的智能体，帮助我挑选英语学习材料，应该怎么办？请说明详细的流程。

以下是创建一个能帮助您挑选英语学习材料的专用智能体的详细流程： 1. 人设与回复逻辑角色定位为专业且贴心的英语学习助手。每日为您精心挑选最新、最实用的地道英语口语表达。通过搜索、筛选、分析、解释及与您的互动，助力您提升英语口语能力。 2. 主要技能搜索筛选口语表达：运用短语音识别极速版和通用文字识别高精度版工具，高效准确地从海量资源中精选出符合您需求和学习阶段的最新、实用的地道英语口语表达。分析解释口语：深入剖析口语表达的使用场景和语境，结合实例为您提供清晰、详尽且易于理解的解释，让您直观感受其用法。每日分享与互动：每日生成一条包含口语表达、解释、使用场景、例句和练习建议的分享内容。以可爱的符号和统一的格式输出，提升阅读体验，并积极与您进行简单互动，倾听您的学习需求和反馈，持续优化分享内容。 3. 限制仅分享地道、实用且符合英语母语者表达习惯的口语内容。严格遵循输出格式和内容要求，不得随意更改。充分利用提供的工具，确保分享内容的高质量和有效性。避免使用生僻、复杂或过于学术的语言。例如，按照以下格式分享内容：

生成AI视频的提示词如何优化更好

以下是关于优化生成 AI 视频提示词的一些方法： 1. 详细描述各部分：例如将“一只小狗在草地上散步”拓展为“一只金色毛发的狗悠然自得地在阳光洒满的草地上行走，草叶轻轻地在它的爪下弯曲。微风拂过，它的毛发随风轻动，时不时低下头嗅闻着大地。远处，夕阳的余晖拉长了影子，营造出一种宁静祥和的氛围”，增加对主体、环境和动作的详细描述，能使生成的视频更稳定、提升美感。 2. 调整不满意结果：用具体动作表达代替抽象表达，如“踱步>走到画面右侧”“小狗让他开心>小狗摇尾巴，男人脸上出现微笑”等。把重点想表达的内容前置，精简提示词，删去不重要部分。获得稳定结果后，可增加更多配合动作和运镜，如将“一个男人在冲浪，镜头跟随他的运动”修改为“一个男人在冲浪，镜头跟随他的运动，镜头特写他的脸部，他对着镜头竖大拇指”。 3. 合理运用基础参数：选择固定相机后镜头会保持不动，未选择则倾向生成带有运镜的视频，可通过在提示词里加入环绕、镜头拉远等描述控制运镜。默认开启提示词增强会对输入的提示词进行修改以获得更大运动效果，关闭则遵循输入的提示词生成视频。 4. 利用海螺 AI 的功能：海螺 AI 视频模型能识别图片、理解指令，不依靠特效模板实现惊艳特效，呈现细腻表情，还上线了提示词优化功能，开放 2000 字的提示词空间，为创作者提供更多发挥空间。同时，为达到更好效果，设计了两类 Prompt 的参考公式。

AI对HR的帮助

AI 对 HR 有以下帮助： 1. 在招聘方面：处理大量候选人简历时，自动化工具可提升筛选工作的效率和准确性，减少人力资源部门的工作负担，提高招聘效率。降低因人为错误导致的招聘成本浪费，节约企业成本。 AI 赋能的全链路招聘流程，通过大模型的深度参与，显著提升招聘效率和候选人体验，优化整体业务效能。 2. 存在潜在风险及应对策略：公司需要采取战略性的应对措施，如更新人力资源程序以限制潜在的不同影响；对人力资源技术提供商进行尽职调查；修改当前的人力资源隐私声明，以符合国家隐私或 AI 相关法规；对 AI 的训练数据进行审查，确保其质量并无偏差；告知申请人有关数据收集和 AI 筛选流程的细节，保障其信息透明度；提供合理的便利措施，确保残障申请人和其他少数群体不会被排除在外；定期评估 AI 筛选结果，发现任何潜在的歧视并及时优化。 3. 具体工作场景案例：团队绩效管理：根据团队和个人的绩效的往期数据，分析员工绩效排名，输出绩效考评和迭代改进建议。面试工具：开发使用 GPT4 技术的实时转录工具，帮助求职者在面试中生成完美的回答。

Dreamface数字人

以下是关于 Dreamface 数字人的相关信息：生成数字人：在剪映右侧窗口顶部打开“数字人”选项，选取免费且适合的数字人形象，如“婉婉青春”。选择后软件会播放其声音，可判断是否需要，点击右下角“添加数字人”将其添加到当前视频中，软件会生成对应音视频并添加到轨道中，左下角会提示渲染完成时间，可点击预览查看效果。增加背景图片：可删除先前导入的文本内容，为视频增加背景图片。点击左上角“媒体”菜单并“导入”选择本地图片上传，将图片添加到视频轨道上（会覆盖数字人），将轨道右侧竖线向右拖拽使其与视频对齐，选中轨道后可调整图片尺寸和数字人位置。虚拟数字人的分类和驱动方式：虚拟数字人通过各种技术创造，具有人类特征，呈现为虚拟形象。从驱动层面分为中之人驱动和 AI 驱动。中之人驱动运用动作捕捉和面部捕捉技术实现交互，有上限且缺乏高并发和量产化能力；AI 驱动使用 AI 技术创建、驱动和生成内容，赋予感知和表达等交互能力。从应用层面可分为服务型、表演型和身份型。服务型如虚拟主播、助手、教师、客服和医生等，表演型如虚拟偶像，身份型是物理世界“真人”的数字分身。构建高质量 AI 数字人的要点： 1. AI Agent：要让数字人像人一样思考需编写类似人的 Agent，记忆模块、工作流模块和工具调用模块的构建是挑战。 2. 驱动躯壳的实现：定义灵魂部分接口，躯壳通过 API 调用，方式视躯壳实现而定。包含情绪的语音表达及保证躯壳口型、表情、动作和语音的同步及匹配，目前主流方案只能预设表情动作和做逻辑判断播放预设，语音驱动口型相对成熟但闭源。 3. 实时性：数字人算法组成庞大，几乎不能单机部署，算法一般部署到额外集群或调用 API，网络耗时和模型推理耗时会影响体验，低延时是需解决的问题。 4. 多元跨模态：仅语音交互不够，可根据需求添加其他感官，如通过摄像头数据获取视觉信息并做图像解析。 5. 拟人化场景：正常与人交流非线性，插话、转移话题等情况需通过工程丝滑处理。

数字人是运用数字技术创造出来的人，虽现阶段不能像科幻作品中的人型机器人那样高度智能，但已在各类生活场景中出现，且随着 AI 技术发展正迎来应用爆发。目前业界对数字人没有准确定义，一般可根据技术栈分为真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情，主要应用于影视行业及直播带货，其表现质量与手动建模精细程度及动捕设备精密程度直接相关，不过视觉算法进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。制作数字人的工具主要有： 1. HeyGen：AI 驱动的平台，可创建逼真数字人脸和角色，使用深度学习算法生成高质量肖像和角色模型，适用于游戏、电影和虚拟现实等。 2. Synthesia：AI 视频制作平台，允许创建虚拟角色并进行语音和口型同步，支持多种语言，用于教育视频、营销内容和虚拟助手等场景。 3. DID：提供 AI 拟真人视频产品服务和开发，上传人像照片和输入内容，平台的 AI 语音机器人自动转换成语音并合成逼真会说话的视频。更多数字人工具请访问网站查看：https://www.waytoagi.com/category/42 。使用这些工具时，请遵守相关使用条款和隐私政策，注意生成内容的版权和伦理责任。以下是一些包含数字人的节目单示例： 1. 节目“猜真人”：魔术互动类表演，2 个、8 个数字分身，分辨哪个是真正的我，需求技术为 AI 数字人。 2. 节目“亲情的应用场景（逝者）”：女儿打扫房间扫到去世父亲二维码再次对话，涉及 AI 分身积累准备。 3. 节目“AI 转绘”：经典电影混剪，涉及短片素材、AI 转绘、Lora 等。 4. 节目“AI 贺岁”：晚会中场致谢，包括共创团队记录、新年祝福等。 5. 节目“打工人共情”：涉及 AI 素材、共情脚本、炫技视频剪辑等。

如何部署私有大语言模型？

部署私有大语言模型通常包括以下步骤： 1. 部署大语言模型：下载并安装 Ollama：根据您的电脑系统，从 https://ollama.com/download 下载 Ollama。下载完成后，双击打开，点击“Install”。安装完成后，将下方地址复制进浏览器中。如果出现下方字样，表示安装完成：http://127.0.0.1:11434/。下载模型：如 qwen2:0.5b 模型（0.5b 是为了方便测试，下载快，自己设备充足的话，可以下载更大的模型）。如果是 Windows 电脑，点击 win+R，输入 cmd，点击回车；如果是 Mac 电脑，按下 Command（⌘）+Space 键打开 Spotlight 搜索，输入“Terminal”或“终端”，然后从搜索结果中选择“终端”应用程序。复制相关命令行，粘贴进入，点击回车。等待下载完成。 2. 部署 Google Gemma：进入 ollama.com，下载程序并安装（支持 windows，linux 和 macos）。查找 cmd 进入命令提示符，输入 ollama v 检查版本，安装完成后版本应该显示 0.1.26，cls 清空屏幕。直接输入 ollama run gemma 运行模型（默认是 2b），首次需要下载，需要等待一段时间，如果想用 7b，运行 ollama run gemma:7b 。完成以后就可以直接对话。 3. 关于 Ollama 的其他特点：支持多种大型语言模型，包括通义千问、Llama 2、Mistral 和 Gemma 等，适用于不同应用场景。易于使用，适用于 macOS、Windows 和 Linux 系统，同时支持 cpu 和 gpu。提供模型库，用户可从中下载不同模型，满足不同需求和硬件条件。模型库可通过 https://ollama.com/library 查找。支持自定义模型，可修改模型的温度参数等。提供 REST API，用于运行和管理模型，以及与其他应用程序的集成选项。社区贡献丰富，包括多种集成插件和界面。总的来说，Ollama 是一个方便用户在本地运行和管理大型语言模型的框架，具有良好的可扩展性和多样的使用场景。安装完之后，确保 ollama 后台服务已启动（在 mac 上启动 ollama 应用程序即可，在 linux 上可以通过 ollama serve 启动）。可以通过 ollama list 进行确认。

请介绍下WaytoAGI

WaytoAGI 是由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库。它具有以下特点和成就： 1. 涵盖多个版块：包括 AI 绘画、AI 视频、AI 智能体、AI 3D 等，还包含赛事和活动促进大家动手实践。 2. 拥有广泛影响力：在没有任何推广的情况下，一年时间已有超过 70 万用户和超千万次的访问量，是很多 AI 爱好者知识的源头。 3. 孵化了离谱村项目：离谱村是由 WaytoAGI 孵化的千人共创项目，让大家学习和接触 AI 更容易、更感兴趣，参与者不分年龄层，都能通过 AI 工具创作作品。 4. 社群宗旨明确：社群的 Slogan 是让更多的人因 AI 而强大，有很多学社和共学共建的活动。 5. 访问便捷：打开“waytoagi.com”就可以找到社群。离谱村是一个没有被定义的地方，每个人心中都有自己想象中的离谱村。在这里，想象力是至高无上的法则，奇迹是日常生活的一部分。它不仅是一个物理空间，更是灵魂的避风港，激励着每一个生命体发挥无限的想象力，创造属于自己的独特生活方式。

是什么大模型

大模型通俗来讲，是输入大量语料，让计算机获得类似人类的“思考”能力，从而能够理解自然语言，并进行文本生成、推理问答、对话、文档摘要等工作。大模型的训练和使用过程可以用“上学参加工作”来类比： 1. 找学校：训练大模型需要大量计算，GPU 更合适，只有购买得起大量 GPU 的才有资本训练自己的大模型。 2. 确定教材：大模型需要的数据量特别多，几千亿序列（Token）的输入基本是标配。 3. 找老师：即用合适的算法讲述“书本”中的内容，让大模型更好理解 Token 之间的关系。 4. 就业指导：为了让大模型更好胜任某一行业，需要进行微调（fine tuning）指导。 5. 搬砖：就业指导完成后，正式干活，比如进行翻译、问答等，在大模型里称之为推导（infer）。在 LLM 中，Token 被视为模型处理和生成的文本单位，可代表单个字符、单词、子单词等。Token 会被数字化形成词汇表，便于计算机处理。为让计算机理解 Token 之间的联系，还需把 Token 表示成稠密矩阵向量，这个过程称为 embedding，常见算法有基于统计的 Word2Vec、GloVe，基于深度网络的 CNN、RNN/LSTM，基于神经网络的 BERT、Doc2Vec 等。以 Transform 为代表的大模型采用自注意力（Selfattention）机制来学习不同 token 之间的依赖关系，生成高质量 embedding。大模型的“大”指用于表达 token 之间关系的参数多，主要是模型中的权重（weight）与偏置（bias），例如 GPT3 拥有 1750 亿参数。从原理角度，传统机器学习是 p，但这个通用模型未经人工标注，什么都能学会。给出的 Prompt 其实就是 x，让大模型基于 x 知道概率最大的 y，避免人工标注，但依赖 x 给入的信息，更大概率找到合适的 y。比如给一张照片，输入这是一个动物，这是什么，大模型根据输入提取照片特征和提示，最终返回猫。

我现在有一款产品，想用ai在上面生成不同图形的印刷，有什么ai网站比较适合呢

目前有一些适合用于生成不同图形印刷的 AI 网站，例如：Canva ，它提供了丰富的图形设计模板和工具，能帮助您创作出各种风格的图形；DALL·E2 ，可以根据您的描述生成独特的图像；StableDiffusion ，具有强大的图像生成能力，能满足多样化的图形需求。

帮我创造一副一只小狗在海边溜达的动画

很抱歉，目前提供的内容中没有直接关于创造一只小狗在海边溜达动画的具体方法和资源。但您可以参考以下思路来创作： 1. 明确动画的风格和细节，例如小狗的品种、毛色、动作姿态，海边的景色、天气等。 2. 利用相关的动画制作软件，如 Adobe Animate、Toon Boom Harmony 等。 3. 通过 AI 绘画工具生成小狗和海边的图像素材，再将其整合到动画中。 4. 设计合理的动画帧数和流畅的动作过渡，以展现小狗在海边溜达的生动场景。