直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
我想学习制作机器人 机器狗等的原理及方法,给我一份理论指导和操作指南吧。
以下是关于制作机器人和机器狗的理论指导和操作指南: 具身智能是将机器学习算法适配至物理实体,与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”通过网页端、手机 APP 与用户交互,能接受多种模态指令实现复杂任务。具身智能体则将大模型嵌入物理实体,通过传感器与人类交流,强调与物理环境交互。人形机器人是具身智能的代表产品。 具身智能有三要素: 1. 本体:即硬件载体,不同环境有不同形态的硬件本体适应,如室内平地适用轮式机器人,崎岖地面适用四足机器人(机器狗)。 2. 智能:包括大模型、语音、图像、控制、导航等算法。 3. 环境:本体所交互的物理世界,本体、智能、环境高度耦合是高级智能基础。 具身智能还有四个模块:感知决策行动反馈。一个具身智能体的行动分为这四个步骤,分别由四个模块完成并形成闭环。在具身智能体与环境的交互中,智能算法通过本体传感器感知环境,做出决策操控本体执行动作任务影响环境,还可通过“交互学习”和拟人化思维学习适应环境实现智能增长。
2025-02-26
图片的提示词的精准度
以下是关于图片提示词精准度的相关内容: 画面精度提示词: high detail(高细节) hyper quality(高品质) high resolution(高分辨率) FHD, 1080P, 2K, 4K, 8K 8k smooth(8K 流畅) 渲染效果提示词: Unreal Engine(虚幻引擎) octane render(渲染器) Maxon Cinema 4D 渲染器 architectural visualisation(建筑渲染) Corona Render(室内渲染) Quixel Megascans Render(真实感) VRay(V 射线) Behance C4D 3D blender surreal photography(超现实摄影) realistic 3D(真实 3D) zbrush 在描述图片提示词时,通常的逻辑包括:人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。通过这些详细的提示词,能更精确地控制绘图。 对于新手而言,有以下辅助书写提示词的方法和网站: 下次作图时,先选择模板,点击倒数第二个按钮快速输入标准提示词。 功能型辅助网站,如:http://www.atoolbox.net/,通过选项卡方式快速填写关键词信息。 https://ai.dawnmark.cn/,每种参数有缩略图参考,方便直观选择提示词。 去 C 站(https://civitai.com/)抄作业,每一张图都有详细参数,可点击复制数据按钮,粘贴到正向提示词栏,Stable Diffusion 会自动匹配参数,但要注意图像作者使用的大模型和 LORA,不然即使参数一样,生成的图也会不同。也可以只取其中较好的描述词,如人物描写、背景描述、小元素或画面质感等。 提示词所做的工作是缩小模型出图的解空间,即缩小生成内容时在模型数据里的检索范围,而非直接指定作画结果。提示词的效果受模型影响,不同模型对自然语言、单词标签等语言风格的反应不同。 提示词中可以填写以下内容: 自然语言:可以使用描述物体的句子作为提示词,大多数情况下英文有效,也可用中文,避免复杂语法。 单词标签:使用逗号隔开的单词作为提示词,一般使用普通常见单词,单词风格要和图像整体风格搭配,避免拼写错误,可参考 Emoji、颜文字:Emoji 表情符号准确且在语义准确度上表现良好,对构图有影响。关于 emoji 确切含义,可参考。对于使用 Danbooru 数据的模型,西式颜文字可在一定程度上控制出图的表情。
2025-02-26
那普通人要研发机器狗从哪方面开始学习?
对于普通人想要研发机器狗,以下这些 AI 相关的基础知识是很有帮助的: 1. 了解 AI 的概念:AI 即人工智能,是让计算机模拟人类智能的技术。 2. 掌握机器学习:这是电脑找规律学习的方式,包括监督学习、无监督学习和强化学习。 监督学习:使用有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归任务。 无监督学习:处理没有标签的数据,让算法自主发现规律,例如聚类任务,像将一堆新闻文章按主题或内容特征分组。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训练小狗。 3. 深度学习:这是一种参照人脑构建神经网络和神经元的方法,由于有很多层所以称为深度。神经网络可用于监督学习、无监督学习和强化学习。 4. 熟悉生成式 AI:能够生成文本、图片、音频、视频等内容形式。 5. 了解 LLM(大语言模型):对于生成式 AI,生成图像的扩散模型不属于大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解,像上下文理解、情感分析、文本分类等,但不太擅长文本生成。 6. 关注技术里程碑:例如 2017 年 6 月谷歌团队发表的论文《Attention is All You Need》,首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖循环神经网络或卷积神经网络。 这些基础知识能为您研发机器狗提供理论支持和技术思路。
2025-02-26
普通人怎么研发制作机器狗?
普通人研发制作机器狗具有很大的挑战性,需要具备多方面的知识和技能。以下是一些关键的步骤和要点: 首先,要了解具身智能的概念。具身智能是将机器学习算法适配至物理实体,与物理世界交互的人工智能范式。人形机器人是具身智能的代表产品,而机器狗作为一种具身智能体,其研发涉及到“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界)三要素的高度耦合。 不同的环境需要不同形态的硬件本体来适应。例如,崎岖不平的地面更适用四足机器人(机器狗)。在具身智能体与环境的交互中,智能算法可以通过本体的传感器感知环境,做出决策以操控本体执行动作任务,从而影响环境。 在研发过程中,还需要关注以下方面: 1. 感知决策行动反馈的四个模块,形成一个闭环,以实现机器狗的有效行动。 2. 模拟训练环境的运用,例如像 Jim 团队在模拟环境中训练机器狗,并通过特定的代理和技术,将其转移到现实世界中。 3. 脑电波控制技术,如 MIT 研究团队通过特殊眼镜读取脑电波和眼动来控制波士顿动力机器狗,这为控制方式提供了新的思路。 然而,对于普通人来说,要完成机器狗的研发制作,还需要足够开放的环境、大规模预训练数据和强大的基础模型,这是非常困难的。但如果您有强烈的兴趣和决心,可以通过学习相关的专业知识,逐步积累经验来尝试。
2025-02-26
waytoagi最有价值的是什么
WaytoAGI 最有价值的方面包括: 1. 了解最新的 AI 技术:它如同免费的“技术期刊”,能让人知晓世界最新的 AI 技术动态,还能传授实用技能,并且开源免费。 2. 线上共学与手把手教学:无论基础如何,都能通过线上共学方式找到适合自己的学习路径,学会应用 AI 技术。 3. 找到志同道合的队友:对于想创业、做副业或找对 AI 感兴趣的伙伴一起做事的人来说,是很好的平台。 4. 收获众多:如实现 AI 自动化、找到副业和创业伙伴、与高手和大佬面对面交流避免走弯路等。 5. 促进个人成长:线下活动让人了解最新的 AI 落地应用现状,结识有趣、有想法的人,让人意识到要多与人交流、体验真实生活才能成长。 6. 知识学习:能学到很多 AI 相关知识,如 markdown 语言等。 7. 开源知识库:由热爱 AI 的专家和爱好者共同建设,在无推广情况下已有超 70 万用户和超千万次访问量,是很多 AI 爱好者知识的源头,有很多学社和共学共建活动。
2025-02-26
AI生成PPT
以下是关于 AI 生成 PPT 的相关内容: 卓 sir 的制作流程:先让 GPT4 生成 PPT 大纲,然后将大纲导入 WPS 启用 WPS AI 一键生成 PPT,再让 chatPPT 添加动画,最后手动修改细节。其中,生成符合要求的大纲最费时间。 市面上大多数 AI 生成 PPT 的思路:AI 生成 PPT 大纲、手动优化大纲、导入工具生成 PPT、优化整体结构。 相关推荐:gamma、AIPPT、islide AI 等产品,其中 gamma 被认为在审美方面表现较好。 扩展阅读:《AI 生成 PPT 工具红黑榜,这三款千万别用》《AI+PPT 等效率工具的研报》 您可以根据自己的需求和喜好选择合适的方法和工具来生成 PPT。
2025-02-26
给我一些关于数据驱动的免费的优质的课程
以下是为您找到的关于数据驱动的免费优质课程相关信息: 一、数字营销方面 1. 2025 年数字营销十大趋势 Bridging the AI skills gap:具备 AI 技能的团队可以制定更加精准、数据驱动的营销策略,提高效率和效果,使品牌在快速适应市场变化和消费者需求方面具备优势。 Advanced Personalization:借助 AI,营销人员可以实时分析消费者行为,从而提供高度个性化的体验,提升客户参与度,加强品牌忠诚度。 Resource Optimization:通过培训现有员工而不是依赖外部招聘,公司可以最大化利用内部资源,降低招聘成本,并为 AI 驱动的项目建立可持续的基础。 许多公司正在投资于 AI 培训项目,以提升其营销团队的技能。例如,Google 提供免费的 AI 和机器学习认证课程,而像 IBM 这样的公司为员工提供高级 AI 培训和导师项目。这些项目涵盖了数据分析、AI 驱动的客户细分和预测建模等关键技能,帮助公司在不断发展的数字领域保持竞争力。 二、智能导购方面 智能导购的 100 个创意方向中的数据驱动场景(20 个方向): 1. 用户生命周期价值分析:预测客户长期贡献并制定维护策略。 2. 关联购买推荐:分析历史订单推荐互补商品(如包包+丝巾)。 3. 社交媒体舆情分析:抓取小红书/微博数据生成品牌健康报告。 4. 客户分群策略:按消费频率、客单价等维度自动划分群体。 5. 促销效果模拟器:预测不同折扣方案对利润的影响。 6. 天气关联销售预测:结合天气数据推荐应季商品(如雨天推伞具)。 7. 门店选址分析:通过人流、竞品分布数据推荐新店位置。 8. 客户旅程地图:可视化用户从认知到复购的全链路行为。 9. A/B 测试自动化:自动分配流量并对比页面转化率。 10. 实时销售看板:整合多渠道数据生成动态业绩仪表盘。 11. 会员续费预测:通过行为数据预测会员卡续费概率。 12. 商品评论情感分析:从评价中提取用户满意度与改进点。 13. 滞销品组合促销:捆绑低动销率商品提升整体销量。 14. 客户等待时间优化:通过排队数据调整导购资源配置。 15. 个性化折扣券:根据用户偏好发放差异化优惠券。 16. 新品接受度预测:通过历史数据预测新品上市成功率。 17. 流失客户召回:自动触发短信/邮件推送挽回策略。 18. 供应链风险预警:监控原材料价格波动触发备选方案。 19. 跨渠道库存同步:实现官网、门店、仓库库存实时共享。 20. 客户反馈聚类分析:自动归类投诉建议并分配处理部门。
2025-02-26
怎么学习提示词 prompt
以下是关于如何学习提示词(prompt)的全面指导: 一、理解提示词的作用 提示词向模型提供上下文和指示,其质量直接影响模型输出的质量,能让模型更准确地理解并完成所需任务。 二、学习提示词的构建技巧 1. 明确任务目标,用简洁准确的语言描述。 2. 给予足够的背景信息和示例,帮助模型理解语境。 3. 使用清晰的指令,如“解释”“总结”“创作”等。 4. 对特殊要求应给予明确指示,如输出格式、字数限制等。 三、参考优秀案例 研究和学习已有的优秀提示词案例,可在领域社区、Github 等资源中找到大量案例。 四、实践、迭代、优化 多与语言模型互动,根据输出提高提示词质量。尝试各种变体,比较分析输出差异,持续优化提示词构建。 五、活用提示工程工具 目前已有一些提示工程工具可供使用,如 Anthropic 的 Constitutional AI。 六、跟上前沿研究 提示工程是当前最前沿的研究领域之一,持续关注最新的研究成果和方法论。 七、具体学习步骤 1. 拥有一个大模型帐号,并熟悉与之对话的方式。推荐 ChatGPT4 及国产平替:。 2. 阅读 OpenAI 的官方文档:。 精心设计的提示词能最大限度发挥语言模型的潜力,多实践、多学习、多总结,终可掌握窍门。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-26
微调
微调(Finetuning)是一种迁移学习技术,常用于深度学习中。其基本思路是先有一个在大量数据上预训练过的模型,该模型已学会一些基本模式和结构,然后在特定任务数据上继续训练,使其适应新任务。 例如在情感分类中,可先使用大量语料库预训练模型,再用标注过的电影评论继续训练以判断情感;在图像分类中,先使用大量图片预训练模型,再用标注过的猫和狗的图片继续训练以区分二者。 微调的超参数选择很重要,默认超参数适用于一系列用例,唯一需要的参数是训练文件。调整超参数通常能产生更高质量输出的模型,可能需要配置的内容包括: 模型:可选择“ada”“babbage”“curie”或“davinci”之一。 n_epochs:默认为 4,指训练模型的时期数。 batch_size:默认为训练集中示例数量的 0.2%,上限为 256。 learning_rate_multiplier:默认为 0.05、0.1 或 0.2,取决于 final batch_size。 compute_classification_metrics:默认为假,若为真,在每个 epoch 结束时在验证集上计算特定于分类的指标。 微调能为应用程序定制模型带来更多收益,如比即时设计更高质量的结果、能训练更多例子、节省 Token、降低延迟请求。微调通过训练更多示例改进小样本学习,在大量任务中取得更好结果。微调涉及准备和上传训练数据、训练新的微调模型、使用微调模型等步骤。 目前微调仅适用于 davinci、curie、babbage 和 ada 等基础模型,还可继续微调微调模型以添加其他数据。建议使用 OpenAI 命令行界面,安装时需注意相关要求。
2025-02-26
文生营销图AI
以下是关于文生营销图 AI 的相关教程: Liblibai 简易上手教程: 1. 定主题:确定您需要生成的图片的主题、风格和要表达的信息。 2. 选择 Checkpoint:根据主题选择内容贴近的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设为 2。 6. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需语法和长句。 7. 负向提示词 Negative Prompt:用英文写要避免的内容,同样是单词和短语组合,用英文半角逗号隔开。 8. 采样方法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 9. 迭代步数:选 DPM++2M Karras 时,在 30 40 之间,多了意义不大且慢,少了效果差。 10. 尺寸:根据喜好和需求选择。 11. 生成批次:默认 1 批。 Tusiart 简易上手教程: 1. 定主题:确定图片的主题、风格和要表达的信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. ControlNet:用于控制图片中特定的图像,如人物姿态等,属于高阶技能。 5. 局部重绘:下篇再教。 6. 设置 VAE:选择 840000 那一串。 7. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需语法和长句。 8. 负向提示词 Negative Prompt:用英文写要避免的内容,同样是单词和短语组合,用英文半角逗号隔开。 9. 采样算法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 10. 采样次数:选 DPM++2M Karras 时,在 30 40 之间,多了意义不大且慢,少了效果差。 11. 尺寸:根据喜好和需求选择。 关于【SD】文生图提示词: 1. 避免使用太大的数值,如 1920x1080,可能导致奇怪构图,可使用高清修复放大图像倍率,记住高宽比主要控制画面比例。 2. 调整好参数后生成图片,若质感不足,可添加标准化提示词,如:,绘图,画笔等,让画面更趋近于固定标准。
2025-02-26