Navigate to WaytoAGI Wiki →
Home/All Questions
类似chatgpt有什么其他产品
以下是类似 ChatGPT 的一些产品: 1. CharacterAI:已成为第二大产品,在移动领域表现出色,其 DAU 可与 ChatGPT 媲美,留存率更高,规模约为 ChatGPT 的 21%。 2. Google 的 Bard:是普通 LLM 聊天机器人类别中的产品,位列前 5 名。 3. Quora 的 Poe:也是普通 LLM 聊天机器人类别中的前 5 名产品。 4. Midjourney:属于内容生成工具类别。 5. ElevenLabs:同样是内容生成工具。 6. Civitai:模型中心类别,排名前 10,用于图像。 7. Hugging Face:模型中心类别,排名前 10。 在写代码方面的替代产品有: 1. GitHub 的 Copilot:在写代码领域是领先的,但并非免费。 2. Tabnine:AI 助手,能保障代码安全并提高交付速度。 3. Codeium:免费的 AI 代码补全和聊天工具。 4. Amazon CodeWhisperer:AI 编码伙伴,帮助更快速和安全地构建应用。 5. SourceGraph Cody:了解整个代码库的 AI。 6. Tabby:开源、自托管的 AI 编码助手。 7. fauxpilot/fauxpilot:GitHub Copilot 的开源替代服务器。 此外,Meta 开源的 LLaMA 1 及进阶的 Llama 2 也推动了大模型的发展。
2025-01-24
我想学习ai
以下是为您提供的新手学习 AI 的方法: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 持续学习和跟进: AI 是一个快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。 考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 可以参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 总之,中学生可以从编程基础、工具体验、知识学习、实践项目等多个方面入手,全面系统地学习 AI 知识和技能,为未来的 AI 发展做好准备。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-24
头像生成工具
以下为您介绍一些头像生成工具: INFP 双人对话互动头像生成工具: 特点:通过双轨音频输入,自动识别说话者与听者,生成对应的嘴唇同步、表情和头部动作动画。支持高性能硬件下 40 FPS 实时生成,可调节情绪参数(如开心、严肃、放松等),兼容多语言、多方言音频及多种头像风格(卡通、真人照片等)。 链接: 给自己做卡通头像: 复杂提示词:如果觉得提示词简单,可选择更复杂的,如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5”。 不同照片生成:若对照片风格不满意,可更换新照片使用上述提示词重新生成。 其他调整:若觉得 Disney 风格太过卡通,可将提示词中的“Disney”换成“Pixar”;若为女孩,可将“boy”换成“girl”。每次生成 4 张图片,对某张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击下方的 V1~V4 进行修改。
2025-01-24
图生视频时,不按照指令行动
在图生视频过程中出现不按照指令行动的情况,可能有多种原因。以下为您提供一些可能的分析和解决建议: 提示词不够准确清晰:确保提示词详细、具体、明确地描述了您想要的图像和动作,避免模糊或歧义。 模型理解偏差:AI 模型可能对某些复杂或特殊的指令理解存在困难,您可以尝试调整提示词的表述方式。 数据和训练限制:模型的训练数据和能力可能存在一定的局限性,导致无法完全按照指令生成视频。 您可以参考以下的案例来进一步理解和改进: 公子在宣武门前站着说话,气场强大,头发和衣衫随风飘动,气体流动,手指向远方。 小孩子向画面右侧奔跑,后面腾起一路尘土。 公子扔出手中球体法器,法器升空爆出万丈金光,公子惊奇的看着。 同时,您还可以利用一些工具和技巧,例如清影工具中的帮写视频提示词的智能体,来优化提示词。另外,注意提示词的主体、描述细节等方面,如“戴眼镜”的提示词因无主体导致唐僧未能遵从指令戴上墨镜,而“唐僧伸出手,戴上墨镜”这样有主体的提示词则效果更好。
2025-01-24
你可以做什麼
以下是我能为您做的事情: 1. 为低年级小学生提供 Genie 模型的科普:Genie 模型可以根据人们的操作改变虚拟世界里发生的事情,其创建过程复杂,是科学家们用智慧和耐心将不同技术和知识拼合而成。长大后,您也可能成为创造智能模型的科学家和工程师。 2. 展示作业相关:您可以使用“/show 命令”和唯一的 Job ID 将自己的作业移动到另一个服务器或频道,恢复丢失的作业,或刷新旧作业以制作新变体、升级或使用较新的参数和功能。 3. 提供使用 AI 做事的指南: 写东西:可草拟各种初稿,如博客文章、论文等。提高提示能获得更好写作效果,还能让 AI 改进文本、创建不同风格草稿、帮助完成任务等。 帮助完成任务:如写邮件、创建销售模板、提供商业计划下一步等。 解锁自己:AI 能提供让您保持动力的方式。
2025-01-24
怎么做tts模型训练
以下是关于 TTS 模型训练的相关内容: 使用 GPTSoVITS 进行 TTS 模型训练: GPTSoVITS 是一个声音克隆和文本到语音转换的开源 Python RAG 框架。 只需 1 分钟语音即可训练一个自己的 TTS 模型。5 秒数据就能模仿您,1 分钟的声音数据就能训练出一个高质量的 TTS 模型,完美克隆您的声音。 主要特点: 零样本 TTS:输入 5 秒的声音样本即可体验即时的文本到语音转换。 少量样本训练:只需 1 分钟的训练数据即可微调模型,提高声音相似度和真实感。模仿出来的声音会更加接近原声,听起来更自然。 跨语言支持:支持与训练数据集不同语言的推理,目前支持英语、日语和中文。 易于使用的界面:集成了声音伴奏分离、自动训练集分割、中文语音识别和文本标签等工具,帮助初学者更容易地创建训练数据集和 GPT/SoVITS 模型。 适用于不同操作系统:项目可以在不同的操作系统上安装和运行,包括 Windows。 预训练模型:项目提供了一些已经训练好的模型,您可以直接下载使用。 GitHub: 视频教程: TTS 模型训练的音库制作和文本前端: 音频录制: 音频的录制对合成语音的表现较为重要,较差的语音甚至会导致端到端声学模型无法正常收敛。 用于训练的录音至少要保证录音环境和设备始终保持一致,无混响、背景噪音;原始录音不可截幅。 如果希望合成出来的语音干净,则要删除含口水音、呼吸音、杂音、模糊等,但对于目前的端到端合成模型,有时会学习到在合适的位置合成呼吸音、口水音,反而会增加语音自然度。 录音尽可能不要事先处理,语速的调节尚可,但调节音效等有时会造成奇怪的问题,甚至导致声学模型无法收敛。 音频的录制可以参考录音公司的标准,购买专业麦克风,并保持录音环境安静即可。 在音库录制过程中,可尽早提前尝试声学模型,比如音库录制 2 个小时语音后,就可尝试训练基线语音合成系统,以防止录音不符合最终的需求。 语料整理: 检查文本和录制的语音是否一一对应,录制的音频本身一句话是否能量渐弱,参与训练的语音前后静音段要保持一致,能量要进行规范化。 可使用预训练的语音活动检测(Voice Activity Detection,VAD)工具,或者直接根据语音起止的电平值确定前后静音段。 可以使用一些开源的工具,比如统一所有语音的整体能量,这将有助于声学模型的收敛。当然,在声学模型模型训练时,首先就要对所有语料计算均值方差,进行统一的规范化,但是这里最好实现统一能量水平,防止一句话前后能量不一致。 GPTSoVITS 实现 AIyoyo 声音克隆的步骤: 前置数据获取处理: 选择音频,开启切割。 有噪音时,进行降噪处理。 降噪处理完成,开启离线 ASR。 GPTSowitsTTS: 训练集格式化:开启一键三连,耐心等待即可。 微调训练:开启 SoVITS 训练和 GPT 训练。 推理:开始推理 刷新模型 选择微调后的模型 yoyo。 成功:出现新的 URL,说明您自己的声音微调完毕,然后可以进行使用。 声音复刻:开启声音复刻之旅,实现跨多语种语言的声音。 希望以上内容对您有所帮助。
2025-01-24
AI辅助写专利交底书
以下是关于 AI 辅助写专利交底书和课题以及在写作中的应用的相关内容: AI 辅助写专利交底书: 近年来,AI 在专利审查领域得到广泛应用,能帮助专利审查员更高效地处理任务。具体应用包括: 1. 专利检索与分类:通过自然语言处理和机器学习算法,自动识别和分类专利文献。例如 Google Patents、IBM Watson for IP 等平台。 2. 专利分析和评估:分析专利文本,评估专利的新颖性和创造性等。如 TurboPatent、PatentBot 等平台。 3. 自动化专利申请:帮助自动生成专利申请文件,如 Specifio、PatentPal 等平台。 4. 专利图像和图表分析:利用 AI 技术分析专利中的图像和图表,如 Aulive、AIpowered image recognition tools 等平台。 利用 AI 写课题: 利用 AI 技术辅助写作课题可按以下步骤和建议进行: 1. 确定课题主题:明确研究兴趣和目标,选择有价值和创新性的主题。 2. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具搜集相关文献和资料。 3. 分析和总结信息:借助 AI 文本分析工具提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成包括引言、文献综述等部分的大纲。 5. 撰写文献综述:利用 AI 工具确保内容准确完整。 6. 构建方法论:根据研究需求,采用 AI 建议的方法和技术设计研究方法。 7. 数据分析:若涉及数据收集和分析,使用 AI 数据分析工具处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具撰写各部分,并检查语法和风格。 9. 生成参考文献:使用 AI 文献管理工具生成正确格式。 10. 审阅和修改:借助 AI 审阅工具检查逻辑性和一致性,并根据反馈修改。 11. 提交前的检查:使用 AI 抄袭检测工具确保原创性,进行最后的格式调整。 AI 在写作中的正确应用: AI 虽能写出文章,但不应完全依赖它来写作。写作是思考过程,能锻炼思维能力,对于想做 IP 账号的人,个人特色很重要。不过,AI 可成为写作中的得力助手: 1. 头脑风暴:写作前让 AI 提供选题建议或内容方向。 2. 查找资料:快速汇总主题相关信息,节省查阅资料时间。 3. 优化表达:写完初稿后让 AI 检查语法、改善表达。 4. 拓展思路:卡壳时询问 AI 开拓新思路。
2025-01-24
Dify如何调用飞书智能表格
Dify 调用飞书智能表格的方法如下: 1. 部署完成后,可以通过以下方式使用飞书·稍后读助手: 得益于飞书 app 的多平台支持,在电脑、手机端通过飞书机器人与稍后读助手进行对话。 直接在 Coze 商店中与 bot 进行对话。 如果还选择了部署到微信服务号、订阅号,也可以通过这些渠道调用 bot。 2. 设置稍后读存储地址: 首次使用,按以下步骤操作: 访问。 点击「更多创建副本」,然后复制新表格的分享链接。 将新链接发送到智能体对话中。 另外,还可以发送“查询存储位置”、“修改存储位置”,来更换飞书多维表格链接,调整稍后读存储位置。 3. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接。如果是第一次使用,会要求授权共享数据。授权通过后,再次输入需要收藏的页面链接,即可完成收藏。 目前部分页面链接可能会小概率保存失败,暂未定位原因。 4. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 此外,关于 Dify 在微信上的调用,可参考以下信息: GitHub: https://github.com/zhayujie/chatgptonwechat Gitee: https://gitee.com/zhayujie/chatgptonwechat 这里先暂时不过多介绍 Dify,它跟 AutoGPT、MetaGPT、FastGPT 等都是可以自己构建 Agent、工作流的 LLM 应用开发平台。AM 就是搭建在 Dify 上面的。 说回 LlamaEdge,可以自建一个 API 扩展来实现调用上面的 FLUX.1 API Server(套娃)。 API 扩展说明,可以查看:https://docs.dify.ai/zhhans/guides/extension/apibasedextension,但貌似 0.8.3 的版本不再使用了(dify 里面有不少功能更新缺陷或版本冲突,所以使用时需要自行修改或提交 PR)。 也可以引入项目,在 bot/dify/新建一个 dify_image.py 的程序,将画图程序的调用过程写到 dify bot 中,如用 query“画”开头接提示来触发调用。dify_image.py 后续会更新到代码仓库中。 图片服务器,很简单,分别写一个 Flask app 程序和一个 html: app.py template/index.html 以上代码都可以由 Phind、Copilot、Cursor、Zed + ollama + 一个代码大模型代劳,但架构感觉整复杂了不够优雅,后面整理好打包一个解决方案再提交一个 repo。
2025-01-24
如何用最简单的方法,训练一个自有数据的大模型
训练自有数据的大模型可以通过以下步骤实现: 1. 了解大模型的概念:大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能够进行文本生成、推理问答、对话、文档摘要等工作。可以用上学参加工作来类比大模型的训练、使用过程,包括找学校(需要大量 GPU 等计算资源)、确定教材(需要大量数据)、找老师(选择合适算法)、就业指导(进行微调)、搬砖(推导)。在 LLM 中,Token 被视为模型处理和生成的文本单位,会对输入进行分词并形成词汇表。 2. 基础训练步骤: 进入厚德云模型训练数据集,如 https://portal.houdeyun.cn/sd/dataset 。 创建数据集:在数据集一栏中,点击右上角创建数据集,输入数据集名称。可以上传包含图片+标签的 zip 文件,也可单独上传照片,但建议提前打包。Zip 文件里图片名称与标签文件应当匹配,上传后等待一段时间确认创建,返回上一个页面等待上传成功并可点击详情检查,能预览数据集的图片及对应的标签。 Lora 训练:点击 Flux,基础模型会默认是 FLUX 1.0D 版本。选择数据集,触发词可有可无,模型效果预览提示词随机抽取数据集里的标签填入。训练参数可调节重复次数与训练轮数,厚德云会自动计算训练步数,可默认 20 重复次数和 10 轮训练轮数,按需求选择是否加速,点击开始训练,会显示所需消耗的算力,等待训练完成,会显示每一轮的预览图,鼠标悬浮到想要的轮次模型,中间会有生图,点击可自动跳转到使用此 lora 生图的界面,点击下方下载按钮可自动下载到本地。 3. 部署和训练自己的 AI 开源模型的主要步骤: 选择合适的部署方式,如本地环境部署、云计算平台部署、分布式部署、模型压缩和量化、公共云服务商部署,根据自身资源、安全和性能需求选择。 准备训练所需的数据和计算资源,确保有足够的训练数据覆盖目标应用场景,并准备足够的计算资源,如 GPU 服务器或云计算资源。 选择合适的预训练模型作为基础,如开源的预训练模型 BERT、GPT 等,也可自行训练基础模型。 针对目标任务进行模型微调训练,根据具体应用场景对预训练模型进行微调训练,优化模型结构和训练过程以提高性能。 部署和调试模型,将训练好的模型部署到生产环境,对部署的模型进行在线调试和性能优化。 注意安全性和隐私保护,大模型涉及大量数据和隐私信息,需要重视安全性和合规性。 总的来说,训练自有数据的大模型需要综合考虑多方面因素,包括部署方式、数据准备、模型训练、部署调试以及安全性等。需要根据具体需求选择合适的方法,并注意优化各个环节以提高模型性能和应用效果。
2025-01-24
我给你一个excel表格,你可以快速生成甘特图吗?
目前我无法直接为您提供将 Excel 表格快速生成甘特图的服务。但您可以使用一些专业的软件,如 Microsoft Project、Excel 本身(通过特定的功能和插件)、Trello 等,它们都具备将相关数据转化为甘特图的功能。您可以根据自己的需求和使用习惯选择合适的工具,并按照其操作指南进行操作。
2025-01-24