「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
我想AI绘图
以下为您介绍一些关于 AI 绘图的相关内容: 常用的 AI 绘图工具: 1. Creately:是一个在线绘图和协作平台,利用 AI 功能简化图表创建过程,适合绘制流程图、组织图、思维导图等。具有智能绘图功能,可自动连接和排列图形,还有丰富的模板库和预定义形状,支持实时协作,官网:https://creately.com/ 2. Whimsical:专注于用户体验和快速绘图,适合创建线框图、流程图、思维导图等。其直观的用户界面易于上手,支持拖放操作,快速绘制和修改图表,提供多种协作功能,官网:https://whimsical.com/ 3. Miro:在线白板平台,结合 AI 功能,适用于团队协作和各种示意图绘制,如思维导图、用户流程图等。支持无缝协作,有丰富的图表模板和工具,还支持与其他项目管理工具(如 Jira、Trello)集成,官网:https://miro.com/ 使用 AI 绘制示意图的步骤: 1. 选择工具:根据具体需求选择合适的 AI 绘图工具。 2. 创建账户:注册并登录该平台。 3. 选择模板:利用平台提供的模板库,选择适合需求的模板。 4. 添加内容:根据需求添加并编辑图形和文字,利用 AI 自动布局功能优化图表布局。 5. 协作和分享:若需要团队协作,可邀请团队成员一起编辑,完成后导出并分享图表。 AI 辅助在独立游戏开发中的“踩坑”经验: 在游戏开发中,比如《玩具帝国》,使用 AI 绘画时可能会遇到一些问题。例如,一开始可能存在风格不适合、缺乏叙事性、已有素材有限、泛化性差等。但通过不断尝试不同的方法,如 Embedding、CKPT、Lora 等,以及进行正则化处理、使用 ControlNet 等,最终可以得到较好的效果。为了引导 AI 画出理想的图像,还可以采取一些特殊的处理方式,如制作引导图、丰富训练集等。
2025-01-04
请介绍一下deepseek
DeepSeek 是一家低调但引人关注的大模型公司。其发布了 2360 亿参数的 DeepSeekV2 模型,该模型具有以下特点: 由 60 位专家参与的混合开源模型。 在数学、编码和推理方面表现出色。 拥有 236B 参数,其中 21B 在生成过程中被激活。 在 MTBench 上表现优异,中文能力强且性价比高。 关于 DeepSeek 的详细介绍,您可以通过以下链接获取更多信息:https://xiaohu.ai/p/7468 。此外,还有一篇文章《》对其进行了深入报道。
2025-01-04
语音转文字有哪些办法
以下是一些语音转文字的办法: 1. 利用 GVoice 提供的语音录制和识别能力,其中文识别率优秀。但需注意语音识别可能存在少量错误,不过 ChatGPT 通常能正常理解和纠错,衔接较为流畅。 2. 使用 Whisper API 时,默认仅支持小于 25MB 的文件。若音频文件更长,需将其分成小于 25MB 的块或使用压缩后格式,可使用 PyDub 开源 Python 软件包来拆分声频文件。 3. 对于 Whisper API,可以使用提示来提高生成的转录质量。例如,改善特定单词或缩略语的识别、保留分段文件的上下文、避免标点符号的省略、保留填充词汇、处理不同书写风格等。 希望这些信息能满足您的需求。
2025-01-04
海外比较好的图片生成工具
以下是一些海外比较好的图片生成工具: 1. 谷歌图像生成工具: 特点:理解能力强,有使用门槛,不能输入中文,每日免费 500 次,生成速度快,可调整提示词和选项,能根据提示词生成不同风格和复杂程度的图像,随机种子影响生成结果,可提供参考图设置主题场景样式。 2. 纳米搜索反推提示词: 可上传图片让其反推 midjourney 提示词,输出效果好,能调用多种模型,查阅资料也可用,会搜索全网并精选资料,还能看到调用的内容和参考资料。 3. ideogram: 是一个海外生图平台,早期以能够准确生成图片中的文字而出名,目前该平台仍然有大量创作者生成各类创意 Logo,对于英文字母的生成非常友好,也非常方便,输入支持中文。 使用方法:最简单的方法就是直接在首页信息流中找到中意的 Logo 款式,点进去 retry,替换掉提示词中字母的部分。目前支持主流的图片比例,以及输入框下方有一些主流风格可以选择。
2025-01-04
如何学习ai视频
以下是关于学习 AI 视频的相关内容: 入门教程: 交流群:需要学习 AI 视频,参与 AI 视频挑战赛,参与 AI 视频提示词共创的小伙伴,直接扫二维码或联系三思或小歪【备注:AI 视频学社】,必须有 AI 视频账号才能进群,请勿随便申请好友。 直播:AI 视频学社每周 1 次直播(周五直播),例如: AI 视频学社的相关介绍: 说明书:这个板块是为 AI 视频建立,方便大家测试学习 AI 视频的相关知识和内容。 学社简介:小伙伴们可以在 AI 视频学社通过参与每周举办的比赛,快速学习 AI 视频的相关知识。并且每周有高手直播直播分享,会分享 AI 视频和影视创作领域最前沿的知识。欢迎大家来 AI 视频学社一起学习,一起共创属于自己的 AI 视频。 学社目标: 有直播:不定期直播,AI 视频方向高手直播分享。 赛中学:每周固定 1 次,video battle 视频挑战赛,每周一发布主题,每周日 18 点前交稿,有奖品。 有活动:不定期组织 AI 视频线上或者线下活动。 学知识:大家一起学习 AI 视频最新软件和最新知识,学习图生视频,视频生视频等的技巧。 软件教程: 每周一赛: 此外,在通往 AGI 之路知识库的智能纪要中也有部分相关内容,如推荐 B 站 up 主 Nally 的课程,二十四节气相关教程和关键词已开源,14、15 号左右白马老师和麦菊老师将带大家用 AI 做生图、毛毡字、光影字、机甲字等,16 号晚上中老师将带大家动手操作炼丹等。
2025-01-04
RAG
RAG(RetrievalAugmented Generation)即检索增强生成,是一种结合检索和生成能力的自然语言处理架构。 其核心目的是为大语言模型(LLM)提供额外的、来自外部知识源的信息,通过检索的模式为大语言模型的生成提供帮助,使大模型生成的答案更符合要求。 大模型需要 RAG 进行检索优化的原因在于其存在一些缺点: 1. 无法记住所有知识,尤其是长尾的,受限于训练数据和学习方式,对长尾知识接受能力不高。 2. 知识容易过时且不好更新,微调效果不佳且有丢失原有知识的风险。 3. 输出难以解释和验证,存在内容黑盒、不可控及受幻觉问题干扰的情况。 4. 容易泄露隐私训练数据。 5. 规模大,训练和运行成本高。 RAG 具有以下优点: 1. 数据库对数据的存储和更新稳定,不存在学不会的风险。 2. 数据库的数据更新敏捷,增删改查可解释,对原有知识无影响。 3. 数据库内容明确、结构化,加上模型的理解能力,可降低大模型输出出错的可能。 4. 知识库存储用户数据,便于管控用户隐私数据,且可控、稳定、准确。 5. 数据库维护可降低大模型的训练成本。 RAG 的核心流程是根据用户提问,从私有知识中检索到“包含答案的内容”,然后把“包含答案的内容”和用户提问一起放到 prompt(提示词)中,提交给大模型,此时大模型的回答就会充分考虑到“包含答案的内容”。其最常见应用场景为知识问答系统,用户提出问题,RAG 模型从大规模的文档集合中检索相关的文档,然后生成回答。 RAG 由一个“检索器”和一个“生成器”组成,检索器从外部知识中快速找到与问题相关的信息,生成器则利用这些信息来制作精确和连贯的答案,非常适合处理需要广泛知识的任务,如问答系统,能够提供详细而准确的回答。
2025-01-04
如何用AI回答我的科学问题的提问
沃尔夫勒姆在探讨人工智能能否解决科学问题时提到了以下观点: 1. 在多重计算过程中,存在许多可能的结果,目标是找到通向某些最终结果的路径。例如从 A 到 BABA 的最短路径,在简单例子中可显式生成整个多路图,但实际中多数情况图会太大,挑战在于不追踪整个可能性图的情况下弄清楚行动。常见方法是为不同状态或结果分配分数,追求分数最高的路径,在自动定理证明中,“从初始命题向下”和“从最终定理向上”工作也常见,还可建立“引理”,将 X→Y 添加为新规则。 2. 人工智能可以提供帮助的一种方法是训练语言模型人工智能生成代表路径的标记序列,向其提供有效序列,呈现新序列的开头和结尾,要求其填充中间部分。 3. 从历史上看,成功科学的一个决定性特征是能预测将会发生什么。在最简单的情况中,用人工智能做归纳推理,输入一系列测量结果,让其预测尚未完成的测量结果。将人工智能视为黑匣子,虽希望其不做假设只遵循数据,但不可避免会存在底层结构使其最终假设某种数据模型。
2025-01-04
如何接入大模型
接入大模型的方法如下: 1. 阿里云百炼模型: 注册阿里云账号:如果没有阿里云账号,您需要先。 开通百炼:前往,若页面顶部显示相关消息,需开通百炼的模型服务以获得免费额度。 获取 API Key:在控制台的右上角选择 APIKEY,然后创建 API Key,用于通过 API 调用大模型。 2. 千问模型: 百炼首页:https://bailian.console.aliyun.com/ 当在 COW 中直接调用千问的某一个大模型时,只需要更改 key 和 model 即可。以调用“qwenmax”模型为例,在/root/chatgptonwechat/文件夹下,打开 config.json 文件,需要更改"model",和添加"dashscope_api_key"。获取 key 的视频教程:,或查看自己是否已认证。 3. silicon 模型: 官方提供的接入 API 的教学文档:以平时使用的 silicon 接口为例,有众多开源模型(Yi、Qwen、Llama、Gemma 等)免费使用。另赠送 14 元体验金,有效期未知,是个人认为 API 接口最方便最实惠的接口了。 silicon 注册和使用地址:邀请码:ESTKPm3J(谢谢支持)注册登录后,单击左边栏的 API 密钥,单击新建 API 密钥,单击密钥即可完成 API 密钥的复制。silicon 支持多种大模型,也支持文生图、图生图、文生视频,可自行探索。这一步得到 silicon 的密钥即可,我们可以调用千问 2.5 的这个模型,满足日常对话完全没有问题,并且是免费调用的。 进入 github 复制 migpt 项目:打开官方仓库:https://github.com/idootop/migpt,Fork 项目到自己的账号。单击 Fork,单击右下角 Create fork,这样就已经把该项目 fork 到自己的仓库中了。找自己仓库项目的方法:进入主页,单击左上角的"三",单击 home,就可以看到刚才 fork 过来的 migpt 项目了,单击可进入项目页面。复制仓库地址:先确认是否在自己的仓库项目页面,再单击绿色的“code”按钮,再点击地址栏的复制按钮。
2025-01-04
最新的AI新闻有哪些
以下是一些最新的 AI 新闻: 2024 年 6 月,苹果发布了 AI 原生操作系统,加强了硬件和模型布局;Claude Sonnet 3.5 发布,挑战 OpenAI;视频生成领域 Runway Gen3 和快手可灵表现优秀;AI 3D 技术逐渐崭露头角;Google 和月之暗面推出长上下文缓存技术。整体趋势是技术不断进步,各领域竞争激烈。 快手发布可灵网页版及大量模型更新;阶跃星辰发布多款模型;商汤打造类似 GPT4o 的实时语音演示;GraphRAG:微软开源新型 RAG 架构。 红杉资本美国合伙人 Pat Grady 在最新访谈中表示,AI 技术将为服务行业带来变革机遇,而非取代软件公司。AI 的潜力在于赋能服务行业,但人际关系和实际执行仍需人工。对于基础模型公司,Grady 认为它们可能像数据库公司一样发展,提供开发者 API,有机会进入应用层。他认为现有模型已足够强大,关键在于工程化优化和认知架构设计。 2024 年 1 月,斯坦福大学 Mobile Aloha;1 月 10 号 LumaAl Genie 文生 3D;1 月 11 号 GPT store 上线;1 月 MagnificAl 高清放大爆火;1 月最后一天苹果 Vision Pro 宣布发售。 2024 年 9 月,Orange AI 有相关小结,包括鼓励建立自媒体,推出中文版 AI 播客 Demo 并吸引大量参与者,开设 AI 酒吧 Bar2AGI 等。此外,国庆节期间,OpenAI 推出 Canvas 功能和实时 API,微软发布新版 Copilot,具备深度系统集成和实时语音功能;Meta 发布 Meta Movie Gen 视频生成模型,自动配音质量高;LiquidAI 发布非 Transformer 模型 LFMs,推理效率显著提高。此外,Sora 项目负责人离职、多个新模型和工具发布,以及 OpenAI 完成新一轮融资,估值达到 1570 亿美元。
2025-01-04
没有编程基础可以学习ai吗
没有编程基础也可以学习 AI,但会面临一定的挑战。以下是一些建议: 1. 学习基础知识: 数学基础:包括线性代数、概率论、优化理论等。 了解 AI 的基本概念、发展历程、主要技术分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 2. 选择学习路径: 偏向技术研究方向:学习监督学习、无监督学习、强化学习等机器学习基础,以及神经网络、卷积网络、递归网络、注意力机制等深度学习知识。 偏向应用方向:掌握 Python、C++等编程基础,学习监督学习、无监督学习等机器学习基础,熟悉 TensorFlow、PyTorch 等深度学习框架。 3. 工具和平台: 可以从 Python、JavaScript 等编程语言开始学习。 尝试使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向初学者的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 4. 学习方式: 阅读入门文章和相关书籍。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程按照自己的节奏学习。 特别推荐李宏毅老师的课程。 5. 实践和尝试: 掌握提示词的技巧,上手容易且很有用。 理论学习之后,通过实践巩固知识,尝试使用各种产品做出作品。 体验如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式。 需要注意的是,无论是技术研究还是应用实践,数学基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。
2025-01-04