知識ベースとの対話 - WayToAGI

「AGIへの道」飛書ナレッジベースへ直行 →

ホーム/すべての質問

文生模型是如何实现的

文生模型的实现方式如下： Tripo 文生 3D 模型：在「Create」界面底部的输入框中输入提示词（不支持中文），不会写提示词可点击输入框左侧的</>按钮随机生成并自动填入。填写好提示词后点击右侧的「Create」生成 3D 模型，每次会生成 4 个基础模型，不满意可点击最下方白色的「Retry」按钮重新生成。若有满意模型，点击单个模型下方黄色的「Refine」精修，精修进度可在「My Models」中查看，一般 5 分钟左右完成。 OpenAI 的 Sora 文生视频模型：能够根据文字指令创造出逼真且充满想象力的场景，生成长达 1 分钟的一镜到底超长视频，视频中的人物和背景具有惊人的一致性，各种镜头随意切换且人物保持稳定性。多模态模型：多模态模型包括文生图、图生图、图生视频、文生视频等。其底层逻辑先从生图片源头出发，以 StableDiffusion 所用的扩散模型为例，训练时先把海量带有标注文字描述的图片逐渐加满噪点，模型学习每一步图片向量值和文字向量值的数据分布演变规律。输入文字后，模型根据文字转化的向量指导充满噪点的图片减噪点生成最终图片。扩散模型中加减噪点的方式与大脑构思图片的方式类似，多模态模型会关联文字向量值和图片的 RGB 像素点向量值。

能根据Excel自动帮我做数据分类吗

在 Excel 中，对于数据分类有一定的方法和限制。假设我们有一个关于电影评论的 Excel 表格，其中包含电影名称、评论、评分等列。传统的搜索原理是单词匹配，例如，如果用户想找到包含“酷”的评论，可使用 Excel 的“查找”功能输入“酷”进行查找，能直接导航到“环太平洋”的评论。然而，这种方式存在局限性。比如语义搜索的缺失，如果用户想找到表达“精彩”或“激动人心”的评论，但没有明确使用这些词，传统搜索无法返回如“星球大战”的相关结果。而且对于非结构化数据，如图像、音频和视频等非文本内容，传统 Excel 工具无法进行有效的内容搜索。不过，在一些简单场景中，Excel 还是能发挥作用的，比如文本数据管理，在个人和商业环境中管理文档、客户反馈、项目说明等，以及进行简单的数据筛选，快速查找包含特定关键词的行或记录，但更适用于小规模数据集。总体来说，Excel 可以在一定程度上帮助进行数据分类，但对于复杂的语义理解和非结构化数据处理，可能无法完全满足需求。

OpenAI前六场发布会的内容提炼

以下是 OpenAI 前六场发布会的部分内容提炼： OpenAI 第六天发布会：ChatGPT 的高级语音模式获得公开访问权限，能通过自然语音与用户对话并理解屏幕内容，降低使用门槛，展示多模态能力和个性化发展潜力。相关报告：甲子光年发布的《2024 人工智能产业 30 条判断——万千流变，一如既往》涵盖 AI 技术历史发展、当前趋势和未来预测，提到 Transformer 模型和 GPT 系列发展及在多行业应用，探讨了 AI 芯片进步、在科学研究中的角色和对社会的广泛影响，还预测了 AI 产业增长。中信建投证券的海外 AI 应用行业专题《旧金山草根调研与海外 AI 应用进展》长达 100 多页，聚焦旧金山草根调研及海外 AI 应用进展，显示旧金山及硅谷地区 AI 企业众多，AI 应用在 To B 场景如广告、助手、数据分析等领域受关注，长期看好，尤其是 C 端应用潜力，列举了多家公司及其业务领域、功能进展，并提供相关上市公司数据。 OpenAI 首届开发者大会：短短 45 分钟发布会，Sam Altman 表示团队对开发者关注的问题做了六大升级，包括更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制，前四条主要关于新模型性能提升，后两点针对企业开发者痛点，同时宣布 API 价格下调。

AI（人工智能）的起源最早可以追溯到上世纪。 1943 年，心理学家麦卡洛克和数学家皮特斯提出了机器的神经元模型，为后续的神经网络奠定了基础。 1945 年，Alan Turing 考虑用计算机来模拟人脑，设计了 ACE（Automatic Computing Engine 自动计算引擎）来模拟大脑工作。 1950 年，伟大的计算机先驱图灵最早提出了图灵测试，作为判别机器是否具备智能的标准。 1956 年，在美国的达特茅斯学院，马文·明斯基和约翰·麦凯西等人共同发起召开了著名的达特茅斯会议，“人工智能（Artificial Intelligence）”一词被正式提出，并作为一门学科被确立下来。此后近 70 年，AI 的发展起起落落。

如何慢慢切入AI进行工作和生活

以下是一些慢慢切入 AI 进行工作和生活的方法： 1. 万能公式法：问 AI 【一个（xxx 职业）需要具备哪些知识？】，AI 就可给出知识框架，然后根据知识框架每一个小点去问，就能让 AI 工具帮您指数级深度思考。 2. 寻找优质信息源：像没有技术背景的普通人，想要学习或了解 AI，最好的信息源就在「即刻」App 的“”等免费圈子里。“AI 探索站”里的前沿信息线索基本够用，很多 Twitter 上的开发者大牛也会在这里分享，需要溯源的时候，才去 Twitter 和相关官网。 3. 信息爆炸做减法的小 tips：只掌握最好的产品，少关注新产品测评（除非远超 ChatGPT）。只解决具体问题，不做泛泛了解。从问题中来，到问题中去。只关注核心能力，不关注花式玩法，用 AI 扬其长避其短。只关注理清需求和逻辑，不死记硬背提示词。先关注提升认知/洞察，然后再谈技巧。 4. 案例参考：案例七：【你想拆解 XX 工作流？】，你来拆解：Decoding 工作流，细化背后需要的能力，找到能提效能力的 AI 工作，嵌入工作流；PDCA 不断迭代。包括制造、IT、运营、学院、法务、财务、营销、采购、计划、物流、研发、行政、战略、流程、产品等领域及其细分和专攻方向。案例四：【读书会活动 AI 赋能】活动策划/文案打磨/快速制作读书笔记思维导图。日常活动文案输出（读书社 ing，AI 复核型玩法“高阶”，依托传音智库+飞书妙记+在线思维导图 Markmap）。例如，用 kimichat 让 AI 拆解这本书的三级章节并按照 markdown 产出内容，然后复制 AI 内容粘贴到在线思维导图 Markmap 中，一键生成思维导图，还可以自定义微调内容，并免费导出图片。

如何利用AI 工具提升面试技能

以下是利用 AI 工具提升面试技能的一些方法： 1. 可以使用 ChatGPT 接入 Siri 来模拟前端电话面试，以更充分地进行面试准备。具体步骤为：首先按照特定文章完成 ChatGPT 接入 Siri 的操作，然后在手机上唤起 ChatGPT 版本的 Siri，设定对话身份和目的，如让其扮演面试者，您作为面试官进行提问和深入交流，通过观察回答情况来提升面试技巧。 2. 了解一些 AI 面试官相关产品，例如用友大易 AI 面试产品，具有强大技术底座、场景贴合度高、全环节集成解决方案、先进防作弊技术和严密数据安全保障；海纳 AI 面试，在线自动面试、评估，精准度高达 98%，效率提升 5 倍以上，候选人到面率提升；InterviewAI 是在线平台，提供职位相关问题和 AI 生成的推荐答案，候选人可回答并获得评估、建议和得分。但使用这些产品时要注意数据安全性和隐私保护。此外，飞书知识库中还提到了一些 AI 在工作场景中的应用案例，如销售话术总结优缺点、定制销售解决方案、定制客服话术、HR 团队绩效管理和面试工具等，可能对您提升面试技能也有一定的启发。

如何确保agent按要求调用插件

要确保 Agent 按要求调用插件，可以参考以下方法： 1. 构建稳定可用的 AI Agent 是一个需要不断调试和迭代的过程。通常从当前性能最强的 LLM（如 ChatGPT4 和 Claude 3.5 sonnet）着手，先用单条 Prompt 或 Prompt Chain 来测试任务的执行质量和稳定性。然后，根据实际执行情况、最终投产使用的 LLM，逐步拆解子任务，降低 LLM 执行单任务的难度，直到达成工程目标。 2. 一般而言，对于场景多样、结构复杂、对输出格式要求严格的内容，基本可以预见到需要将其拆解为工作流。此外，鉴于 LLM 只能处理文本输入输出的特性，如果涉及生成多媒体内容或从网络自主获取额外信息等能力，必然需要通过工作流来调用相应的插件。 3. 在插件中心确定需要的插件时，先用关键词进行尝试性搜索，根据插件名称、插件介绍页、描述、参数、示例，判断是否可能满足需求。有多个插件同时可选时，一般优选官方/高收藏/高成功率的插件，提升使用效果。如果实际试用效果不行，则换用其他插件，或自己编写上架插件。例如，在搜索 TTS 文字转语音插件时，可以使用“语音”“文字转语音”“TTS”等相关关键词；在搜索思维导图插件时，可以使用“脑图”“树图”“导图”“mindmap”等关键词。

ai会运营店铺吗？

AI 可以运营店铺。在电子商务领域，企业大多完全在线运营，容易将 AI 工具整合到工作流程中。例如，像 Flair、Booth 和 Bloom 这样的工具能帮助品牌创建引人注目的产品照片，AdCreative 和 Pencil 可以制作用于电子邮件或社交媒体的营销材料，Frase 或 Writesonic 可以编写经过 SEO 优化的产品描述。最终，用户有望仅通过描述期望的审美并点击按钮，就能创建一个完整的电商商店以及用于市场营销的材料。 AI 在医疗药品零售领域也有广泛应用，包括药品推荐系统、库存管理、药品识别与查询、客户服务智能助手、药店运营分析、药品质量监控和药品防伪追溯等方面。展望 2025，在 AI 应用的 ToB 方向，有企业为北美和欧洲企业提供全球雇佣的 AI 驱动解决方案，帮助企业快速组建高效团队，也有企业为线下餐饮服务门店提供全自动管理私域流量营销运营的解决方案，提升营销转化效果和营业额。但当前 ToC 的 AI 应用在一些方向虽有一定用户规模，但距离大规模商业化仍有距离，面临同质化竞争和来自行业现有头部公司的压力。

有哪些AI视频生成的免费应用

以下是一些免费的 AI 视频生成应用： 1. Runway：主流的 AI 视频生成应用之一。 2. Luma：可用于生成视频。 3. SORA：是免费的 AI 视频生成工具。 4. Veo：能帮助生成视频。 5. 可灵：可进行 AI 视频生成。此外，一些 AI 视频平台会为专业创作者提供免费支持，例如 Invideo AI、Pictory 等，它们能帮助创作者降低视频素材制作门槛。OpusClip 提供的长视频转短视频功能也致力于解决创作者在不同平台分发视频的痛点。

有哪些图片生成的免费AI应用

以下是一些免费的图片生成 AI 应用： Adobe firefly：图像生成，4 月访问量 30250 万次。 Freepik：图像生成，4 月访问量 8643 万次。 Civitai：图像生成，4 月访问量 2315 万次。 Midjourney：图像生成，4 月访问量 1704 万次。 Yodayo：图像生成，4 月访问量 1578 万次。 Picsart Al：图像生成，4 月访问量 1078 万次。 Sea Art AI：图像生成，4 月访问量 981 万次。 Playground：图像生成，4 月访问量 853 万次。 PixAI：图像生成，4 月访问量 834 万次。 Ideogram：图像生成，4 月访问量 804 万次。