「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
我想用coze写一个能够自动提取我手机的支付记录然后记账的应用要怎么做
要使用 Coze 写一个能够自动提取手机支付记录然后记账的应用,您可以参考以下步骤: 1. 了解 Coze:COZE 是字节跳动旗下子公司推出的 AI Agent 构建工具,允许用户在无编程知识的基础上,使用自然语言和拖拽等方式构建 Agent,目前有丰富的插件生态且可以免费使用海量大模型。 2. 配置变现模板: 设置套餐金额及时长:价格页信息默认包含 3 个套餐,可自行修改、删除、新增,套餐数量无上限,修改后无需保存即刻生效。 订单与用户信息查看:在“管理后台”页面除了可以进行智能体配置,还可查看已付费订单以及注册用户,方便运营维护。 完成所有项目配置后,点击【配置完成】即可邀请用户访问并体验您的 Coze 智能体。 激活支付功能:配置该功能后,可实现平台收款、退款等操作,实现项目的商业变现。通过支付宝申请电脑网站支付,将申请到的 AppId、商户私钥、公钥按要求配置即可。详细的配置教程可以在'Zion 帮助中心'中搜索'支付'找到。 3. 学习记账管家相关知识:记账管家是基于 COZE 平台的能力搭建的一个记账应用,您可以直接和 coze 说您今天的收入或者支出情况,coze 会自动帮您记账,同时帮您计算出账户余额,每一笔记账记录都不会丢失。 4. 搭建教学: 增加记账记录 add_accounting_record 工作流:用于增加记账的工作流,通过大语言模型把用户输入的非结构化数据转变成数据库能理解的结构化数据存入,并告诉用户结果。 开始:定义一个{{prompt}},把用户在 bot 输入的记账内容传入进来(例如:今天花了 233.32 元吃了一顿烧烤)。 大模型:本次任务比较简单,使用任意模型都可以胜任,无需调整大模型参数。输入定义了一个{{input}}引用了【开始节点】的 prompt 参数。提示词让大模型根据{{input}}传入的内容进行拆解,分别识别【记账事项】、【发生时间】、【变动金额】,并把识别出来的内容分别赋值到{{item}}、{{occurrence_time}}、{{balance_change}}。输出定义了【记账事项】、【发生时间】、【变动金额】对应的{{item}}、{{occurrence_time}}、{{balance_change}}。 数据库——插入记账记录:输入定义了{{item}}、{{occurrence_time}}、{{balance_change}},用于接收从大模型节点{{item}}、{{occurrence_time}}、{{balance_change}}输出传入的内容。SQL 命令:不会写没关系,直接使用自动生成语法,输入命令如下,注意我们数据库存入的金额最小单位是分,所以在最终的语法,{{account_change}}100;意思当用户说我花了 2.23 元,数据库存储的是 2.23100=223。提示词:把 item、occurrence_time、account_change 存入到 user_accounting_records 表的{{item}}、{{occurrence_time}}、{{account_change}}中。 数据库——查询账户余额。
2025-01-10
有没有专门翻译的ai软件
以下是一些专门用于翻译的 AI 软件: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-10
地方国民经济和社会发展规划、产业规划编制的Ai工具
以下是一些可以用于地方国民经济和社会发展规划、产业规划编制的 AI 工具: 在绘制逻辑视图、功能视图、部署视图方面: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,用户可通过拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能。 3. ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板用于创建相关视图。 6. draw.io(现称为 diagrams.net):免费在线图表软件,支持创建逻辑视图和部署视图等。 7. PlantUML:文本到 UML 转换工具,通过编写描述性文本自动生成相关视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图。 在审核规划平面图方面: 1. HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型。 2. Maket.ai:面向住宅行业,在户型和室内软装设计方面有 AI 技术探索。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期阶段可引入标准和规范。 4. Fast AI 人工智能审图平台:形成全自动智能审图流程,实现建筑全寿命周期内信息集成与管理。 但每个工具都有其特定应用场景和功能,建议根据具体需求选择合适的工具。
2025-01-10
写小说
以下是关于用 AI 写小说的一些方法和经验: 1. Stuart 分享的 coze 工作流: 用 bing 搜索标题相关的内容。 用程序将搜索结果结构化(不熟悉程序的可忽略或直接复制文中代码)。 用大模型草拟大纲,包括标题、主旨、世界观、主要角色、小说背景、情节概要。 再用大模型来写文章。 输出文章内容。通过此工作流能写出至少高中生水平的小说。 2. 南瓜博士的人机协作经验: 为 LLM 小说比赛尝试多种方法,包括写 agent flow 框架让 AI 自动按步骤写作、评判和提交,但因无法认同 AI 审美而放弃。 选择在 GPT 页面上对话,先让 AI 生成大量创意,自己进行判断和挑拣,在写作过程中自己负责掌舵,最后给出改进意见让 AI 遵循修改。在这个过程中找到了满满的存在感,认为小说创作中人有人的用处。
2025-01-10
如何系统学习ai知识
以下是系统学习 AI 知识的方法: 1. 编程语言基础:从 Python、JavaScript 等编程语言开始学习,掌握编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 工具和平台体验:使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 基础知识学习: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 实践项目参与:参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注前沿动态:关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展,思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 对于新手学习 AI,还可以: 1. 了解基本概念:阅读「」部分,熟悉 AI 的术语和基础概念,浏览入门文章,了解其历史、应用和发展趋势。 2. 开始学习之旅:在「」中找到为初学者设计的课程,推荐李宏毅老师的课程。通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习并获取证书。 3. 选择兴趣模块深入:根据自身兴趣选择特定的 AI 模块(如图像、音乐、视频等)深入学习,掌握提示词技巧。 4. 实践和尝试:理论学习后进行实践,巩固知识,尝试使用各种产品并分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式,获得实际应用体验。
2025-01-10
免费数字人工具
以下为您推荐一些免费的数字人工具: 1. 开源且适合小白用户的工具: 特点:一键安装包,无需配置环境,简单易用。 功能:生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 使用步骤:下载 8G+3G 语音模型包,启动模型即可。 GitHub 链接: 官网: 相关链接: 2. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 1. 点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。 2. 上传后效果如图所示,My Avatar 处显示上传的照片。 3. 点开大图后,点击 Create with AI Studio,进入数字人制作。 4. 写上视频文案并选择配音音色,也可以自行上传音频。 5. 最后点击 Submit,就可以得到一段数字人视频。 3. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 1. 点击上面的网址,点击右上角的 Create vedio。 2. 选择人物形象,可以点击 ADD 添加照片,或者使用 DID 给出的人物形象。 3. 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 4. 最后,点击 Generate vedio 就可以生成一段视频。 5. 打开自己生成的视频,可以下载或者直接分享给朋友。 4. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很 AI。 使用方法: 1. 点击上面的网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。 2. 点击开始创作,选择自定义照片。 3. 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 4. 打开绿幕按钮,点击背景,可以添加背景图。 5. 最后,点击生成视频。
2025-01-10
有什么AI模型可以制作瞬息宇宙?比如Stable Diffusion,还有别的吗?
以下是一些可以用于制作类似效果的 AI 模型: 1. Adobe Firefly:内置在各种 Adobe 产品中,不过在质量方面稍逊于 DALLE 和 Midjourney,但它只使用有权使用的图像进行训练。 2. Stable Diffusion:开源模型,可以在任何高端计算机运行。开始时需要学会正确制作提示,一旦掌握能产生很好的结果,尤其适合将 AI 与其他源的图像结合。 3. DALLE:来自 OpenAI,已纳入 Bing(需使用创意模式)和 Bing 图像创建器,系统可靠但效果比 Midjourney 稍差。 4. Midjourney:2023 年中期最好的系统,学习曲线最低,只需键入特定指令就能得到很好的结果,需要 Discord。 此外,在游戏制作领域,已经出现了用于游戏中几乎所有资产的生成式人工智能模型,从 3D 模型到角色动画,再到对话和音乐。但文中未提及具体的模型名称。
2025-01-10
2025年1月9日,AI领域最新新闻
以下是 2025 年 1 月 9 日 AI 领域的部分最新新闻: 艾媒咨询发布的《》显示,中国 AI 大模型市场在 2024 年规模约为 294.16 亿元,预计 2026 年将突破 700 亿元。用户调研表明,超过半数用户频繁使用 AI 大模型,主要用于工作和学习。国产大模型正广泛应用于各行业,如金融、医疗、教育等,推动数字化转型。政策支持、算力发展和经济因素共同驱动产业发展。AI 大模型在网络安全、教育、金融等领域展现出巨大潜力,用户对其在这些领域的应用充满期待。 其它一些报告发布在: UiPath:《》 毕马威:《》 清华大学:《》 中央企业人工智能:《》 拾象投研团队预测 2025 年 AI 发展的关键趋势,包括微软可能转向 Anthropic 合作,Google 利用其强大资源缩小与领先者的差距,以及 Agent 成为新的软件核心,推动任务自动化和推理能力的提升。同时,数据的上下文层和合成数据技术的突破将是竞争的关键。硬件方面,推理需求激增将使 NVDA 继续在算力市场中保持领先地位。 讨论了即将进入的智能代理 AI 时代,特别是 Coding Agent 的崛起。随着 AI 编程能力的提升,许多人将有机会更快地开发产品,投资者对此充满期待。然而,关于 AI Coding 是否会取代传统程序员的争论仍然存在,分为保守派、乐观派和激进派。尽管未来仍不确定,但 AI 编程课程的需求已显著增加,显示出人们对这一领域的关注和焦虑。 过去一年,头部 AI 应用的品类变化并不显著。对比美国 2023 年与 2024 年的 AI 应用 Top50 榜单,整体类别基本保持稳定。其中,创意工具(如图像和视频内容创作)依然占据最大比重,大语言模型助手、AI 陪伴和模型中心等类别也继续稳居主流地位。新上榜的仅包括美食、约会和音乐创意工具等几个小品类。 模型进展(算法、算力和数据) AI 算法的“推陈出新” OpenAI 新模型——o1 在业界对传统预训练模型进展放缓的担忧中,2024 年 9 月,OpenAI 发布了新一代语言模型 o1。尽管技术细节未被完全公开,但业界推测 o1 采用了全新的训练与推理方案,结合强化学习技术,显著增强了模型的推理能力。o1 可能是通过生成内部“思维链”(Chain of Thought),模拟人类的系统 2 思维方式,在回答复杂问题时能够逐步推理、自我纠错和优化。 心理学家丹尼尔·卡尼曼(Daniel Kahneman)曾提出人类的系统 1 和系统 2 两种思维模式——前者快速、直觉,后者慢速、理性。业界专家认为,传统的 GPT4 等模型更像系统 1,快速生成答案但缺乏深度推理,而 o1 则更倾向于系统 2,通过逐步推理提升回答质量。 o1 可能借鉴了下围棋的 AlphaGo Zero 的技术思路,例如强化学习、自我博弈和思维链的结合。尽管围棋任务的规则性与自然语言的开放性不同,但这些技术不仅为 o1 提供了更强的推理能力,也预示着 AI 技术在复杂任务领域进一步突破的可能。
2025-01-10
什么是AIGC
AIGC 即 AI generated content,又称为生成式 AI,是一种利用人工智能技术生成各种类型内容的应用方式。 AIGC 能够通过机器学习和深度学习算法,根据输入的数据和指令生成符合特定要求的内容,其应用领域广泛,包括但不限于内容创作、广告、媒体等。 例如,在文字生成方面,可使用大型语言模型(如 GPT 系列模型)生成文章、故事、对话等内容;在图像生成方面,可使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等;在视频生成方面,可使用 Runway、KLING 等模型生成动画、短视频等。 AIGC 与 UGC(普通用户生产)、PGC(专业用户生产)都是内容生成的不同方式。UGC 是由用户生成的内容,优势在于内容丰富多样,能反映用户真实想法和创意,适用于社交媒体、社区论坛等互动性强的平台。PGC 是由专业人士或机构生成的内容,优势在于内容质量高、专业性强,适用于新闻媒体、专业网站等需要高质量内容的平台。 能进行 AIGC 的产品项目众多,媒介也多样。语言文字类有 OpenAI 的 GPT、Google 的 Bard、百度的文心一言等;语音声音类有 Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits;图片美术类有早期的 GEN 等图片识别/生成技术,去年大热的扩散模型带火了生成质量很高的 Midjourney、先驱者谷歌的 Disco Diffusion、一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion。Stable Diffusion 是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型,代码模型权重已公开发布,当前版本为 2.1 稳定版(2022.12.7),源代码库为 github.com/StabilityAI/stablediffusion。
2025-01-10
transformer
Transformer 是一种深度学习模型,其核心思想是“Attention is all you need”。以下为您详细介绍其工作流程: 假设我们有一个英文句子“I am a student”需要翻译成中文。 1. 输入嵌入(Input Embeddings):首先,将每个单词映射为一个向量,即单词嵌入(word embeddings)。例如“I”映射为一个 512 维的向量。 2. 位置编码(Positional Encodings):由于 Transformer 没有递归或卷积等捕获序列顺序的结构,所以需要给每个词位置加上位置编码,使模型知道词语的相对位置。 3. 编码器(Encoder):输入序列的嵌入向量和位置编码相加后被送入编码器层。编码器由多个相同的层组成,每层有两个核心部分: 多头注意力机制(MultiHead Attention):捕捉单词间的依赖关系。 前馈神经网络(FeedForward NN):对 attention 的结果进行进一步编码。 4. 解码器(Decoder):编码器的输出被送入解码器层。解码器也是由多个相同层组成,每层除了编码器组件外,还有一个额外的注意力模块,对编码器的输出序列建模依赖关系。 5. 输出嵌入(Output Embeddings):解码器最后一层的输出被映射为输出单词概率分布。例如生成单词“我”“是”等概率。 6. 生成(Generation):基于概率分布,以贪婪或 beam search 等解码策略生成完整的输出序列。 Transformer 主要用于处理序列数据,包括现在最火的 NLP 任务。与之前的模型不同,Transformer 完全基于注意力机制,不使用传统的循环神经网络(RNN)或卷积神经网络(CNN)的计算架构。它可以用来翻译文本、写诗、写文章,甚至生成计算机代码。像 GPT3、BERT、T5 等功能强大的自然语言处理(NLP)模型都是基于 Transformer 模型。如果您想在机器学习,特别是自然语言处理方面与时俱进,至少要对 Transformer 有一定的了解。
2025-01-10