直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
有哪些可以生成诗的 AI
以下是一些可以生成诗的 AI: 诗歌相机(Poetry Camera):内核搭载树莓派,能通过分析拍摄的照片,利用计算机视觉算法和人工智能模型,识别图像关键元素等信息来生成诗,并以类似超市收银条的方式打印出来。 ChatGPT:虽然可能在某些特定情境下的诗歌创作不够精准,但也能生成诗歌。 此外,还有一些相关的信息: 2016 年,由人工智能撰写的《电脑写小说的那一天》小说成功通过了日本“星新一文学奖”的初选。 Sony 开发的 DeepBach AI 在深度学习巴赫后,创作出的仿巴赫音乐,在 1600 位听众里,骗过了超过一半的人。 生成式人工智能能够生成文本和图像,涵盖诗歌等,但训练它们通常需要大量数据和计算能力。
2024-10-28
AI做人体视频
以下是用 10 分钟轻松制作 AI 换脸、AI 数字人视频的方法: 1. 整体流程介绍: 数字人视频的整体制作流程大致分为三步,分别是创建视频内容、生成数字人、AI 换脸。 2. 创建视频内容: 先准备一段视频中播放的内容文字,比如产品介绍、课程讲解、游戏攻略等,也可以利用 AI 生成这段文字。 使用剪映 App 对视频进行简单处理,电脑端打开剪映 App,点击“开始创作”,选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号,添加文字内容轨道,将准备好的文字内容替换默认文本内容,为数字人提供语音播放的内容以及生成相对应的口型。 3. AI 换脸: 有多个 AI 产品可以实现换脸效果,如开源、免费的 facefusion。 本机解决方案:需要 Python 环境及安装视频解码器等多个依赖软件,对编程知识有要求,且运行推理计算速度依赖 GPU,本地计算机若无 GPU 或 GPU 显存较小,执行速度缓慢,不推荐本地化安装。 云服务解决方案:可利用云厂商如阿里云的 PAI 和 AutoDL 已提供的大模型运行环境和计算能力,选择 AutoDL 时,在算力市场中选择能接受价格的算力服务器,建议选取 GPU 配置更高的算力设备。在算法社区查找 facefusion 镜像,通过模型镜像启动 GPU 服务器。
2024-10-28
学AI的APP
以下为您推荐一些学习 AI 的 APP: 1. 盒马鲜生 APP:AI 菜谱食材采购平台,使用自然语言处理、数据分析技术,市场规模达数亿美元。可根据菜谱推荐食材并提供采购渠道。 2. 沪江网校社区:AI 语言学习社区平台,运用自然语言处理、数据分析技术,市场规模达数十亿美元。为语言学习者提供交流平台。 3. 猫眼专业版 APP:AI 电影票房预测系统,采用数据分析、机器学习技术,市场规模达数亿美元。预测电影票房,为电影行业提供参考。 4. 联想设备管理平台:AI 办公设备管理系统,借助数据分析、物联网技术,市场规模达数亿美元。管理办公设备,提高设备利用率。 5. Logic Pro X 教学软件:AI 音乐制作教学平台,利用机器学习、音频处理技术,市场规模达数亿美元。教授音乐制作技巧,培养音乐人才。 6. 鲁班到家 APP:AI 家居维修服务平台,通过数据分析、自然语言处理技术,市场规模达数亿美元。为用户提供家居维修服务,解决生活难题。 7. 雪球财经 APP:AI 金融投资教育平台,使用数据分析、自然语言处理技术,市场规模达数亿美元。提供金融投资知识教育,提高投资者素质。 8. 穷游网社区:AI 旅游体验分享平台,借助自然语言处理、图像识别技术,市场规模达数亿美元。让用户分享旅游体验,发现更多美好。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习,如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识。 2. 尝试使用 AI 工具和平台,如 ChatGPT、Midjourney 等,也可以探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识,了解其基本概念、发展历程、主要技术(如机器学习、深度学习等),学习其在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目,参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态,关注权威媒体和学者,了解最新进展,思考其对未来社会的影响,培养思考和判断能力。 总之,中学生可以从编程基础、工具体验、知识学习、实践项目等多个方面入手,全面系统地学习 AI 知识和技能,为未来的 AI 发展做好准备。
2024-10-28
有哪些图片转文字的工具?
以下是一些图片转文字的工具: 2txt:利用 AI SDK 将图片内容转换为文字,不仅限于 OCR,提供体验地址和开源代码链接:https://x.com/imxiaohu/status/1780101723719393780 Memo:由 Notion 中文社区负责人 Linmi 和他的朋友们制作的视频播客转文字和翻译的工具。未领到邀请码的可以在此主动申请:https://mxmefbp9p0g.feishu.cn/share/base/form/shrcnsxtPkCciZ32iQVSkEpgIWg
2024-10-28
控制在智能制造中的应用
以下是关于控制在智能制造中的应用的相关信息: 在智能制造领域,控制技术有着广泛的应用: 1. 预测性维护:利用人工智能预测机器故障,帮助工厂避免停机,提高生产效率。 2. 质量控制:通过人工智能检测产品缺陷,提升产品质量。 3. 供应链管理:借助人工智能优化供应链,提高效率并降低成本。 4. 机器人自动化:运用人工智能控制工业机器人,进一步提高生产效率。 此外,ControlNet 是一种由斯坦福大学张吕敏发布的神经网络模型,它能与预训练的图像扩散模型(如 Stable Diffusion)结合,通过引入额外条件输入来控制 AI 绘画的生成过程。其工作原理是将 Stable Diffusion 模型的权重复制到 ControlNet 的可训练副本中,并使用外部条件向量训练副本,具有训练过程的鲁棒性、避免过度拟合、可在小规模设备训练以及架构兼容性和迁移能力强等优点,不仅用于 AI 绘画,还可用于图像编辑、风格迁移、图像超分辨率等多种计算机视觉任务。
2024-10-28
情感丰富音频ai模型
以下为您介绍一些情感丰富音频 AI 模型: 阿里云最新开源模型 FunAudioLLM:这是通义实验室语音团队全新推出的生成式语音大模型,能提供舒适自然的语音合成能力。它可以生成不同情感的语音,如中性、悲伤、快乐等。例如,悲伤情感的语音有“等你熬过那些孤独无助的时刻,你才会发现,原来自己并没有想象中那么脆弱。原来一个人,也可以活成千军万马的模样。我可以安慰很多人,但就是不能安慰自己那颗千疮百孔的心。总有一些人会慢慢淡出你的生活。你要学会接受,而不是怀念。有些事。不管我们如何努力,回不去就是回不去了。我们漫长的岁月中有太多的过客,有太多的无奈。”;快乐情感的语音有“小丽抿着嘴,弓着腰,蹑手蹑脚地,一步一步慢慢地靠近它。靠近了,靠近了,又见她悄悄地将右手伸向蝴蝶,张开的两个手指一合,夹住了粉蝶的翅膀。小丽高兴得又蹦又跳。除夕晚上,儿子孙子都来到她身边,她满脸皱纹都舒展开了,就像盛开的菊花瓣,每根皱纹里都洋溢着笑意。” XiaoHu.AI 日报中提到的模型:它由 SenseVoice 和 CosyVoice 构成。声音克隆仅需几秒音频样本,无需额外训练数据,还能控制情绪情感、语速、音高。详细内容:https://xiaohu.ai/p/10954 项目地址:https://funaudiollm.github.io 在线演示:https://modelscope.cn/studios/iic/CosyVoice300M 此外,还有 LLM 比价工具,可对比不同种类模型型号的订阅价格和 API 价格,传送门:https://huggingface.co/spaces/philschmid/llmpricing 以及浦语灵笔 IXC2.5,能看懂视频,完整书写文章,自动生成网站,由上海人工智能实验室开发,使用 7B LLM 后端,具有与 GPT4V 相当的能力,擅长网页制作和高质量文本图像文章创作。详细内容:https://xiaohu.ai/p/10891
2024-10-28
人工智能视阈下高校设计学科教学 改革的新路径研究
以下是为您整合的相关内容: 在高校设计学科教学改革方面,相关法案提到了对人工智能领域的支持,包括支持跨学科研究、教育和培训项目,以促进学生和研究人员在人工智能方法和系统方面的学习,并培养相关领域专家的跨学科视角和合作。同时,在高等教育中,有人认为大型语言模型(LLMs)可能会对其产生显著的积极影响,特别是提升人文学科的重要性。LLMs 具有深度且内在的文本属性,与大学人文学科课程所强调的技能和方法直接相关。此外,还有法案涉及推动机器学习的发展,支持跨多个机构和组织的人工智能及相关学科的跨学科研究和开发。
2024-10-28
专门为大模型RAG设计的知识库产品 有哪些?
以下是一些专门为大模型 RAG 设计的知识库产品: 1. Metaso.cn:适用于学术、研究领域。 2. So.360.com:在生活方面提供便捷的搜索服务。 3. Felo.ai/search:具有综合性的特点。 4. Devv.ai:主要面向程序员、开发者。 5. Perplexity:属于付费产品,提供高质量的服务。 6. Bing.com:具有通用性。 7. Google.com:在全球范围内提供精准的搜索结果。 RAG 就像一个超级智能的图书馆员,其工作流程包括检索、增强和生成三个环节。在不改变大模型本身的基础上,通过外挂知识库等方式,为模型提供特定领域的数据信息输入,让模型能基于特定的数据生成内容、降低幻觉,实现对该内容更准确的信息检索和生成。 RAG 具有成本效益、灵活性和可扩展性等优点,比如实现成本更低,可以利用多种数据源,能随时增加或更新知识库中的内容。但也存在回答准确性不够的缺点。 在一些示例中,如设定使用阿里千问模型作为 AI 模型,将角色设定为“美嘉”并按照其人设、背景和对话风格设定提示词,放入《爱情公寓》全季剧情作为知识库,从而让“美嘉”拥有过往“记忆”。
2024-10-28
贝叶斯网络
贝叶斯网络: 在 1985 年“ A Learning Algorithm for Boltzmann Machines”中,玻尔兹曼机器类似于神经网络,其单元在给定相连单元值和权重的情况下能计算自身概率,取值为 1 或 0,是随机的,遵循概率分布而非决定性方式。玻尔兹曼机器部分与概率分布有关,其分布决定了数学和推理方法,是一种基于能量的模型实例,适用于基于能量的学习理论框架。一个简单的信念,或者说贝叶斯网络,玻尔兹曼机器基本上就是如此,但有着非直接/对称联系和可训练式权重,能够学习特定模式下的概率。 在深度学习领域的讨论中,有人是贝叶斯主义者,喜欢贝叶斯非参数方法。当时神经网络因无法证明相关数学定理而被边缘化,但有人从一开始就被神经网络吸引。
2024-10-28
AI图生图工具
以下是一些好用的图生图工具: 1. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,能将上传的照片转换为芭比风格,效果很好。 目前市场上受欢迎的文生图工具包括: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真图片。 2. StableDiffusion:开源工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量图像生成效果和用户友好界面设计而受欢迎,在创意设计人群中流行。 您还可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 另外,像吐司(https://tusiart.com/images/635511733697550450?post_id=635512498197535244&source_id=nzywoVHilkK7o_cqaH31xAh)、哩布(https://www.liblib.ai/)这样的网站是免费的在线 SD 工具。 需要注意的是,这些 AI 模型在使用时可能存在一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。同时,本教程适用于入门玩家,如果在使用过程中有任何问题,可以通过评论区、微信(designurlife1st,记得备注来意:ai 绘图交流)等方式与作者联系。教程内容会持续更新。
2024-10-28