直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
有没有什么能够把手绘扩展成插画的 AI?
以下是一些能够把手绘扩展成插画的 AI 工具或方法: 1. Stable Diffusion:在有参考图的情况下,可以对原图进行风格化转变。若要创作原创卡通插画,可不使用 ControlNet。通过调整提示词,如“一个女孩坐在沙发上,吃西瓜,看电视,夏天”,能生成插画。完成后可能存在小瑕疵,可在 PS 里后期修复。 2. 公众号【白马与少年】:如果想要相关模型和 Lora,可以添加该公众号,回复【SD】获取。 需要注意的是,在使用这些工具时,可能需要一定的操作技巧和相关知识。
2025-01-13
免费的AI工具
以下是一些免费的 AI 工具: 绘图方面: draw.io(现在称为 diagrams.net):免费的在线图表软件,支持创建逻辑视图和部署视图等。 Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 思维导图方面: GitMind:免费的跨平台 AI 思维导图软件,支持多种模式。 ProcessOn:国内思维导图+AIGC 的工具,可利用 AI 生成思维导图。 AmyMind:轻量级的在线 AI 思维导图工具,无需注册登录即可使用,支持自动生成节点。 此外,还有一些与不同领域相关的免费 AI 工具: AI 研究工具:Claude、ChatGPT、Bing Chat、Perplexity。 图片处理:DallE、Leonardo、BlueWillow、Midjourney。 版权写作:Rytr、Copy AI、Wordtune、Writesonic。 设计:Canva、Clipdrop、Designify、Microsoft Designer。 网站搭建:10Web、Framer、Hostinger、Landingsite。 视频处理:Klap、Opus、Invideo、Heygen。 音频处理:Murf、LovoAI、Resemble、Eleven Labs。 SEO 优化:Alli AI、BlogSEO、Seona AI、Clearscope。 Logo 设计:Looka、LogoAI、Brandmark、Logomaster。 聊天机器人:Droxy、Chatbase、Voiceflow、Chatsimple。 自动化工具:Make、Zapier、Bardeen、Postman。
2025-01-13
图片转文字
图片转文字的相关内容如下: AI 拍立得: 在线体验:可通过微信小程序“Pailido”搜索使用,能拍照快速生成各类文案,丰富场景自由切换,如快速生成闲鱼文案、生成外卖/大众点评等。 交互逻辑:用户选择拍摄场景类型并拍照,AI 自动识别和分析照片内容,依据预设场景规则迅速生成符合情境的反馈。 实现场景: 图片转成文本:用户上传图片后,大模型根据选择的场景生成与内容相关的文字描述或解说文本。其逻辑在于图片内容识别和高质量文本生成,核心是图片理解和文本整理润色,场景应用包括产品文档生成(电商/零售)、社交媒体内容生成(品牌营销)、法律文件自动生成(法律行业)等。 图片转绘图片:用户上传图片后,大模型按照指定的风格快速生成图像的转绘版本,适应不同风格和场景需求。 2txt:Image to text 转换工具:利用 AI SDK 将图片内容转换为文字,不仅限于 OCR,提供体验地址和开源代码链接。
2025-01-13
我想学习使用python
Python 是一种高级编程语言,具有以下特点和优势: 特点:简单易学、功能强大、库丰富。可以想象成一个拥有多种工具的工具箱,能帮助完成画画、计算、整理东西等各种任务。 起源:1989 年由 Guido van Rossum 在荷兰的 Centrum Wiskunde&Informatica(CWI)开始开发,1991 年发布第一个公开发行版 Python 0.9.0,之后不断发展,2020 年 1 月 1 日 Python 2 正式停止支持。 为什么使用:环境部署简单,下载两个软件并点击安装即可;语法简单且可读性强,适合小白;应用广泛,可用于做网站、开发游戏、分析数据、自动化任务等。 如果您想深入学习 Python,至少需要熟悉以下内容: Python 基础:包括基本语法(如变量命名、缩进)、数据类型(如字符串、整数、浮点数、列表、元组、字典)、控制流(如条件语句、循环语句)。 函数:定义和调用函数,理解参数和返回值,以及作用域和命名空间。 模块和包:学会导入模块和使用包来扩展程序功能。 面向对象编程(OOP):了解类和对象、属性和方法、继承和多态。 异常处理:理解异常以及如何使用 try 和 except 语句处理错误。 文件操作:掌握文件读写和文件与路径操作。 在学习 Python 的课程中,比如“和 Cursor AI 一起学 Python 编程”的第一节,会介绍 Python 是什么、Cursor 使用、notebook 远程编程。包括 Python 的简介、发展历史和特点,在数据分析和人工智能等领域的优势及应用案例,还会介绍 Cursor 编程环境,它是结合了 AI 功能的编程编辑器,具有 AI 辅助代码补全和生成、实时语法和错误检查等功能和优势,以及 Bohrium 在线编程平台,它是 AI for Science 的科研学习平台,利用其 Jupyter Notebook 进行远程编程具有无需本地环境配置、内置丰富功能、适合团队协作和教学场景等优势。
2025-01-13
如何将ollama下载到其他盘中
要将 ollama 下载到其他盘,您可以按照以下步骤进行操作: 1. 新建环境变量:ollama 默认的模型保存路径为 Windows:C:\\Users\\%username%\\.ollama\\models 。添加环境变量添加 OLLAMA_MODELS 环境变量。 2. 进入 ollama 官网下载:地址为 https://ollama.com/ 。 3. 下载语言模型:模型地址为 https://ollama.com/library 。 选择 llama 模型下载至本地。 选择本地文件夹,在 CMD 后粘贴刚才复制的命令。 开始下载,下载完成并测试。 4. 下载图像模型:模型地址为 https://ollama.com/library 。 选择 llava 模型下载至本地。 选择本地文件夹,在 CMD 后粘贴刚才复制的命令。 开始下载,下载成功。 5. 在 Comfy 中使用: 下载并安装 ollama 节点,下载地址: ,下载完成后安装到节点目录。 在 Comfy 中调用。 此外,还有以下相关信息供您参考: 为了应对没下载大模型带来的报错,需要下载大模型。首先,下载 ollama,网站: 网站中,复制代码。然后,像建议一样打开 ComfyUi 根目录下的 custom_nodes\\ComfyUiOllamaYN 的文件路径,在上方的路径下输入 cmd,进入到下方的命令行,右键即可粘贴刚才的代码,等待下载即可。 部署大语言模型: 下载并安装 Ollama:点击进入,根据您的电脑系统,下载 Ollama:https://ollama.com/download 。下载完成后,双击打开,点击“Install”。安装完成后,将下方地址复制进浏览器中。如果出现下方字样,表示安装完成:http://127.0.0.1:11434/ 。 下载 qwen2:0.5b 模型(0.5b 是为了方便测试,下载快,自己设备充足的话,可以下载更大的模型)。如果是 windows 电脑,点击 win+R ,输入 cmd,点击回车。如果是 Mac 电脑,按下 Command(⌘)+Space 键打开 Spotlight 搜索,输入“Terminal”或“终端”,然后从搜索结果中选择“终端”应用程序。复制以下命令行,粘贴进入,点击回车。回车后,会开始自动下载,等待完成。(这里下载久了,可能会发现卡着不动,不知道下载了多少了。鼠标点击一下窗口,键盘点空格,就会刷新了)下载完成后您会发现,大模型已经在本地运行了。输入文本即可进行对话。
2025-01-13
免费做ppt的Ai
以下是一些免费做 PPT 的 AI 工具: 1. Gamma:在交流群中被频繁推荐,免费版本能生成高质量 PPT,性能卓越,用户体验好。从个人使用体验来看,其生成效果在内容组织、设计美观度和整体专业感方面表现出色。网址:https://gamma.app/ 2. 歌者 PPT:是一款永久免费的智能 PPT 生成工具。具有话题生成、资料转换、多语言支持、在线编辑和分享等功能,拥有海量模板和案例库,增值服务包括自定义模板、字体、动效等。其优势包括免费使用、智能易用、海量案例、资料转 PPT 专业、AI 翻译等,特别适合不太擅长制作 PPT 或时间紧张的人群。网址:gezhe.com 3. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,用户通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,可根据需求选择不同风格和主题模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 4. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包括互动元素和动画效果,以增强演示文稿吸引力。网址:https://www.mindshow.fun/ 5. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能,能提高文档编辑效率。网址:https://zhiwen.xfyun.cn/
2025-01-13
AI提示词
以下是关于 AI 提示词的相关内容: 108 个舞蹈音乐提示词:这是由作者@mista.lewys@normalgoodz 发布在 SUNO.WIKI 的 PROMPTS BOOK,由格林翻译和扩展。它是一个全面的 108 条简洁提示列表,用于生成 AI 舞曲,每个提示的字符数在 117 到 120 之间,涵盖了各种舞曲子流派,如 Punchy 4/4 beats(节奏感强的四四拍鼓点)、Electro bass(电子低音)、Catchy synths(易于记住的合成器旋律或音效)、Pop vocals(流行音乐风格的主唱)、Bright pads(明亮的和弦音效)、Clubready mixes(适合在夜店播放的混音)、Energetic drops(高潮部分)等。每个提示精心制作,以有效地封装各种舞蹈音乐流派的具体特点和大气质量,同时确保适应不同的聆听环境。 SD 新手入门图文教程中的提示词模板相关网站: Majinai: 词图: Black Lily: Danbooru 标签超市: 魔咒百科词典: AI 词汇加速器: NovelAI 魔导书: 鳖哲法典: Danbooru tag: AIBooru:
2025-01-13
有什么能帮助写申报书的AI
以下是一些能帮助写申报书的 AI 工具: 1. Kickresume 的 AI 写作器:使用 OpenAI 的 GPT4 语言模型自动生成内容,包括申报书的摘要、工作经验和教育等部分,并保持一致语调。 2. Rezi:受到超过 200 万用户信任的领先 AI 构建平台,使用先进的 AI 技术自动化创建申报书的各个方面,包括写作、编辑、格式化和优化。 3. Huntr 的 AI 构建器:提供免费模板,以及 AI 生成的总结、技能、成就生成器和工作匹配功能。 更多相关工具,您还可以查看这里:https://www.waytoagi.com/category/79 。您可以根据自己的需求选择最适合的工具。
2025-01-13
如今ai发展到什么地步
AI 技术的发展历程和前沿技术点如下: 发展历程: 早期阶段(1950s 1960s):专家系统、博弈论、机器学习初步理论。 知识驱动时期(1970s 1980s):专家系统、知识表示、自动推理。 统计学习时期(1990s 2000s):机器学习算法(决策树、支持向量机、贝叶斯方法等)。 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等。 前沿技术点: 大模型(Large Language Models):GPT、PaLM 等。 多模态 AI:视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 自监督学习:自监督预训练、对比学习、掩码语言模型等。 小样本学习:元学习、一次学习、提示学习等。 可解释 AI:模型可解释性、因果推理、符号推理等。 机器人学:强化学习、运动规划、人机交互等。 量子 AI:量子机器学习、量子神经网络等。 AI 芯片和硬件加速。 OpenAI 提出的通用人工智能(AGI)的五个发展等级分别为: 1. 聊天机器人(Chatbots):具备基本对话能力的 AI,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平的 AI,能够解决复杂问题,如 ChatGPT,能够根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务的 AI。目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明的 AI,如谷歌 DeepMind 的 AlphaFold 模型,可以预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 关于红杉|AI 50 未来公司: 去年,生成式 AI 从不引人注意的地方走到了 AI 50 强榜单的前列。今年,随着企业用户和消费者的 AI 生产力大幅提高,它成为前沿和中心。尽管 2023 年美国的大部分 AI 风投都流向了基础设施领域,其中 60%流向了最大的大语言模型(LLM)提供商,但应用公司仍在 AI 50 强榜单中占据主导地位。 与此同时,我们开始看到 AI 为公司赋能。如今,许多公司正将 AI 融入其工作流程,以此来快速达成 KPI。我们看到大公司正通过将 AI 融入其产品的方式而获益。工作流程自动化平台 ServiceNow 通过 AI 驱动的 Now Assist,实现了近 20%的事件避免率。Palo Alto Networks 利用 AI 降低了处理费用的成本。Hubspot 利用 AI 扩大了能够支持的用户规模。瑞典金融科技公司 Klarna 最近宣布,通过将 AI 融入用户支持,他们在运行率方面节省了 4000 多万美元。现在,成千上万的公司正在将 AI 整合到他们的工作流程中,以扩张规模和降低成本。AI 50 强企业正在快速进化。不远的将来,我们有望看到 UX 和 UI 围绕 AI 的功能进行重新设计。在更好、更廉价地复制现有功能之后,我们将开发全新的用户界面,以提供有价值的新体验。原文链接:https://www.sequoiacap.com/article/ai502024/ ,发表时间:2024 4 11,作者:Konstantine Buhler,编译:Z Potentials 。
2025-01-13
提示词框架
以下是关于提示词框架的相关内容: 视频模型中的提示词框架: Vidu Prompt 基本构成: 提示词基础架构:包括主体/场景、场景描述、环境描述、艺术风格/媒介。需调整句式和语序,避免主体物过多/复杂、模糊术语表达,使用流畅准确的口语化措辞,丰富、准确和完整的描述以生成特定艺术风格、满足需求的视频。 提示词与画面联想程度的说明:以单帧图像为例,通过具体详实的位置描述/环境描述进行构图,艺术风格描述提升效果和氛围,统一画面风格。 AI 提示词工程师相关的提示词框架: 提示词工程师是专门负责为大语言模型设计、优化和实施 Prompt 的技术角色,不仅编写 Prompt,还需测试和优化以确保输出内容质量。 发展出多种提示词框架,如 ICIP 框架(包括指令、背景信息、输入数据、输出指示器)、BROKE 框架(包括背景、角色定义、目标设定、关键成果展示、持续的试验与优化)、CRISPE 框架(包括上下文、角色、说明、主题、预设、例外)。 有定制化的 Prompt 编写服务,由资深提示词工程师深入了解客户需求设计、优化并定制最合适的 Prompt。 RAG 提示工程中的提示词框架: 在输入环节构建全面的提示词框架,包含伦理审查及针对不同类型攻击的审查规则,具体划分为伦理审查及对越狱类、泄露类、目标劫持类等攻击类型的审查。融入人格设定元素,利用大型模型的注意力机制,加固输入防护的审核能力及人格设定的稳定性。
2025-01-13