「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
AI绘画
AI 绘画是一个对艺术界产生双向影响的领域: 背景:从生成艺术作品到辅助艺术创作,AI 绘画逐渐改变传统艺术面貌,艺术界的反馈也推动其发展。技术进步使 AI 绘画在创作质量和速度上有新突破,为艺术家提供新工具,推动传统艺术数字化和普及化。 争议:人们对 AI 驱动的机器人创作和人类创作的艺术品接受程度相似,但不太愿意将机器人视为艺术家,AI 在表达情感和创造性意图方面存在局限性。艺术家对其态度复杂,有期待也有对版权、原创性和伦理的担忧。同时,AI 绘画技术发展带来从业者职业安全焦虑和“侵权”反对之声,反映新技术对行业生态和现有法律伦理框架的挑战。 积极影响:为艺术创作提供新可能性,帮助艺术家探索新创意表达方式,提高制作效率,降低成本,促进艺术与观众互动,提供个性化和互动的艺术体验。 着色画: 关键词简介:中文为着色画,英文为 Coloring page。它提供基础框架,由简单线条勾勒物体或场景轮廓,留给创作者无限想象空间填充色彩和纹理,可手绘或数字格式。 艺术效果:体现在色彩丰富性、情感表达、细节和纹理突出、创意发挥等方面。 AI 绘画的关键词结构思路:包括基础描述、风格指定、色彩要求、细节强调等。 进阶玩法:可用 MJ 的 Retexture 功能或即梦参考功能,通过写提示词或垫图功能给着色画上色。 AI 绘画的关键词指南: 公式:主题+环境+气氛+灯光+色彩+构图+风格参考。 比如:可找喜欢的艺术家、灯光、颜色调色板风格,分别放到相应的关键词里。
2024-12-25
精准的提示词如何找到
要找到精准的提示词,可以参考以下方法: 1. 描述逻辑:人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。 2. 功能型辅助网站: http://www.atoolbox.net/,通过选项卡的方式快速填写关键词信息。 https://ai.dawnmark.cn/,每种参数都有缩略图参考,方便直观选择提示词。 C 站(https://civitai.com/),每一张图都有详细参数,可点击复制数据按钮,粘贴到正向提示词栏,注意图像作者使用的大模型和 LORA。 也可只取其中较好的描述词,如人物描写、背景描述、小元素或画面质感等。 3. 星流一站式 AI 设计工具: prompt 输入框中可输入提示词、使用图生图功能辅助创作。 输入语言:星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(一个长头发的金发女孩),基础模型 1.5 使用单个词组(女孩、金发、长头发),支持中英文输入。 提示词优化:启用提示词优化后,可扩展提示词,更生动描述画面内容。 写好提示词: 预设词组:小白用户可点击提示词上方官方预设词组生图,提示词内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,帮助 AI 理解不想生成的内容。 利用“加权重”功能:在功能框增加提示词并调节权重,权重数值越大越优先。 辅助功能:翻译功能可一键将提示词翻译成英文,还有删除所有提示词、会员加速等功能。 4. SD 新手入门: 提示词工作是缩小模型出图的解空间,效果受模型影响,不同模型对提示词语言风格反应不同。 提示词内容:自然语言可使用描述物体的句子,大多数情况下英文有效,也可用中文,避免复杂语法;单词标签可用逗号隔开的单词,使用普通常见单词,风格要和图像整体搭配,避免拼写错误,可参考;Emoji、颜文字 Emoji表情符号准确,对构图有影响,对于使用 Danbooru 数据的模型,西式颜文字可一定程度控制出图表情。
2024-12-25
大模型在金融领域的量化投研领域的应用
大模型在金融领域的量化投研领域有以下应用和特点: 1. 大型系统工程: 量化和大模型都需要大型计算集群,上万张卡的互联是对基础设施的极致挑战。量化对性能和效率有极致追求,交易指令速度至关重要;大模型在基础设施层面的每一点提升都能优化训练效率。 细节在大型系统工程中十分关键。量化交易系统包含多个方面,任何环节出问题都会导致交易系统失败;大模型预训练从数据到评估包含大量细节,如数据配比、顺序、训练策略等。 2. 本土化机会: 很多 Global 的量化基金到中国会水土不服,国家政策也限制其大规模开展业务,给国内量化基金崛起机会。 OpenAI、Google、Meta 等的模型中文能力一般,未对中国国情优化,不符合政策要求,给国内大模型公司本土化预训练机会。 两者都受政策影响极大,需要有效监管才能健康发展。 3. 其他相似之处: 少数精英的人赚大量的钱,做大模型和金融量化都不用很多人,但每个人都要绝顶聪明。 核心问题一样,下一个 token 预测和下一个股价预测类似。 都需要大量数据,都追求可解释性。 作者:黄文灏 源地址:https://zhuanlan.zhihu.com/p/646909899 最近和朋友讨论发现大模型预训练和金融量化有很多相似之处,作者恰好同时具有两者背景,做了对比。
2024-12-25
生成视频
以下是关于生成视频的相关内容: 使用 Adobe Firefly 生成带有文本提示和图像的视频: 1. 在上,选择“生成视频”。 2. 在 Generate video 页面上,在 Prompt 字段中输入文本提示。您还可以使用 Upload 部分中的 Image 选项,将图像用于第一帧,并为视频剪辑提供方向参考。添加图像以提供清晰的视觉引导,使生成的视频更紧密地与您的愿景对齐。 3. 在 General settings 部分,您可以确定 Aspect ratio 和 Frames per second。 4. 在 Advanced 部分,您可以使用 Seed 选项添加种子编号,以帮助启动流程并控制 AI 创建的内容的随机性。如果使用相同的种子、提示和控制设置,则可以重新生成类似的视频剪辑。最后选择 Generate 生成。 使用 Pika 生成视频: 需要进入 generate 频道,目前有 10 个 generate 频道,大家随便选择一个进入即可。 PIKA 生成视频的工作流程: 1. 直接生成视频:在输入/create,然后输入 prompt,得到视频。 2. 图片生成视频:使用 MJ/SD 生成图像(可选)+在 PIKA 平台添加 prompt=得到视频。 此外,还有可供参考。
2024-12-25
AI生成图片的app有哪些?
以下是一些 AI 生成图片的 APP 和工具: 1. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,能将上传的照片转换为芭比风格,效果很好。 此外,还有以下用于生成海报或图片的工具: 1. Canva(可画):https://www.canva.cn/ ,是受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可帮助选择合适颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ ,稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ ,简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面,可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,简化设计流程。 文生图工具方面: 1. DALL·E:OpenAI 推出的文生图工具,能根据输入文本描述生成逼真图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量图像生成效果和用户友好界面设计而受广泛欢迎,在创意设计人群中尤其流行。 您可在 WaytoAGI 网站(https://www.waytoagi.com/category/104 )查看更多文生图工具。但需要注意,这些工具可能存在一些局限,如偶尔性能不稳定、生成内容不当等问题。
2024-12-25
gpt4
以下是关于 GPT4 的相关信息: 技术报告: GPT4 是一个能够处理图像和文本输入并产生文本输出的大型多模态模型。 此类模型是重要研究领域,有潜力用于多种应用,如对话系统、文本摘要和机器翻译,近年来备受关注并取得进展。 开发目标之一是提高理解和生成自然语言文本能力,尤其在复杂细致场景中。 GPT4 在为人类设计的考试中表现出色,如在模拟律师考试中分数位列前 10%,与 GPT3.5 形成鲜明对比。 在传统 NLP 基准测试中,超过以前大型语言模型和大多数先进系统,在 MMLU 基准测试中,不仅在英语中优势明显,在其他语言中也表现强大。 报告还讨论了项目关键挑战,即开发在各种规模下表现可预测的深度学习基础设施和优化方法。 GPT4 有类似早期 GPT 模型的局限性,如不完全可靠、上下文窗口有限、不从经验学习,使用其输出结果需谨慎。 能力测试: 在一系列不同基准上进行测试,包括模拟为人类设计的考试。 考试中的少数问题是模型在训练中看到的,会运行去除这些问题的变体,并报告较低分数,相信结果有代表性。 考试来源为公开材料,包括选择题和自由回答题,为每种形式设计单独提示,在需要输入的问题中加入图像。 评估设置根据考试验证集成绩设计,报告的最终结果基于预留测试考试,总分通过结合选择题和自由回答题分数确定,并报告应试者百分数。 对于 AMC 10 和 AMC 12 2022 年考试,人类百分位数未公布,报告数字是推断的,可能有不确定性。 常见问题解答: 所用模型为 GPT4。 若 GPT4 总结内容质量不行,可点击“重试”按钮让其重新总结。 无法让 GPT 输出排版内容时直接不输出“”,强制不输出会导致总结内容效果大幅下降。 前面提到的剪切板共享工具是微信输入法。
2024-12-25
我需要脚本创作工具,请问推荐哪个呢
以下是为您推荐的一些脚本创作工具及相关信息: 1. Pika、Pixverse、Runway、SVD 这四大 AI 视频工具可用于 AI 短片创作。在创作剧本时,您可以从原创(如自身或周围人的经历、做过的梦、想象的故事等)或改编(如经典 IP、名著、新闻、二创等)入手。短片创作篇幅较小,情节和角色相对简单,从自身或朋友经历改编,或对触动您的短篇故事进行改编是较好的练手方式。多与他人讨论故事,有助于修改和进步。 2. Stuart 制作的“剧本创作”Bot,基于资深影视制作人猫叔的专业捏剧本制作标准流程和专业提示词,用于离谱村视频及其他剧本创作。Bot 地址:https://www.coze.cn/s/i2aHsER3/ 。创作步骤包括构建创意、用创意创作剧本大纲、基于初始剧本规划角色、规划镜头风格、写详细剧本、基于剧本创建分镜、细化重要分镜。 3. 在商业级 AI 视频广告脚本创作中,可将工作交给大模型,如 Kimi(https://kimi.moonshot.cn/)、Claude(https://claude.ai/new)、Chatgpt(https://chatgpt.com/)等。按需选择,效果都能满足要求。脚本提示词结构包括说明要做的视频类型、包含的关键元素以及对输出的要求,推荐使用 Markdown 格式输出。
2024-12-25
请描述具身智能的技术原理
具身智能是人工智能领域的一个子领域,其原理包括以下几个方面: 1. 强调智能体通过与物理世界或虚拟环境的直接交互来发展和展现智能。智能体的“身体”或“形态”很重要,它可以是物理形态如机器人的机械结构,也可以是虚拟形态如模拟环境中的虚拟角色。这些身体为智能体提供了与环境互动的手段,并影响其学习和发展。 2. 涉及多个学科,如机器人学、认知科学、神经科学和计算机视觉等。在机器人学中关注设计能自主行动和适应环境的机器人;在认知科学和神经科学中探索大脑处理与身体相关信息的机制及应用于人造智能系统;在计算机视觉中致力于开发使智能体能够理解和解释视觉信息的算法。 3. 以“具身+智能”的范式,将机器学习算法适配至物理实体,与物理世界交互。例如将大模型嵌入到物理实体上,通过机器配备的传感器与人类交流。 4. 具身智能的三要素包括“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界),三者高度耦合是高级智能的基础。 5. 行动分为“感知决策行动反馈”四个步骤,分别由四个模块完成并形成闭环。 6. 在追求人工通用智能(AGI)的过程中,具身 Agent 强调将智能系统与物理世界紧密结合,能够主动感知和理解所在环境并互动,产生具身行动。 具身智能在机器人领域,特别是服务机器人、工业自动化和辅助技术等方面有重要应用,也在虚拟现实、增强现实和游戏设计等领域广泛应用。但仍面临诸多挑战,如设计智能体身体以最大化智能表现、让智能体在复杂环境中有效学习、处理智能体与人类社会的伦理和安全问题等。
2024-12-25
写短视频脚本用那个更好
以下是一些关于写短视频脚本的方法和工具: 1. 使用框架: ABT 框架:可以为您的产品或服务编写关于特定主题的短视频脚本。 英雄之旅框架:能帮助您为产品或服务创建强大的品牌故事。 Hooked 模型:可用于制定详细的营销活动。 2. 指令逻辑: 给出开头,让 AI 理解语言逻辑并撰写下半部,包含必要内容。 以不同写作技巧转换风格,多滚动生成多样版本。 例如以“失眠的原因”为例,给出开头后包含“睡前滑手机”“咖啡太晚喝”“心中有焦虑感”等内容,并进行不同写作技巧的改写。 3. 反问法: 让 AI 问您问题,能发现其更仔细的思考和逻辑,便于修正。 如在短视频脚本撰写中,可询问需要提供什么资料来表现个人品牌专业度,或在创造社群话题时让其引导您完成。 4. 利用 AIGC 工具: 如 ChatGPT 可生成视频脚本,包括具体场景和转场画面,虽创意有限,但能提高内容制作效率,对非专业人士有帮助。 还能筛选 BGM,告诉其视频情绪,它会给出参考建议。未来若能与音源网站结合实现同步预览,体验会更好。
2024-12-25
大模型在办公场景的应用
大模型在办公场景有诸多应用,具体如下: 基础办公提效:在 PPT、Excel、会议报告、策划会、文案包装、图文海报、客服机器人 bot 等方面,能从单个任务 task 到角色 role 再到角色间协同 collaboration 显著提高工作效率。 人力资源管理:覆盖招聘初期(如职位描述生成、简历分析、面试题设计)、员工绩效评估(分析员工工作表现,识别绩效趋势和提升点,为管理层提供数据支持的绩效反馈)以及员工培训与发展各个环节,提高工作效率。 通俗来讲,大模型是输入大量语料,让计算机获得类似人类的“思考”能力,能够理解自然语言,进行文本生成、推理问答、对话、文档摘要等工作。其训练和使用过程可类比为上学参加工作: 1. 找学校:训练大模型需要大量计算,GPU 更合适,只有购买得起大量 GPU 的才有资本训练自己的大模型。 2. 确定教材:大模型需要的数据量特别多,几千亿序列(Token)的输入基本是标配。 3. 找老师:即用合适的算法讲述“书本”中的内容,让大模型更好理解 Token 之间的关系。 4. 就业指导:为了让大模型更好胜任某一行业,需要进行微调(fine tuning)指导。 5. 搬砖:就业指导完成后,正式干活,比如进行翻译、问答等,在大模型里称之为推导(infer)。 在 LLM 中,Token 被视为模型处理和生成的文本单位,能代表单个字符、单词、子单词,甚至更大的语言单位,具体取决于所使用的分词方法(Tokenization)。Token 是原始文本数据与 LLM 可以使用的数字表示之间的桥梁。在将输入进行分词时,会对其进行数字化,形成一个词汇表(Vocabulary)。 此外,在游戏行业,大模型能降低成本,打造创新玩法,提供更好的游戏体验。如网易推出的首款 AI 手游《逆水寒》,将 AIGC 应用于美术开发,在 NPC 与玩家的交互上呈现独特剧情体验,还内嵌了全自动“AI 作词机”。在健身行业,AI 减重顾问既能解决售前客服问题,也能解决学员离开健身营之后的健康监护,提高学员体验。
2024-12-25