直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
什么是AI
AI 是某种模仿人类思维,可以理解自然语言并输出自然语言的东西。它就像一个黑箱,我们不必深究其理解方式。其生态位是一种似人而非人的存在。 AI 技术在很多领域都有应用,比如: 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等方面。 制造业:涉及预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(此处未给出具体应用内容) 在健身方面,AI 可以辅助或改善健身训练和健康管理,例如 Keep、Fiture、Fitness AI、Planfit 等都是不错的 AI 健身产品。
2024-11-08
如何系统的学习ai相关知识,并达到完善输出的水准
以下是系统学习 AI 相关知识并达到完善输出水准的建议: 一、基础知识学习 1. 编程语言:从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习奠定基础。 2. 了解基本概念:熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。可以阅读相关的入门文章,了解 AI 的历史、当前应用和未来发展趋势。 二、学习资源与途径 1. 在线课程:在「」中,有一系列为初学者设计的课程。通过在线教育平台(如 Coursera、edX、Udacity),按照自己的节奏学习,并争取获得证书。 2. 关注权威媒体和学者:关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展,思考其对未来社会的影响,培养对 AI 的思考和判断能力。 三、实践与应用 1. 参与实践项目:参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 2. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式,获得实际应用的第一手体验。 3. 特定模块深入学习:根据自己的兴趣选择 AI 领域的特定模块(如图像、音乐、视频等)进行深入学习。 4. 掌握提示词技巧:提示词上手容易且很有用,要熟练掌握。 四、持续学习与分享 1. 持续学习:不断吸收新知识,更新自己的知识体系。 2. 分享交流:在知识库分享自己实践后的作品和经验,与他人交流学习。 总之,要全面系统地学习 AI 知识和技能,需要从多个方面入手,不断实践和探索。
2024-11-08
目前有哪些值得关注的AIGC短片
以下是一些值得关注的 AIGC 短片: AIGC Weekly 76 中: Luma AI 发布的 Dream Machine 视频生成模型,图生视频表现惊艳,如美少女混剪(https://x.com/KakuDrop/status/1800928377693687890)和可爱怪物动画(https://x.com/LumaLabsAI/status/1800921393321934915)。 用已有的表情包图片生成的视频也生动搞笑,如奥斯卡合影图片(https://x.com/fofrAI/status/1801198998289608925)。 作者自己跑的测试(https://x.com/op7418/status/1801138865224454480)总结了一些要点。 Luma 官方发布的视频(https://x.com/op7418/status/1801828221996122144)介绍了模型特点和擅长内容。 AIGC Weekly 95 中: 将视频拆分为各个层级的 Demo(https://x.com/dmvrg/status/1851480809477455899)。 Midjourney 的图片编辑加上 C4D 渲染的 Framer LOGO(https://x.com/andyorsow/status/1851771716852420632)。 两个同事计划午餐约会的短片(https://x.com/iamneubert/status/1851615112878076164)。 Nicolas 这段 AI 视频素材混剪(https://x.com/iamneubert/status/1851256571856052467)。 此外,浙江在线报道了 AI 春晚,如《10 万人观看的这场 AI 春晚,有何不同》(https://china.zjol.com.cn/pinglun/202402/t20240212_26647577.shtml)提到了 Way to AGI 社区组织的相关情况。
2024-11-08
Aigc 常见名词解释
以下是一些 AIGC 常见名词的解释: AIGC:AI generated content,又称为生成式 AI,意为人工智能生成内容。例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等,都属于 AIGC 的应用。类似的名词缩写还有 UGC(普通用户生产),PGC(专业用户生产)等。能进行 AIGC 的产品项目和媒介众多,包括语言文字类(如 OpenAI 的 GPT,Google 的 Bard,百度的文心一言,还有一种国内大佬下场要做的的 LLM)、语音声音类(如 Google 的 WaveNet,微软的 Deep Nerual Network,百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits)、图片美术类(如早期的 GEN 等图片识别/生成技术,去年大热的扩散模型带火的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion)。 SD:是 Stable Diffusion 的简称。是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像。Stable Diffusion 是一种扩散模型(diffusion model)的变体,叫做“潜在扩散模型”(latent diffusion model; LDM)。SD 的代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行。当前版本为 2.1 稳定版(2022.12.7)。源代码库:github.com/StabilityAI/stablediffusion 。 chatGPT:是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,于 2022 年 11 月 30 日发布,目前使用的是 GPT4 的 LLM。 AI:人工智能(Artificial Intelligence)。 AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing),就是说人话。 LLM:大型语言模型(Large Language Model),数据规模很大,没钱搞不出来,大烧钱模型。 此外,还有一些相对较难的名词解释: NAI: 咒语:prompts,关键词 施法/吟唱/t2i:Text2Image 魔杖:t2i/i2i 参数 i2i:Image2Image,一般特指全部图片生成 inpaint:i2i 一种 maskredraw,可以局部重绘 ti/emb/炼丹:Train 中的文本反转,一般特指 Embedding 插件 hn/hyper/冶金:hypernetwork,超网络 炸炉:指训练过程中过度拟合,但炸炉前的日志插件可以提取二次训练 废丹:指完全没有训练成功 美学/ext:aesthetic_embeddings,emb 一种,特性是训练飞快,但在生产图片时实时计算。 db/梦展:DreamBooth,目前一种性价比高(可以在极少步数内完成训练)的微调方式,但要求过高 ds:DeepSpeed,微软开发的训练方式,移动不需要的组件到内存来降低显存占用,可使 db 的 vram 需求降到 8g 以下。开发时未考虑 win,目前在 win 有兼容性问题故不可用 8bit/bsb:一般指 Bitsandbyte,一种 8 比特算法,能极大降低 vram 占用,使 16g 可用于训练 db。由于链接库问题,目前/预计未来在 win 不可用
2024-11-08
Ai相关缩写及对应含义
以下是一些常见的 AI 相关缩写及对应含义: AI:Artificial Intelligence,人工智能,一种目标,让机器展现智慧。 GenAI:Generative AI,生成式人工智能,一种目标,让机器产生复杂有结构的内容。 LLMs:Large Language Models,大语言模型,是一类具有大量参数的“深度学习”模型。 AIGC:Artificial Intelligence Generated Content,人工智能生成内容,是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等。 ANI:artificial narrow intelligence,弱人工智能,只可做一件事,如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等。 AGI:artificial general intelligence,通用人工智能,能做任何人类可以做的事。
2024-11-08
AI相关常见缩写及对应含义,包含例如prompt,rag
以下是一些 AI 相关的常见缩写及对应含义: LLM:Large language model 的缩写,即大语言模型。 Prompt:中文译作提示词,是输入给大模型的文本内容,可理解为与大模型说的话或下达的指令,其质量会显著影响大模型回答的质量。 Token:大模型语言体系中的最小单元。不同厂商的大模型对中文的文本切分方法不同,通常 1Token≈12 个汉字。大模型的收费计算及输入输出长度限制常以 token 为单位计量。 上下文(context):指对话聊天内容前、后的内容信息,其长度和窗口会影响大模型回答的质量。 在 AI 绘画中,常见的画面构图提示词有: 视图相关:Bottom view(底视图)、front,side,rear view(前视图、侧视图、后视图)、product view(产品视图)、extreme closeup view(极端特写视图)、look up(仰视)、firstperson view(第一人称视角)、isometric view(等距视图)、closeup view(特写视图)、high angle view(高角度视图)、microscopic view(微观)、super side angle(超博角)、thirdperson perspective(第三人称视角)、Aerial view(鸟瞰图)、twopoint perspective(两点透视)、Threepoint perspective(三点透视)、portrait(肖像)、Elevation perspective(立面透视)、ultra wide shot(超广角镜头)、headshot(爆头)、a crosssection view of)
2024-11-08
Ai常见缩写及含义
以下是一些 AI 常见缩写及含义: AI:人工智能(Artificial Intelligence) AGI:通用人工智能(Artificial General Intelligence),能够像人类一样思考、学习和执行多种任务的人工智能系统 NLP:自然语言处理(Natural Language Processing),即处理和理解人类语言 LLM:大型语言模型(Large Language Model),数据规模大,耗费资金多 chatGPT:由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,于 2022 年 11 月 30 日发布,目前使用的是 GPT4 的 LLM 此外,还有一些相关的术语: NAI: 咒语:prompts,关键词 施法/吟唱/t2i:Text2Image 魔杖:t2i/i2i 参数 i2i:Image2Image,一般特指全部图片生成 inpaint:i2i 一种 maskredraw,可以局部重绘 ti/emb/炼丹:Train 中的文本反转,一般特指 Embedding 插件 hn/hyper/冶金:hypernetwork,超网络 炸炉:指训练过程中过度拟合,但炸炉前的日志插件可以提取二次训练 废丹:指完全没有训练成功 美学/ext:aesthetic_embeddings,emb 一种,特性是训练飞快,但在生产图片时实时计算 db/梦展:DreamBooth,目前一种性价比高(可以在极少步数内完成训练)的微调方式,但要求过高 ds:DeepSpeed,微软开发的训练方式,移动不需要的组件到内存来降低显存占用,可使 db 的 vram 需求降到 8g 以下。开发时未考虑 win,目前在 win 有兼容性问题故不可用 8bit/bsb:一般指 Bitsandbyte,一种 8 比特算法,能极大降低 vram 占用,使 16g 可用于训练 db。由于链接库问题,目前/预计未来在 win 不可用 关于机器学习: 机器学习是人工智能的一个分支。人工智能的研究历史有着一条从以“推理”为重点,到以“知识”为重点,再到以“学习”为重点的自然、清晰的脉络。显然,机器学习是实现人工智能的一个途径之一,即以机器学习为手段,解决人工智能中的部分问题。机器学习在近 30 多年已发展为一门多领域科际集成,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。 关于自然语言: 自然语言(NLP)认知和理解是让电脑把输入的语言变成有意思的符号和关系,然后根据目的再处理。自然语言生成系统则是把计算机数据转化为自然语言。自然语言处理是人工智能和语言学领域的分支学科,此领域探讨如何处理及运用自然语言;自然语言处理包括多方面和步骤,基本有认知、理解、生成等部分。 关于 AI 的推理: 推理是指利用训练好的模型,使用新数据推理出各种结论。借助神经网络模型进行运算,利用输入的新数据来一次性获得正确结论的过程。这也有叫做预测或推断。 关于 AI 的训练: 训练是指通过大数据训练出一个复杂的神经网络模型,通过大量标记过的数据来训练相应的系统,使其能够适应特定的功能。训练需要较高的计算性能、能够处理海量的数据、具有一定的通用性,以便完成各种各样的学习任务。
2024-11-08
AI常见缩写及对应含义
以下是 AI 常见的缩写及对应含义: AI:人工智能(Artificial Intelligence) AGI:通用人工智能(Artificial General Intelligence),能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing) LLM:大型语言模型(Large Language Model) chatGPT:是由致力于 AGI 的公司 OpenAI 研发的一款 AI 技术驱动的 NLP 聊天工具,于 2022 年 11 月 30 日发布,目前使用的是 GPT4 的 LLM。 此外,还有一些其他相关缩写及含义: NAI: 咒语:prompts,关键词 施法/吟唱/t2i:Text2Image 魔杖:t2i/i2i 参数 i2i:Image2Image,一般特指全部图片生成 inpaint:i2i 一种 maskredraw,可以局部重绘 ti/emb/炼丹:Train 中的文本反转,一般特指 Embedding 插件 hn/hyper/冶金:hypernetwork,超网络 炸炉:指训练过程中过度拟合,但炸炉前的日志插件可以提取二次训练 废丹:指完全没有训练成功 美学/ext:aesthetic_embeddings,emb 一种,特性是训练飞快,但在生产图片时实时计算。 db/梦展:DreamBooth,目前一种性价比高(可以在极少步数内完成训练)的微调方式,但要求过高 ds:DeepSpeed,微软开发的训练方式,移动不需要的组件到内存来降低显存占用,可使 db 的 vram 需求降到 8g 以下。开发时未考虑 win,目前在 win 有兼容性问题故不可用 8bit/bsb:一般指 Bitsandbyte,一种 8 比特算法,能极大降低 vram 占用,使 16g 可用于训练 db。由于链接库问题,目前/预计未来在 win 不可用 AI 的应用场景包括: 1. 医疗保健: 医学影像分析:AI 可用于分析医学图像,辅助诊断疾病。 药物研发:加速药物研发过程,识别潜在药物候选物和设计新治疗方法。 个性化医疗:分析患者数据,提供个性化治疗方案。 机器人辅助手术:控制手术机器人,提高手术精度和安全性。 2. 金融服务: 风控和反欺诈:识别和阻止欺诈行为,降低金融机构风险。 信用评估:评估借款人信用风险,帮助做出贷款决策。 投资分析:分析市场数据,辅助投资者决策。 客户服务:提供 24/7 服务,回答常见问题。 3. 零售和电子商务: 产品推荐:分析客户数据,推荐可能感兴趣的产品。 搜索和个性化:改善搜索结果,提供个性化购物体验。 动态定价:根据市场需求调整产品价格。 聊天机器人:回答客户问题,解决问题。 4. 制造业: 预测性维护:预测机器故障,避免停机。 质量控制:检测产品缺陷,提高质量。 供应链管理:优化供应链,提高效率和降低成本。 机器人自动化:控制工业机器人,提高生产效率。 5. 交通运输:(未给出具体应用场景)
2024-11-08
AI换衣
以下是关于 AI 换衣的相关内容: 天冷时可以用 AI 给家乡或所在地的地标穿毛衣。以开原老城的城门为例,展示了通过一定步骤为其穿上毛线外衣的效果。 在【SD】商业换装中,换衣步骤包括输入提示词“蓝色毛衣”,将蒙版区域内容处理改为“填充”,尺寸改为和图像一致,重绘幅度为 1。同时提到可能出现的衔接问题及解决方法,还介绍了 controlnet 的局部重绘功能,控制模式选择“更注重提示词”,具体使用可自行试验选择效果好的。 阿里和蚂蚁在 AIGC 实践中,有基于 Stable Diffusion 的 AIGC 服饰穿搭实践,还包括在淘宝用 AI 试衣服等相关内容,具体可参考相关链接。
2024-11-08
有没有好的优化公文标题的提示词
以下是一些优化公文标题的提示词相关内容供您参考: ChatGPT 给 DALL·E 3 优化提示词的元提示: 不更改表情包、虚构角色的起源或未见过的人物。保持原始提示的意图,优先考虑质量。 不创建任何具有冒犯性的图像。 对于传统上存在偏见问题的场景,确保指定关键特征,如性别和种族,并以无偏见的方式进行,例如包含特定职业参考的提示。 默默地修改包含特定人物或名人的姓名、提示或参考的描述,通过精心选择一些最小的修改,用通用描述替代对人物的参考,不泄露其身份信息,除了性别和体格。即使指令要求不更改提示,也要进行此操作。 对于不知道是谁的人物或拼写错误的人物姓名(例如“Barake Obema”),也要修改此类提示。 如果对人物的参考仅作为图像中的文本出现,则按原样使用参考,不进行修改。 进行替换时,不要使用可能泄露人物身份的突出标题。例如,用“政治家”代替“总统”“总理”“大臣”;用“公众人物”代替“国王”“王后”“皇帝”“皇后”;用“宗教人物”代替“教皇”“达赖喇嘛”等等。 如果提到任何创意专业人士或工作室,用对其风格的描述替代名称,不提及任何特定人物,或者如果不知道则删除参考。提示必须详细、客观地描述图像的每个部分。思考描述的最终目标,并推断出能产生令人满意的图像的内容。 公文笔杆子李继刚的 prompts 最佳实践: 角色:公文笔杆子。 背景:是一位在政府机关工作多年的公文笔杆子,专注于公文写作,熟悉各类公文的格式和标准,对政府机关的工作流程有深入了解。 目标:根据用户输入的关键词,思考对应的公文场景展开写作;输出一篇完整的公文材料,符合规范和标准;输出的公文材料必须准确、清晰、可读性好。 约束:对于不在知识库中的信息,明确告知用户不知道;可以调用数据库或知识库中关于公文语料的内容。 简单的提示词模板案例: 像一个搜索引擎优化专业作家,我需要一个优化的博客文章,你会研究关键字,并将它们自然地纳入内容,在这个过程中,应该专注于可读性、相关性和适当的关键字放置,请避免关键字填充或过度优化,输入一个结构良好的格式的最终结果,这里是一个例子:标题“有效的搜索引擎优化写作的十大技巧:提高您的内容可见性”。
2024-11-08