知識ベースとの対話 - WayToAGI

「AGIへの道」飛書ナレッジベースへ直行 →

ホーム/すべての質問

ai从哪里开始学

学习 AI 是一个长期的过程，新手可以参考以下步骤： 1. 了解 AI 基本概念：阅读「」部分，熟悉 AI 的术语和基础概念，包括其主要分支（如机器学习、深度学习、自然语言处理等）以及它们之间的联系。浏览入门文章，了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅：在「」中，找到为初学者设计的课程，特别推荐李宏毅老师的课程。通过在线教育平台（如 Coursera、edX、Udacity）上的课程，按照自己的节奏学习，并有机会获得证书。 3. 选择感兴趣的模块深入学习： AI 领域广泛（比如图像、音乐、视频等），根据自己的兴趣选择特定的模块进行深入学习。掌握提示词的技巧，它上手容易且很有用。 4. 实践和尝试：理论学习之后，实践是巩固知识的关键，尝试使用各种产品做出作品。在知识库提供了很多大家实践后的作品、文章分享，欢迎实践后的分享。 5. 体验 AI 产品：与现有的 AI 产品进行互动，如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人，了解它们的工作原理和交互方式。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法，设计自己的学习路径。不要害怕犯错，每个挑战都是成长的机会。随着时间的推移，您将逐渐建立起自己的 AI 知识体系，并能够在这一领域取得自己的成就。

以下是关于文生图的相关知识：简明操作流程：定主题：明确生成图片的主题、风格和要表达的信息。选择基础模型 Checkpoint：根据主题选择贴近的模型，如麦橘、墨幽的系列模型。选择 lora：寻找与生成内容重叠的 lora 以控制图片效果和质量。 ControlNet：可控制图片中特定的图像，如人物姿态、特定文字等，属于高阶技能。局部重绘：下篇再教。设置 VAE：选择 840000 即可。 Prompt 提示词：用英文写需求，使用单词和短语组合，用英文半角逗号隔开。负向提示词 Negative Prompt：用英文写要避免产生的内容，单词和短语组合，用英文半角逗号隔开。采样算法：一般选 DPM++2M Karras，也可参考模型作者推荐的采样器。采样次数：选 DPM++2M Karras 时，采样次数在 30 40 之间。尺寸：根据喜好和需求选择，注意尺寸并非越大越好。提示词：分为内容型提示词和标准化提示词，用于描述想要的画面。例如选择 anythingV5 大模型，输入“1 个女孩，黑发，长发，校服，向上看，短袖，粉红色的花，户外，白天，蓝色的天空，云，阳光，上身，侧面”等描述。采样迭代步数通常控制在 20 40 之间，步数越高绘画越清晰，但速度越慢。采样方法常用的有 Euler a、DPM++2S a Karras、DPM++2M Karras、DPM++SDE Karras、DDIM 等，有的模型有指定算法，搭配更好用。比例设置为 800:400，模型练图基本按 512x512 框架，太大数值可能导致奇怪构图，可通过高清修复放大图像倍率。文生图工具： DALL·E：OpenAI 推出，可根据文本描述生成逼真图片。 StableDiffusion：开源，能生成高质量图片，支持多种模型和算法。 MidJourney：图像生成效果好，界面设计用户友好，在创意设计人群中流行。更多工具可在 WaytoAGI 网站（https://www.waytoagi.com/category/104 ）查看。

计算两个文本的相识度代码实现

以下是关于计算两个文本相似度的代码实现相关内容：在文本处理中，文本会先转为 tokens，再转为向量，然后放到计算机中运算以找出规律。在文本转为向量后，可以通过欧式距离或 cosin 角度来计算两个文本之间的相似性。例如，使用 SBERT 算法时，对于描述主体相同的情况（如屏幕相关的描述）会设为高相似性。文本统计单位“1”通常是以二级类别来衡量，比如屏幕模糊，它包括画面模糊、边缘模糊、文本模糊等细分情况。若要统计三级类别，目前多采用人工统计。同时，文本统计单位“1”是一个 clustering 概念，因为在向量空间中难以找到完全相同的两个单位，更多是距离较近的单位，所以统计通常以 clustering 计算。另外，在初级菜鸟学 Langchain 实录中，对于文本相似度检索过程，包括读入文字、进行文字清洗、文本句子切分、文本向量化、计算相似度以及取前几的答案等步骤，详情可见 https://github.com/yuanzhoulvpi2017/DocumentSearch 。

帮助初一孩子学好英语的AI是什么

以下是一些可以帮助初一孩子学好英语的 AI 工具和方法： 1. 工具方面： LingoDeer：使用游戏和互动活动教英语，提供各种课程，有家长仪表板可跟踪孩子进度。 Busuu：提供英语及多种语言课程，多种教学方法，有社区功能可与他人练习口语。 Memrise：用抽认卡和游戏教英语，涵盖多种课程，有社交功能可与亲友一起学习。 Rosetta Stone：使用沉浸式方法教英语，有语音识别功能帮助练习发音。 Duolingo：免费的语言学习应用，课程多样，游戏化方法让学习有趣。 2. 学习方法：智能辅助工具：如 Grammarly 可进行英语写作和语法纠错。语音识别和发音练习：如 Call Annie 用于口语练习和发音纠正。自适应学习平台：如 Duolingo 为孩子量身定制学习计划，提供个性化内容。智能导师和对话机器人：如 ChatGPT 进行英语会话练习和对话模拟。在为孩子选择 AI 工具时，要考虑他们的年龄、兴趣和学习风格，还需考虑应用程序的功能和成本。

如何计算两耳文本的相识度

计算两耳文本的相似度通常可以通过以下步骤和方法： 1. 文本预处理：将文本转为 tokens，再转为向量。 2. 相似度计算：在文本转为向量后，通过欧式距离或 cosin 角度来计算两个文本之间的相似性。 3. 聚类分析：可以将向量通过主成分分析降维到 2 维空间，观察文本聚类效果。 4. 文本单位定义：文本统计单位“1”通常是以二级类别来衡量，例如屏幕模糊，它包括画面模糊、边缘模糊、文本模糊等细分情况。若要统计三级类别情况，目前多采用人工统计。 5. 算法应用：使用 SBERT 算法时，会将描述主体相同且带有相似形容词的文本设为高相似性。但在某些情况下，不能将三级类目作为文本统计项。 6. 借助工具：如可以询问 Claude 两段文本在含义上是否大致相同，通过特定的提示格式让 Claude 进行判断和回答。

卷积神经网络模型原理

卷积神经网络（CNN）通常由卷积层、池化层和全连接层叠加构成。在卷积过程中，卷积层中的卷积核依次与输入图像的像素做卷积运算来自动提取图像中的特征。卷积核尺寸一般小于图像，并以一定的步长在图像上移动得到特征图。步长设置越大，特征图尺寸越小，但过大步长会损失部分图像特征。此外，池化层作用于产生的特征图上，能保证 CNN 模型在不同形式的图像中识别出相同物体，同时减少模型对图像的内存需求，其最大特点是为 CNN 模型引入了空间不变性。

帮助孩子学好英语的AI是什么

以下是一些可以帮助孩子学好英语的 AI 工具： 1. LingoDeer：这是一款通过游戏和互动活动教孩子英语的应用程序，提供各种课程，包括字母、数字、语法和词汇等，还有家长仪表板可跟踪孩子进度和设置学习目标。 2. Busuu：另一个流行的语言学习应用，提供英语及多种语言课程，采用多种教学方法，包括音频、视频课程和互动练习，还有社区功能让孩子与世界各地的孩子练习口语。 3. Memrise：使用抽认卡和游戏教孩子英语，提供从基本词汇到会话技巧的课程，具有社交功能可与朋友和家人一起学习。 4. Rosetta Stone：采用沉浸式方法教孩子英语，让孩子在自然环境中学习，还有语音识别功能帮助练习发音。 5. Duolingo：免费的语言学习应用，提供多种语言课程，通过游戏化方法使学习有趣。在为孩子选择 AI 工具时，要考虑孩子的年龄、兴趣和学习风格，还需考虑应用程序的功能和成本。此外，使用 AI 进行英语学习的方法还包括： 1. 利用智能辅助工具如 Grammarly 进行写作和语法纠错。 2. 使用语音识别应用如 Call Annie 进行口语练习和发音纠正。 3. 借助自适应学习平台如 Duolingo 获得量身定制的学习计划和个性化内容。 4. 利用智能对话机器人如 ChatGPT 进行会话练习和对话模拟。

以下是一些常见的 AI 模型： OpenAI 模型： GPT4 Beta：一组改进 GPT3.5 的模型，可以理解和生成自然语言或代码。 GPT3.5：一组改进 GPT3 的模型，可以理解并生成自然语言或代码。 DALL·E Beta：可以在给定自然语言提示的情况下生成和编辑图像的模型。 Whisper Beta：可以将音频转换为文本的模型。 Embeddings：一组可以将文本转换为数字形式的模型。 Codex Limited Beta：一组可以理解和生成代码的模型，包括将自然语言转换为代码。 Moderation：可以检测文本是否敏感或不安全的微调模型。 GPT3：一组可以理解和生成自然语言的模型。智谱·AI 模型： WebGLM10B：利用百亿参数通用语言模型（GLM）提供高效、经济的网络增强型问题解答系统。 WebGLM2B MathGLM2B：在训练数据充足的情况下，20 亿参数的 MathGLM 模型能够准确地执行多位算术运算，准确率几乎可以达到 100%。 MathGLM500M MathGLM100M MathGLM10M MathGLMLarge：采用 GLM 的不同变体作为骨干来训练 MathGLM。 ProductHunt 2023 年度最佳产品榜单中的模型： GPT4（免费可用）：与人类水平相当的 LLM，是 OpenAI 在深度学习规模扩大方面的最新里程碑，是一个大型多模态模型（接受图像和文本输入，输出文本），在各种专业和学术基准测试中表现出与人类相当的水平。 Midjourney v5（免费）：最新、最先进的模型，具有极高的一致性，擅长以更高分辨率解释自然语言 prompt，并支持像使用 tile 这样的重复图案等高级功能。 DALL·E 3（免费可用）：代表了生成完全符合文本的图像能力的一大飞跃。 Mistral 7B（免费）：是一个具有 73 亿参数的模型，在所有基准测试上超越了 Llama 2 13B，在许多基准测试上超越了 Llama 1 34B，在代码任务上接近 CodeLlama 7B 的性能，同时在英语任务上表现良好。

以下是一些常见的 AI 算法种类：分类算法：如 Categorization Algorithms、Classification Model 等。聚类方法：如 Cluster Resolution Feature Selection、ClusterBased Splitting、Clustering Methods 等。动态规划：如 Dynamic Programming 。超参数相关：如 Hyperparameter Opimization、Hyperparameters 。图像相关：如 Image And Speech Recognition、Image Classification、Image Classifier、Image Recognition 。其他：如 Combined Gradient、Dual Algorithm、Dual Problem 等。

AI 的原理包括以下几个方面： 1. 概念：生成式 AI 生成的内容称为 AIGC。 2. 概念与关系： AI 即人工智能。机器学习是电脑找规律学习，包括监督学习、无监督学习、强化学习。监督学习使用有标签的训练数据，目标是学习输入和输出之间的映射关系，包括分类和回归。无监督学习的数据没有标签，算法自主发现规律，经典任务如聚类。强化学习从反馈中学习，以最大化奖励或最小化损失，类似训小狗。深度学习是一种参照人脑的方法，具有神经网络和神经元，因层数多被称为深度，神经网络可用于监督学习、无监督学习、强化学习。生成式 AI 可以生成文本、图片、音频、视频等内容形式。 LLM 是大语言模型，对于生成式 AI，生成图像的扩散模型不是大语言模型；对于大语言模型，生成只是其中一个处理任务，如谷歌的 BERT 模型可用于语义理解（不擅长文本生成），像上下文理解、情感分析、文本分类。 3. 技术里程碑：2017 年 6 月，谷歌团队发表论文《Attention is All You Need》，首次提出 Transformer 模型，它完全基于自注意力机制处理序列数据，无需依赖循环神经网络（RNN）或卷积神经网络（CNN），Transformer 比 RNN 更适合处理文本的长距离依赖性。