「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
2024ai 大事记
以下是 2024 年 AI 大事纪的相关内容: 1 月: 斯坦福大学 Mobile Aloha。 1 月 10 号 LumaAl Genie 文生 3D。 1 月 11 号 GPT store 上线。 MagnificAl 高清放大爆火。 1 月最后一天苹果 Vision Pro 宣布发售。 3 月: 潞晨科技发布 OpenSora。 Suno 发布 V3 版本爆火。 4 月:英伟达发布硬件股价飙升。 5 月: 苹果发布 AI 芯片。 张吕敏发布 IC light。 7 月:快手开源 LivePortrait 模型,表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月: 阿里云发布模型,海螺 AI 参战。 Google 发布 GameGen 实时生成游戏。 通义千问 2.5 系列全家桶开源。 华为发布 cloud matrix 云计算基础设施。 GPT 高级语音模式上线。 Meta 发布 AI 眼镜 Orion。 AI 代码编辑器 cursor 爆火。 10 月: Pika 发布 1.5 模型。 诺奖颁发给 AI 奠基人。 特斯拉发布机器人。 Adobe 发布 Illustrator+Al 生成矢量图。 智谱 AI 发布 autoGLM。 腾讯混元开源 3D 模型。 云深处发布机器人山猫机器狗。 Apple 发布 Mac mini。 12 月: 李飞飞发布空间智能成果。 腾讯开源混元视频模型。 Open AI 开 12 天发布会。 微软发布 Trellis 最强开源图生 3D。 Gemini2.0 视觉交互智能体。 智元机器人开始量产。 谷歌发布 Veo2 能生成 4K 视频。 需要注意的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-10
rga实操
RAG(Retrieval Augmented Generation,检索增强生成)是一种利用大模型能力搭建知识库的技术。其应用过程可抽象为以下 5 个步骤: 1. 文档加载:从多种不同来源加载文档,如 PDF 等非结构化数据、SQL 等结构化数据以及 Python、Java 等代码,LangChain 提供了 100 多种不同的文档加载器。 2. 文本分割:文本分割器把 Documents 切分为指定大小的块,称为“文档块”或“文档片”。 3. 存储:包括将切分好的文档块进行嵌入转换成向量的形式,以及将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法从向量数据库中找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示生成更合理的答案。 在本地部署 RAG 时,需要加载所需的库和模块,如 feedparse 用于解析 RSS 订阅源,ollama 用于在 python 程序中跑大模型。从订阅源获取内容,通过专门的文本拆分器将长文本拆分成较小的块,并附带相关元数据。为文档内容生成向量,可使用文本向量模型 bgem3。基于用户的问题,从向量数据库中检索相关段落,并根据设定的阈值进行过滤,最后让模型参考上下文信息回答用户的问题,从而实现 RAG。还可以创建网页 UI,并进行评测。 在问答测试中,对于同样的问题和上下文,基于不同模型如 Qwen7b、Gemma、Mistral、Mixtral 和 GPT4 分别进行了多次测试,得出了不同模型的表现结论。总结来说,本文展示了如何使用 Langchain 和 Ollama 技术栈在本地部署一个资讯问答机器人,同时结合 RSSHub 来处理和提供资讯。上下文数据质量和大模型的性能决定了 RAG 系统性能的上限,RAG 能提升答案质量和相关性,但不能完全消除大模型幻觉、信息滞后等问题。
2025-01-10
2025年1月10日,AI领域最新新闻
以下是 2025 年 1 月 10 日 AI 领域的最新新闻: 《拾象 2025 AI Best Ideas:20 大关键预测》:拾象投研团队预测 2025 年 AI 发展的关键趋势,包括微软可能转向 Anthropic 合作,Google 利用其强大资源缩小与领先者的差距,以及 Agent 成为新的软件核心,推动任务自动化和推理能力的提升。同时,数据的上下文层和合成数据技术的突破将是竞争的关键。硬件方面,推理需求激增将使 NVDA 继续在算力市场中保持领先地位。 《我们即将进入 Agentic AI 时代,而第一个落地就是 Coding Agent》:讨论了即将进入的智能代理 AI 时代,特别是 Coding Agent 的崛起。随着 AI 编程能力的提升,许多人将有机会更快地开发产品,投资者对此充满期待。然而,关于 AI Coding 是否会取代传统程序员的争论仍然存在,分为保守派、乐观派和激进派。尽管未来仍不确定,但 AI 编程课程的需求已显著增加,显示出人们对这一领域的关注和焦虑。 《海螺主体一致视频教程及测试效果》 《「灵宇宙」顾嘉唯:半年完成三轮融资,携新一代智能硬件 OS 亮相 CES》:在 2025 年 CES 上,初创公司「灵宇宙」展示了针对儿童的 AI 学习伴侣 Ling!。创始人顾嘉唯强调,公司的目标是开发新一代智能硬件 OS,利用多模态技术提升机器的感知与决策能力。Ling!通过 4D 空间交互为孩子们提供沉浸式学习体验,内置多种 AI 角色,覆盖多个学科。 《CES 2025:井喷的 AI 陪伴与 AI 眼镜》:CES 2025 在拉斯维加斯举行,展出大量 AI 陪伴产品和智能眼镜。针对儿童和家庭的 AI 产品激增,包括可爱的机器人如 Yukai Engineering 的 Mirumi 和 Nékojita FuFu。其他亮点有 TCL 的模块化 AI 机器人 Ai Me、全自动拉布拉多机器人 Jennie 及三星的 Ballie 滚动机器人。 《帆哥:2024AI 大事纪》:总结了 2024 年发生的大多数 AI 大事,包括 1 月斯坦福大学 Mobile Aloha、1 月 10 号 LumaAl Genie 文生 3D、1 月 11 号 GPT store 上线、1 月 MagnificAl 高清放大爆火、1 月最后一天苹果 Vision Pro 宣布发售等。
2025-01-10
2024AI 大事记
以下是 2024 年 AI 大事纪: 1 月: 斯坦福大学 Mobile Aloha 1 月 10 号 LumaAl Genie 文生 3D 1 月 11 号 GPT store 上线 MagnificAl 高清放大爆火 1 月最后一天苹果 Vision Pro 宣布发售 3 月: 潞晨科技发布 OpenSora Suno 发布 V3 版本爆火 4 月:英伟达发布硬件股价飙升 5 月: 苹果发布 AI 芯片 张吕敏发布 IC light AI 竞争白热化 伊莉雅离开 OpenAI,伊利亚成立新公司,估值超五亿美金 7 月:快手开源 LivePortrait 模型,表情迁移 8 月:StabilityAI 老板成立新公司发布 flux 大模型 9 月: 阿里云发布模型,海螺 AI 参战 Google 发布 GameGen 实时生成游戏 通义千问 2.5 系列全家桶开源 华为发布 cloud matrix 云计算基础设施 GPT 高级语音模式上线 Meta 发布 AI 眼镜 Orion AI 代码编辑器 cursor 爆火 10 月: Pika 发布 1.5 模型 诺奖颁发给 AI 奠基人 特斯拉发布机器人 Adobe 发布 Illustrator+Al 生成矢量图 智谱 AI 发布 autoGLM 腾讯混元开源 3D 模型 云深处发布机器人山猫机器狗 Apple 发布 Mac mini 12 月: 李飞飞发布空间智能成果 腾讯开源混元视频模型 Open AI 开 12 天发布会 微软发布 Trellis 最强开源图生 3D Gemini2.0 视觉交互智能体 智元机器人开始量产 谷歌发布 Veo2 能生成 4K 视频 宇树科技机器狗爆火,似奔着打架去 SORA 兑现引关注,被测试出奇怪问题 需要说明的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-10
工作流
工作流是通过可视化方式对插件、大语言模型、代码块等功能进行组合,以实现复杂、稳定的业务流程编排,例如旅行规划、报告分析等。当任务场景包含较多步骤且对输出结果的准确性和格式有严格要求时,适合配置工作流。 工作流由多个节点构成,默认包含 Start 节点和 End 节点。Start 节点是起始节点,可包含用户输入信息;End 节点是末尾节点,用于返回运行结果。不同节点可能需要不同的输入参数,分为引用和输入两类。 扣子提供了基础节点,如 LLM(大语言模型节点)、Code(代码节点)、Knowledge(知识库节点)、Condition(ifelse 逻辑节点)等,还可添加插件节点或其他工作流。 使用工作流的顺序如下: 1. 创建工作流:在页面顶部进入工作流页面,单击创建工作流,设置名称与描述,确认后页面自动跳转至编辑页面,初始状态包含 Start 节点和 End 节点。 2. 配置工作流:添加工作流节点并按用户任务顺序连接。 3. 测试并发布工作流。 4. 将工作流添加到 Bot 内。 以下是一些具体的工作流示例: 1. 写起点爆款小说《夜无疆》的工作流:核心节点包括用 bing 搜索标题相关内容、用程序将搜索结果结构化、用大模型草拟大纲、用大模型写文章、输出文章内容。 2. 其他工作流效果和思路,欢迎大家在评论区分享。
2025-01-10
图生视频
以下是关于图生视频的相关内容: 什么是图生视频: 输入一张图片+相应的提示词,清影大模型将根据提示将图片转变为视频画面。您也可以只输入一张图片,清影大模型将自行发挥想象力,把图片扩展为一段有故事的视频。 图生视频的两个小技巧: 1. 选用尽可能清晰的图片,上传图片比例最好为 3:2(横版),清影支持上传 png 和 jpeg 图像。如果原图不够清晰,会影响模型对图片的识别,可以采用分辨率提升工具将图片变清晰。 2. 提示词要【简单清晰】: 可以选择不写 prompt,直接让模型自己操控图片动起来。 明确您想动起来的【主体】并以「主体」+「主题运动」+「背景」+「背景运动」的方式撰写提示词(一定要有主体,不然可能会出现 AI 狂乱景象)。如果不明确大模型如何理解您的图片,推荐将照片发送到清言对话框进行识图,明确您的【主体】该如何描述。 在其他场景中的应用: 1. 在离谱村的共创故事中,每张图片转视频都进行了大量的尝试。各种工具轮番上场,如 pika、runway、Pixverse 等。中间还找了 ZHO 来做技术指导,他帮忙用 SVD1.1 出来几个精美的视频,甚至还上了 stablevideo.com 的首页官方推荐。 2. 在 PixVerse V3 中,生成视频的比例取决于您上传图片的比例,提示词遵循相关规则。同时为您展示了几个示例帮助拓展创意,还提供了 4 种风格,且支持文生和图生的风格选择和转换。为保证最佳效果,不推荐风格化与其他功能混用。
2025-01-10
免费数字人AI
以下为您介绍一些免费数字人的相关信息: HEYGEN 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 1. 点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。 2. 上传后效果如图所示,My Avatar 处显示上传的照片。 3. 点开大图后,点击 Create with AI Studio,进入数字人制作。 4. 写上视频文案并选择配音音色,也可以自行上传音频。 5. 最后点击 Submit,就可以得到一段数字人视频。 DID 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 1. 点击上面的网址,点击右上角的 Create vedio。 2. 选择人物形象,你可以点击 ADD 添加你的照片,或者使用 DID 给出的人物形象。 3. 配音时,你可以选择提供文字选择音色,或者直接上传一段音频。 4. 最后,点击 Generate vedio 就可以生成一段视频。 5. 打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很 AI。 使用方法: 1. 点击上面的网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。 2. 点击开始创作,选择自定义照片。 3. 配音时,你可以选择提供文字选择音色,或者直接上传一段音频。 4. 打开绿幕按钮,点击背景,可以添加背景图。 5. 最后,点击生成视频。 此外,还有照片数字人工作流及语音合成(TTS)API 出门问问 Mobvoi,为您展示了不同风格的照片驱动效果。 剪映数字人也具有一定优势,剪映作为字节跳动旗下的产品,在抖音平台上被广泛应用。其已有的 AI 功能解决了用数字人做视频的痛点。制作流程如下: 1. 打开剪映,添加一个文本到文字轨道,并修改好需要朗读的文字。 2. 点击朗读,并进行声音克隆,剪映的声音克隆现在只用念一句话就可以完成克隆。 3. 克隆完成后,选择喜欢的数字人形象,并把自己的克隆音色换上去。 4. 一键智能生成字幕,再自行调整文字样式并校准。
2025-01-10
人工智能的分类
人工智能主要有以下分类和应用场景: 分类: 1. 按照智能水平: 弱人工智能(ANI):只能做一件事,如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等。 通用人工智能(AGI):能做任何人类可以做的事。 AGI 的五个发展等级: 聊天机器人(Chatbots):具备基本对话能力,依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 推理者(Reasoners):具备人类推理水平,能解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多产品执行任务后仍需人类参与。 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 应用场景: 1. 医疗保健: 医学影像分析:辅助诊断疾病。 药物研发:加速药物研发过程。 个性化医疗:提供个性化治疗方案。 机器人辅助手术:提高手术精度和安全性。 2. 金融服务: 风控和反欺诈:降低金融机构风险。 信用评估:帮助做出贷款决策。 投资分析:辅助做出投资决策。 客户服务:提供 24/7 服务并回答常见问题。 3. 零售和电子商务: 产品推荐:根据客户数据推荐感兴趣的产品。 搜索和个性化:改善搜索结果和提供个性化购物体验。 动态定价:根据市场需求调整产品价格。 聊天机器人:回答客户问题和解决问题。 4. 制造业: 预测性维护:预测机器故障避免停机。 质量控制:检测产品缺陷提高质量。 供应链管理:优化供应链提高效率和降低成本。 机器人自动化:提高生产效率。 5. 交通运输:(具体应用未详细说明)
2025-01-10
什么是人工智能
人工智能(Artificial Intelligence)是一门研究如何使计算机表现出智能行为的科学,例如做一些人类所擅长的事情。 最初,查尔斯·巴贝奇发明了计算机,现代计算机虽先进,但仍遵循受控计算理念。若知道实现目标的每一步骤及顺序,就能编写程序让计算机做事。 但有些任务无法明确编程,如根据照片判断人的年龄,因为我们不清楚大脑完成此任务的具体步骤。这类任务正是人工智能感兴趣的。 AI 分为 ANI(artificial narrow intelligence 弱人工智能)和 AGI(artificial general intelligence)。ANI 得到巨大发展,只能做一件事,如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等;AGI 则能做任何人类可以做的事。 人工智能术语包括: 机械学习:学习输入输出,从 A 到 B 的映射。让电脑在不被编程的情况下自己学习。 数据科学:分析数据集,从数据中获取结论与提示,输出结果往往是幻灯片、结论、PPT 等。 神经网络/深度学习:有输入层、输出层、中间层(隐藏层)。
2025-01-10
开发软件 系统规划,哪个AI工具最适合
以下是一些适合用于绘制逻辑视图、功能视图、部署视图的工具: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑、功能和部署视图,用户可通过拖放轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,如逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源建模语言,与 Archi 工具配合使用,支持逻辑视图创建。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑、功能和部署视图等。 6. draw.io(现称为 diagrams.net):免费在线图表软件,允许创建各种类型图表,包括逻辑和部署视图。 7. PlantUML:文本到 UML 转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑和部署视图。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑和部署视图。 需要注意的是,虽然这些工具可以辅助创建架构视图,但它们不都是基于 AI 的。AI 在绘图工具中的应用通常涉及智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,应考虑您的具体需求,比如是否需要支持特定的建模语言、是否需要与特定的开发工具集成、是否偏好在线工具或桌面应用程序等。 此外,对于软件项目经理,以下是一些适合的 AI 工具: 1. 项目管理和任务跟踪工具:如 Jira、Trello 等,已开始集成 AI 功能,辅助制定计划、分配任务、跟踪进度等。 2. 文档和协作工具:微软的 Copilot 可集成到 Office 套件中,为项目文档撰写、编辑等提供 AI 助手功能。一些云存储服务如 Google Drive 也开始提供 AI 驱动的文档管理和协作功能。 3. 风险管理和决策支持工具:一些 AI 工具可帮助识别和分析项目风险,并提供决策建议。 4. 沟通和协作工具:AI 助手可辅助进行团队沟通协调、客户关系维护等。 5. 创意生成工具:如文心一格、Vega AI 等,可以帮助快速生成创意图像素材。 随着 AI 技术的发展,越来越多的工具正在为软件项目经理提供智能化的辅助功能,涵盖项目管理的各个环节,有助于提高工作效率和决策能力。
2025-01-10