直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

midjourney最近一次更新是什么时候

回答

Midjourney 最近的更新情况如下:

  • 上周更新了 V5.2 版本,增加了一些重要新功能,如新的美学风格、修复的 stylize 命令、新的“高变异模式”、新的 /shorten 命令、图片填充功能等。
  • 数月前更新到了 v6.1 版本,该版本大大提高了图像质量、文本和连贯性,并配备了全新升级的个性化模型,带来了更连贯的图像、更好的图像质量、更精确详细和正确的小图像特征、新的 2x 放大器、标准图像处理速度提升约 25%、改进的文本准确性等新变化。同时,MJ 可能会在下个月左右发布 V6.2 模型。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AIGC Weekly #27

[title]AIGC Weekly #27[heading2]Midjuourney发布V5.2版本,包括图片放大和提示词分析Midjourney上周终于更新了V5.2版本,虽然版本号没有改变但是增加了一些比较重要的新功能,他们分别是:新的美学风格:改进了审美和更清晰的图像,略微提高了连贯性和文本理解,增加了内容输出的多样性。左边为V5.1右边为V5.2。stylize命令已修复:对应用于图像的风格化程度产生较强的影响(更像V3)。此命令的范围是--stylize 0到--stylize 1000,默认值是--stylize 100。左边为默认stylize 100右边为stylize 1000新的“高变异模式”:默认开启,使所有变异任务具有更高的多样性,要切换此设置,请输入/settings然后点击另一个变异模式。在所有升级的图片下面,还可以选择变异的强度。新的/shorten命令:这让你可以“分析”一个提示,获得关于哪些词可能没什么作用和哪些词可能是关键的建议,这个对于优化提示词非常重要。点击show details可以显示提示词中每个词的具体权重。图片填充功能:类似PS AI的图片填充。[Zoom Out 1.5x][Zoom Out 2x]缩小镜头,并在四周填充细节。[Make Square]在两侧添加细节,将非正方形图像变为正方形。[Custom Zoom](高级)为您提供一个弹出文本框,允许你在缩小的同时更改提示以及宽高比或精确缩小。

五花肉:Midjourney v6.0 与 v6.1 版本对比

Midjourney V6.1现已更新,大大提高了图像质量、文本和连贯性,并配备了全新升级的个性化模型,它更智能、更快、更清晰、更美观。V6.1有哪些新变化1.更连贯的图像(手臂、腿、手、身体、植物、动物等)2.更好的图像质量(减少像素伪影,增强纹理、皮肤等)3.更精确、详细和正确的小图像特征(眼睛、小脸、远处的手等)4.新的2x放大器,具有更好的图像/纹理质量5.标准图像处理速度提升约25%6.改进的文本准确性(在提示中使用“引号”绘制单词时)7.新的个性化模型,具有改进的细微差别、惊喜和准确性,以及个性化代码版本控制(使用旧版本中的任何个性化代码来使用该个性化模型和数据)8.新的--q 2模式,处理时间延长25%,有时会增加更多纹理,但图像连贯性有所降低9.整体图像应“更加美观”其他重要说明1.V6.1目前没有新的补绘/扩绘模型,因此如果使用缩放/重新构图/重新绘制/区域变化,将回退到V6.0模型2.如果你想切换回V6,只需进入/settings并点击V6,或在作业后输入--v 6(或点击网站上的设置面板)未来计划MJ可能会在下个月左右发布V6.2模型,进一步改进,但首先MJ需要收集尽可能多的用户使用V6.1的数据,因此从今天起,MJ将V6.1设为Midjourney所有用户的默认模型。

AIGC Weekly #25

[title]AIGC Weekly #25工具:Midjourney v5.1a close up of an object with a lot of blue light,in the style of dark white and dark indigo,Low saturation,post-modern minimalist style,smooth gradient,light black and dark amber,smooth curves,in the style of distorted form,8k resolution,light black and dark amber,minimalist beauty,rounded forms,grainy,rim light --ar 3:2 --style raw由于上周拖更到了周三有,一部分上周内容在周三那期已经更新了,所以这期的内容会相对少一些。可能有的朋友没注意到上周更新了,如果还需要看的话可以去这里看一下https://op7418.zhubai.love/posts/2278279250169987072。

其他人在问
"如何使用Midjourney"
以下是关于如何使用 Midjourney 的详细介绍: 1. “人物参考”功能: 在提示词后输入`cref URL`并附上一个人物图像的 URL。需注意一定要在提示词后面,否则会报错。 可以使用`cw`来修改参考“强度”,从 0 到 100。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;在强度 0(`cw 0`)时,只会关注面部,适合改变服装、发型等。 2. 喂图: 意义:从第一张起,可反复上传优化图片,来达到自己想要的图片。 过程:上传单张或者一组(4 到 5 张)到 Midjourney 输入框里,有两种方法: 点击输入框前方的加号上传。 鼠标选择图片或一组拖到软件里,回车,点击上传后的图片,在左下角“在浏览器打开链接“打开后复制浏览器上的链接,返回主界面,在输入框里“/imagine:粘贴刚才复制的链接+所描述的关键词。 常见问题:小白新手找不到输入框频道。解决方法是找到 Midjourney 白色图标,点击进去,找带数字结尾的频道,或者在自己社区里添加 Midjourney 机器人。 3. Midjourney V6 更新角色一致性命令“cref”: 官方说明:在提示后键入`cref URL`,其中 URL 是一个角色图像的网址。可以使用`cw`来修改参考的“强度”。 用途:这个功能在使用由 Midjourney 图像制作的角色时效果最佳,不适用于真实的人物/照片。 高级功能:可以使用多个 URL 来混合信息/来自多个图像的角色。 在网页 alpha(测试最初版)上的操作:拖动或粘贴图像到想象栏,有三个图标。选择这些图标设置它是一个图像提示,一个风格参考,还是一个角色参考。按住 Shift 键选择一个选项以将图像用于多个类别。 需注意,虽然 MJ V6 还处于 alpha 测试阶段,但这个和其他功能可能会突然更改,V6 官方 beta 版本即将推出。
2025-03-24
midjourney图怎么 放大
在 Midjourney 中,放大图像的方法如下: 放大(Upscale)将图像尺寸加倍: 精细放大(Subtle):放大图像同时尽量保持原样。 创意放大(Creative):在放大的同时会调整或改变图像中的某些细节。 操作时,您可以点击相应的按钮进行放大。例如,在生成的图像中,点击上面的 U 1 4 即可放大一张图。 另外,使用当前默认模型版本的中途图像的默认尺寸为 1024 x 1024 像素。您可以使用 upscale 工具将文件大小增加到 2048 x 2048 或 4096 x 4096 像素。在网络浏览器中打开 Midjourney 图像,或从 Midjourney.com 下载它们以获得最大文件大小。 需要注意的是,如果没看到放大相关的按钮,可能有以下原因: 1. 该图像已经在 Discord 中生成最满意的一张,不可再放大。 2. 在 More options 文字里没打上相应的对勾。
2025-03-21
Stable Diffusion、MidJourney、DALL·E 这些生成式AI工具有什么区别
Stable Diffusion、Midjourney 和 DALL·E 这三个生成式 AI 工具主要有以下区别: 1. 开源性:Stable Diffusion 是开源的,用户可以在任何高端计算机上运行。 2. 学习曲线:Midjourney 的学习曲线较低,只需键入特定的提示就能得到较好的结果。 3. 图像质量:Midjourney 被认为是 2023 年中期图像质量最好的系统。 4. 应用场景:Stable Diffusion 特别适合将 AI 与来自其他源的图像结合;Adobe Firefly 内置在各种 Adobe 产品中,但在质量方面落后于 DALL·E 和 Midjourney。 5. 训练数据:这些工具都是使用大量的内容数据集进行训练的,例如 Stable Diffusion 是在从网络上抓取的超过 50 亿的图像/标题对上进行训练的。 6. 所属公司:DALL·E 来自 OpenAI。 在使用方面: 1. Stable Diffusion 开始使用需要付出努力,因为要学会正确制作提示,但一旦掌握,能产生很好的结果。 2. DALL·E 已纳入 Bing(需使用创意模式)和 Bing 图像创建器,系统可靠,但图像质量比 Midjourney 差。 3. Midjourney 需要 Discord,使用时需键入特定格式的提示。
2025-03-20
midjourney的平替
以下是关于 Midjourney 的相关信息: Midjourney V6 更新角色一致性命令“cref”:您可以仅描述环境、背景等,Midjourney 会努力将角色融入场景中,但可能会有不连贯的结果,此时可尝试更高值的样式化(如s 800)。场景唯一提示示例:在一个空荒地下,乌云密布的暴风雨天空下。cref https://my.image.host/joisstanding.jpg 。注意该命令适用于单一主题、单一角色的图像,若要添加多个角色,需使用平移按钮。将多个角色放置到单个画布上的最佳方法是使用平移功能将新画布与现有画布拼接,每个新画布部分都有自己的 cref。具体操作:1.使用/settings 将 Remix 打开,然后选择;2.选择包含第二个字符的图像,用 U 将其从网格中分离出来;3.寻找蓝色小箭头(⬆️⬇️⬅️➡️),每个都会在现有图像中添加新图像,选择新角色前进方向并输入提示及其cref,缝合新画布,比如描绘两个人的开场提示。 训练 Midjourney 的 prompt:style<4a,4b or 4c>可在 Midjourney 模型版本 4 之间切换。stylize<number>或s<number>参数影响 Midjourney 默认美学风格应用于 Jobs 的强度。还有uplight 和upbeta 等参数。默认值(模型版本 5)包括纵横比、混沌、质量、种子、停止、样式化等,各有相应的默认值和范围。纵横比大于 2:1 为实验性的,可能产生不可预测的结果。不同模型版本和参数具有兼容性。
2025-03-18
midjourney注册不了,有替代的软件吗
以下是一些可以替代 Midjourney 的软件: 1. 扣子+ByteArtist: 网址:https://www.coze.cn/home 优点:不需要?,无收费,可以直接生成。 注册:手机号、抖音号或飞书号。 操作步骤:需要在 coze 的 bot 里面添加绘图插件,时间约 5 分钟。这里需要一点小小的加插件操作,不难,截图一步一步即可做到,而且全程没有科学?️,不需要付费。 2. 悠船: 网址:www.youchuanai.com 新用户注册:在悠船桌面端,输入离谱村专用激活码(296976)即可完成注册。 特点:从成本和小白理解力的角度来说适合先尝试,最近有新注册的免费福利。
2025-03-18
如何登陆midjourney?
以下是登录 Midjourney 的方法: 1. 登录 Midjourney 官网: Midjourney 官网现已向生成 100 张以上图片的用户开放了使用权限。登录 MJ 官网,您将进入到特定页面。左侧为各种页面入口,顶部是生成入口(prompt 框)和搜索框。在社区作品、创作(Create)以及组织(Organize)页面中,您可以随时使用 prompt 框和搜索框,方便查找参考和进行创作,无需频繁切换页面。 您可以通过点击 prompt 框最右侧的图标来设置常用参数的默认值,包括画面比例和个性化模型开关。 在官网上使用图片参考变得简单直观。只需要点击 prompt 框最左侧的图片按钮,或直接拖入图片即可,并且官网会记录所有使用过的图片,方便调用或删除。当鼠标悬停在图片上时,会看到 3 个小图标,从左到右分别是角色参考、风格参考、整图参考,点击相应的图标即可,如需多种参考逻辑可按住 shift 键点选多个图标即可。 创作页面的最大亮点是 prompt 的复用。您可以直接点击画面描述或复制描述词到 prompt 框中,也可以直接点击下方横列菜单里的按钮,将包括参考图在内的完整 prompt 替换当前的 prompt。点击图片则会进入单图调整模式,在 discord 中常用的操作指令都被集中在了右下角的按键中,并且上线了全新的 Editor 编辑器功能。 2. 通过 Discord 登录: 通过 Web 浏览器、移动应用程序或桌面应用程序通过 Discord 访问 Midjourney Bot。在加入 Midjourney Discord 服务器之前,请确保您拥有经过验证的 Discord 帐户。请按照以下指南创建或验证您的 Discord 帐户: 要开始使用 Midjourney 生成图像,您需要订阅计划。 访问。 使用您经过验证的 Discord 帐户登录。 选择适合您需求的订阅计划。请转至了解有关定价和各层可用功能的信息。 要开始与中途机器人交互,请加入中途服务器: 打开 Discord 并找到左侧边栏上的服务器列表。 按+服务器列表底部的按钮。 在弹出窗口中,单击 Join a Server 按钮。 粘贴或输入以下 URL:。
2025-03-18
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
可灵AI近期有哪些重大更新
快手 AI 产品“可灵”近期的重大更新如下: 1. 今年 6 月,凭借“让老照片动起来”、“让照片中的人拥抱”等热点在互联网爆火,以高质量视频效果、低价格和良心免费额度获好评。 2. 9 月更新了 1.5 模型能力,使视频的画面表现力、提示词理解能力、画面清晰度大幅提升,位列视频生成产品第一梯队。 1.0 模型生成一次视频消耗 10 灵感值,1.5 模型消耗 35 灵感值。 免费用户每日免费享 66 灵感值,付费用户享有 1.5 模型、去水印、高清晰度视频生成、视频延长能力、大师运镜、AI 生图画质增强能力。 增加了运动笔刷控制。 1.5 模型在画面表现力、提示词理解能力上有大幅提升,改善了此前将相机运动描述当作实物生成的问题,但视频中文本内容生成仍有待改进。 3. 移动端 APP 为快影,网页版访问地址为:https://klingai.kuaishou.com/ ,使用指南:https://docs.qingque.cn/d/home/eZQDKi7uTmtUr3iXnALzw6vxpsection=h.j6c40npi1fan 。 4. 传统 txt2vid、img2vid 以外,还支持首尾帧控制、延长视频、对口型能力。txt2vid 模式下支持运镜控制,普通用户可使用水平/垂直运镜、推进/拉远、垂直/水平摇镜;另有四种大师运镜仅付费用户可用。
2025-04-08
我是一个ai新手,请根据知识库现有的内容帮我拟一份学校ai的学习计划,以及更新知识的跟进和学习
以下是为您拟定的学校 AI 学习计划,以及知识更新的跟进和学习方法: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。建议您一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键。尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 六、持续学习和跟进 AI 是一个快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 希望这份学习计划对您有所帮助,祝您在 AI 学习的道路上取得成功!
2025-03-31
帮我列举2025年3月1日以来,国内外、闭源开源模型厂商的更新记录。
以下是 2025 年 3 月 1 日以来,国内外、闭源开源模型厂商的部分更新记录: 2025 年 3 月 20 日,OpenAI 推出了一套全新的音频模型,旨在通过 API 为开发者提供更智能、更可定制的语音代理支持,包括改进的语音转文本和文本转语音功能,为语音交互应用带来显著提升。 李开复公开表示 OpenAI 面临生存危机,商业模式不可持续。他强调中国的 DeepSeek 以极低成本提供接近的性能,开源模式将主导未来 AI 发展。他认为企业级 AI 应用将成为投资重点,资源限制反而促进了创新。李开复大胆预测,中国将出现三大 AI 玩家,竞争愈发激烈。 SuperCLUE 发布《中文大模型基准测评 2025 年 3 月报告》,指出 2022 2025 年经历多阶段发展,国内外模型差距缩小。测评显示 o3mini总分领先,国产模型表现亮眼,如 DeepSeekR1 等在部分能力上与国际领先模型相当,且小参数模型潜力大。性价比上,国产模型优势明显。DeepSeek 系列模型深度分析表明,其 R1 在多方面表现出色,蒸馏模型实用性高,不同第三方平台的联网搜索和稳定性有差异。 以上信息来源包括: 《》 《》 《》
2025-03-26
Way to AGI 近期更新
Way to AGI 近期更新如下: 3 月 8 日: 《》:专为 AI 小白打造的实用指南,涵盖基础概念、30 分钟 AI 工具速成体验、Deepseek 使用指南、WayToAGI 知识库导航、Coze 智能体搭建等核心内容,适合多种人群,强调实践、通俗易懂、循序渐进,并融入社区互动。 《》:Manus 是 AI 驱动的无图形界面 Linux 虚拟机&浏览器,能运行终端命令、访问网页、调用 API,适用于自动化办公、数据分析等任务,但有一定限制,本文基于 8 小时直播测试,带你深入体验其能力、限制与未来可能性。 3 月 7 日: 《》:作者夙愿学长介绍了 2025 年必用的十大 AI 工具和工作流,涵盖写作、搜索、语音与视频处理等领域,推荐了 Claude、Gemini 和 Gamma 等工具。 《》:在 6 号晚的 WaytoAGI 直播中,Manus 引发 3 万人围观,展示了其强大的 AI 智能,参与者分享了各种趣味案例。 《》:与传统 AI 不同,“Manus”能完成复杂任务,成为用户在数字世界的“代理人”,创始人强调未来成功的关键在于主动寻找和解决问题的能力。 此外,WaytoAGI 近期活动备份: :2024 年 7 月 26 日9 月下旬,由中国科学技术馆和网易新闻发起,WaytoAGI 作为特别支持社区,即日起向全球征集 AI 音乐歌曲作品,9 月下旬进行线下汇演。8 月 1 日更新。 【线上⬆️】:2024 年 7 月 24 日8 月 8 日,Agent 共学活动新一期“谁是人类”全新开启,获得阿里云☁️百炼和通义千问大模型的支持,准备了丰厚奖品。 【线下⬇️】
2025-03-14
Way to AGI 近期更新
Way to AGI 近期更新如下: 3 月 8 日: 《》:专为 AI 小白打造的实用指南,涵盖基础概念、30 分钟 AI 工具速成体验、Deepseek 使用指南、WayToAGI 知识库导航、Coze 智能体搭建等核心内容,适合多种人群,强调实践、通俗易懂、循序渐进,并融入社区互动。 《》:Manus 是 AI 驱动的无图形界面 Linux 虚拟机&浏览器,能运行终端命令、访问网页、调用 API,适用于自动化办公、数据分析等任务,但有一定限制,基于 8 小时直播测试深入体验其能力、限制与未来可能性。 3 月 7 日: 《》:作者夙愿学长介绍 2025 年必用的十大 AI 工具和工作流,涵盖写作、搜索、语音与视频处理等领域,推荐工具如 Claude、Gemini 和 Gamma。 《》:6 号晚的 WaytoAGI 直播中,Manus 展示强大智能,引发 3 万人围观,参与者分享趣味案例,显示 AI 在代理任务中的潜力与挑战。 《》:与传统 AI 不同,“Manus”能完成复杂任务,成为用户在数字世界的“代理人”,创始人强调未来成功关键在于主动寻找和解决问题的能力,AI 将是放大器,创业者应从小目标出发抓住市场红利,核心壁垒在于对动态机会的把握。 此外,还有以下近期活动: :由中国科学技术馆和网易新闻发起,WaytoAGI 作为特别支持社区,即日起向全球征集 AI 音乐歌曲作品,通过专业评审评选出 10 首歌曲,将在 9 月下旬进行线下汇演。 8 月 1 日更新: 【线上⬆️】:Agent 共学活动新一期“谁是人类”全新开启,获得阿里云☁️百炼和通义千问大模型的支持,准备了丰厚奖品,活动时间为 2024 年 7 月 24 日8 月 8 日。 【线下⬇️】
2025-03-08
最近6个月的ai技术和趋势
在过去 6 个月中,AI 技术和趋势呈现出以下特点: 模型方面:DeepSeek 开源 R1 模型,将大模型行业推进到推理时代,引发了深刻影响。Scaling Law 再次“续命”,目标指向 AGI。 图像方面:整体朝着更快、更便宜的方向发展,AI 图像生成已成为常用生产力工具,资本市场看好相关赛道。 视频方面:底层架构无大变化,公司逐渐分化为面向 C 端的好玩快速的视频模板方向和面向 B 端的高质量高可控性的视频创作方向。 音频方面:跨越了真假难辨的临界点,成为继图像领域后被资本看好的赛道。 3D 方面:暂时停留在文字/图片生成 3D 模型阶段,世界模型刚起步。 应用方面:AI 编程领域快速迭代发展,从半自动向全自动迈进;Computer Agent 缓慢发展,OpenAI 的 Operator 工具效果不佳;DeepSearch 作为调研 Agent 存在模型幻觉等问题,实际使用需谨慎。 新闻方面:中美欧 2025 年将加大对 AI 基础建设和科学研究的投入,越来越多厂商接入 R1 并拥抱开源。
2025-03-31
最近很火的古人怼人视频怎么做的
制作最近很火的古人怼人视频,可按照以下步骤进行: 1. 文案生成 工具:DeepSeek 操作: 打开 DeepSeek 网站:https://chat.deepseek.com/ 输入提示词,示例:“让 XX 用现代口语化的表达、生气骂人的口吻吐槽 XXXX(例如:吐槽现代人),XXX 目的(例如:推广 XXX 吸引游客来旅游),输出 3 条 60 字左右的毒舌文案,每条里面都要有‘回答我!Look in my eyes!Tell me!why?baby!why?’” 可以根据自己的内容自行调整文案和字数要求。 点击生成,等待 DeepSeek 输出 3 条文案。 从中挑选最满意的一条(或多条)保存备用。 2. 准备人物形象图 可以用现有的照片或者图片,也可以用工具生成。 工具:即梦 AI 操作: 打开即梦 AI 网站:https://jimeng.jianying.com/aitool/image/generate 输入提示词,即梦已经接入了 DeepSeek,可以直接用它来生成绘图提示词 调整生成参数(如风格、细节等),点击生成。 预览生成的人物图,不满意可调整提示词重新生成,直到满意为止。 下载最终的人物形象图。 此外,还有以下扩展玩法和变现玩法: 扩展玩法: 1. 文旅引流版:用地方历史名人“骂”现代游客,再顺便夸家乡美景。 2. 名人认知刷新版:让古人吐槽他们被误解的形象。 3. 系列化挑战:做一个“古人骂遍现代生活”系列,吸引粉丝追更。还能号召网友提建议,互动拉满! 变现玩法: 1. 品牌合作与广告植入:让古人吐槽现代生活痛点,顺势植入品牌产品或服务,打造新颖幽默的广告形式。 2. IP 开发与周边销售:基于古人形象开发文化衍生品,打造可销售的 IP 周边。 3. 教育与文化传播:将吐槽视频融入历史文化知识,吸引学生和文化爱好者。
2025-03-30
最近流行的ai技术
AI 技术的发展历程和前沿技术点如下: 发展历程: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现机器学习算法,如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前前沿技术点: 1. 大模型(Large Language Models):如 GPT、PaLM 等。 2. 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:例如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:如元学习、一次学习、提示学习等。 5. 可解释 AI:涉及模型可解释性、因果推理、符号推理等。 6. 机器人学:涵盖强化学习、运动规划、人机交互等。 7. 量子 AI:包括量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 学习路径: 偏向技术研究方向: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 偏向应用方向: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 近期热门融资的 AI 产品,如 Genspark、Rockset、ButterfliesAI、MeetRecord 等,不仅展示了技术的先进性,也为各行各业提供了高效、智能的信息处理和决策支持工具。
2025-03-29
最近有什么AI比赛
以下是为您整理的近期 AI 比赛: 1. 【灵璧 AI】安徽文创 截止日期:0115 0315 奖金奖项:一等奖 2k1、二等奖 1k2、三等奖 8005 主题+作品类型:赛道一为数字艺术创作,利用 AIGC 技术创作数字绘画、数字雕塑等艺术作品;赛道二为互动体验设计,设计互动体验项目,如 AR/VR 体验、互动游戏等;赛道三为数字故事讲述,创作以虞姬及灵璧特色历史文化为主题的数字故事,如动画短片等。 关键要求:只能提交一份作品。以压缩包上传,材料包含创作作品的源文件、prompt 指令、制作过程的关键过程截图、录屏与说明等。 提交方式:邮箱 链接: 2. 创无界智未来·文旅应用赛 截止日期:0101 0330 奖金奖项:一等奖 10w1、二等奖 6w2、三等奖 3w3 主题+作品类型:四个赛道 关键要求:模糊 提交方式:官网 链接: 3. 【凌家滩】AI 创作大赛 截止日期:0101 0415 奖金奖项:一等奖 2w1、二等奖 8k2、三等奖 2k3、优秀奖 010 主题+作品类型:“文化遗产的数字化重现与未来表达”AI 图像/AIMV/AI 视频 关键要求:无 提交方式:无 链接: 4. 【云山杯】AIGC 大赛 截止日期:0116 0225 奖金奖项:四赛道分别为一等奖 2k1、二等奖 1k1、三等奖 3003、优秀奖 10020 主题+作品类型:图片、视频、文本、音频 关键要求:【AI 图片】1.设计一个代表“杯云山”的全新品牌标志,融合传统与现代元素。2.创作一套完整的品牌视觉形象,包括颜色、字体和图案设计。【AI 视频】1.制作一个简短视频,介绍“杯云山”品牌的历史、价值观和产品特色。2.制作一段云南茶文化的纪录片,展示其历史、传统和现代发展的融合。【AI 文本】1.撰写关于“杯云山”品牌从创立到发展的故事,突出品牌的传承与创新。2.编写一个以茶园为背景的微型剧本,展示茶叶从种植到品鉴的全过程。【AI 音乐】1.创作能够代表“杯云山”的纯音乐,体现茶园的宁静与创新的活力。2.将传统云南音乐元素与现代电子音乐相结合,创作段具有地域特色和创新感的音乐作品。 提交方式:无 链接: 5. 智绘未来【台州】AI 大赛 截止日期:0122 0309 奖金奖项:①一等奖 5k1、二等奖 2k3、三等奖 1k5、台州奖 1k1;②一等奖 5.5k1、二等奖 2.5k2、三等奖 1.5k3、台州奖 1k1 主题+作品类型:AI 绘画赛道、AI 视频赛道(60S 以上) 关键要求:分辨率 2K 以上,【加分项】展现台州自然风光、人文历史、城市印象等元素,对台州未来景象的想象,或对台数字馆的未来想象相关的台州元素(额外在总分值增加 10%的分数) 提交方式:AITOP100 平台,投稿后必须转发至小红书分享并带上话题智绘未来+关注官方账号@台州数字馆。 链接:
2025-03-27
最近新出的大模型有哪些
最近新出的大模型有: 1. 通义千问推出的 Qwen2.5Max 大型专家模型,通过 SFT 和 RLHF 策略后训练,性能与顶尖模型竞争,在多个基准测试中超越了 DeepSeek V3,引发了 AI 社区对大规模专家模型的高度关注。相关链接: Blog: Qwen Chat: (选择 Qwen2.5Max 模型) API: HF Demo: 2. 阿里云发布的 Qwen2.5VL 新一代视觉语言模型。
2025-03-27
吴恩达最近推出了哪些课程?
吴恩达最近推出的课程包括: 1. 与 OpenAI 合作推出的免费的 Prompt Engineering(提示工程师)课程。 主要内容是教书写 AI 提示词,并利用 GPT 开发一个 AI 聊天机器人。 原版网址:https://www.deeplearning.ai/shortcourses/chatgptpromptengineeringfordevelopers/ B 站版本:【合集·AI Course哔哩哔哩】https://b23.tv/ATc4lX0 、https://b23.tv/lKSnMbB 翻译版本: 推荐直接使用 Jupyter 版本学习,效率更高:https://github.com/datawhalechina/promptengineeringfordevelopers/ 视频下载地址:https://pan.quark.cn/s/77669b9a89d7 OpenAI 开源了教程:https://islinxu.github.io/promptengineeringnote/Introduction/index.html 纯文字版本 2. 2023 年 8 月 24 日上线的最新短课程: 《》,课程内容包括了解何时对 LLM 应用微调、准备数据以进行微调、根据自己的数据训练和评估 LLM。 《》,深入浅出地介绍了基于大语言模型的 AI Agents,从记忆检索到决策推理,再到行动顺序的选择,真实展现了 Agent 的智能化进程。
2025-03-27
ai概念第一次是被谁提出来的,什么时候?
AI 概念首次被提出是在 1956 年的达特茅斯会议上。这次会议由时任达特茅斯学院的数学助理教授约翰·麦卡锡发起,邀请了包括马文·明斯基、克劳德·香农、艾伦·纽厄尔、赫伯特·西蒙等多位杰出科学家参与。约 47 位参与者就自动计算机、编程语言、神经网络、计算理论等多个前沿话题进行了深入讨论,并首次提出了“人工智能”(Artificial Intelligence)这一术语,为这个新兴领域正式命名。在此之前,艾伦·图灵和约翰·冯·诺依曼等人通过理论和实践为 AI 奠定了初步的理论基础。1943 年,心理学家麦卡洛克和数学家皮特斯提出了机器的神经元模型,为后续的神经网络奠定了基础。1950 年,图灵最早提出了图灵测试,作为判别机器是否具备智能的标准。此后近 70 年,AI 的发展起起落落。
2025-02-20
AI一次最多可以生成多少文字
目前国内外的大模型在生成内容时,一次生成 1000 字以内的质量较为稳定,默认情况下一般为 700 800 字。超过 1000 字,生成的文本质量就可能开始下降。例如通过“文本改写”场景测试能直观反映这一情况。不过,Claude 在长文本生成能力上相对较强,有试过其单次输出 2800 字。如果想要使用 AI 生成长文章,建议分段落让其完成,以保证生成文章的质量。对于长文章的解读或改写,也可采用分段方式,让 AI 逐项完成,每个段落长度控制在 700 800 字左右效果最佳。此外,对于复杂任务,可拆分成工作流,比如写文章任务可拆分为搜集材料、生成大纲、逐段填充内容、润色、起爆款标题、吸睛开篇金句等。
2025-01-07
可否输入一次同时使用多个人工智能
360 于 8 月 1 日发布了集合国内 16 家主流模型的 AI 助手。用户可以通过其桌面客户端和浏览器等多个入口随时唤起,支持在同一问题上同时使用多个模型进行解答。当用户不确定选择哪个模型时,AI 助手会通过意图识别自动选择模型。您可以体验一下:https://bot.360.com
2025-01-05
如何让ai一次回复两条信息
要让 AI 一次回复两条信息,可以从以下几个方面考虑: 1. 检索原理: 信息筛选与确认:系统会对检索器提供的信息进行评估,筛选出最相关和最可信的内容,同时验证信息的来源、时效性和相关性。 消除冗余:识别并去除多个文档或数据源中的重复信息,避免在生成回答时出现重复或矛盾。 关系映射:分析不同信息片段之间的逻辑和事实关系,如因果、对比、顺序等,构建结构化的知识框架。 上下文构建:将筛选和结构化的信息组织成连贯的上下文环境,包括排序、归类和整合。 语义融合:在必要时合并意义相近但表达不同的信息片段,增强信息表达力。 预备生成阶段:将整合好的上下文信息编码成适合生成器处理的格式。 2. 聊天机器人场景: 明确告诉助手如何行事,在每次交互中提供所有相关信息作为上下文,若想让模型从先前对话中获取信息,需将之前对话作为输入。 3. 设定回复逻辑: 对于不同的 AI 产品,大都支持自定义 AI 的回复方式。如在 ChatGPT/GPTs 里是“Instructions”,在 Coze 里是“人设与回复逻辑”,设定方式类似 Prompt,可根据需求灵活编写,但由于 AI 特性,可能无法完全按需求返回,可通过重试、优化 Prompt 或使用 Workflow 等方法处理。
2024-11-09
一次向多个大模型发送消息
以下是关于您提到的向多个大模型发送消息的相关信息: 在认识大模型 Embedding 技术加实战方面: Embedding 在大模型中的价值体现在增强 GPT 的能力,其过程包括搜索内部知识库、检索相关文本、将检索到的文本内容部分发送给 GPT 大模型并提问。 具体操作步骤包括准备搜索数据(仅一次),如搜集数据、切块、嵌入、存储;以及搜索(每次查询一次)和提问(每次查询一次)。 Embedding 共有搜索(结果按相关性排名)、聚类(文本字符串按相似性分组)、建议(包含相关文本字符串的项目)、异常检测(识别离群值)、多样性测量(分析相似性分布)、分类(按标签分类)等作用。 在熊猫大侠基于 COW 框架的 ChatBot 实现步骤方面: COW 是基于大模型搭建的 Chat 机器人框架,可将多模型塞进微信。 有更适合小白的使用教程,可实现打造自己的 ChatBot(包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等)和常用开源插件的安装应用。 正式开始前需知道,此实现思路需接入大模型 API(单独付费),且微信端使用有封号危险,不建议主力微信号接入。 要依法合规使用,注意甄别大模型生成的内容,禁止用于非法目的,处理敏感或个人隐私数据时注意脱敏。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5、GPT4.0、Claude、文心一言、讯飞星火、通义千问、Gemini、GLM4、LinkAI 等;多消息类型,如文本、语音、图片,以及基于自有知识库的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 方式。
2024-10-12
请问大家使用过AI工具一次性阅读10个左右的PDF文档/PDF文档链接吗?针对篇幅较大的说明书,哪些工具、以及如何使用工具辅助阅读整理信息效果响应会比较好
目前在 AI 领域,能够一次性阅读 10 个左右 PDF 文档并辅助整理信息的工具包括但不限于: 1. ChatPDF:您可以将多个 PDF 文档上传至该平台,然后通过提问获取文档中的关键信息和总结。 2. Adobe Acrobat Pro:具有强大的文档处理和阅读功能,能帮助您标记、注释和整理文档内容。 使用这些工具时,一般步骤如下: 1. 注册并登录相关工具的账号。 2. 按照工具的指引上传您的 PDF 文档。 3. 输入您想要获取的信息或提出整理要求,等待工具处理并给出结果。 需要注意的是,不同工具的具体操作和效果可能会有所差异,您可以根据自己的需求和文档特点选择合适的工具。
2024-09-25