Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

国内现有ai模型

Answer

以下是 8 月正式上线的国内部分大模型:

  • 北京:
    • 百度(文心一言):https://wenxin.baidu.com
    • 抖音(云雀大模型):https://www.doubao.com
    • 智谱 AI(GLM 大模型):https://chatglm.cn
    • 中科院(紫东太初大模型):https://xihe.mindspore.cn
    • 百川智能(百川大模型):https://www.baichuan-ai.com/
  • 上海:
    • 商汤(日日新大模型):https://www.sensetime.com/
    • MiniMax(ABAB 大模型):https://api.minimax.chat
    • 上海人工智能实验室(书生通用大模型):https://intern-ai.org.cn

这些大模型在聊天状态下具有不同特点,例如:

  • 能生成 Markdown 格式的:智谱清言、商量 Sensechat、MiniMax
  • 目前不能进行自然语言交流的:昇思、书生
  • 受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值)
  • 具有特色功能的:昇思可生图,MiniMax 可语音合成

此外,阿里通义千问、360 智脑、讯飞星火等不在首批获批名单中。据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。

Content generated by AI large model, please carefully verify (powered by aily)

References

8月正式上线的国内大模型

5⃣️五家北京企业机构:百度(文心一言)https://wenxin.baidu.com抖音(云雀大模型)https://www.doubao.com智谱AI(GLM大模型)https://chatglm.cn中科院(紫东太初大模型)https://xihe.mindspore.cn百川智能(百川大模型)https://www.baichuan-ai.com/3⃣️三家上海企业机构:商汤(日日新大模型)https://www.sensetime.com/MiniMax(ABAB大模型)https://api.minimax.chat上海人工智能实验室(书生通用大模型)https://intern-ai.org.cn今天这8个大模型,在聊天状态下——能生成Markdown格式的:智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的:昇思(可以对文本进行是否由AI生成的检测,类似论文查重,准确度不错)、书生受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有15元的预充值额度进行体验,完成企业认证后可以进行充值)特色功能:昇思——生图,MiniMax——语音合成阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中,广东省2家和其他省市1家也将陆续开放据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品

快速学习 AIGC,有料通俗易懂版!

人工智能:一种目标,让机器展现智慧,Artificial Intelligence,简称AI生成式人工智能GenAI:一种目标,让机器产生复杂有结构的内容,Generative AI简称GenAI机器学习:一种手段,让机器自动从资料中找到公式深度学习:一种更厉害的手段,类神经网络-非常大量参数的函数大语言模型:是一类具有大量参数的“深度学习”模型,Large Language Models,简称LLMsChatGPT:一个应用实例,形象比喻:通过投喂大量资料预训练后,ChatGPT会通过聊天玩“文字接龙游戏”了。英文解释:Chat聊天,G:Generative生成,P:Pre-trained预训练,T:Transformer类神经网络模型以上概念之间的关系如下图:AIGC(Artificial Intelligence Generated Content,人工智能生成内容)是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等内容。AIGC技术可以用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。ChatGPT是AIGC技术的一个应用实例,它代表了AIGC在文本生成领域的进展。ChatGPT是美国OpenAI公司开发的一款基于大型语言模型(Large Language Model,简称LLM)的对话机器人,它能够根据用户的输入生成连贯且相关的文本回复。用户界面如下:AGI、GenAI、AIGC几个概念的区别与理解可参考下图:更多概念可问Kimi、通义千问、文心一言等大模型,也可以继续往下看,会逐步讲解更多概念。国内主要模型公司及地址如下:

快速学习 AIGC,有料通俗易懂版!

人工智能:一种目标,让机器展现智慧,Artificial Intelligence,简称AI生成式人工智能GenAI:一种目标,让机器产生复杂有结构的内容,Generative AI简称GenAI机器学习:一种手段,让机器自动从资料中找到公式深度学习:一种更厉害的手段,类神经网络-非常大量参数的函数大语言模型:是一类具有大量参数的“深度学习”模型,Large Language Models,简称LLMsChatGPT:一个应用实例,形象比喻:通过投喂大量资料预训练后,ChatGPT会通过聊天玩“文字接龙游戏”了。英文解释:Chat聊天,G:Generative生成,P:Pre-trained预训练,T:Transformer类神经网络模型以上概念之间的关系如下图:AIGC(Artificial Intelligence Generated Content,人工智能生成内容)是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等内容。AIGC技术可以用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。ChatGPT是AIGC技术的一个应用实例,它代表了AIGC在文本生成领域的进展。ChatGPT是美国OpenAI公司开发的一款基于大型语言模型(Large Language Model,简称LLM)的对话机器人,它能够根据用户的输入生成连贯且相关的文本回复。用户界面如下:AGI、GenAI、AIGC几个概念的区别与理解可参考下图:更多概念可问Kimi、通义千问、文心一言等大模型,也可以继续往下看,会逐步讲解更多概念。国内主要模型公司及地址如下:

Others are asking
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
如何根据现有的合同模板搭建一个合同生成的智能体
要根据现有的合同模板搭建一个合同生成的智能体,可以参考以下步骤: 1. 创建智能体:输入人设等信息,并放上相关工作流。 2. 基础配置: 选择“Coze 变现模板(多智能体版)”并“新建项目”,可使用代金券进行抵扣。 添加智能体,获取 Coze Bot 的 ID,导入数据库后上线展示。获取 Bot ID 时,进入 Coze 智能体页面,在地址栏内复制“bot/”之后的数字,且 bot 发布时记得勾选 WEB SDK。回到模板项目,在“coze_bot”数据表中添加智能体,填写相关字段,如宣传图、智能体名称、图标、license、作者和介绍等。 3. 工作流设置: “批处理”节点:循环处理之前“文本”节点生成的文案 List,对每一句文案通过画板生图、通过插件进行语音合成。 “选择器”节点:对循环到的“这句话”进行异常处理,选择不为空的进行后续处理。 “画板”节点:是一个“白色画板”,可添加任意变量进行内容添加,点击编辑进行操作。 “语音合成”节点:输入每一句文案,选择喜欢的音色生成语音。 “图片音频合成”节点:选择合适的视频合成插件。 配置完成后,先进行测试,注意工作流中【所有视频片段拼接】节点使用的插件 api_token 填的是您的 token,其他人调用这个工作流会直接消耗您的 money,所以不能直接发布。您可以将 api_token 作为工作流最开始的输入,用户自己购买后,输入 api_token 就可以使用,然后再发布。
2025-04-01
我是一个ai新手,请根据知识库现有的内容帮我拟一份学校ai的学习计划,以及更新知识的跟进和学习
以下是为您拟定的学校 AI 学习计划,以及知识更新的跟进和学习方法: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。建议您一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键。尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 六、持续学习和跟进 AI 是一个快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 希望这份学习计划对您有所帮助,祝您在 AI 学习的道路上取得成功!
2025-03-31
我是一个产品经理,我想要绘制ai agent对现有业务流程的提升ppt,有没有一些好的案例
以下是一些关于 AI Agent 对现有业务流程提升的案例,希望对您绘制相关 PPT 有所帮助: 1. 在查询问题方面,如使用 Kimi Chat 时,它会在互联网检索相关内容并总结分析给出结论,这是大模型利用“网页搜索”工具的典型例子,同时 PPT 中还介绍了众多不同领域类型的工具,为大模型在获取、处理、呈现信息上做补充。 2. 在任务执行的工作流路径规划方面,Agent 能够自行规划,面向简单或线性流程运行。例如,先识别男孩姿势,再找姿势提取模型、姿势图像模型、图像理解文本模型和语音合成模型来完成流程任务。 3. 在多智能体协作方面,吴恩达通过开源项目 ChatDev 举例,可让大语言模型扮演不同角色,如公司 CEO、产品经理、设计师、代码工程师或测试人员等,这些 Agent 相互协作共同开发应用或复杂程序。 4. 对于 AI Agent 的基本框架,OpenAI 的研究主管 Lilian Weng 提出“Agent=LLM+规划+记忆+工具使用”的基础架构,其中大模型 LLM 扮演了 Agent 的“大脑”。规划主要包括子目标分解、反思与改进,将大型任务分解为较小可管理的子目标,处理复杂任务,并对过去行动进行自我批评和反思,从错误中学习改进未来步骤,提高最终结果质量。 5. 在信息处理方面,近期出现的各类 AI 搜索引擎,如 perplexity.ai、metaso、360 搜索、ThinkAny 等,不断颠覆传统搜索引擎。智能摘要功能能辅助快速筛选信息,实现信息降噪。 6. 在信息表达方面,现在用自然语言描述一句话就能生成美观可用的图片,降低了不同角色的创作门槛和周期。 7. 对于产品经理的工作流,可使用 AI 进行搞定用户画像、竞品调研、设计产品测试用例、绘制产品功能流程图等。但建议先摸清自己的日常工作流,再根据工作节点线索找到适合自己的工具。 关于 Agent 的未来,曾被认为异想天开的想法都可能成为现实,技术迭代会不断向前。同时,在法律法规方面,相关生命周期参与者应实施适当的透明度措施,直接受 AI 系统使用影响的各方应能获取足够信息以维护自身权利,技术标准也可为评估、设计和改进 AI 系统的透明度和可解释性提供指导。
2025-03-24
降本增效的情况下建筑设计院自己开发AI和应用好现有的AI哪个选择更好
在降本增效的情况下,建筑设计院是自己开发 AI 还是应用现有的 AI,需要综合多方面因素来考虑。 现有的 AI 工具已经在很多领域带来了显著的优势,例如: 1. 提高效率:能够快速产生创意效果和设计方案。 2. 丰富设计效果:极大地丰富了设计自由度,实现各种创意。 3. 拓展工作流程:促使设计工作流程重新组合再造,拓展设计师的思维边界。 同时,也有一些专门针对建筑设计的现有 AI 工具,比如: 1. HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型,软件 UI 和设计成果颜值在线。 2. Maket.ai:面向住宅行业,在户型和室内软装设计方面有 AI 技术探索,能根据输入需求自动生成户型图。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期阶段可引入标准和规范约束设计结果。 4. Fast AI 人工智能审图平台:形成全自动智能审图流程,能实现建筑全寿命周期内信息的集成与管理。 然而,自己开发 AI 也有其潜在的好处,比如可以更精准地满足设计院的特定需求和业务特点。但开发 AI 需要投入大量的资源和时间,包括技术人才、资金、研发周期等。 综上所述,建筑设计院应根据自身的技术实力、资源状况、业务需求的独特性等因素来权衡选择。如果资源有限且现有工具能满足大部分需求,应用现有的 AI 可能是更好的选择;如果对特定功能有极高的要求且有足够的能力和资源支持,自己开发 AI 也未尝不可。
2025-03-23
我想学习有关ai的知识,但是并不是单单的系统性的学,而是想利用现有的模型比如说deep seekr1模型来训练一个自己的模型这样的,来实现某些功能
以下是关于 DeepSeek R1 模型的相关知识: 1. DeepSeek R1 引入了纯强化学习(RL),不依赖大量人类标注数据,而是通过自我探索和试错来学习。在“冷启动”阶段,仅通过少量人工精选的思维链数据进行初步引导,建立符合人类阅读习惯的推理表达范式,随后主要依靠强化学习,在奖励系统的反馈下(只对结果准确率与回答格式进行奖励),自主探索推理策略,不断提升回答的准确性,实现自我进化。准确率奖励用于评估最终答案是否正确,格式奖励强制结构化输出,让模型把思考过程置于<think></think>标签之间。 2. 与其他模型相比,Alpha Zero 只训练了三天,就以 100 比 0 的战绩完胜 Alpha Go Lee,Alpha Go(老)采用监督学习+强化学习,学习人类棋谱,更接近人类职业棋手风格,继承了人类的局限,Alpha Zero(新)完全摒弃人类数据的纯强化学习,从零开始自我博弈,不受限于人类经验,具有创造性的下棋风格。DeepSeek R1 在训练中更注重学习推理的底层策略,培养通用推理能力,使其能够实现跨领域的知识迁移运用和推理解答。 3. 使用 DeepSeek R1 给老外起中文名的操作指引: 点击邀请,复制邀请链接或下载邀请海报分享给好友。 打开火山引擎的模型页面(https://zjsms.com/iP5QRuGW/),使用习惯的方式登录。 登录后点击左侧列表里的“在线推理”,再点击“快速入门”。 获取 API Key,点击“创建 API Key”,可修改名字后创建,创建完成后点击“查看并选择”,将“已复制”的提示内容找个地方存一下。 复制 R1 的调用示例代码,选择模型为“DeepSeek R1”,修改示例代码中的相关内容,然后点击右侧的复制按钮,将代码找个地方存起来。 上述接入方法是快速入门方式,平台会自动创建在线推理接入点,并提供 50 万 Token 的免费额度,用完才需充值。如需充值,点击页面右上角的“费用”》“充值汇款”,根据账单适当充值。 4. DeepSeek R1 不同于先前的普通模型,它与 OpenAI 现在最先进的模型 o1、o3 同属于基于强化学习 RL 的推理模型。在回答用户问题前,R1 会先进行“自问自答”式的推理思考,提升最终回答的质量,这种“自问自答”是在模拟人类的深度思考,其“聪明”源于独特的“教育方式”,在其他模型还在接受“填鸭式教育”时,它已率先进入“自学成才”新阶段。
2025-03-22
你现在是抖音运营,如何可以利用现有图片素材,自动生成服饰图文
以下是一些利用现有图片素材自动生成服饰图文的方法和相关资源: 1. TryOffDiff:这是一种 AI 脱衣技术,能够逆向打造服装图片。与虚拟试衣不同,它可以将衣服从照片中“摘取”生成标准化服装图,并且能够保留图案、褶皱、徽标等精细细节,即使原图中部分被遮挡,也能准确推断。其应用场景广泛,适合商品目录制作及电商平台服装展示需求。详细介绍: 2. 可生成自定义服装效果图,支持颜色、款式、材质等多种细节描述。基于 H&M Fashion Captions 数据集,提供多样化的时尚风格参考。模型权重为 Safetensors 格式,便于集成和使用。模型下载: 3. 在 Stable Diffusion 中,若看到好看的图片想复制其效果,可将照片导入。若为 SD 下载的 PNG 格式照片,右边会自动弹出照片信息,包括正面关键词、负面关键词等,可复制这些信息到“文生图”页面生成相似图片。若照片无法自动弹出信息,可使用“标签器(Tagger)”生成关键词。
2025-03-12
国内好用的文档排版AI工具
以下是国内一些好用的文档排版 AI 工具: 1. Grammarly:不仅是语法和拼写检查工具,还提供排版功能,可改进文档整体风格和流畅性。 2. QuillBot:AI 驱动的写作和排版工具,能改进文本清晰度和流畅性,保持原意。 3. Latex:虽不是纯粹的 AI 工具,但在学术论文排版方面广泛使用,有许多 AI 辅助的编辑器和插件简化排版过程。 4. PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 5. Wordtune:AI 写作助手,重新表述和改进文本,使其更清晰专业,保持原始意图。 6. Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 选择合适的工具取决于您的具体需求,如文档类型、出版标准和个人偏好。对于学术论文,Latex 和 Overleaf 受欢迎;对于一般文章和商业文档,Grammarly 和 PandaDoc 等可能更适用。 此外,还有一些与文档相关的 AI 工具,如文章润色工具: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,优化文章语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可根据输入生成符合要求的学术论文。 制作 PPT 的 AI 工具: 1. Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。 2. 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素。 3. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能。 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-13
目前国内各大ai有排名么
目前国内各大 AI 的排名情况如下: 从用户规模、新增速度、用户活跃和用户粘性等角度进行数据统计,在 APP 端,截至 2024 年 10 月,共 56 款产品的历史下载量超百万,8 款产品历史下载量超千万,夸克和豆包的历史总下载量已过亿。夸克、豆包和 Kimi 智能助手月增长可达到千万级,DAU 方面,夸克 DAU 超过 2600 万,豆包、Kimi、天天跳绳和文小言 DAU 超百万;用户粘性方面,夸克和叨叨三日留存率超过 30%。 在 Web 端,AI 智能助手赛道外的所有赛道都基本处于停滞状态。用户规模方面,月总访问量超千万的共 7 款产品,包括夸克、腾讯文档、百度文库、Kimi 智能助手、文心一言、豆包和通义。在用户活跃度上,共 3 款产品——夸克、Notion 和百度文库的 MAU 超过千万,19 款产品 MAU 超过百万。仅有 14 款产品人均每月访问超过 5 次,13 款产品平均访问时长超过 10 分钟。 “量子位智库 AI 100”通过综合 100 和原生 100 两张榜单提名了国内优秀的 AI 产品。 需要注意的是,中国国内的大模型排名可能在短时间内会有变化。要获取最新的排名,您可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台。在通往 AGI 之路的知识库里,在会定期更新相关的排名报告,可以供您查阅。
2025-04-12
目前国内各大ai有排名么
目前国内各大 AI 的排名情况如下: 从用户规模、新增速度、用户活跃和用户粘性等角度进行数据统计,在 APP 端,截至 2024 年 10 月,共 56 款产品的历史下载量超百万,8 款产品历史下载量超千万,夸克和豆包的历史总下载量已过亿。夸克、豆包和 Kimi 智能助手月增长可达到千万级,DAU 方面,夸克 DAU 超过 2600 万,豆包、Kimi、天天跳绳和文小言 DAU 超百万;用户粘性方面,夸克和叨叨三日留存率超过 30%。 在 Web 端,AI 智能助手赛道外的所有赛道都基本处于停滞状态。用户规模方面,月总访问量超千万的共 7 款产品,包括夸克、腾讯文档、百度文库、Kimi 智能助手、文心一言、豆包和通义。在用户活跃度上,共 3 款产品——夸克、Notion 和百度文库的 MAU 超过千万,19 款产品 MAU 超过百万。仅有 14 款产品人均每月访问超过 5 次,13 款产品平均访问时长超过 10 分钟。 “量子位智库 AI 100”通过综合 100 和原生 100 两张榜单提名了国内优秀的 AI 产品。 需要注意的是,中国国内的大模型排名可能在短时间内会有变化。要获取最新的排名,您可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台。在通往 AGI 之路的知识库里,在会定期更新相关的排名报告,可以供您查阅。
2025-04-12
准确的讲述垂直大模型的概念,国内外的应用现状、场景,发展趋势,最好能附带图片。内容尽量详细、逻辑通顺。
垂直大模型是专注于特定领域的大模型,例如小语种交流、临床医学、AI 蛋白质结构预测等。 在国内,大模型分为通用模型如文心一言、讯飞星火等,处理自然语言;也有垂直模型专注特定领域。 大模型因其强大的语言理解和生成能力,在多个领域和应用场景中表现出色。比较火的应用场景包括: 1. 文本生成和内容创作:撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手:提供客户服务、日常任务提醒和信息咨询等服务。 3. 编程和代码辅助:代码自动补全、bug 修复和代码解释。 4. 翻译和跨语言通信:促进不同语言背景的用户之间的沟通和信息共享。 5. 情感分析和意见挖掘:为市场研究和产品改进提供数据支持。 6. 教育和学习辅助:创建个性化的学习材料、自动回答学生问题和提供语言学习支持。 7. 图像和视频生成:如 DALLE 等模型可以根据文本描述生成相应的图像,甚至在未来可能扩展到视频内容的生成。 8. 游戏开发和互动体验:创建游戏中的角色对话、故事情节生成和增强玩家的沉浸式体验。 9. 医疗和健康咨询:理解和回答医疗相关的问题,提供初步的健康建议和医疗信息查询服务。 10. 法律和合规咨询:帮助解读法律文件,提供合规建议,降低法律服务的门槛。 关于发展趋势,尽管当前市场以基础大模型为主,但将大模型与行业专业知识结合,以满足不同行业的需求,成为未来发展的关键。例如腾讯研究院的《行业大模型调研报告》指出,如何将大模型与行业专业知识结合是重点。同时,在发展过程中也需要注意其在隐私、安全和伦理方面的挑战。 很抱歉,暂时无法为您提供相关图片。
2025-04-11
在国内如何使用GPT-4O
在国内使用 GPT4 的方法如下: 安卓系统: 1. 安装 Google Play:到小米自带的应用商店搜索 Google Play 进行安装,安装好后打开,按照提示一步步操作登录。 2. 下载安装 ChatGPT:到谷歌商店搜索“ChatGPT”进行下载安装(开发者是 OpenAI,别下错)。可能会遇到“google play 未在您所在的地区提供此应用”的问题,解决方法如下:在 google play 点按右上角的个人资料图标,依次点按:设置>常规>帐号和设备偏好设置>国家/地区和个人资料。在这里看到账号没有地区,可以“添加信用卡或借记卡”,国内的双币信用卡就行,填写信息时地区记得选美。如果回到 Google Play 首页还搜不到 ChatGPT,可以卸载重装 Google Play,操作过程保持梯子的 IP 一直是美,多试几次。 3. 体验 ChatGPT:如果只想体验 ChatGPT 3.5 版本,不升级 GPT4,直接登录第二部注册好的 ChatGPT 账号即可。 4. 订阅 GPT4 Plus 版本:先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡,然后在 ChatGPT 里订阅 Plus。 苹果系统: 1. 在 Apple Store 下载 ChatGPT:中国区正常下载不了,需要切换到美区才可以下载。美区 Apple ID 注册教程参考如下知乎链接: 。最终在 Apple Store 搜到 ChatGPT 结果如下,下载安装即可,注意别下错。 2. 支付宝 购买苹果礼品卡 充值 订阅付费 App:打开支付宝,地区切换到【美区任意区】,往下滑,找到【品牌精选 折扣礼品卡】,点击进去,可以看到【大牌礼品卡】,往下滑找到【App Store&iTunes US】礼品卡,按需要的金额购买即可,建议先买 20 刀。然后进行以下操作: 支付宝购买礼品卡。 在 apple store 中兑换礼品卡。 在 chatgpt 中购买订阅 gpt plus,如果中途不想继续订阅了,可到订阅列表中取消订阅。 完成上述步骤后,就可以开始使用 ChatGPT 4 了。需要注意的是,在国内使用相关服务可能存在法律风险和技术限制,请谨慎操作。
2025-03-30
国内有什么好的音乐AI可以用即兴哼唱旋律去写歌
以下是国内一些可用即兴哼唱旋律写歌的音乐 AI 相关信息: 《We Are The One》的创作思路: 只有词和意向风格:先确定最核心情绪所在段落,用 AI 生成最佳结果,以此作为动机音轨扩展创作。 只有词和一小段自己哼唱的旋律:上传哼唱旋律,让 AI 扩展出喜欢的风格,作为动机音轨继续创作。 已有 midi 作曲:挂载音源导出,在 AI 帮助下丰满包含主歌、副歌等主要段落的核心音轨,然后继续扩展出其他段落完成全曲创作。 已有简单录音小样:利用 REMIX 优化音质与编曲结构,利用 AI 尝试不同曲风版本,找到最喜欢的风格制作成核心音轨,进而完成全曲创作。 Suno 和 Udio 推出的上传音频文件生成音乐的功能: 精确控制每首歌的速度(Tempo),无需背绕口的速度词,可精确控制想要的 BPM。 控制旋律(Melody),通过自己制作简单旋律让 AI 补全并贯穿整首歌,实现旋律与速度的一谱变速,节省大量 Roll 旋律的时间。 选择配器(Instrumentation),按想法选乐器,减少提示词中乐器不灵光的情况,也可选择特殊音色。 进行合成(synthesizer),当有两支 BPM 相同、调性相同的音乐时,可尝试更多拆分组合和有趣效果。 节省上传音频的点数消耗后,点数可用于:用提示词多 Roll 一些和流派、心情、场景相关的曲子,减少限制让 AI 音乐发挥更多创造力,把好旋律存起来作为制作素材;用于 roll 更多细节调整部分,如让某段曲子升调,提升作品品质。
2025-03-29