Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

总结一下24年国产AI大模型的主要进展

Answer

2024 年国产 AI 大模型的主要进展包括:

  • 9 月:
    • 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。
    • 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSE-MoE-A36B;OpenAI 发布 o1 模型。
    • 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 Reader-LM 和 Jina Embeddings V3。
    • 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。
    • 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。
    • 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step-2 万亿参数 MoE 语言大模型。
    • 21 日:大模型测试基准研究组正式成立。
    • 23 日:钉钉 365 会员上线。
    • 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。
    • 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 Westlake-Omni。
  • 国内大模型落地情况:
    • 2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。
    • 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。在金融行业,百度以 14 个中标数量、3734.4 万元中标金额排名第一;科大讯飞居第二。
    • 在智能终端行业,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。
    • 百度表现突出,截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%。
    • 大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。大模型的竞争,正在加速成为体系化之战。
Content generated by AI large model, please carefully verify (powered by aily)

References

2024 年 9 月

9月12日:李继刚再现神级Prompt,玩法持续翻新9月12日:Mistral●发布首个多模态模型Pixtral 12B9月13日:商汤●Vimi相机开放微博小程序9月13日:元象●开源中国最大MoE大模型XVERSE-MoE-A36B9月13日:OpenAI发布o1模型,传说中的草莓来了9月14日:人工智能生成合成内容标识办法(征求意见稿)9月14日:Jina AI发布Reader-LM9月14日:Jina AI发布Jina Embeddings V39月18日:DeepSeek发文庆祝登上LMSYS榜单国产第一,几小时后Qwen新模型表示不服9月19日:云栖大会9月19日:通义万相●AI生视频上线9月19日:快手可灵1.5模型●新增运动笔刷能力9月20日:腾讯元器智能体对外发布9月20日:秘塔科技产品经理JD走红AI圈9月20日:阶跃●跃问接入Step-2万亿参数MoE语言大模型9月21日:大模型测试基准研究组正式成立,国家队来了9月23日:钉钉●365会员上线9月24日:讯飞星火API全新升级9月24日:豆包大模型全系列发布&更新9月25日:Vidu API正式开放,加速企业级视频创作9月25日:OpenAI发布高级语音功能9月25日:西湖心辰开源Westlake-Omni

国内大模型落地“狂飙”一年,各家厂商成绩如何?

Gartner《2025年十大战略技术趋势》中预测,到2028年至少有15%的日常工作决策将由代理型AI(AI智能体)自主做出。2024年,AI大模型在生产和生活中正以“狂飙猛进“的速度落地。“百模大战”过后,国内大模型行业基本跑出了以百度、阿里、字节等科技大厂和创业“AI六小虎”为主要玩家的竞争格局。2024年被称为国内大模型落地元年,经过一年时间的赛跑,各家大模型在各行各业的落地成绩究竟如何?2024年国内大模型项目增3.6倍,百度中标数量和金额双第一各厂商公布的大模型调用数据固然是一个成绩参考,但是让企业客户为大模型买单掏出的真金白银数量无疑是更为直观的成绩。根据云头条统计公开可查的大模型招投标项目数据,2024年国内大模型中标项目数量和金额都呈现大幅度增长。2024年1至11月,大模型中标项目共728个,是2023年全年的3.6倍;中标金额17.1亿元,是2023年全年的2.6倍。大模型中标项目数前五的行业分别是运营商、能源、教育、政务、金融。厂商方面,百度以40个中标项目数、2.74亿元的中标金额排名所有厂商之首,科大讯飞居第二。再看各细分行业,在金融行业,根据2024年1-11月份金融机构发起的大模型相关采购中标项目来看,百度以14个中标数量、3734.4万元中标金额排名第一;科大讯飞居第二。

国内大模型落地“狂飙”一年,各家厂商成绩如何?

在智能终端行业,根据媒体报道,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。整体来看,在主流大模型厂商中,百度表现突出,拿下最关键的中标项目数量、中标金额两项第一。根据百度披露的数据,截至11月,其文心大模型日均调用量超过15亿次,千帆平台帮助客户精调了3.3万个模型、开发了77万个企业应用。今年三季度财报披露,百度智能云营收达49亿元,同比增长11%,百度智能云的增长主要由互联网、教育、金融等行业对模型训练和推理的高需求带动。这与前文所述百度大模型中标行业相一致。2024年,百度在大模型落地交出的成绩单可谓亮眼。大模型时代,AI基础设施的正确范式事实上,大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。这也就意味着,在大模型落地赋能企业智能化时,能力比拼从单项变为全能比拼(大模型自身、工程能力、工具平台等)。大模型的竞争,正在加速成为体系化之战。

Others are asking
2024年10月的AIPO活动相关云文档在哪儿?
以下是与 2024 年 10 月的 AIPO 活动相关的云文档: :包含关于 AI 模型训练的介绍与讲解,如 Eagle 插件批量收藏 3D 图表、不同步数训练时间、使用 MZ 数据集训练 Flux、云服务器训练流程、训练集收集要求、训练模型的时机、角色一致性表现、云服务器训练集设置、模型训练参数设置、模型训练启动与等待等内容。 》,列举了美国融资金额超过 1 亿美元的 AI 公司。 :包含 2024 年 10 月 24 日娜乌斯佳:AIGC 商业片落地经验分享等多个日期的智能纪要。
2025-03-28
AI生成PPT,介绍员工持股平台2024年的治理情况
很抱歉,目前知识库中没有关于使用 AI 生成介绍员工持股平台 2024 年治理情况 PPT 的相关内容。但我可以为您提供一些思路和建议来帮助您完成这个任务。 首先,您需要明确 PPT 的结构和主要内容板块。比如,可以包括员工持股平台的概述、2024 年的治理目标和策略、治理成果和关键数据、面临的挑战和解决方案、未来展望等。 在使用 AI 工具生成 PPT 时,您可以向工具清晰地描述每个板块的具体要求和重点内容。例如,对于治理成果板块,您可以要求 AI 突出显示关键的数据和图表,并进行简洁明了的解读。 同时,您还可以参考一些现有的优秀 PPT 模板和案例,以获取更多的灵感和设计思路。 希望这些建议对您有所帮助,如果您还有其他问题,请随时向我提问。
2025-03-22
2月24日ai新闻
以下是 2 月 24 日的 AI 新闻: 帆哥:2024AI 大事纪 3 月:AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 4 月:英伟达发布硬件股价飙升。 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 7 月:快手开源 LivePortrait 模型,表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月:阿里云发布模型,海螺 AI 参战,AI 新动态不断,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 2 月 24 日社区动态速览 2 月 23 日,AI 切磋大会在 23 个城市同步举行,预计有近 4000 人参与,主题围绕 DeepSeek,邀请各行业专家分享应用场和见解。 向阳乔木介绍了通过结合 VS Code、Cline 插件和 Deepseek API 等工具提升 AI 应用能力的方法,用户可实现自动发送邮件等功能,Cline 作为 AI 编程工具支持多种大模型,用户可通过火山引擎等平台获取 API,通过 MCP 协议可扩展 LLM 功能。 南瓜博士探讨了如何有效引导儿童和青少年从初级认知阶段过渡到更高级的思维模式。 通往 AGI 之路 21 个 mj 风格,105 个 prompt。 张小珺邀请 MIT 计算机科学与人工智能实验室的在读博士松琳解读 DeepSeek、Kimi、MiniMax 注意力机制新论文。 CB Insights 发布重磅报告指出 2025 年人工智能市场的六大趋势。
2025-02-24
2024 年值得关注的中文大模型全景图
2024 年,AI 大模型在生产和生活中落地速度迅猛,被称为国内大模型落地元年。以下是一些值得关注的情况: 国内大模型行业形成了以百度、阿里、字节等科技大厂和创业“AI 六小虎”为主要玩家的竞争格局。 2024 年 1 至 11 月,国内大模型中标项目数量和金额大幅增长,中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。 在金融行业,百度以 14 个中标数量、3734.4 万元中标金额排名第一;科大讯飞居第二。 在智能终端行业,超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 百度表现突出,截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%。 2024 年 9 月 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法;Jina AI 发布 ReaderLM、Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力,大模型的竞争正在加速成为体系化之战。
2025-02-21
2024 年中国人工智能+产业规模
目前关于 2024 年中国人工智能+产业规模的相关信息如下: 国家统计局数据显示,2022 年全国研究与试验发展(R&D)经费投入总量首次超过 3 万亿元,达到 30782.9 亿元,比上年增加 2826.6 亿元,增长 10.1%,表明国家对科技创新和算力设施的重视和持续投入。我国算力设施产业链规模巨大,已达到万亿元级别。2022 年我国算力核心产业规模达到 1.8 万亿元,预计到 2023 年,中国算力产业规模将超过 3 万亿元。 在企业数量方面,截至 2024 年 3 月,全国算力存量企业共有 75,343 家。其中,广东省、北京市和江苏省的企业数量位居前三,分别有 10,315 家、7,167 家和 6,728 家。此外,人工智能企业数量也超过 4400 家。 德勤的报告指出,中国 AI 产业快速发展,得益于政策支持、经济增长和技术创新。成长型 AI 企业作为产业创新的重要力量,数量占比高达九成,活跃于各行业领域。预计到 2025 年,中国人工智能核心产业规模将突破 5000 亿元。 在影视行业,若假设 2027 年 AI 影视市场可以获得国内总市场份额的 10%,则国内 AI 影视总市场规模预计将达约 380 亿元以上;若假设 2030 年可以获得 25%以上市场份额,则国内 AI 影视总市场规模将达千亿级别。 营销行业或成生成式 AI 最早实现商业化落地的行业之一,未来,AI 技术还将持续推动营销行业的深刻变革。
2025-02-20
明略科技:2024年中国AI Agent行业研究
以下是关于 2024 年中国 AI Agent 行业的相关研究报告: 2024 年 9 月: 《》 《》 2024 年 8 月: 《》深入分析了 AI Agent 的市场定义、发展阶段、核心组件及其在企业用户场景中的应用。 《》指出企业实施 AI Agent 的主要目标是降低运营成本,尤其是在知识库管理、数据分析、营销与客户服务等领域。 2024 年 5 月: 《》提到 AI Agent 市场处于早期阶段,其商业价值在于提升工作均值、实现行业知识库构建、改变工作流程及生产关系。未来,AI Agent 将作为数字生产力,通过与工作流的结合,成为企业知识资产积累与复用的关键角色,推动技术革命。
2025-02-10
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
国产ai中,哪个可以把平面产品图处理成3d产品视频
以下是一些国产 AI 可以将平面产品图处理成 3D 产品视频的相关信息: 即梦:在平面设计稿转 3D 这一环节,可以在即梦图片生成界面中导入参考图,参考选项为参考轮廓边缘,生图模型选择图片 2.0,输入包含角色、细节描述、场景、风格材质等的提示词,生成图片,经过多次生成并选择高清放大。 但需要注意的是,不同的 AI 在处理效果和适用场景上可能会有所差异,您可以根据具体需求进行选择和尝试。
2025-03-25
国产的ai工具有哪些
以下是一些国产的 AI 工具: 图像类: 可灵:由快手团队开发,可生成高质量的图像和视频,但价格相对较高,重度用户年费可达几千元,轻度用户有每日免费点数和较便宜的包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,操作界面简洁,用户友好度高,目前免费,每天签到获取灵感值即可,但在某些方面存在局限性。 思维导图类: GitMind:免费跨平台,支持多种模式,可通过 AI 自动生成思维导图。 ProcessOn:国内的思维导图+AIGC 工具,能利用 AI 生成思维导图。 AmyMind:轻量级在线工具,无需注册登录,支持自动生成节点。 Xmind Copilot:Xmind 推出的基于 GPT 的助手,可一键拓展思路,生成文章大纲。 TreeMind:输入需求即可由 AI 自动完成思维导图生成。 EdrawMind:提供一系列 AI 工具,包括头脑风暴功能。 其他类: 传音智库:公司内部的 AI 平台,功能类似于 Poe,仅内网可访问,可用 kimi 替代。 Kimichat:https://kimi.moonshot.cn/ 秘塔 AI:https://metaso.cn/
2025-03-18
国产编码类AI
以下是一些国产的编码类 AI 产品: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议,提高编程效率。 2. 通义灵码:阿里巴巴团队推出,基于通义大模型,具备行级/函数级实时续写、自然语言生成代码等多种能力。 3. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,为开发人员实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费编程助手,基于 130 亿参数的预训练大模型,可提升开发效率。 5. Cody:代码搜索平台 Sourcegraph 推出,借助强大的代码语义索引和分析能力,了解开发者的整个代码库。 6. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供的免费 AI 代码助手,基于自研基础大模型微调。 7. Codeium:由 AI 驱动的编程助手工具,通过提供代码建议等帮助软件开发人员提高效率和准确性。 此外,字节最新发布的 AI 编程工具 Trae 的 Windows 版也已发布,具有以下特点: 1. 全中文界面,跨平台支持,包括 Windows 和 MacOS 系统,操作界面简洁直观,易于上手。 2. 内置 Claude3.5 和 GPT4o 两大顶尖 AI 模型,完全免费且不限使用次数。 3. 零门槛智能开发,不懂编程也能通过中文对话让 AI 生成所需代码,并自动识别和解决代码错误。 字节的 Trae 目前处于公测阶段,完全免费。它同时支持豆包 1.5 Pro 和 Deepseek R1、V3 等模型。虽然在处理复杂业务时可能不如 Cursor,但为不懂技术的人提供了新选择,有望实现一人搞定业务、产品、设计、开发、运维等全流程。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同,您可以根据自身需求选择最适合的工具。
2025-03-16
有关国产大模型介绍及对比
以下是关于国产大模型的介绍及对比: 过去一年,国内大模型取得了显著进步。综合能力超过 GPT 3.5 和 GeminiPro 的国产模型有 11 个,如百度的文心一言 4.0、阿里云的通义千问 2.0 和 Qwen 72BChat、OPPO 的 AndesGPT、清华&智谱 AI 的智谱清言、字节跳动的云雀大模型等。在 SuperCLUE 测评中,国外模型平均成绩为 69.42 分,国内模型平均成绩为 65.95 分,差距约 4 分,且国内外平均水平差距在缩小。 国内开源模型在中文上表现优于国外开源模型,如百川智能的 Baichuan213BChat、阿里云的 Qwen72B、Yi34BChat 均优于 Llama213BChat。国内大模型竞争格局方面,从国内 TOP19 大模型的数量来看,创业公司和大厂的占比几乎持平。 此外,还有针对国产大模型的测评机制,包括以同组提示词下 ChatGPT 4.0 生成的内容做对标参照,对复杂提示词理解和执行、推理能力、文本生成能力、提示词设计能力、长文本归纳总结能力等方面进行多轮测评。 国外的代表性大模型如 GPT4 的不同版本、Claude2、Llama2 有较好的稳定性表现。国内开源模型总体表现较好,成绩最好的开源模型在中文某些场景或任务上接近 GPT 4,大版本的模型通常优于中小版本,众多创业公司是开源模型的主力。
2025-03-10
能够生成AI视频的免费国产软件有哪些?
以下是一些能够生成 AI 视频的免费国产软件: 1. Hidreamai:有免费额度,网址为 https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA:网址为 https://etna.7volcanoes.com/ 。这是一款由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps,支持中文和时空理解。 3. 可灵:网址为 https://klingai.kuaishou.com/ 。在 AI 视频生成领域表现出色,生成的视频质量高,生成速度快,对国内用户的可访问性强。支持文生视频、图生视频,提示词可使用中文,文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持多种尺寸。 4. Dreamina:处于国内内测阶段,有免费额度,网址为 https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频、视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以,文生视频支持多种控制和尺寸选择,默认生成 3s 的视频。
2025-03-08
国产AGI进程到哪了
2023 年之前,国内 AI 行业自认为和美国差距不大,但 ChatGPT 和 GPT4 的出现打破了这种认知,OpenAI 直接拉开了 2 年的技术差距。上半年国内坚信靠资金和卡能实现“大炼钢铁”,许多大厂和创业公司都想创造国产 AGI,但下半年发现不容易后纷纷转向“垂直应用”“商业化”,不再提 AGI。目前国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距。百度的“文心 4.0”和即将发布的阿里的“通义千问”是国内较好的模型。 2024 年,国内多家厂商竞相推出新型推理模型,AI 与数学结合被视为实现 AGI 的关键。在这一年,AI 音频能力有长足进展,“全真 AI 颜值网红”出现,游戏 AI NPC 有里程碑式进展,AI 男/女朋友聊天基本成熟,实时生成的内容开始在社交媒体和广告中出现,AI Agent 有明确进展,可穿戴全天候 AI 硬件层出不穷,华为昇腾生态开始形成,国内推理芯片开始国产替代。但同时,AI 造成的一些问题也开始进入公众视野,AI 立法、伦理讨论仍大规模落后于技术进展。预计到 2025 2027 年,AI 相关技术还会有更多突破和发展,同时也会带来更多社会问题。
2025-03-06
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14