Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

今天有什么AI资讯

Answer

以下是为您整理的今日 AI 资讯:

  • 近期热门融资 AI 产品速递 1 st :包括多种搜索模式且重隐私的搜索引擎 You.com、通过 Sparkpages 来满足用户个性化搜索需求的 Genspark、刚被 OpenAI 收购的提供实时搜索和分析数据库服务的 Rockset、人类与 AI 共存的社交软件 Butterflies AI、可以对销售通话进行记录和辅导的 AI 助手 MeetRecord。
  • 宝玉日报 2 月 3 日:
    • AI 对软件工程的影响:涵盖自动代码生成、智能调试、AI 驱动的 DevOps 和敏捷开发优化等方面。
    • OpenAI CEO 宣布开发 AI 设备,目标颠覆智能手机,同时表达了对自研 AI 芯片的兴趣。
    • OpenAI 推出全新 Deep Research,让 ChatGPT 成为您的研究助理。
  • AIGC Weekly#32 上周精选:
    • Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位。
    • Shopify 的 AI 助手 Sidekick 已上线,能帮助执行相关操作。
    • Artifact 推出了自定义内容阅读语音的功能。
    • OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,确保 AI 模型的安全发展。
    • Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器。
Content generated by AI large model, please carefully verify (powered by aily)

References

近期热门融资 AI 产品速递 1 st|Genspark、Rockset、ButterfliesAI、MeetRecord...

在信息爆炸的时代,如何快速、准确地获取和理解信息变得尤为关键。AI技术的发展极大地提升了信息检索和处理的效率。今天我们向大家介绍五款领先的AI产品,看看它们如何帮助我们更高效地获取信息,提升工作效率和决策质量。[heading1]目录[content]一、You.com:多种搜索模式且重隐私的搜索引擎二、Genspark:通过Sparkpages来满足用户个性化的搜索需求三、Rockset:刚被OpenAI收购的提供实时搜索和分析数据库服务的公司四、Butterflies AI:人类与AI共存的社交软件五、MeetRecord:可以对销售通话进行记录和辅导的AI助手

宝玉 日报

?宝玉日报「2月3日」✨✨✨✨✨✨✨✨1⃣️?AI对软件工程的影响:编程、DevOps与敏捷开发AI正深刻变革软件工程,涵盖自动代码生成、智能调试、AI驱动的DevOps和敏捷开发优化。自动代码生成工具(如GitHub Copilot)提高编程效率,AI也助力智能测试与运维。DevOps迎来AI驱动的CI/CD和AIOps,提升部署自动化和智能监控能力。AI让敏捷开发更加高效,通过自动化需求分析、测试优化和团队协作增强生产力。?[https://x.com/dotey/status/1886440500955328555](https://x.com/dotey/status/1886440500955328555)2⃣️?OpenAI CEO宣布开发AI设备,目标颠覆智能手机Sam Altman确认OpenAI正在研发AI专用设备,预计将带来2007年iPhone以来的最大数字革命。他还表达了对自研AI芯片的兴趣,意在加速AI计算能力的发展。OpenAI计划通过AI设备重塑人机交互方式,超越传统智能手机的局限性。?[https://x.com/dotey/status/1886259299929989403](https://x.com/dotey/status/1886259299929989403)3⃣️?OpenAI推出全新Deep Research,让ChatGPT成为你的研究助理

AIGC Weekly #32

每周都有很多还挺重要但是又不需要深入分析的AI资讯,都会放在这里。Netflix列出了一个年薪90万美元的机器学习平台产品经理的AI产品工作岗位:[https://jobs.netflix.com/jobs/278437235](https://jobs.netflix.com/jobs/278437235)Shopify的AI助手现已上线。Sidekick是一个帮助机器人,它知道如何在Shopify中执行任何操作-提取相关数据、操作新功能或创建报告:[https://techcrunch.com/2023/07/26/shopify-sidekick-is-like-chatgpt-but-for-ecommerce-merchants/](https://techcrunch.com/2023/07/26/shopify-sidekick-is-like-chatgpt-but-for-ecommerce-merchants/)Artifact(Ins创始人做的AI新闻浏览软件)推出了自定义内容阅读语音的功能:[https://twitter.com/Artifact_News/status/1684631632374902784?s=20](https://twitter.com/Artifact_News/status/1684631632374902784?s=20)OpenAI、谷歌、微软和Anthropic组建了前沿模型论坛,主要目的是确保AI模型的安全发展:[https://openai.com/blog/frontier-model-forum](https://openai.com/blog/frontier-model-forum)Open AI悄咪咪下线了他们的ChatGPT生成内容的检测器:[https://techcrunch.com/2023/07/25/openai-scuttles-ai-written-text-detector-over-low-rate-of-accuracy/](https://techcrunch.com/2023/07/25/openai-scuttles-ai-written-text-detector-over-low-rate-of-accuracy/)

Others are asking
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
我想了解最新的ai的即时信息(最新资讯与ai工具)
以下是为您提供的最新 AI 即时信息和工具: 4 月 1 日 AI 资讯: 【AI 模型及应用】 OpenAI:将会开源一个推理模型,ChatGPT 即将推出推理强度控制选项,Gpt4o 生图能力面向免费用户。 Gemini 2.5 Pro:免费使用,任何人都可以使用 Canvas 进行编码和创作。 【AI 视频】 Higgsfield:发布 50 多个电影级摄影机动作预设,提升动态镜头表现力。 luma:为 Ray 2 引入摄像机运动概念,可基于预设镜头并组合编辑。 Remakes:支持基于用户上传图像直接编辑,并融合 Remade 视频特效,简化创意流程。 Meta:宣布推出 MoCha 系统,实现电影级说话角色合成效果。 【AI 3D】 HSMR:推出从单张图像重建人体 3D 骨骼和网格模型的系统。 krea:引入 AI 3D 生成能力,扩展其创意工具的功能范围。 PGC:推出基于物理的单一姿势高斯布料模拟技术,提升数字服装的真实感。 【AI 音频】 MiniMax Audio:发布全新 Speech02 语音模型,提升语音合成质量。 3 月 19 日 AI 资讯: 【AI 模型】 英伟达:发布全球首个开源人形机器人基础模型 Isaac GR00T N1 及相关 GTC 信息。 谷歌 Gemini:放出了两个功能 Canvas 和 Audio Overview。 【AI 视频】 STAbility AI:发布 Stable Virtual Camera,2D 图像转化 3D 视频。 Domo AI:推出“图片说话”功能,带口型匹配。 【AI 3D】 Roblox:推出 AI 3D 技术 Cube 3D。 Claude MCP Unity 版本推出。 【AI 音乐】 AI 音乐工具 Udio:推出 v1.5 Allegro。 LVAS Agent:基于多智能体协作的长视频音频合成。 获取 AI 资讯的渠道: 公众号:超时空视角、AI 替代人类。 小红书/抖音:EverAI。 B 站:Ever AI 酱(这里会有教程及 AI 工具界面操作)。 关于“通往 AGI 之路”知识库和社区平台: WaytoAGI(通往 AGI 之路)是一个致力于人工智能(AI)学习的中文知识库和社区平台。为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。 汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯。 提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 社区定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 引领并推广开放共享的知识体系,倡导共学共创等形式,孵化了 AI 春晚、离谱村等大型共创项目。 在没有任何推广的情况下,WaytoAGI 一年时间已有超过 100 万用户和超千万次的访问量。 目前合作过的公司/产品包括阿里云,通义千问,淘宝,智谱,支付宝,豆包,火山引擎,marscode,coze,堆友,即梦,可灵,MiniMax 海螺 AI,阶跃星辰,百度,Kimi,吐司,liblib,华硕,美团,美的,360,伊利,魔搭,央视频,Civitai,Openart,Tripo3D,青椒云等。
2025-04-10
请告诉我有关AI的最新资讯
以下是近期的 AI 资讯汇总: 4 月 1 日: 【AI 模型及应用】OpenAI 将会开源一个推理模型,ChatGPT 即将推出推理强度控制选项,Gpt4o 生图能力面向免费用户;Gemini 2.5 Pro 免费使用,任何人都可以使用 Canvas 进行编码和创作。 【AI 视频】Higgsfield 发布 50 多个电影级摄影机动作预设,提升动态镜头表现力;luma 为 Ray 2 引入摄像机运动概念,可基于预设镜头并组合编辑;Remakes 支持基于用户上传图像直接编辑,并融合 Remade 视频特效,简化创意流程;Meta 宣布推出 MoCha 系统,实现电影级说话角色合成效果。 【AI 3D】HSMR 推出从单张图像重建人体 3D 骨骼和网格模型的系统;krea 引入 AI 3D 生成能力,扩展其创意工具的功能范围;PGC 推出基于物理的单一姿势高斯布料模拟技术,提升数字服装的真实感。 【AI 音频】MiniMax Audio 发布全新 Speech02 语音模型,提升语音合成质量。 3 月 21 日: 【AI 绘画】网传神秘 Halfmoon 文本转图像模型为 Reve 对比 Midjourney 效果;Topaz Labs 推出 Gigapixel v8.3.0,将任何图像放大 16 倍;FLORA 引入 gemini 2.0 自然语言编辑图像能力。 【AI 视频】pika 超创内测“操控原视频中物体运动”能力;Krea 上线视频模型训练能力,可控制视频风格/动作/物体等。 【AI 3D】SpatialLM 用于空间理解的大型语言模型。 【AI 模型及应用】OpenAI 发布 2 个语音模型(文本转语音/语音转文本)+1 个演示网站;Claude 支持搜索功能。 3 月 14 日: 【AI 模型及其他】谷歌 Gemini 应用能力升级,包含升级推理模型 gemini 2.0、Flash Thinking Experimental 等多个功能提升;OpenAI 4 项更新;Bolt 一键将 Figma 设计转换为可运行的 Web 应用;阿里推出 AI 旗舰应用“新夸克”;360 智脑团队开源推理模型 LightR114BDS,复现 Deepseek 的强化学习效果。 【AI 视频】Pika 更新 Pikaffects,新增多款变身特效;Freepik 与 Fal 平台引入 Topaz AI 的提升“FPS 和视频分辨率”能力;Krea 上线 Veo 2 模型,支持图生视频功能,但生成成本较高。 【AI 绘图】LBM 用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。 【AI 语音】Sesame 开源 TTS 语音模型 CSM1B。
2025-04-08
最新的AI资讯
以下是为您汇总的最新 AI 资讯: 3 月 17 日: 【AI 3D】UE5MCP 提出将 AI 驱动的自动化集成到虚幻引擎中,可用于游戏关卡设计、游戏编程等。 【AI 视频】可灵接入 Deepseek R1,帮助书写 AI 视频提示词;Long Context Tuning for Video Generation 用于场景级视频生成的长上下文调整技术。 【AI 绘图】Thera 是新 sota 超分辨率模型,允许任意尺寸图像进行高清化。 【AI 语音】赤兔 Chitu 是清华团队模型推理引擎,可实现 DeepSeek 推理成本降低一半,性能翻番;Anthropic 预推出 Harmony 新功能,可将本地目录集成 Claude 中。 百度文心大模型 4.5 和文心大模型 X1 正式发布,免费向用户开放。 3 月 4 日: 【AI 3D】Meshcapade 预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝;InsTaG 能通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果;3DMem 是新型 3D 场景记忆框架。 【AI 绘图】智谱开源 AI 绘图 CogView4,可在图像中生成中文字符;海螺推出 Image01 多功能文本转图像模型。 【AI 视频】Runway 内测能力可根据参考图像进行 Video to Video 视频风格化;Vidu 的 API 开放平台全面开放。 【AI 模型】Google Colab 推出 Data Science Agent;微软为医疗行业提供首个统一语音 AI 助手:Dragon Copilot;Opera 宣布推出网页浏览器的 AI 代理。 3 月 20 日: 【AI 模型】OpenAI 推出 o1pro API;Adobe 表示将向其用户提供 Veo2、Runway 等非 Adobe 生态模型。 【AI 视频】阶跃星辰推出 StepVideoTI2V:30B 参数图生视频模型。 【AI 3D】Amodal3R 可从遮挡二维图像进行非模态三维重建;Bolt3D 能单图内生成交互式 3D 场景。 【AI 音乐】阶跃星辰推出 StepVideoTI2V:30B 参数图生视频模型;Orpheus 是开源 TTS 模型。
2025-03-21
育儿智能体落地实践推荐,相关案例和资讯
以下是为您整理的育儿智能体落地实践的相关案例和资讯: 在“通往 AGI 之路知识库使用指南”中,提到了智能纪要、智能章节等内容。包括博主精美解释六大策略,小七姐在社区带来共学课程及直播分享与回放,介绍了官方最佳 prompt 的 6 个实践办法。还提到了 AI 智能体的进阶、案例拆解及扣子的应用,如景淮老师的相关成果,阐述扣子、千帆百炼属于智能体范畴,扣子更偏 ToC 应用。同时提到 Cos 平台功能全面,社区共学成果显著,学习 AI agent 建议先吃透 prompt,官方文档内容全面,社区小伙伴参加 cos 比赛常获奖并分享经验。 在“张翼然:AI 赋能教学,创新引领未来.pdf_AI 赋能教学创新引领未来”中,涵盖了教育目标由知识本位向能力为重的转型、群智协同与知识动态生成、核心能力、关键价值等方面。还包括设计实验或观察方法、收集与分析数据、得出结论并撰写报告等研究过程的指导,以及黎加厚关于让教师掌握教育智能体金钥匙的相关内容。同时探讨了 AIGC 教育革命、AI 从工具到助手、赋能教师提升效率与能力、大语言模型的教学潜力、AI 与教育场景融合拓展教学边界与创新场景、一线教师的 AI 需求与高效工具推荐、AI 赋能课堂的核心逻辑、AI 与人类智能的共生放大学生思考力塑造深度学习能力、解码 AI 教学案例、能力的普遍性与局限性、现阶段 AI 在教育领域应用的局限性等内容。 在“扣子案例合集社区内容分享”中,包含了如“用 Coze 扣子轻松搭个 Bot,从此告别‘标题党’”“扣子官方:用扣子/Coze 揭秘吴恩达的 4 种 AI Agent 设计模式”“扣子官方:这届 00 后已经学会用扣子/Coze‘偷懒’了”“【2 万字长文】如何用 Kimi 全自动创建扣子智能体?这喂饭级教程将揭晓一切!”“保姆级教程:Coze 打工你躺平”“扣子 Coze 智能体开发实战教程|智能体开发”等案例。
2025-03-20
有什么ai学习的最新资讯么
以下是关于 AI 学习的最新资讯: WaytoAGI(通往 AGI 之路)是一个致力于人工智能学习的中文知识库和社区平台。它为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。在没有任何推广的情况下,一年时间已有超过 100 万用户和超千万次的访问量。目前合作过的公司/产品包括阿里云、通义千问、淘宝、智谱等众多知名企业和产品。 3 月 4 日的 AI 资讯: 【AI 3D】Meshcapade 预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝;InsTaG 通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果;3DMem 为新型 3D 场景记忆框架。 【AI 绘图】智谱开源 AI 绘图 CogView4,可在图像中生成中文字符;海螺推出 Image01 多功能文本转图像模型。 【AI 视频】Runway 被网友爆料内测能力可根据参考图像进行 Video to Video 视频风格化;Vidu 的 API 开放平台全面开放。 【AI 模型】Google Colab 推出 Data Science Agent;微软为医疗行业提供首个统一语音 AI 助手 Dragon Copilot;Opera 宣布推出网页浏览器的 AI 代理。 对于新手学习 AI,建议持续学习和跟进,AI 是快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。
2025-03-14
本周最新的AI资讯
以下是本周最新的 AI 资讯: 3 月 12 日: 【AI 3D】:BlenderMCP 与 Claude AI 沟通,在 Blender 实现快速 3D 建模;MIDI 可实现单幅图像到 3D 场景生成;Move AI 更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】:MMStoryAgent 是 AI 多模态故事生成系统。 【AI 视频】:VACE 是阿里推出的一体化视频创作和编辑技术;VideoPainter 是腾讯开源的视频编辑技术;Wonder Dynamics 推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】:OpenAI 为开发者推出一套 AI Agent 开发套件;R1Omni 是阿里情感识别模型,通过视频识别情感;Luma AI 发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能;Manus 宣布与阿里通义千问团队达成战略合作。 3 月 4 日: 【AI 3D】:Meshcapade 预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝;InsTaG 通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果;3DMem 是新型 3D 场景记忆框架。 【AI 绘图】:智谱开源 AI 绘图 CogView4,可以在图像中生成中文字符;海螺推出 Image01 多功能文本转图像模型。 【AI 视频】:Runway 网友爆料其内测能力可根据参考图像进行 Video to Video 视频风格化;Vidu 的 API 开放平台全面开放。 【AI 模型】:Google Colab 推出 Data Science Agent;微软为医疗行业提供首个统一语音 AI 助手:Dragon Copilot;Opera 宣布推出网页浏览器的 AI 代理。 AIGC Weekly32: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器:
2025-03-13
AI的昨天、今天和明天
AI 的发展历程可以从以下几个方面来阐述: 昨天: 在过去,AI 的研究和发展处于相对初级的阶段,技术和应用都较为有限。 今天: 1. AI 艺术方面,Prompting 成为驱动因素,创造了多维感官和令人印象深刻的记忆,改变了人们对艺术创作和表达的认知。 2. OpenAI CEO Sam Altman 发表的文章指出,AI 智能水平与计算资源呈对数关系,成本每年下降 10 倍,智能增长带来超指数级经济价值,AI 代理将颠覆知识型工作。 3. 如斯坦福的 2025 年 AI 指数报告所示,AI 在硬件、推理成本估计、出版和专利趋势等方面有了新的分析和发展,在企业责任实践、科学和医学领域的作用不断扩大。 明天: 1. AGI(通用人工智能)的影响力可能会扩散,但不均衡,科学研究可能率先受益。 2. 社会需要适应 AI 带来的变革,如工作方式、经济体系等方面的改变。 3. 人们可能会通过 AI 分享记忆,一个人的体验可能被全人类所感受。 总之,AI 的发展迅速且影响深远,未来充满了机遇和挑战。
2025-04-14
今天是2025-3-20日,给下最近一周的AI相关新闻
以下是最近一周(2025 年 3 月 14 日至 20 日)的 AI 相关新闻: 在 GTC 2025 大会上,黄仁勋展示了英伟达的最新芯片 Blackwell Ultra,强调其性能是 Hopper 的 40 倍,预计 2025 年将出货 360 万颗。黄仁勋反驳市场质疑,指出推理的算力需求远超预期,Dynamo 的推出将优化 GPU 利用率。尽管市场信心动摇,英伟达依然展现了其作为 AI 算力领导者的决心,“只要有 Token 就有英伟达的生意”。 本文介绍了如何通过 MCP(Model Context Protocol)将 Claude 3.7 与 Blender 连接,实现一句话生成 3D 场景的功能。Claude 作为“大脑”,MCP 为“桥梁”,Blender 则是“手脚”,三者紧密协作,使得 3D 建模变得简单而高效。随着 MCP 的崛起,AI 不再是数据孤岛,未来的 AI 智能体将能自主完成更复杂的任务,开启创作的新纪元。 AI 切磋大会第 11 期报名开启!3 月 30 日,主题是“2 小时,让 AI 将你的创意变为现实”。无论你是编程小白还是高手,欢迎来现场展示你们的案例。 Yourware 是一款强大的工具,让普通用户轻松创建和部署 AI 编程作品集。只需复制代码,即可一键部署网页,快速展示自己的创作。此外,平台提供了全球优秀作品的参考,极大激发灵感。更有一键美化功能,让网页焕然一新,分享权限也能自由控制。 谷歌以 320 亿美元收购网络安全公司 Wiz,创下其历史上最大收购案。Wiz 在 18 个月内实现 1 亿美元年收入,成为史上最快的软件公司之一。创始团队拥有近 20 年的友谊和合作,先后成立 Adallom 并被微软收购,再打造 Wiz。
2025-03-20
今天是2025年3月20日,给下最近一周的AI相关新闻
以下是最近一周(2025 年 3 月 19 日至 3 月 20 日)的 AI 相关新闻: 3 月 20 日: 在 GTC 2025 大会上,黄仁勋展示了英伟达的最新芯片 Blackwell Ultra,强调其性能是 Hopper 的 40 倍,预计 2025 年将出货 360 万颗。黄仁勋反驳市场质疑,指出推理的算力需求远超预期,Dynamo 的推出将优化 GPU 利用率。尽管市场信心动摇,英伟达依然展现了其作为 AI 算力领导者的决心,“只要有 Token 就有英伟达的生意”。 介绍了如何通过 MCP(Model Context Protocol)将 Claude 3.7 与 Blender 连接,实现一句话生成 3D 场景的功能。Claude 作为“大脑”,MCP 为“桥梁”,Blender 则是“手脚”,三者紧密协作,使得 3D 建模变得简单而高效。随着 MCP 的崛起,AI 不再是数据孤岛,未来的 AI 智能体将能自主完成更复杂的任务,开启创作的新纪元。 3 月 19 日: “回答我!Look in my eyes!Tell me why?baby why?”——最近全网都被这句魔性古风骂人视频刷屏了!古人+现代梗的爆笑碰撞,不只是娱乐玩梗,更成了宣传、带货、文旅推广的新利器。本文手把手教你 0 基础复刻这类 AI 视频,搭配爆款文案+AI 人物+鬼畜视频合成,让你也能轻松玩转流量密码,打造自己的“AI 古人爆款工厂”! 在 GTC2025 大会上,黄教主分享了十五个“饼”,涵盖数据中心的未来、强大的 CUDA、边缘计算与 6G 结合、汽车智能驾驶安全方案等多个领域。他强调,未来推理需求将暴增,并推出新款 NVL72 服务器,性价比显著提升。管推出了多项创新,黄教主仍未解答算力通缩的疑问,未来的硬件发展将面临更多挑战。延伸阅读:《[“AI 工厂时代降临”:黄仁勋 GTC2025 主旨演讲图文全文 3 万字》
2025-03-20
现在是2025年3月18日,我现在要整理一份AI行业的最新动态,在每天早上十点发布,请你整理今天的最新动态,10条左右
以下是 2025 年 3 月 18 日 AI 行业的最新动态: 1. 3 月 AI 发展持续升温。 2. 3 月潞晨科技发布 OpenSora。 3. 3 月 Suno 发布 V3 版本爆火。 4. OpenAI CPO Kevin Weil 访谈亮点:GPT5 近在眼前,将融合多个模型能力,快速推进,AI 代码自动化将在今年内达到 99%,强化推理能力和大规模预训练是关键方向,AI 不仅会写代码,还将让人人都能成为软件创造者。 5. 2025 年职场思考与建议:高管们面临“经验贬值”与“转型焦虑”,非 AI 公司的估值与融资变难,软件开发方式正被重构,“等风来”的代价越来越高,加入 AI 公司也并非万能,市场冷却下招聘更挑剔。 6. 你的孩子可能已经在用 AI“作弊”。 7. 过去一年,头部 AI 应用的品类变化不显著,创意工具仍占据最大比重。 8. 2024 年 9 月,OpenAI 发布新一代语言模型 o1,采用全新训练与推理方案,结合强化学习技术,显著增强推理能力,可能通过生成内部“思维链”模拟人类系统 2 思维方式。 9. 5 月伊莉雅离开 OpenAI,AI 竞争白热化。 10. 5 月伊利亚成立新公司,估值超五亿美金。
2025-03-18
今天的AI新闻
以下是 3 月 4 日、3 月 12 日和 3 月 14 日的 AI 新闻汇总: 3 月 4 日: 【AI 3D】 Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。 InsTaG:通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果。 3DMem:新型 3D 场景记忆框架。 【AI 绘图】 智谱:开源 AI 绘图 CogView4,可以在图像中生成中文字符。 海螺:推出 Image01 多功能文本转图像模型。 【AI 视频】 Runway:网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。 Vidu:API 开放平台全面开放。 【AI 模型】 Google Colab:推出 Data Science Agent。 微软:为医疗行业提供首个统一语音 AI 助手:Dragon Copilot。 Opera:宣布推出网页浏览器的 AI 代理。 3 月 12 日: 【AI 3D】 BlenderMCP:与 Claude AI 沟通,在 blender 实现快速 3D 建模。 MIDI:单幅图像到 3D 场景生成。 Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】 MMStoryAgent:AI 多模态故事生成系统。 【AI 视频】 VACE:阿里推出一体化视频创作和编辑技术。 VideoPainter:腾讯开源视频编辑技术。 Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】 OpenAI:为开发者推出一套 AI Agent 开发套件。 R1Omni:阿里情感识别模型,通过视频识别情感。 Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。 Manus:宣布与阿里通义千问团队达成战略合作。 3 月 14 日: 【AI 模型及其他】 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。 OpenAI:4 项更新。 Bolt:一键将 Figma 设计转换为可运行的 Web 应用。 阿里:推出 AI 旗舰应用“新夸克”。 360 智脑团队:开源推理模型 LightR114BDS,复现 Deepseek 的强化学习效果。 【AI 视频】 Pika:更新 Pikaffects,新增多款变身特效。 Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。 Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。 【AI 绘图】 LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。 【AI 语音】 Sesame:开源 TTS 语音模型 CSM1B。
2025-03-15
今天有什么ai新动态
以下是近期的 AI 新动态: 2024 年 3 月:AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 2024 年 4 月:英伟达发布硬件,股价飙升。 2024 年 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 2024 年 7 月:快手开源 LivePortrait 模型,实现表情迁移。 2024 年 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 2024 年 9 月:阿里云发布模型,海螺 AI 参战,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 2024 年 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 12 月 5 日的 AI 新动态: Clone Robotics:仿生机器人公司致力于生产高仿真产品,技术和外观的进步让人类与机器人的边界变得越来越模糊。 Humane 发布 AI 驱动操作系统 CosmOS,具有多种核心功能,支持多种输入方式,并可实时从互联网获取数据为用户提供服务。 DeepMind 发布天气预测 AI 模型 GenCast,可预测未来 15 天的天气和极端天气风险,与顶级预测系统相比表现更优,且模型代码、权重和预测数据已开源。 OpenAI 的 ChatGPT 用户突破 3 亿。 在法律法规方面: 虽然 AI 概念不新,但近期数据生成和处理的进步改变了该领域及其产生的技术。例如,生成式 AI 模型的能力发展带来机会的同时也引发了关于潜在风险的新辩论。 并非所有 AI 风险都源于不良行为者的故意行为,有些可能是意外后果或缺乏适当控制导致的。 对 AI 特定风险及其潜在危害进行了初步评估,并参考了其威胁的价值,包括安全、公平、隐私、人权、社会福祉和繁荣等。 交叉的 AI 风险评估确定了一系列高级风险,框架将寻求通过适当干预来优先处理和减轻这些风险。例如,安全风险包括对人类和财产的身体损害以及对心理健康的损害。
2025-03-12