Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

请你描述一下AI的发展情况

Answer

AI 的发展情况如下:

AI 技术的发展历程:

  1. 早期阶段(1950s - 1960s):包括专家系统、博弈论、机器学习初步理论。
  2. 知识驱动时期(1970s - 1980s):有专家系统、知识表示、自动推理。
  3. 统计学习时期(1990s - 2000s):出现机器学习算法,如决策树、支持向量机、贝叶斯方法等。
  4. 深度学习时期(2010s - 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。

当前 AI 前沿技术点:

  1. 大模型(Large Language Models):如 GPT、PaLM 等。
  2. 多模态 AI:包括视觉 - 语言模型(CLIP、Stable Diffusion)、多模态融合。
  3. 自监督学习:如自监督预训练、对比学习、掩码语言模型等。
  4. 小样本学习:例如元学习、一次学习、提示学习等。
  5. 可解释 AI:涉及模型可解释性、因果推理、符号推理等。
  6. 机器人学:涵盖强化学习、运动规划、人机交互等。
  7. 量子 AI:包括量子机器学习、量子神经网络等。
  8. AI 芯片和硬件加速。

AI 的重大突破:

  1. 1956 年人工智能被提出。
  2. 1997 年深蓝在国际象棋比赛中击败卡斯帕罗夫。
  3. 2016 年 AlphaGo 在围棋比赛中战胜李世石。
  4. 2020 年 GPT-3 发布。
  5. 2022 年 DALL-E 发布。
  6. 2023 年 GPT-4 发布。

从图灵测试之后,科学家们就努力让机器变得更聪明。人工智能从一个小小的想法发展至今,已经能帮人们做很多事情,技术的变革也越来越快。

Content generated by AI large model, please carefully verify (powered by aily)

References

问:AI的技术历史和发展方向,目前最前沿的技术点有哪些

1.早期阶段(1950s-1960s):专家系统、博弈论、机器学习初步理论2.知识驱动时期(1970s-1980s):专家系统、知识表示、自动推理3.统计学习时期(1990s-2000s):机器学习算法(决策树、支持向量机、贝叶斯方法等)4.深度学习时期(2010s-至今):深度神经网络、卷积神经网络、循环神经网络等[heading2]当前AI前沿技术点[content]1.大模型(Large Language Models):GPT、PaLM等2.多模态AI:视觉-语言模型(CLIP、Stable Diffusion)、多模态融合3.自监督学习:自监督预训练、对比学习、掩码语言模型等4.小样本学习:元学习、一次学习、提示学习等5.可解释AI:模型可解释性、因果推理、符号推理等6.机器人学:强化学习、运动规划、人机交互等7.量子AI:量子机器学习、量子神经网络等8.AI芯片和硬件加速

当AI走进小学课堂(全套课程设计)

[title]当AI走进小学课堂(全套课程设计)[heading1]课程内容设计[heading2]2.AI的发展历程和重大突破[heading3]2.2人工智能的发展1956年人工智能被提出1997年深蓝击败卡斯帕罗夫2016年AlphaGo击败李世石2020年GPT-3的发布2022年DALL-E的发布2023年GPT-4的发布2024年即将发布GPT-5说明:这里未来可以改进一下,当时匆忙只写了语言模型和DALL-E,绘图的SD和Midjourney等我都没写进去,已经新出的视频和音乐创作工具等,都可以往上写,但也不用太多。只需要让孩子理解,技术的变革已经越来越快了!内容从图灵测试之后,科学家们就开始努力让机器变得更聪明。到了1956年,人工智能这个词首次被提出,从那时起,人们就开始正式研究如何让机器像人一样思考了。重大突破1997年:有一个叫做深蓝的电脑,在国际象棋比赛中战胜了世界冠军。这是第一次机器在这样的智力游戏中击败了顶尖的人类选手。2016年:有一个更聪明的AI叫AlphaGo,它在围棋比赛中战胜了世界冠军李世石。围棋是一个非常复杂的游戏,这次胜利让全世界都很惊讶。2020年:有一个AI叫GPT-3,它非常擅长用电脑写文章和做其他很多用语言的事情。它可以帮助人们写故事、答复邮件,甚至写程序代码!2022年:还有一些AI,比如DALL-E,可以根据你告诉它的话,画出你想象中的图画。你说“一个穿宇航服的猫在月球上”,它就可以画出来!看到这些有趣的故事,你们是不是觉得人工智能非常神奇呢?从一个小小的想法发展到现在,人工智能已经能帮我们做很多事情了。那么,接下来,我们来探索一下人工智能现在都可以做些什么吧!

问:新手如何学习 AI?

[title]问:新手如何学习AI?持续学习和跟进:AI是一个快速发展的领域,新的研究成果和技术不断涌现。关注AI领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入AI相关的社群和组织,参加研讨会、工作坊和会议,与其他AI爱好者和专业人士交流。

Others are asking
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
有没有能根据描述,生成对应的word模板的ai
目前有一些可以根据描述生成特定内容的 AI 应用和方法。例如: 在法律领域,您可以提供【案情描述】,按照给定的法律意见书模板生成法律意见书。例如针对商业贿赂等刑事案件,模拟不同辩护策略下的量刑结果,对比并推荐最佳辩护策略,或者为商业合同纠纷案件设计诉讼策略等。 在 AI 视频生成方面,有结构化的提示词模板,包括镜头语言(景别、运动、节奏等)、主体强化(动态描述、反常组合等)、细节层次(近景、中景、远景等)、背景氛围(超现实天气、空间异常等),以及增强电影感的技巧(加入时间变化、强调物理规则、设计视觉焦点转移等)。 一泽 Eze 提出的样例驱动的渐进式引导法,可利用 AI 高效设计提示词生成预期内容。先评估样例,与 AI 对话让其理解需求,提炼初始模板,通过多轮反馈直至达到预期,再用例测试看 AI 是否真正理解。 但需要注意的是,不同的场景和需求可能需要对提示词和模板进行针对性的调整和优化,以获得更符合期望的 word 模板。
2025-04-18
用通俗易懂的动画描述人工智能工作原理
人工智能的工作原理可以通过以下动画来描述: 在一个动画场景中,首先有一个传统工作流的部分,就像精心搭建的积木城堡,每一块积木的位置和形状都被精确设计和控制,这代表着传统工作流的可控性和高成本、慢速度。 然后是 AI 工作流的部分。想象一下,有一团混乱的色彩在飞舞,这团色彩代表着随机和不可控。但在这混乱中,有一种力量在尝试引导和塑造,就像在狂风中努力抓住风筝线一样,这就是在随机性中寻找可控性。 比如在一个生成音频与视频同步的例子中,动画展示了一个系统。首先,系统将视频输入编码成压缩的表示形式,就像把一大包东西压缩成一个小包裹。然后,扩散模型从随机噪声中不断改进音频,就像在混沌中逐渐塑造出清晰的声音。这个过程受到视觉输入和自然语言提示的引导,最终生成与提示紧密配合的同步逼真音频。最后,音频输出被解码,变成音频波形,并与视频数据完美结合。 总的来说,传统工作流在可控中寻找创新的随机,而 AI 工作流更多是在随机中寻找可控,两者各有优劣,结合起来能创造出更出色的成果。
2025-04-14
我想生成一个爆款小说描述词
以下是为您生成爆款小说描述词的一些建议: 1. 遵循“形容词+主语+环境+行为+构图+参考风格+渲染程度+后缀”的公式。例如,对人物的描述要包括情绪、发型、穿着等细节,对环境的描写要涵盖天气、地理位置等要素,还要对摄影、灯光和成像质量进行描述,并规定绘图比例。 2. 对于写小说本身,提示词相对简单。但要注意搜索相关思路,用上下文告诉模型需求中的概念含义,并将搜索结果结构化,方便模型理解。 3. 当为儿童创作简单易懂的绘画描述时,要符合逻辑且简单直白,有镜头描述,不增加额外元素。若主体为中国相关,要在描述中提及;未明确古代则默认为现代场景和人物。描述人物要涵盖多个维度,描述场景也要考虑多个方面,且要强调主体。
2025-04-08
现在我想通过一段描述生成一段视频,那么我现在用哪一个?工具是最好的呢。我想说的是现在因为在国内访问不了国外的网站,那么国内有没有哪些应用比较功能强大的是视频生成工具。
以下是一些在国内可用且功能强大的视频生成工具: 1. VIGGLE:可以直接通过文字描述让任何静态图动起来,能做各种动作,如跳舞等。其核心技术基于 JST1 模型,能理解真实世界的物理运动原理,生成的视频很真实,还能直接文字生成视频,进行各种角色混合和动作替换。核心功能包括可控制的视频生成、基于物理的动画、3D 角色和场景创建。 2. Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 3. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。 4. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 5. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 6. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 此外,还有以下根据视频脚本生成短视频的工具: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户轻松创建和编辑高质量视频,用户提供文本描述即可生成相应的视频内容。 4. VEED.IO:提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 这些工具各有特点,适用于不同的应用场景和需求,您可以根据自己的具体情况进行选择。需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2025-03-23
现在我想通过一段描述生成一段视频,那么我现在用哪一个?工具是最好的呢。
以下是一些可用于根据文字描述生成视频的工具: 1. Adobe Firefly:其“生成视频”(测试版)能将书面描述转换为视频剪辑。您可以使用文本提示定义内容、情感和设置,包括摄像机角度,还能合并图像为视频生成提供视觉提示。操作步骤为:在 Adobe Firefly 网站上选择“生成视频”,在 Generate video 页面输入文本提示,也可在图像部分上传图像用于第一帧并提供方向参考,在 General settings 部分确定 aspect ratio 和 frames per second。 2. VIGGLE:其核心技术基于 JST1 模型,能理解真实世界的物理运动原理,生成的视频很真实。核心功能包括可控制的视频生成、基于物理的动画、3D 角色和场景创建。用户可通过文字描述指定角色动作和场景细节来生成视频。 3. Pika:出色的文本生成视频 AI 工具,擅长动画制作,支持视频编辑。 4. SVD:如果熟悉 Stable Diffusion,可安装此最新插件,在图片基础上直接生成视频,是由 Stability AI 开源的 video model。 5. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 6. Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 7. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 以上工具适用于不同的使用场景和需求,您可以根据自身具体情况选择。更多文生视频的网站可查看:。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-03-23
即梦提示词的描述结构框架是什么
即梦提示词的描述结构框架主要包括以下方面: 1. 提示词基础架构: 主体/场景 场景描述 环境描述 艺术风格/媒介 调整句式和语序,避免主体物过多/复杂、主体物分散的句式描述。 避免模糊的术语表达,尽可能准确。 使用更加流畅准确的口语化措辞,避免过度文学化的叙述。 丰富、准确和完整的描述才能生成特定艺术风格、满足需求的视频。 2. 提示词与画面联想程度的说明: 以单帧图像为例介绍提示词与画面联想的关系。 基础词示例:玻璃桌上的咖啡杯,杯子外面写着单词 LOVE。 适度联想扩充:花园里(具体的位置描述)的透明(材质描述)玻璃桌上的咖啡杯,杯子外面写着单词 LOVE,周围满是盛开的鲜花(具体的位置描述/环境描述),和煦的阳光洒满整个花园(环境描述),Claude Monet(艺术家风格),印象派风格(艺术流派风格)。 联想关键点: 具体详实的位置描述/环境描述:笼统来讲就是在进行构图,可以帮助构建画面的基本呈现效果。 艺术风格描述:进一步提升效果和氛围,统一画面风格。 此外,结构化提示词框架还包括: 1. 标识符:如 、<> 等符号(、 也是),依次标识标题、变量,控制内容层级,用于标识层次结构。 2. 属性词:如 Role、Profile、Initialization 等等,包含语义,是对模块下内容的总结和提示,用于标识语义结构。 您可以把结构化提示词框架当做提示词的八股文标准,在不了解如何开始进行提示词设计的时候,当做一个通用的标准格式来使用。结构化提示词的概念在行业内应用广泛且成熟度较高,您可以在即刻、知识星球、知乎等很多地方看到优秀的类型案例。例如以下案例: 关于结构化提示词的理论感兴趣想要进一步了解更多信息的朋友,推荐大家阅读李继刚和云中江树的详细理论原文: 结构化语法提示词示例:可以在 AGI 的下列板块看到非常多优秀的结构化 Prompt 示例。
2025-03-23
现在比较好用的AI硬件工具推荐一下,比如鼠标,眼镜,耳机啥的
以下是为您推荐的一些 AI 硬件工具: 1. 对于将 Raspberry Pi 连接到其他设备的配件,您可以参考: 防止过热的散热器 MicroUSB 转 USB 适配器,用于 Logitech 键盘的无线传感器 用于显示器的 MiniHDMI 转 HDMI 适配器 键盘和鼠标:推荐 2. 在可穿戴方面,以 GenAI 硬件为例,Meta 雷朋眼镜是具有代表性的产品。您还可以查看 GenAI 硬件榜单获取更多信息,比如: ,该榜单包含多个分类,数据来源包括 google、tiktok、twitter、亚马逊等。
2025-04-13
推荐一下从文本生成播客音频的AI 工具
以下是一些可以从文本生成播客音频的 AI 工具: :为所有人提供开放的语音技术。 :基于 AI 的语音引擎能够模仿人类语音的情感和韵律。 :基于 NLP 的最先进文本和音频编辑平台,内置数百种 AI 声音。 :使用突触技术和脑机接口将想象的声音转化为合成 MIDI 乐器的脑控仪器。 :为出版商和创作者开发最具吸引力的 AI 语音软件。 :Wondercraft 使用户能够使用文本转语音技术生成播客。 :基于生成机器学习模型构建内容创作的未来。 :从网页仪表板或 VST 插件生成录音室质量的 AI 声音并训练 AI 语音模型。 此外,还有 NotebookLlama:Meta 的播客生成教程,它使用 Llama 模型从 PDF 中提取文本,生成干净的.txt 文件,转化文本为播客转录,创造富有创意的内容,对转录进行戏剧化处理,提高互动性和吸引力,最终将文本转换为播客音频,支持多种 TTS 模型。详细介绍:
2025-04-12
介绍一下AI视频的基础知识
以下是关于 AI 视频的基础知识: 1. 概念 生成式 AI 生成的内容称为 AIGC。 2. 相关技术名词 AI:即人工智能。 机器学习:电脑找规律学习,包括监督学习、无监督学习、强化学习。 监督学习:使用有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归。 无监督学习:学习的数据没有标签,算法自主发现规律,经典任务如聚类。 强化学习:从反馈中学习,以最大化奖励或最小化损失,类似训小狗。 深度学习:一种参照人脑的方法,具有神经网络和神经元,因层数多而称为深度,神经网络可用于监督学习、无监督学习、强化学习。 生成式 AI:可以生成文本、图片、音频、视频等内容形式。 LLM:大语言模型。对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类。 3. 技术里程碑 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制(SelfAttention)处理序列数据,不依赖于循环神经网络(RNN)或卷积神经网络(CNN)。
2025-04-12
找一下翻译插件
以下为您介绍一些翻译插件和方法: 1. 提示词翻译副本 Alekpet: 插件地址:安装后重启 ComfyUI 即可。 将 CLIP 文本编码器转换为输入,连接翻译文本节点即可使用。 链接:https://github.com/kingzcheung/ComfyUI_kkTranslator_nodes 2. 提示词翻译副本 Prompt_Translate_to_English: 用的百度翻译 API 方法如下: 下载节点压缩包,并将它放在 custom_nodes 文件夹。 去百度翻译 Api 和登记册开发人员的帐户中得到您的 appid 和 secretKey。 百度翻译平台地址:https://fanyiapi.baidu.com/manage/developer 。 打开文件 config.py 在记事本/其他编辑,填您的 secretKey 在引号的 secretKey ="",保存文件重启 Comfy 即可。 3. 翻译一份英文 PDF 完整地翻译成中文的方法: DeepL(网站): 点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 沉浸式翻译(浏览器插件): 安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 calibre(电子书管理应用): 下载并安装 calibre,并安装翻译插件「Ebook Translator」。 谷歌翻译(网页): 使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 百度翻译(网页): 点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、PDF、Word、Excel、PPT、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 浏览器自带的翻译功能:如果一些 PDF 太大,翻译工具不支持,除了将 PDF 压缩或者切分外,还可以转成 HTML 格式,然后使用浏览器自带的网页翻译功能。
2025-04-08
有哪些免费好用的制作数字人短视频的软件?推荐一下
以下是一些免费好用的制作数字人短视频的软件及相关介绍: 1. 剪映: 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,软件会生成对应音视频并添加到轨道中。左下角会提示渲染完成时间,可点击预览查看效果。 为让视频更美观,可删除先前导入的文本内容,通过点击左上角“媒体”菜单并“导入”按钮选择本地图片作为背景,将图片添加到视频轨道上,并将轨道右侧竖线向右拖拽至与视频对齐。 2. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片,上传后效果在My Avatar处显示,点开大图后,点击Create with AI Studio进入制作,写上视频文案并选择配音音色,也可自行上传音频,最后点击Submit得到数字人视频。 3. DID: 优点:制作简单,人物灵活。 缺点:免费版下载后有水印。 使用方法:点击网址,点击右上角Create vedio,选择人物形象,可点击ADD添加照片或使用给出的形象,配音时可选择提供文字选择音色或直接上传音频,最后点击Generate vedio生成视频,打开生成的视频可下载或分享。 4. KreadoAI: 优点:免费,功能齐全。 缺点:音色很AI。 使用方法:点击网址注册后获得120免费k币,选择“照片数字人口播”功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮,点击背景添加背景图,最后点击生成视频。
2025-04-01
帮我查一下关于deep research的prompt
以下是关于 deep research 的 prompt 相关信息: 一个提示词让 DeepSeek 的能力更上一层楼: 效果对比:用 Coze 做了小测试,可对比查看。 如何使用: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 Deepseek。 认真阅读开场白之后,正式开始对话。 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 照猫画虎参考大模型的 temperature 设计了阈值系统,可能形式大于实质,之后根据反馈可能会修改。 用 XML 来进行更为规范的设定,而不是用 Lisp(有难度)和 Markdown(运行不太稳定)。 完整提示词:v 1.3。 特别鸣谢:李继刚的【思考的七把武器】在前期提供了很多思考方向;Thinking Claude 是设计 HiDeepSeek 的灵感来源;Claude 3.5 Sonnet 是最得力的助手。 集合 Deepseek 提示词方法论: DeepSeek R1 提示词系统完全指南: 核心原理认知: AI 特性定位:多模态理解,支持文本/代码/数学公式混合输入;动态上下文,对话式连续记忆(约 8K tokens 上下文窗口,换算成汉字是 4000 字左右);任务适应性,可切换创意生成/逻辑推理/数据分析模式。 系统响应机制:采用意图识别 + 内容生成双通道,自动检测 prompt 中的任务类型/输出格式/知识范围,对位置权重(开头/结尾)、符号强调敏感。 基础指令框架:如果不知道如何表达,可套用框架指令。 四要素模板。 格式控制语法:强制结构,使用```包裹格式要求;占位符标记,用{{}}标注需填充内容;优先级符号,>表示关键要求,!表示禁止项。 2 月 5 日社区动态速览: Deep Research 与 DeepSeek 区别解析:Deep Research 基于 GPT 4o 和 o3,具备 UI 交互和搜索功能,更擅长生成专业报告;而 DeepSeek 只是品牌名称,需搭配具体模型(如 DeepSeek V3 或 DeepSeek R1),其集成搜索效果尚不及 Deep Research。 人工智能与人类智能的关系(官方文件译文):该官方文件《Antiqua et Nova》由圣座教义部与文化教育部发布,探讨 AI 与人类智能的关系,提供了英文原文及中文译文,便于不同语言背景的读者理解。 Deep Research 前置模型提示词泄露:Deep Research 在任务前通过微调的 GPT 4o 交互并调用 research_kickoff_tool 补充上下文,用户可尝试发送“please start_research_task”来触发任务启动。 Anthropic 禁止用 AI 写求职申请:Anthropic 要求求职者在申请过程中不得使用 AI 生成答案,以便更真实地评估其兴趣与沟通能力。
2025-04-01
分析AI颠覆性发展的生产策略调查的研究情况综述
以下是关于企业构建和购买生成式 AI 方式的 16 个变化的研究情况综述: 生成式人工智能在 2023 年迅速席卷消费市场,创下超过 10 亿美元的消费支出纪录。预计 2024 年企业领域的收入机会将数倍于消费市场。去年,企业对 genAI 的参与多局限于少数明显用例,且以“GPTwrapper(GPT 套壳)”产品作为新的 SKU 交付,一些人对其在企业中的扩展持怀疑态度。 然而,在过去几个月,a16Z 与数十家财富 500 强和顶级企业领导人交谈并对 70 多位进行调查后发现,过去 6 个月里,企业对生成式 AI 的资源配置和态度有显著变化。尽管仍有保留,但企业领导人几乎将预算增加两倍,更多应用部署在较小的开源模型上,并将更多业务从早期实验转移到生产环境中。 这对创始人是巨大机遇。a16Z 认为,为客户“以 AI 为中心的战略计划”构建解决方案,能预见痛点,从重服务模式转向构建可扩展产品的人工智能初创公司,将抓住新投资浪潮并占据重要市场份额。 任何时候,为企业构建和销售产品都需深入了解客户预算、关注点和路线图。a16Z 根据访谈结果总结了 16 个最为关键的考虑因素,涉及资源、模型和应用。
2025-04-15
我怎么让ai帮我写论文,在我有完整的数据内容和大纲的情况下
以下是在您有完整的数据内容和大纲的情况下,让 AI 帮您写论文的步骤和建议: 1. 确定论文主题:明确您的研究兴趣和目标,选择一个具有研究价值和创新性的主题。 2. 收集背景资料:使用 AI 工具如学术搜索引擎和文献管理软件来搜集相关的研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成论文的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 5. 撰写文献综述:利用 AI 工具来帮助撰写文献综述部分,确保内容的准确性和完整性。 6. 构建方法论:根据研究需求,利用 AI 建议的方法和技术来设计研究方法。 7. 数据分析:如果论文涉及数据收集和分析,可以使用 AI 数据分析工具来处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具来撰写论文的各个部分,并进行语法和风格的检查。 9. 生成参考文献:使用 AI 文献管理工具来生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具来检查论文的逻辑性和一致性,并根据反馈进行修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具来确保论文的原创性,并进行最后的格式调整。 需要注意的是,AI 工具可以作为辅助,但不能完全替代研究者的专业判断和创造性思维。在使用 AI 进行论文写作时,应保持批判性思维,并确保研究的质量和学术诚信。 另外,还有一些相关的经验分享: 对于写作与内容创作,先确定一个明确的大主题,再细化出一系列小主题,形成文章大纲,在大纲要点下添加关键词提示。对着文章大纲,挨个语音输出。然后用 AI 组合成完整的文章,在 AI 合并出来的文章里插入一些配图,再稍微修改调整。 对于丰富细化,要让 AI 一段一段进行细节描写。为确保文章前后一致,可先让 AI 帮助写故事概要和角色背景介绍,并在其基础上按自己的审美略做修改。可以让 AI 以表格的形式输出细节描述,这样有打破 AI 叙事习惯、便于局部调整、确保内容具体等好处。 对于串联成文,把生成的表格依次复制粘贴,让 AI 照着写文章。 但也要注意,在修改过程中可能会遇到一些问题,比如某些 AI 模型可能会出现“失忆”等情况,导致修改不符合预期。
2025-04-09
如果面试AI产品经理岗位,我的简历应该如何介绍对应的AI项目?目前我在做的是一个AI深度解读的功能,用户通过报告页面进行深度解读,进入后触发AI与用户的沟通,根据沟通信息,将用户的一些情况写在病历信息中,最终发给医生
以下是为您提供的一些参考,帮助您在面试 AI 产品经理岗位时介绍对应的 AI 项目: 在您所做的 AI 深度解读功能项目中,可以从以下几个方面进行介绍: 项目背景:阐述开展该项目的原因和目标,例如为了提升医疗服务的效率和准确性,满足用户对深度医疗解读的需求等。 项目职责:详细说明您在项目中的具体职责,如需求分析、产品规划、与开发团队协作、与用户沟通获取反馈等。 技术实现:描述项目中所运用的关键技术,如触发 AI 与用户沟通的机制、如何将用户信息写入病历等。 用户体验优化:提及为提升用户体验所采取的措施,比如优化报告页面的设计、提高 AI 沟通的自然度和准确性等。 成果与效益:展示项目取得的成果,如提高了医生的诊断效率、提升了用户满意度等。 此外,您还可以参考以下其他相关人员的项目经验: 秦超作为 AI 2C 项目负责人,在产品落地服务方面具有丰富的经验,包括产品、技术架构以及项目管理等。 Cici?在 AI 算法开发领域,将宠物与 AI 结合,具备 AI 产品研发和创业经验。 11 鸭鸭呀作为产品经理,在智能写作产品方面有 Prompt 撰写和 AI 应用的经验。 枫 share 作为产品经理,熟悉 ChatGPT,写过 prompt,使用过多种 AI 创作工具,并正在寻找 AI 方向的产品岗位。 行远作为产品经理,熟悉 prompt,部署过多种绘图项目,使用过多款 AI 创作工具,期待学习和实战案例应用。 希望以上内容对您有所帮助,祝您面试成功!
2025-04-01
我希望了解人工智能大模型公司的整体产业情况
以下是关于人工智能大模型公司的整体产业情况: 2024 年被称为国内大模型落地元年,经过一年时间的发展,呈现出以下特点: 1. 竞争格局:国内大模型行业基本形成了以百度、阿里、字节等科技大厂和创业“AI 六小虎”为主要玩家的竞争态势。 2. 落地增长:2024 年 1 至 11 月,国内大模型中标项目数量和金额大幅增长。中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 3. 厂商表现:百度在中标数量和金额方面排名所有厂商之首,科大讯飞居第二。在金融行业,百度也排名第一。 4. 行业应用:在智能终端行业,超半数手机厂商使用文心大模型,多家车企已接入百度文心大模型。 5. 能力要求:大模型进入产业落地后,除模型本身能力外,落地应用所需的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业落地大模型需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力,大模型的竞争正成为体系化之战。 此外,2023 年国内大模型发展情况包括:智谱推出了 4 代 GLM,MiniMax 推出新模型及“星野”APP,月之暗面在长 Token 能力上表现出色。但在 2C 端真正出圈的产品较少,在 2B 行业中,大模型对收入撬动有限。硬件层上,国内仍缺乏胜任大模型训练的芯片,华为昇腾在单卡指标上接近,但存在稳定性和生态问题。
2025-03-27
介绍一下秘塔AI的基本情况和使用技巧
秘塔 AI 是一款优秀的工具,具有以下基本情况和使用技巧: 基本情况: 整体流程较长且完整,首先需要构建专题,并上传文档或者复制网页链接。 搜索完成后的操作类型丰富,例如可以继续追问、导出文档、收藏、保存到秘塔写作猫并编辑、生成在线演示文稿、下载脑图图片等,还能查看与原文的对应关系并进一步搜索。 RAG 和搜索能力出色,是国产之光。 使用技巧: 构建专题时,认真准备上传的文档或网页链接。 搜索时,在搜索框左下角选中专题以定制数据源。 充分利用丰富的搜索完成后的操作,满足不同需求,如追问、编辑、分享等。 您可以通过以下链接访问秘塔 AI 搜索:https://metaso.cn
2025-03-26
我是一个AI Agent初学者,现在我想要捏一款Agent,目的是喂给Agent固定材料之后对其做提问,让Agent学习完我的材料之后,在不联网的情况下对我问出的问题做出贴切材料的回答,现在请你告诉我如何操作
以下是捏制一个满足您需求的 AI Agent 的操作步骤: 1. 规划: 制定任务的关键方法,总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施: 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善: 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。 AI Agent 相关概念: AI Agent 是基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。 Chain:通常一个 AI Agent 可能由多个 Chain 组成。一个 Chain 视作是一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的 Chain 是大语言模型完成的 LLM Chain。 Router:可以使用一些判定(甚至可以用 LLM 来判定),然后让 Agent 走向不同的 Chain。例如:如果这是一个图片,则 a;否则 b。 Tool:Agent 上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。 常见的 AI Agent 类型包括: Responser Agent:主 agent,用于回复用户(伪多模态)。 Background Agent:背景 agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)。 Daily Agent:每日 agent,用于生成剧本,配套的图片,以及每日朋友圈。 Background Agent 每隔一段时间运行一次(默认 3 分钟),分析期间的历史对话,变更人物关系(亲密度,了解度等),变更反感度,如果超标则拉黑用户,抽简对话内容,提取人物和用户的信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。
2025-03-23