Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

可以做PPT的大模型

Answer

以下是关于可以做 PPT 的大模型的相关信息:

  1. 将 PPT 转换为 MD 语言文本 - PPTX2MD:
    • Github 上有一个把 PPTX 格式文件转换成 MD 语言的简单项目,可在此基础上接大模型进一步开发。
    • 原项目地址:https://github.com/ssine/pptx2md 。
    • Markdown 是轻量化结构语言,与 PPT 结构有相似性,能提升写作效率并检查逻辑漏洞,但存在图片、图表等插件处理的问题,后续可优化。
    • Colab 上跑通的代码,本地运行可自行修改。识别效果与 PPT 写作方式有关。
    • 准备接上智谱的 API 试试总结能力。
  2. 七大行业的商业化应用:PPT 式大模型能做千行百业。
  3. 自动 PPT 翻译脚本:
    • 起源于为客户翻译 PPT 的需求,编写了自动翻译脚本,目前效率提升但仍有性能问题。
    • 脚本在 Python 环境下运行,逻辑不复杂,分几个步骤。
    • 前期准备:翻译需外接 API,推荐讯飞大模型,新账户免费送 200 万 tokens,有效期 3 个月。可按以下步骤操作:
      • 进入 https://xinghuo.xfyun.cn/ 。
      • 选择 API 接入,点服务管理进入控制台。
      • 创建“PPT 翻译”项目,避免 API 泄露。
      • 找到左边机器翻译的模型,按提示领取 200 万 tokens 礼包,在主控台获取对应信息。
    • 导入依赖:大部分常用,只有 ppt 可能需安装,运行 CMD 输入 pip install python-pptx,缺的可按提示安装。
    • 初始化 API 相关信息和文件路径,其他模型可对应替换。
Content generated by AI large model, please carefully verify (powered by aily)

References

[应用开发] 将PPT转换为MD语言文本 - PPTX2MD

Github上面一个很简单的项目,把PPTX格式的文件转换成MD语言(可以用txt或者其他任何文本输出),没有用到大模型,不过感觉可以在这个基础上接上大模型做进一步的开发。原项目地址https://github.com/ssine/pptx2md这个趋势应该还是有的,因为Markdown是一种非常轻量化的结构语言,而PPT通常也是以同样的结构来制作的,两者的切换可以让更多用户用markdown语言的习惯进行PPT写作。作为一个写了十几年PPT的牛马,虽然这个模式仍然存在一些漏洞(比如图片,图表,表格等插件的处理),但整理来讲,确实是大大提升了写作效率,而且可以清晰检查自己的前后逻辑是否有漏洞。Colab上跑通的代码,本地运行可以自行修改由于之前我们的PPT通常不是用现有框架做的(我之前比较喜欢白板,然后自己拉标题,正文),所以识别度并不是很好,如果在ppt现有框架内写作的会相对好一些(比如在预设的标题,正文框里面填写)。这个之后可以进一步去做优化。准备接上智谱的API试试总结能力

七大行业的商业化应用

[title]七大行业的商业化应用[heading2]PPT式大模型能做千行百业

[应用开发] 自动PPT翻译脚本

这个故事起源于,我有一个客户,有一天global的老大来开会,喊了微博的销售,会后老外想要一个案例分析,微博也答应了。但是TMD过了一个礼拜,他们给了个中文的案例,说没人翻译...就只好让同事用gpt去翻,但是发现这个PPT碎的令人发指,小朋友翻译翻的绝望了,就想办法写了个自动翻译的脚本。目前测下来整体还可以,虽然性能还不够好(比如有些翻译不是很全,有些本土化的梗无法理解),但整体的效率已经提升很多了。(版本还会有些小更新,改了个名字好找一点~)脚本在Python环境下运行,整体逻辑不复杂,分成几个步骤(如果有大佬有兴趣拆成xml来搞,欢迎交流)[heading2]前期准备[content]因为翻译需要外接API,这里根据自己的API资源提前设置下,推荐讯飞大模型,新账户免费送200万tokens,有效期3个月,很良心~https://xinghuo.xfyun.cn/首页进去选择API接入,然后点服务管理进入控制台创建一个新项目,比如“PPT翻译”,这样你的API只会被这个项目ID调用,避免泄露点进去,找到左边机器翻译的模型按提示来,领一个200万tokens的礼包然后就可以在主控台看到对应的id,apikey,api secret和接入路径了[heading2][heading2]导入依赖[content]大部分都是常用的,只有一个ppt可能需要装运行CMD输入pip install python-pptx,如果还缺的可以按提示安装[heading2]初始化API相关信息和文件路径[content]接着先设置对应的api信息,其他模型可以对应做替换

Others are asking
怎样使用AI做PPT
使用 AI 做 PPT 可以参考以下内容: 1. 信息的 AI 可视化: 优点:节省制作时间、具有优秀的视觉风格、能快速归纳整理信息、可用图形代替文字枯燥的表达。 注意事项: 不要指望复制一段提示词就能得到满意结果,这是与 AI 互动的过程,需要反复尝试。 AI 生成的是基于模型的 HTML 输出,并非真正的 PPT 格式,目前无法在 PPT 里进行二次深度编辑。 模型选择:目前推荐 Claude 3.7 Sonnet,可通过 POE 调用,不建议使用其他效果不佳的模型。 交互流程: 阶段 1 主观描述:通过文字聊天让 Claude 领悟您想要的视觉风格,描述要尽量具体,如颜色、画布、装饰等方面的要求。 2. 好用的 AI PPT 工具: Gamma:在线 PPT 制作网站,支持输入文本和想法提示快速生成幻灯片,可嵌入多媒体格式。https://gamma.app/ 美图 AI PPT:由美图秀秀团队推出,可通过输入文本描述生成专业设计。https://www.xdesign.com/ppt/ Mindshow:AI 驱动的辅助工具,提供智能设计功能。https://www.mindshow.fun/ 讯飞智文:科大讯飞推出的辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成等功能。https://zhiwen.xfyun.cn/ 3. 教学案例: 上午的尝试中,Claude + Gamma.app 帮助学生从组会准备工作中解放出来,实现了快速寻找符合条件的论文、提取精炼论文信息、找到适合的 PPT 制作工具并学会使用等目的。 Claude 的用法示例:如通过一系列问题让其搜索权威期刊、论文,提取摘要等,并用于制作 PPT。
2025-04-18
最好的制作ppt的大模型是哪个
目前在制作 PPT 方面,没有绝对的“最好”的大模型。例如,Claude 3.7 在将 PDF 转换为 HTML 方面效果较好,但国内用户使用不太方便,可改用 DeepSeekR1 实现。某上市公司使用某互联网大厂研发的千亿 AI 大模型产品声称能 3 分钟制作 PPT,但接入公司系统时出现“一连接就死机”的情况。同时需要注意的是,过去几个月内国内的 AI 大模型在某些方面大同小异,且大部分远未达到可商用化程度。
2025-04-13
我要根据PPT开发一个网页,请详细提供操作步骤和选择哪一个AI工具更合适。
以下是根据 PPT 开发网页的详细操作步骤以及适用的 AI 工具: 一、生成 PDF 1. 将您的文件转换为 PDF 格式,其他文件格式也可行,但 PDF 效果更佳。 2. 若希望在文章中加入图片,需将图片转换为 Markdown 格式。 网络图片:直接复制图片的 URL,右键图片选择复制 URL,然后用 Markdown 格式写入文档。 自己的图片:使用图床服务(如 https://sm.ms/)托管图片,生成公链。 3. 插入视频:先将本地视频上传到公网(如 B 站),在视频页面寻找“分享”按钮,点击“嵌入”或“嵌入代码”选项获取 URL,用 Markdown 格式写入。 二、适用的 AI 工具 1. 爱设计 网址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite 输入大纲和要点: 导入大纲和要点 输入主题自动生成大纲和要求 选择模版并生成 PPT 导出 2. MindShow 网址:https://www.mindshow.fun//home 输入大纲和要点: 导入大纲和要点 输入主题自动生成大纲和要求 选择模版并生成 PPT 导出 3. Process ON 网址:https://www.processon.com/ 输入大纲和要点: 导入大纲和要点: 手动复制(相对耗时) 导入方式:复制最终大纲内容到本地 txt 文件,将后缀改为.md(若看不见后缀可自行搜索开启),打开 Xmind 软件导入 md 文件,在 Process ON 导入 Xmind 文件。 输入主题自动生成大纲和要求:新增思维导图,输入主题点击 AI 帮我创作。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版再点击下载。若喜欢使用且无会员,可在某宝买一天会员。
2025-04-13
有哪些自动生成ppt的ai平台
以下是一些自动生成 PPT 的 AI 平台: 1. Kimi.ai:选 PPT 助手暂时免费效果好,网址为 http://kimi.ai 。 2. 讯飞智文:网址为 https://zhiwen.xfyun.cn/ 。 3. Mindshow.fun:支持 Markdown 导入,网址为 http://Mindshow.fun 。 4. Tome.app:AI 配图效果好,网址为 http://Tome.app 。 5. Chatppt.com:自动化程度高。 6. Gamma:在线 PPT 制作网站,网址为 https://gamma.app/ 。 7. 美图 AI PPT:网址为 https://www.xdesign.com/ppt/ 。 这些工具通过自动化和智能化的设计流程,极大地简化了 PPT 的制作工作。目前市面上大多数 AI 生成 PPT 通常按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲。 2. 手动优化大纲。 3. 导入工具生成 PPT。 4. 优化整体结构。 您可以根据自己的需求和喜好选择合适的 AI PPT 工具,以提高工作效率和演示效果。 扩展阅读: 1. 《》 2. 《》(质朴发言) 相似问题: 1. 有没有生成 PPT 的应用推荐,不用翻墙的。 2. 免费生成 PPT 的网站有哪些。 3. 推荐一款文字生成 ppt 的工具。 4. 免费 ai 制作 ppt 软件。 5. 推荐 3 款好用的 AI 制作 ppt 工具。 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-04-12
AI PPT
以下是关于 AI PPT 的相关信息: AiPPT: 一句话 AI 生成 PPT,智能生成 PPT 内容大纲与匹配正文。 任选各行业海量模板,智能完成排版设计与关联配图,美观省时。 支持在线编辑与演示、一键换色与字体调整、动效导出下载等高级功能,助您轻松制作高水准 PPT。 用途包括制作企业宣传的幻灯片、创建学术报告演示文稿、设计教学课程的课件、制作个人简历、编辑年终总结报告、生成产品发布和推广的演示材料、为教育学科编制互动式课本、设计商业计划书的提案、定制营销策划提案等。 其他 AI PPT 工具: Gamma:在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。网址:https://gamma.app/ 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,允许用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素。网址:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等,可能还包括互动元素和动画效果。网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/
2025-04-10
我有一页PPT的截图,现在想通过工具将这张图还原为PPT ,请推荐我几个工具
以下为您推荐几个可能有助于将 PPT 截图还原为 PPT 的工具: 1. PPT 软件本身:例如 Microsoft PowerPoint 或 WPS 演示。您可以在新的 PPT 页面中,根据截图的内容重新进行排版和编辑。 2. 图像处理软件:如 Adobe Photoshop 等,用于对截图进行处理和优化,然后再将处理后的图片插入到新的 PPT 中。 需要注意的是,目前将截图直接完美还原为 PPT 格式的工具可能并不存在,可能需要您结合多种工具和手动操作来实现。另外,在使用 PPT 进行排版时,要注意尺寸的选择。如果想要打印,4:3 的比例比较适合童书绘本的比例;如果要发小红书或者小绿书,竖版比例选 3:4 更合适;如果要制作 H5,出图选 9:16 的竖版比例。同时,PPT 里的删除背景功能对于一些基础抠图很有用。用 PPT 另存为图片时,先另存为“增强型 Windows 源文件”格式,再用画图软件打开另存为 JPG 可得到高清图。
2025-04-10
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14