与知识库对话 - ocr

回答

关于 OCR 的相关信息如下：

GPT 的 OCR 识别问题及解决方案：
- 问题：开启代码执行功能时，GPT 会尝试用代码完成 OCR，导致无法正确识别图片文字。
- 解决方案：
  - 如果是自定义 GPT，关闭 Code Interpreter。
  - 无法关闭时，提问时明确说明“不要执行代码，请用自身多模态能力识别文字”。
  - 直接使用 ChatGPT，而非 GPT。参考链接：https://x.com/dotey/status/1869947164249489507
开源的 Zerox OCR 工具：
- 支持 PDF、DOCX 转换为 Markdown。
- 可并发处理，能选择特定页面及模型选项。详细介绍参考：https://xiaohu.ai/p/14778 、https://getomni.ai/ocr-demo

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

?宝玉日报「12月20日」✨✨✨✨✨✨✨✨1⃣️?️GPT的OCR识别问题及解决方案问题：开启代码执行功能时，GPT会尝试用代码完成OCR，导致无法正确识别图片文字。解决方案：1.如果是自定义GPT，关闭Code Interpreter。2.无法关闭时，提问时明确说明“不要执行代码，请用自身多模态能力识别文字”。3.直接使用ChatGPT，而非GPT。?[https://x.com/dotey/status/1869947164249489507](https://x.com/dotey/status/1869947164249489507)2⃣️?ChatGPT桌面应用升级发布主要亮点：支持与多种应用协作，优化工作效率。新功能：1.实时协作：通过Warp终端、Xcode实现智能协作。2.文档支持：支持Notion、Apple Notes等工具。3.语音交互：新增语音助手模式，体验更智能。4.搜索辅助：确保输出信息的准确性。可用性：Mac版本现已发布，Windows版本即将推出。?[https://x.c](https://x.com/dotey/status/1869844320322204154)[om/dotey/status/1869844320322204154](https://x.com/dotey/status/1869844320322204154)3⃣️?Gemini推理模型已上线AI Studio

XiaoHu.AI日报

?Xiaohu.AI日报「10月20日」✨✨✨✨✨✨✨✨1⃣️?️Zerox OCR工具：开源GPT OCR工具，支持PDF、DOCX转换为Markdown。可并发处理，选择特定页面及模型选项。详细介绍?[https://xiaohu.ai/p/14778](https://xiaohu.ai/p/14778)?[https://getomni.ai/ocr-demo](https://getomni.ai/ocr-demo)2⃣️?BrightEdge数据揭示：OpenAI的SearchGPT以150%增长速度成竞争对手。YouTube内容引用增长310%，促进品牌搜索表现。?[https://x.com/imxiaohu/status/1847491108642963573](https://x.com/imxiaohu/status/1847491108642963573)3⃣️?️ChatGPT高级语音模式：即将上线，但应用场景有限，API成本降低将拓展用途。?[https://x.com/imxiaohu/status/1847575551424548931](https://x.com/imxiaohu/status/1847575551424548931)4⃣️?Viggle视频生成：文字描述生成动态视频，基于JST-1模型理解物理运动。可控制角色动作和场景，创建3D角色和场景。?[http://viggle.ai](http://viggle.ai)?[https://discord.gg/5kk5SKwTWd](https://discord.gg/5kk5SKwTWd)?[https://x.com/imxiaohu/status/1771173928591093940](https://x.com/imxiaohu/status/1771173928591093940)

XiaoHu.AI日报