直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

复活老照片,哪个工具最好用?

回答

以下是一些可以用于复活老照片的工具:

  • 本地工具放大:https://www.upscayl.org/#download
  • SD 放大:扩散模型可以增加更多细节
  • 开源工作流开源的 Magnific AI 的图片放大工作流
  • 开源工作流图像高清修复,无损放大 N 倍
  • stability.ai 的 https://clipdrop.co/tools
  • 画质增强 magnific 遥遥领先:https://magnific.ai/
  • Krea:https://www.krea.ai/apps/image/enhancer
  • Image Upscaler:https://imageupscaler.com/
  • 佐糖:https://picwish.cn/photo-enhancer-api?apptype=aps-bd-api&bd_vid=8091972682159211710
  • 腾讯 ARC:https://arc.tencent.com/zh/ai-demos/humansegmentation?ref=88sheji.cn
  • 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN
  • 在线测试地址:https://replicate.com/tencentarc/gfpgan
  • 美图老照片修复:https://www.x-design.com/quality/?channel=sllbd90&bd_vid=11711254260543749686
  • Imglarger:https://imglarger.com/
  • Let's Enhance:https://letsenhance.io/
  • Waifu2x:http://waifu2x.udp.jp/

这些工具各有特点,你可以根据自己的需求和喜好选择适合的工具来复活老照片。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

辅助工具:放大/扩图

本地工具放大:https://www.upscayl.org/#downloadSD放大:扩散模型可以增加更多细节开源工作流:[开源的Magnific AI的图片放大工作流](https://waytoagi.feishu.cn/wiki/A5LtwIV6KixSCckCOuYcAYpFnjb)开源工作流:[图像高清修复,无损放大N倍](https://waytoagi.feishu.cn/wiki/BDNJwt5uji6hkakgahGcp0LlnVb)stability.ai的https://clipdrop.co/tools画质增强magnific遥遥领先:https://magnific.ai/Krea https://www.krea.ai/apps/image/enhancerImage Upscaler:https://imageupscaler.com/佐糖:https://picwish.cn/photo-enhancer-api?apptype=aps-bd-api&bd_vid=8091972682159211710腾讯ARChttps://arc.tencent.com/zh/ai-demos/humansegmentation?ref=88sheji.cn腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN在线测试地址:https://replicate.com/tencentarc/gfpgan美图老照片修复:https://www.x-design.com/quality/?channel=sllbd90&bd_vid=11711254260543749686Imglarger:https://imglarger.com/Let's Enhance:https://letsenhance.io/Waifu2x:http://waifu2x.udp.jp/Waifu2x能够提供图片的放大和降噪功能,通过使用深度学习技术可以提高图像的质量,同时保留细节和纹理。它简单易用且效果非常好。

【SD】用AI给老照片上色,岁月不改它模样

所以,接下来我将图片再发送到图生图当中,打开stableSR脚本,放大两倍。这个放大插件是所有插件中对原图还原最精准的,也是重绘效果最好的,不知道的朋友可以参考我的这篇文章——[【Stable Diffusion】超清无损放大器StableSR](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487403&idx=1&sn=cbb96534fa6f58c37cf9fc64bc7ade0c&chksm=c251596ff526d0792b4bba0e21b69427b23e780824bdc75b22f1073e8bad6f61f30199fc8344&scene=21#wechat_redirect)。切换到sd2.1的模型进行修复,vae选择vqgan,提示词可以什么都不写,以免对原图产生干扰。启用MutiDiffusion插件,不开放大倍数,仅使用分块渲染的功能,能帮助我们在显存不够的情况下,将图片放大到足够的倍数。好了,经过一顿操作,我们就将这张图片处理完成了。对比一下看看,之前的黑白照片和经过上色高清化完成之后效果。同样的步骤,又还原了一张我妈妈的照片。在问到她当时穿的什么颜色衣服的时候,她记得可清楚了,想都没想就告诉我说是绿色的。

辅助工具:放大/扩图

Kraken.ioKraken.io主要用于图像压缩,但也提供了一个免费的图像放大功能。不仅能够放大图像,还能保证图像的细节清晰度。Deep Art EffectsDeep Art Effects是一款强大的艺术效果编辑器,通过AI技术能够将图像放大并赋予艺术效果。它支持多种滤镜和风格,让您的图像更加独特。Real-ESRGAN https://replicate.com/nightmareai/real-esrgan --------这个暂时处理的假(群友实操)这个模型是一个基于Real-ESRGAN的图像超分辨率增强模型,具有可选的人脸修复和可调节的放大倍数。Real-ESRGAN是一个非常强大的图像超分辨率算法,可以将低分辨率图像转换为高分辨率图像。它使用深度学习模型进行训练,能够恢复出更多的细节和清晰度。此外,该模型还提供了人脸修复的选项,可以在超分辨率处理的同时对图像中的人脸进行修复,使得人脸更加清晰和自然。同时,用户还可以通过调整放大倍数来控制图像的超分辨率程度,最大放大倍数为10。该模型可以通过API在Replicate上运行,使用户可以方便地对图像进行超分辨率增强处理。这个用几次要收费多种组合操作4️⃣📸使用Photoshop Generative AI功能修复破损老照片🛠️主要工具包括:Remove tool,Clone brush,Generative fill以及Neural filters。

其他人在问
修复老照片的AI工具
以下是一些修复老照片的 AI 工具及相关操作步骤: 工具: 1. Stable Diffusion:启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。还可使用 t2ia_color 模型和 controlnet 控制颜色。 2. GFPGAN 算法:用于将人脸变清晰。 3. 本地工具放大:https://www.upscayl.org/download 4. SD 放大:扩散模型可增加更多细节。 5. 开源工作流: 6. stability.ai 的 https://clipdrop.co/tools 7. 画质增强 magnific:https://magnific.ai/ 8. Krea:https://www.krea.ai/apps/image/enhancer 9. Image Upscaler:https://imageupscaler.com/ 10. 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 11. 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 12. 腾讯开源的模型(能恢复老照片):https://github.com/TencentARC/GFPGAN,在线测试地址:https://replicate.com/tencentarc/gfpgan 13. 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 14. Imglarger:https://imglarger.com/ 15. Let's Enhance:https://letsenhance.io/ 16. Waifu2x:http://waifu2x.udp.jp/ 操作步骤: 1. 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。 2. 对照片在 ps 里进行角度调整和裁切。 3. 把图片发送到图生图中,打开 stableSR 脚本,放大两倍。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。
2024-10-08
AI怎么做老照片修复
以下是使用 AI 进行老照片修复的步骤: 1. 首先将图片发送到图生图中,打开 stableSR 脚本,放大两倍。stableSR 放大插件是所有插件中对原图还原最精准、重绘效果最好的。您可以参考文章——。 2. 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写,以免对原图产生干扰。 3. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,能在显存不够的情况下,将图片放大到足够的倍数。 对于复杂的老照片,比如人物多、场景复杂、像素非常低的情况: 1. 首先在 ps 里面进行角度的调整和照片的裁切。 2. 然后按照上述步骤进行上色,如果直接上色效果不佳,比如像加了一层黄色滤镜、年代感太强,可以放弃人物服装的颜色指定,只给一个场景方向。 3. 从网上找到相关的参考照片,让 AI 去匹配色调。 4. 加入第二个 controlnet 来控制颜色,使用 t2ia_color 的模型,关键词只给简单的几个词,如“蓝天、绿树、灰石砖”。 5. 最后经过脸部的修复和放大,得到最终效果。 另外,在最近新上线的 controlnet 模型中,新增的 Recolor 模型可以将黑白图片重新上色,可用于老照片修复。
2024-09-28
老照片优化
以下是使用 AI 给老照片上色和优化的步骤: 1. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。stableSR 放大插件是所有插件中对原图还原最精准、重绘效果最好的。不了解的朋友可参考文章——。 2. 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写,以免对原图产生干扰。 3. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,能在显存不够的情况下,将图片放大到足够的倍数。 4. 为做到颜色与内容的统一,启用之前讲到过的 cutoff 插件来进行控制,依次按顺序设置好颜色提示词。不了解这款插件的朋友可以参照文章——。 5. 在新上线的 controlnet 模型中,新增的 Recolor 模型可将黑白图片重新上色。 经过上述操作,就能完成老照片的上色和优化。
2024-09-27
老照片动画用什么AI工具
以下是一些可以让老照片动画化的 AI 工具: 1. 未提及具体名称的工具:可以上传照片,让照片产生一些动态效果,如风景照片中的水面动起来,但也可能出现画面扭曲的情况。 2. Dreamina:在有插件的情况下可能可以使用,否则直接去其官网使用可能更方便快捷。 需要注意的是,使用这类工具时可能会涉及肖像权、版权、信息安全等问题,使用时需谨慎。
2024-09-26
老照片上色
以下是使用 AI 给老照片上色的步骤和相关注意事项: 1. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。stableSR 放大插件是所有插件中对原图还原最精准、重绘效果最好的。若想了解更多,可参考文章——。 2. 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写,以免对原图产生干扰。 3. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,可在显存不够的情况下将图片放大到足够的倍数。 4. 对于人物照片的还原,选择 realisian 的写实大模型。提示词直接描述颜色和对应的内容,比如黑色的头发、黄色的皮肤、深蓝色的衣服、浅蓝色的背景。 5. ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果会更好。但可能会出现颜色不精准出现在想要位置、提示词相互污染以及背景不能完全统一等问题。 6. 对于内容较多的照片,如外婆带着妈妈和舅舅的合影,可能需要逐个上色,再用 ps 进行融合。 在给老照片上色的过程中,可能会遇到各种复杂的情况,需要根据具体照片的特点和需求进行灵活处理。
2024-09-02
老照片修复
以下是关于老照片修复的相关内容: 使用 AI 给老照片上色及修复的步骤: 1. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。stableSR 放大插件是所有插件中对原图还原最精准、重绘效果最好的。可参考文章——。 2. 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免对原图产生干扰。 3. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,能在显存不够的情况下将图片放大到足够的倍数。 辅助工具: 1. 本地工具放大:https://www.upscayl.org/download 2. SD 放大:扩散模型可以增加更多细节 3. 开源工作流: 4. stability.ai 的 https://clipdrop.co/tools 5. 画质增强 magnific 遥遥领先:https://magnific.ai/ 6. Krea https://www.krea.ai/apps/image/enhancer 7. Image Upscaler:https://imageupscaler.com/ 8. 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 9. 腾讯 ARC https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 10. 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 11. 在线测试地址:https://replicate.com/tencentarc/gfpgan 12. 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 13. Imglarger:https://imglarger.com/ 14. Let's Enhance:https://letsenhance.io/ 15. Waifu2x:http://waifu2x.udp.jp/ ,能够提供图片的放大和降噪功能,通过使用深度学习技术可以提高图像的质量,同时保留细节和纹理。 在最近新上线的 controlnet 模型中,新增的 Recolor 模型可将黑白图片重新上色,可用于修复老照片。
2024-08-29
有什么AI工具 可以转换视频的尺寸
以下是一些可以转换视频尺寸的 AI 工具: 1. Topaz Video AI:可通过以下链接获取:https://www.topazlabs.com/topazvideoai 。超级会员 V6 可通过百度网盘分享获取相关文件,链接:https://pan.baidu.com/s/1bL4tGfl2nD6leugFh4jg9Q?pwd=16d1 ,提取码:16d1 ,复制这段内容打开「百度网盘 APP 即可获取」。 2. Kraken.io:主要用于图像压缩,但也提供了免费的图像放大功能,能保证图像的细节清晰度。 3. Deep Art Effects:强大的艺术效果编辑器,通过 AI 技术能够将图像放大并赋予艺术效果,支持多种滤镜和风格。 4. RealESRGAN:https://replicate.com/nightmareai/realesrgan ,这是一个基于 RealESRGAN 的图像超分辨率增强模型,具有可选的人脸修复和可调节的放大倍数,但使用几次后要收费。 5. Stability AI 推出的基于 Discord 的媒体生成和编辑工具:包括搜索和替换(无需蒙版,通过搜索提示识别对象并替换)、创意放大(将低分辨率或低质量图像放大至 4K 分辨率,同时可以附加提示)、外扩(在图像中添加内容以扩展空间)、控制草图(将手绘草图转换为高质量图像)、删除背景(准确分割前景并删除背景)、基于初始图像使用 Stable Video Diffusion 生成短视频等功能。
2024-10-22
有没有什么好用的视频剪辑AI工具
以下为您介绍一些好用的视频剪辑 AI 工具: 剪映:方便之处在于有很多人性化设计以及简单的音效库和小特效。但无法协同工作和导出工程文件,难以与其他软件进行工程联通,应用于商业化效果有限。剪辑流程包括视频粗剪、定剪、音效/音乐、特效、包装(如字幕)。在声音运用方面,好的声音制作可为影片增色,视频粗剪时可先确定画面逻辑,定剪时再调整和替换画面素材至满意效果。音效方面,剪映的简单音效库可用于制作简单短片,复杂音效可能需另外制作。特效方面,例如可添加一些光影效果。包装方面,剪映可智能匹配字幕再修改。 视频配音效的 AI 工具: Vidnoz AI:支持 23 多种语言的配音,音质高保真,支持文本转语音和语音克隆功能,提供语音参数自定义和背景音乐添加工具,有面向个人和企业的经济实惠的定价方案。 Wavel Studio:支持 30 多种语言的配音,音质自然流畅,能自动去除背景噪音和杂音,提供添加字幕和文本叠加层的工具,界面友好且有多种自定义选项。 Elai.io:支持 65 多种语言的配音,音色和语调真实,能自动将唇形与语音同步,生成字幕提高视频可访问性,支持多位配音者适合复杂对话场景。 Rask AI:支持 130 多种语言的配音,包括稀有和濒危语言,采用先进语音合成技术音质高保真,提供语音参数自定义和音效添加工具,与多种视频编辑平台和工作流程整合。 Notta:提供快速实惠的多语言配音解决方案,保留原声说话风格和细微差别,提供调整语音速度和音调的工具,支持批量处理高效完成多视频配音。 Dubverse:支持 60 多种语言的配音,音质接近真人,提供文本转语音和语音克隆功能,提供语音参数自定义和情感添加工具,与多种视频平台和社交媒体渠道整合。 在选择视频配音工具时,请考虑支持的语言数量、语音质量、自定义选项和价格等因素。
2024-10-22
我有126个docs文件,我需要用同一套提示词,对这些文件进行总结,有什么工具可以做到
以下是一些可能用于对 126 个 docs 文件进行总结的工具和方法: 1. 可以考虑使用由杨志磊开发的律师的文本总结助手。其说明为对客户提供的文件或文本进行总结,具有明确的角色设定、目标和约束条件。链接地址为:https://waytoagi.feishu.cn/wiki/HvJGwlMFhidzZukPsoKcnuXlnKe 。 2. 在 Stable Diffusion 中,Embedding 功能可以将很多提示词打包到一个文件里。例如常见的负向提示词 Embedding,如 EasyNegative,官方推荐搭配二次元模型使用,能在一定程度上优化生成效果。但需注意,对于一些复杂问题如 AI 绘图中的手部问题,可能无法完全解决。
2024-10-22
如何对文件批处理总结,需要什么工具。
对文件进行批处理总结可以参考以下步骤和工具: 1. 抓取公众号内容: 先在平台搜索现成的插件,如 Coze 平台,但部分插件可能已荒废。 可考虑自己写爬虫抓取,或者通过 API 调用现成的服务,如“瓦斯阅读”“WeWe RSS”等。 2. 公众号内容总结: 主要依靠大模型的能力,如字节的豆包大模型。 对于批量总结操作,可以使用“批处理”功能。 3. 定时推送到微信: 定时功能可通过 Coze 平台的触发器实现。 推送功能可借助第三方 API 方案,如“server 酱”。 类似的工具还有:Notion AI、Dify、Slack Workflow Builder 等,它们都提供了可视化的工作流构建功能,集成了丰富的服务和 API,适合自动化信息处理。处理完的信息摘要可以考虑整理为 Markdown 文档,接入飞书文档进行存储。
2024-10-22
我想要个视频AI模糊变高清的工具
以下为您介绍两款可将视频 AI 模糊变高清的工具: 1. Topaz Video AI: 解压对应文件,推荐使用绿色版(安装包已在网盘,可直接下载)。 右键管理员运行 VideoAIportable.exe 文件。 导入处理好的视频。 主界面左边是原视频,右边是待处理视频,下面是对应的视频轨道。 右边部分是主要对视频处理的方式,预设部分主要有放大视频、提升画质、提升帧率等功能。 视频部分保持默认,稳定 AI 用于画面稳定和减少抖动,模式分为自动裁切和完整帧,强度在 60 左右,抖动需开启,次数一般选择 2。 消除运动模糊 AI 按字面意思操作,帧插值 AI 可识别帧之间进行修复替换,增强 AI 能选择不同模型对视频整体优化,包括面部、去噪、锐化提升等。 一般会选择稳定+运动模糊,若电脑配置不行,可一个一个操作,但速度较慢。 2. FMANet: 能将模糊低分辨率视频恢复为清晰高分辨率。 可解决快速移动物体或摄像机引起的视频模糊。 智能理解物体运动,改善画质,去除模糊。 相关网址:http://kaistviclab.github.io/fmanetsite/ 、https://x.com/xiaohuggg/status/1746160750610075689?s=20
2024-10-22
做PPT目前最好的ai工具是什么
目前市场上有以下一些好用的做 PPT 的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 此外,还有以下工具: 1. 爱设计 2. 闪击 3. Process ON 4. WPS AI 目前市面上大多数 AI 生成 PPT 按照如下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-10-22
请问现在最好的用AI写公众号的AI是什么
目前没有明确的“最好”用 AI 写公众号的工具,不过可以通过以下方式利用 AI 来创作公众号文章: 1. 设计明确且具有指导性的提示词:例如“请根据我们收集的关于 OpenAI 回应马斯克言论的资讯,创作一篇既深入又易于理解的科技资讯文章。文章应该有一个吸引人的标题,开头部分要概述事件的背景和重要性,主体部分详细分析 OpenAI 的回应内容及其可能产生的影响,结尾处提出一些引人深思的问题或观点。”这样的提示词能为 AI 提供明确指导,并设定文章基本结构和内容要求,AI 会据此生成结构完整、内容丰富、观点鲜明的文章,但最终产出的内容可能需要进行微调,以符合预期和公众号风格。 2. 校对文章:虽然 AI 生成文本已相当精确,但人工校对仍不可或缺。在校对过程中,需注意内容准确性,核实信息和数据是否准确无误,引用来源是否可靠;确保表达清晰,检查文章是否流畅易读,语言是否清晰,专业术语和概念对目标读者群体是否易于理解;保证逻辑连贯,确保文章结构合理,论点和论据逻辑关系清晰,避免逻辑跳跃或混乱。 3. 利用 AI 找配图:让 AI 分析文章内容,给出配图建议和关键词,然后利用这些信息在免费图库中快速找到合适的无版权图片,提高配图效率,避免版权风险。
2024-10-22
哪个软件做出来的数字人最好
以下是一些制作数字人效果较好的软件及相关介绍: 剪映: 优势:作为字节跳动旗下产品,在抖音平台广泛应用,海外版 CapCut 成绩斐然。具有声音克隆、公模数字人等 AI 功能,能在编辑器内完成脚本生成、语音克隆、数字人口播等环节。 制作流程:打开剪映,添加文本到文字轨道并修改文字,点击朗读进行声音克隆,选择数字人形象并换上克隆音色,一键智能生成字幕并调整文字样式。 生成数字人:在右侧窗口顶部打开“数字人”选项,选取免费合适的形象,软件会播放声音供判断,添加后可预览效果。还可增加背景图片等进行美化。 下载地址: Heygen: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片,上传后效果在 My Avatar 处显示,点开大图后,点击 Create with AI Studio 进入制作,写上视频文案并选择配音音色,也可自行上传音频,最后点击 Submit 得到数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:免费版下载后有水印。 使用方法:点击网址,点击右上角的 Create vedio,选择人物形象,可添加自己照片或使用给出的形象,配音时可选择提供文字选择音色或直接上传音频,最后点击 Generate vedio 生成视频,打开可下载或分享。 KreadoAI: 优点:免费,功能齐全。 缺点:音色较 AI。 使用方法:点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮,点击背景添加背景图,最后点击生成视频。
2024-10-20
最好的开源LLM是什么
目前开源的 LLM 有很多优秀的选择,以下为您列举一些: OPT 是表现最优秀的全开源 LLM 之一。这个拥有 1750 亿参数的模型的发布附带了代码,并在公开可用的数据集上进行了训练。 ChatGLM 是中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。 VisualGLM6B 是一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM6B,具有 62 亿参数;图像部分通过训练 BLIP2Qformer 构建起视觉模型与语言模型的桥梁,整体模型共 78 亿参数。依靠来自于 CogView 数据集的 30M 高质量中文图文对,与 300M 经过筛选的英文图文对进行预训练。 ChineseLLaMAAlpaca 是在原版 LLaMA 的基础上扩充了中文词表并使用了中文数据进行二次预训练,支持本地 CPU/GPU 部署。 需要注意的是,对于“最好的开源 LLM”的评判标准因人而异,取决于具体的应用场景和需求。
2024-10-19
目前最好用的机关公文写作大模型或智能体
目前在机关公文写作方面表现较好的大模型或智能体有: 智谱清言:由智谱 AI 和清华大学推出,基础模型为 ChatGLM 大模型。在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三。更擅长专业能力,但在代码能力上还有优化空间,知识百科方面稍显不足。可应用场景广泛,在 AI 智能体方面相关的应用,包括任务规划、工具使用及长文本记忆相关场景表现出色,在较复杂推理应用上效果不错,也适用于广告文案、文学写作等。 此外,在大模型中,智能体是大模型的一个重要发展方向。智能体可以理解为在大模型(如 LLM)基础上增加了工具、记忆、行动、规划等能力。目前行业里主要用到的如 langchain 框架,能通过代码或 prompt 的形式将 LLM 与 LLM 之间以及 LLM 与工具之间进行串接。
2024-10-18
我想找一些具有「图片理解」能力的模型,最好是国内的
以下是一些具有“图片理解”能力的国内模型: 1. Gemini 模型:在各种图像理解基准测试中表现出色,如在表 7 中的各项测试中是最先进的,在回答自然图像和扫描文档的问题,以及理解信息图表、图表和科学图解等任务中性能强大。在 zeroshot 评估中表现优于其他模型,在多学科的 MMMU 评估基准测试中也取得了最好的分数。 2. 国内大模型: 北京企业机构:百度(文心一言)https://wenxin.baidu.com 、抖音(云雀大模型)https://www.doubao.com 、智谱 AI(GLM 大模型)https://chatglm.cn 、中科院(紫东太初大模型)https://xihe.mindspore.cn 、百川智能(百川大模型)https://www.baichuanai.com/ 上海企业机构:商汤(日日新大模型)https://www.sensetime.com/ 、MiniMax(ABAB 大模型)https://api.minimax.chat 、上海人工智能实验室(书生通用大模型)https://internai.org.cn 3. 智谱·AI 开源模型: CogAgent18B:基于 CogVLM17B 改进的开源视觉语言模型,拥有 110 亿视觉参数和 70 亿语言参数,支持 11201120 分辨率的图像理解,具备 GUI 图像的 Agent 能力。 CogVLM17B:强大的开源视觉语言模型,在多模态权威学术榜单上综合成绩第一,在 14 个数据集上取得了 stateoftheart 或者第二名的成绩。 Visualglm6B:开源的支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM6B,具有 62 亿参数;图像部分通过训练 BLIP2Qformer 构建起视觉模型与语言模型的桥梁,整体模型共 78 亿参数。 RDM:Relay Diffusion Model,级联扩散模型,可以从任意给定分辨率的图像快速生成,而无需从白噪声生成。
2024-10-16