Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

哪些应用或者是web服务可以使用api

Answer

以下是一些可以使用 API 的应用和 Web 服务:

  1. TMDB 提供了搜索电影的 API,其文档网址为 https://developer.themoviedb.org/reference/search-movie 。在该网站的开发者相关页面或 API 文档中,可获取 API 规则。通过在右上角的认证里能看到 API 读访问令牌,配置文件中包含了如 url、请求方法 get、查询参数 query 和 language 等。输入关键词和相关语言设置,如“奥本海默”和“zh-CN”,点击 Try it 即可获取数据,返回的数据格式为 JSON。
  2. RAG 加速器的数据抽取服务,基于 FastAPI 和 Postgresql 搭建,并提供了标准的 REST API 接口,附带有 docker-compose 文件方便搭建服务环境。该服务支持定义并持久化“抽取器”,包含抽取结构的图式(Schema)、抽取上下文的指令(Prompt)和抽取样例(Reference examples)。此外,提供了提交文件进行抽取的端点和通过 RemoteRunnable 使抽取服务在 LangChain Expression Language(LCEL)链中更易用的端点。预设了基于 MIME 类型的解析器,支持 PDF 和 HTML 文档的解析,还可扩展支持其他文件类型。使用时可通过 JSON 模式定义提取信息、指定样例提升提取结果质量,传入原始文本或二进制文件。

如果您对 Action 很感兴趣,可以从以下方向继续学习:

  1. 系统学习 API 相关知识。
  2. 在网上寻找可用的 API 进行练习。
  3. 发掘 GPT Action 的更多潜力。
Content generated by AI large model, please carefully verify (powered by aily)

References

像高手一样编写 GPT:从基础到实践,学习使用 GPT 的 Action

很简单,去官网找,API的规则一般都会写在网站的开发者相关的页面里或者API文档里,比如你可以从TMDB首页的“更多”进入,其它网站也大同小异。这个Action用到了TMDB的搜索电影API,文档的网址是:https://developer.themoviedb.org/reference/search-movie,下面是这个网址的内容:API文档都会很详细的告诉你如何使用他们的API,在左侧的导航部分你可以看到还有很多其他的API可以使用,我们先忽略,专注到右侧部分,点击图片可以放大。你可以在右上角的认证里看到你的API读访问令牌。也可以看到和我配置文件里相同的部分,包括url,请求方法get(红框),对应需要的查询参数query(蓝框)和language(黄框)。这个API的作用就是:Search for movies by their original,translated and alternative titles.——输入query关键词,如果成功,就会返回符合关键词的电影列表。在右侧RESPONSE(响应)这里也展示了当我们请求后响应的范例。我们可以在左边query输入“奥本海默”,Language填zh-CN,点一下Try it,就会“啪”的一下出来一大堆数据。这种数据格式叫做JSON,你只需要知道这种写法可以让程序很方便的读写就好,看起来有点复杂。——不过你仔细看一下,就会发现这个数据其实和脑图没有太大区别。还记得之前提到的键和值么?可以看到这里面返回了两条结果,是不是有点眼熟?没错,这个API返回的数据,应该和搜索结果页是一样的。只不过网页拿到了这些数据,做了样式的美化展示。

RAG加速器:数据抽取服务

明白了这些基础之后,我们来看看我们的数据抽取服务到底提供了哪些东西?该服务基于FastAPI和Postgresql搭建,并提供了一个标准的REST API接口。同时附带有docker-compose文件,方便你快速搭建服务环境。这个服务以一个基本的Web应用程序模板形态现身,你可以进一步开发扩展,为你的团队成员创建一个便捷的数据抽取应用程序。简而言之,它就是一个帮你开始应用开发的样板。当然,如果你不想做任何开发,也可以直接使用它进行数据抽取流程。该API支持定义并持久化“抽取器”,这些抽取器包含了配置LLM抽取需要的关键部件:一个描述你想从数据中抽取的结构的图式(Schema),一个提供抽取上下文背景并振奋模型的指令(Prompt),以及展示一些抽取样例给模型的样例(Reference examples)。此外,API提供了一个让你提交文件进行抽取的端点,使用已经定义的抽取器,以及另一个通过RemoteRunnable来让抽取服务作为更大LangChain Expression Language(LCEL)链中的一环更容易使用的端点。服务已经预设了基于MIME类型的解析器,并可支持PDF和HTML文档的解析。你还可以扩展该服务以支持其他文件类型(例如,PowerPoint),方法是使用现有的LangChain文档加载器和解析器。设计抽取API时我们作了一个关键决定:设计它总能提取多个实体。通常在文本信息抽取时这是期望的行为,因为这让模型有可能在文字中存在对应信息时抽取多个实体,且在文本中没有相关信息时不会有任何提取动作。你如何实际使用这个服务呢?在上面的基础上,有几个方面是你需要考虑的。你可以使用JSON模式精确定义提取信息,也可以指定需合入的样例来提升提取结果的质量。你既可以在调用API时指定这些参数,也可以将抽取器和样例保存在数据库中,便于保存和分享。在传入文本时,你可以选择传入原始文本或者二进制文件。

像高手一样编写 GPT:从基础到实践,学习使用 GPT 的 Action

总结一下:今天我们的讨论起始于人工智能中的“Agent&Action”,然后转向OpenAI对智能体(Agent)能力模型的定义。接着,我们深入探讨了ChatGPT中的Action(搜索、画图、代码解释器),以及GPT系列中的不同Action。使用了一个容易上手的Action Webpilot,用于访问网页获取实时的文本内容。最后,我们初步了解了API的概念,以及GPT如何通过Action与外部数据进行交互和使用。如果对Action很感兴趣,你可以从以下方向开始继续前进:系统的了解和学习API相关的知识去网上寻找可以用的API来练习发掘GPT Action更多的潜力以上是我认为相对容易入门的知识框架,但是我们都知道:你不可能只在一次分享/一篇文章中就获得完整的Action相关知识学习虽然没有终点,但有阶段性目标。大家可以通过后续看到的不同的教程和资料,识别这些知识之间的共性和逻辑关系,然后继续深化对这个主题的理解,构建你自己的知识体系。如果你对GPT开发有兴趣,想要认识更多玩GPT的朋友,欢迎加入GPTGeeker的星球:

Others are asking
可灵api
ComfyUI GeminiAPI 相关内容如下: 用途:用于在 ComfyUI 中调用 Google Gemini API。 安装说明: 手动安装: 1. 将此存储库克隆到 ComfyUI 的 custom_nodes 目录。 2. 安装所需依赖: 如果使用 ComfyUI 便携版。 如果使用自己的 Python 环境。 通过 ComfyUI Manager 安装: 1. 在 ComfyUI 中安装并打开 ComfyUI Manager。 2. 在 Manager 中搜索“Gemini API”。 3. 点击安装按钮,安装完成后重启 ComfyUI。 节点说明: Gemini 2.0 image:通过 Gemini API 生成图像的节点。 输入参数: prompt(必填):描述想要生成的图像的文本提示词。 api_key(必填):Google Gemini API 密钥(首次设置后会自动保存)。 model:模型选择。 width:生成图像的宽度(512 2048 像素)。 height:生成图像的高度(512 2048 像素)。 temperature:控制生成多样性的参数(0.0 2.0)。 seed(可选):随机种子,指定值可重现结果。 image(可选):参考图像输入,用于风格引导。 输出: image:生成的图像,可以连接到 ComfyUI 的其他节点。 API Respond:包含处理日志和 API 返回的文本信息。 使用场景: 创建独特的概念艺术。 基于文本描述生成图像。 使用参考图像创建风格一致的新图像。 基于图像的编辑操作。 API key 获取:在 Google 的 AI Studio 申请一个 API key(需要网络环境),有免费的额度,访问 https://aistudio.google.com/apikey?hl=zhcn 。 温度参数说明:温度值范围为 0.0 到 2.0,较低的温度(接近 0)生成更确定性、可预测的结果,较高的温度(接近 2)生成更多样化、创造性的结果,默认值 1.0 平衡确定性和创造性。 注意事项: API 可能有使用限制或费用,请查阅 Google 的官方文档。 图像生成质量和速度取决于 Google 的服务器状态和您的网络连接。 参考图像功能会将您的图像提供给 Google 服务,请注意隐私影响。 首次使用时需要输入 API 密钥,之后会自动存储在节点目录中的 gemini_api_key.txt 文件中。
2025-04-14
grok API能用在什么软件上
Grok API 可以用在以下软件上: 1. 扣子工作流:可以用代码模块进行 HTTP 访问,实现 0 token 脱离扣子模型来使用 Groq 作为 LLM,还能参考相关教程将扣子接入微信机器人,但有微信封号风险。 2. 沉浸式翻译:由于 Groq 的 API 与 OpenAI 的 API 几乎兼容,可以适配到任何 APP 产品可以用来填 APIKEY 调用的场景,比如沉浸式翻译这个网页翻译工具。 3. 手机类 APP:比如通过快捷方式接入 Siri。 此外,xAI 发布的 Grok 3 API 提供了多个模型版本,如 grok3beta、mini、fast 等,满足不同场景需求,上下文窗口达 131K,支持图像输入输出,但当前不支持联网或实时访问外部网页与数据。
2025-04-12
deepseek api
Jina DeepSearch 是一项基于推理大模型的深度搜索服务,其 API 已上线且开源。它可以在搜索时进行不断推理、迭代、探索、读取和归纳总结,直到找到最优答案为止。与 OpenAI 和 Gemini 不同,Jina DeepSearch 专注于通过迭代提供准确的答案,而不是生成长篇文章。它针对深度网络搜索的快速、精确答案进行了优化,而不是创建全面的报告。 使用入口:官方深度搜索 API 与 OpenAI API 架构完全兼容,您可以前往官网(jina.ai/deepsearch)了解详情;或者前往应用页面(search.jina.ai)体验。 此外,北京时间 00:30 至 08:30 期间,DeepSeek API 价格大幅下调。DeepSeekV3 降至原价的 50%,DeepSeekR1 低至 25%,鼓励用户在夜间空闲时段调用 API,以更低成本享受服务。
2025-03-30
api
以下是关于 API 的相关信息: ComfyUI GeminiAPI: 用于在 ComfyUI 中调用 Google Gemini API。 安装说明: 手动安装:将存储库克隆到 ComfyUI 的 custom_nodes 目录,安装所需依赖(根据使用的 ComfyUI 版本有所不同)。 通过 ComfyUI Manager 安装:在 ComfyUI 中安装并打开 ComfyUI Manager,搜索“Gemini API”并点击安装按钮,安装完成后重启 ComfyUI。 节点说明: Gemini 2.0 image:通过 Gemini API 生成图像的节点。输入参数包括必填的 prompt、api_key,可选的 model、width、height、temperature、seed、image 等。输出包括生成的图像和 API Respond。使用场景包括创建独特的概念艺术、基于文本描述生成图像、使用参考图像创建风格一致的新图像、基于图像的编辑操作。 API 与速率限制: 速率限制是 API 对用户或客户端在指定时间内访问服务器的次数施加的限制。 速率限制的原因包括防止滥用或误用 API、确保公平访问、管理基础设施负载等。 OpenAI 的 API 提供商在 API 使用方面有限制和规定,不同用户类型可获得不同的速率限制,若请求超过限制将返回错误响应。 关于 API 的一般性描述: API 就像是一个信差,接受一端的请求,告诉系统用户想要做的事情,然后把返回的信息发回。 学习使用 GPT 的 Action 工作流包括:确定想要的 GPT 及是否需要外部数据,寻找 API 文档或开发 API 以及编写 Action 里的 Schema 和 Prompt。 对 Action 感兴趣可以从系统了解和学习 API 相关知识、在网上寻找可用的 API 练习、发掘 GPT Action 更多潜力等方向继续前进。
2025-03-29
API是什么意思有什么用
API 是应用程序编程接口(Application Programming Interface)的缩写。它是软件之间进行交互和数据交换的接口,使得开发者能够访问和使用另一个程序或服务的功能,而无需了解其内部实现的详细信息。 API 就像是一个信差,接受一端的请求,告诉那边的系统您想要做的事情,然后把返回的信息发回给您。 APIKey 是一种实现对 API 访问控制的方法,通常是一串字符串,用于身份验证和访问控制。当开发者或应用程序尝试通过 API 与另一个程序或服务交互时,APIKey 作为请求的一部分被发送,以证明请求者具有调用该 API 的权限。APIKey 帮助服务提供商识别调用者身份,监控和控制 API 的使用情况,以及防止未经授权的访问。 要使用 API,通常需要去官网寻找 API 文档,API 的规则一般会写在网站的开发者相关页面或 API 文档里。例如,TMDB 的搜索电影 API 文档的网址是:https://developer.themoviedb.org/reference/searchmovie 。在 API 文档中,会详细告知如何使用相应的 API,包括请求方法、所需的查询参数等。您可以在文档中进行相关配置和操作。 登录网站寻找 Apikeys 创建新的密钥(记得保存好、不要泄露)。使用 APIKEY 可能需要单独充值,一共有两种模式可以使用: 1. 使用官方的 key 网站:https://platform.openai.com/apikeys 创建好您的 key 后记得复制保存。 2. 如果觉得充值比较麻烦可以考虑用第三方的网站:https://www.gptapi.us/register?aff=WLkA ,这个充值起来方便一些,模型选择也可以多一些。
2025-03-29
哪个大模型的API接口免费?
以下是一些提供免费 API 接口的大模型: 1. Silicon 硅基接口:有众多开源模型(Yi、Qwen、Llama、Gemma 等)免费使用,还赠送 14 元体验金,有效期未知。注册和使用地址为,邀请码:ESTKPm3J。注册登录后,单击左边栏的 API 密钥,单击新建 API 密钥,单击密钥即可完成 API 密钥的复制。它支持多种大模型,也支持文生图、图生图、文生视频。 2. 智普 GLM4 接口:在 BigModel.cn 上通过专属邀请链接注册即可获得额外 GLM4Air 2000 万 Tokens 好友专属福利。进入个人中心,先完成实名认证,再单击左边栏 API KEYS 或右上角的 API 密钥,进入后单击右上角的添加 API,鼠标移至密钥上方,单击复制即可得到智普的 API key。 3. 阿里的通义千问大模型:打开链接,创建个 API key。 4. 智谱 AI(ChatGLM):有免费接口。 5. 科大讯飞(SparkDesk):有免费接口。 此外,谷歌的 Gemini 大模型(gemini 1.5)和海外版 Coze 的 GPT4 模型是免费的,但需要给服务器挂梯子。
2025-03-28
I'm a beginer of AI learning. This is the first time I explore this website - Wayto AGI. I just wonder how I can start my journey of AI learning by using this website. Could you give me a plan or some suggestions?
以下是为您提供的新手学习 AI 的计划和建议: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 一定要掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。 另外,《雪梅 May 的 AI 学习日记》中提到,在学习 AI 时,要进行系统性的学习,打好基础。比如一开始就去系统地看几本书,听几门好课。May 还分享了自己加入 AI 社区:waytoAGI 的经历,认为这是一个宝藏社区,您可以看看这个社区的新手指引,怎么入门,比如 。
2025-04-09
comfyUI和webUI的区别
ComfyUI 和 WebUI 的区别主要体现在以下几个方面: ComfyUI: 简介:是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI,将 stable diffusion 的流程拆分成节点,实现更精准的工作流定制和完善的可复现性。 优势: 对显存要求相对较低,启动速度快,出图速度快。 具有更高的生成自由度。 可以和 WebUI 共享环境和模型。 可以搭建自己的工作流程,可以导出流程并分享给别人,报错时能清晰发现错误所在步骤。 生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势: 操作门槛高,需要有清晰的逻辑。 生态没有 WebUI 多(常用的都有),但也有一些针对 ComfyUI 开发的有趣插件。 官方链接:从 github 上下载作者部署好环境和依赖的整合包,按照官方文档安装即可:https://github.com/comfyanonymous/ComfyUI 插件推荐: 插件安装管理器:https://github.com/ltdrdata/ComfyUIManager SDXL 风格样式:https://github.com/twri/sdxl_prompt_styler ComfyUI 界面汉化:https://github.com/AIGODLIKE/AIGODLIKECOMFYUITRANSLATION 中文提示词输入:https://github.com/AlekPet/ComfyUI_Custom_Nodes_AlekPet 蟒蛇八卦工具箱:https://github.com/pythongosssss/ComfyUICustomScripts 提示词权重调节器:https://github.com/BlenderNeko/ComfyUI_AD WebUI: 采样器与调度器:在 ComfyUI 中,采样器与调度器分开,而在 WebUI 中的采样方法是把两者合并在一起。ComfyUI 通过采样器+调度器组合的方式与 WebUI 中的一致,一般选择 karras 调度器效果较好。 在插件安装方面,WebUI 有较好的用户界面,安装插件后可直观看到并使用;而 ComfyUI 安装插件后可能看不到,需通过节点连接才能感受到其功能。
2025-03-12
any recommendation for using AI to create my own website
以下是一些使用 AI 创建自己网站的建议和推荐: Bard 建议使用“给 AI 下具体设计任务”的方式,而不是简单地“要求 AI 直接输出内容”。这可以让 AI 更好地发挥创造力,同时也便于人类对最终输出进行检查和修改。 设计网站 logo 时,应保持简单易记,使用相关符号或图标,选择与技术和信任相关的颜色(如蓝色、绿色、白色),使用一致的字体,并获取他人的反馈。 利用 AI 创建网站时,通过与 AI 交互输入需求可快速创建网站,发布后会获得网址。 代码下载后可能复制容易但修改不易,有的工具可选中特定版块修改,有的则需整体重写。 网站修改的方法如通过浏览器开发者工具修改 logo,可替换图片或删除后上传同名图片。 推荐的网页原型图生成工具包括: 即时设计:https://js.design/ ,是一款可在线使用的「专业 UI 设计工具」,为设计师提供更加本土化的功能和服务,相较于其他传统设计工具,更注重云端文件管理、团队协作,并将设计工具与更多平台整合,一站搞定全流程工作。 V0.dev:https://v0.dev/ ,Vercel Labs 推出的 AI 生成式用户界面系统。每个人都能通过文本或图像生成代码化的用户界面。它基于 Shadcn UI 和 Tailwind CSS 生成复制粘贴友好的 React 代码。 Wix: ,是一款用户友好的 AI 工具,可让您在没有任何编码知识的情况下轻松创建和自定义自己的网站,提供广泛的模板和设计供您选择,以及移动优化和集成电子商务功能等功能。Wix 建站工具通过拖放编辑、优秀模板和 250 多种 app,能帮助不同领域的用户创建所有种类的网站。 Dora:https://www.dora.run/ ,使用 Dora AI,可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。支持文字转网站,生成式 3D 互动,高级 AI 动画。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-08
我想让cursor帮我编程一个能在Android studio编译的Android应用,它的主要功能是接受esp32通过websocket协议发送过来的opus数据,保存opus并把数据转换成wav,再使用sherpa-onnx语音识别成文字。我该使用什么提示词让cursor帮我写出这个Android应用?
很抱歉,目前没有适用于让 Cursor 生成您所需 Android 应用的特定提示词。编写这样一个复杂的 Android 应用需要对 Android 开发、网络通信、音频处理和语音识别等多个领域有深入的了解和专业知识。您可能需要逐步向 Cursor 描述应用的架构、各个模块的功能和实现逻辑,例如先描述如何建立与 ESP32 的 WebSocket 连接,如何接收和处理 Opus 数据,如何进行数据转换以及如何调用 Sherpaonnx 进行语音识别等。但需要注意的是,仅仅依靠提示词让 Cursor 生成完整可用的复杂应用可能具有一定的局限性,建议您在具备相关基础知识的前提下,结合 Cursor 的辅助来逐步完成开发。
2025-03-06
我想让cursor帮我编程一个能在Android studio编译的Android应用,它的主要功能是接受esp32通过websocket协议发送过来的opus数据,保存opus并把数据转换成wav,再使用sherpa-onnx语音识别成文字。我该使用什么提示词让cursor帮我写出这个Android应用?
很抱歉,目前没有关于使用 Cursor 生成您所需的这种特定 Android 应用的提示词的相关内容。一般来说,您可以向 Cursor 提供以下关键信息作为提示词的参考: 1. 明确应用的功能需求,如“编写一个在 Android Studio 中编译的 Android 应用,用于接收 ESP32 通过 WebSocket 协议发送的 Opus 数据,保存 Opus 并转换为 WAV 格式,然后使用 Sherpaonnx 进行语音识别成文字。” 2. 描述应用的技术架构和关键技术点,例如“应用需基于 Android 平台,使用合适的网络库处理 WebSocket 连接,采用有效的数据存储方式保存 Opus 数据,利用特定的音频转换库将 Opus 转换为 WAV,以及集成 Sherpaonnx 语音识别库实现文字转换。” 3. 提及开发环境和工具要求,比如“在 Android Studio 开发环境中,遵循 Android 应用开发规范和最佳实践。” 但需要注意的是,Cursor 生成的代码可能并不完全满足您的需求,还需要您进行进一步的修改和完善。
2025-03-06
comfyUi与webui的区别
ComfyUI 与 WebUI 的区别如下: ComfyUI 简介: 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI,可想象成集成了 stable diffusion 功能的 substance designer,将流程拆分成节点,实现更精准工作流定制和完善的可复现性。 优势: 对显存要求相对较低,启动和出图速度快。 生成自由度更高。 可以和 WebUI 共享环境和模型。 能搭建自己的工作流程,可导出流程并分享,报错时能清晰发现错误所在。 生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势: 操作门槛高,需要清晰逻辑。 生态不如 WebUI 丰富,但也有针对其开发的有趣插件。 官方链接:https://github.com/comfyanonymous/ComfyUI 采样器与调度器: 在 ComfyUI 中,采样器与调度器分开,不同于 WebUI 中将两者合并。ComfyUI 通过采样器+调度器组合的方式与 WebUI 中的一致,选择 karras 调度器一般效果较好。 插件: 插件安装管理器:https://github.com/ltdrdata/ComfyUIManager SDXL 风格样式:https://github.com/twri/sdxl_prompt_styler ComfyUI 界面汉化:https://github.com/AIGODLIKE/AIGODLIKECOMFYUITRANSLATION 中文提示词输入:https://github.com/AlekPet/ComfyUI_Custom_Nodes_AlekPet 蟒蛇八卦工具箱:https://github.com/pythongosssss/ComfyUICustomScripts 提示词权重调节器:https://github.com/BlenderNeko/ComfyUI_AD 在 WebUI 中安装插件能直观看到并使用,因其有良好用户界面;而 ComfyUI 安装插件后可能看不到,需通过节点连接感受其功能,安装方法是将解压好的文件夹放入“E:\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes”目录,然后重新启动。
2025-03-06
多模态应用
以下是一些多模态应用的案例: 1. 电商领域: 拍立淘:由淘宝推出,用户拍照即可识别商品并直接进入购物页面,简化购物搜索步骤。 探一下:支付宝推出的图像搜索引擎,拍照后 AI 能识别并搜索相关商品或信息。 2. 创意领域: 诗歌相机:拍照能生成一首诗,还能打印,将诗意与现代技术结合,并做成硬件形式。 3. 技术平台: 阿里云百炼大模型平台为企业侧提供各种原子级别能力,包括多模态能力。 4. 其他应用场景: 融图:如把图二中的机器人合成到图一的环境中,保持比例、细节、光影和氛围感统一。 小红书风格卡片:使用特定风格生成关于特定内容的卡片。 Logo 转 3D 效果:将图标改成 3D 立体、毛玻璃、毛绒等效果。 示意图转卡通漫画:把示意图转成幼儿园小朋友能看懂的漫画并配中文说明。 遥感理解(图像数据):识别图中的建筑物并用色块标注。 包装图直出效果:生成图片对应的包装侧面效果图。 参考生成海报图:参考小红书封面生成 PPT 设计相关封面图。 三维建模模拟:将图片转化为 3D max 建模渲染界面并加入 UI 界面。 手办三视图:保留人物样貌、神态,制作成特定要求的 3D 手办三视图。
2025-04-18
金融业相关AI应用场景或AI技术介绍
在金融业中,AI 有以下应用场景和技术: 1. 风控和反欺诈:用于识别和阻止欺诈行为,降低金融机构的风险。 2. 信用评估:评估借款人的信用风险,帮助金融机构做出更好的贷款决策。 3. 投资分析:分析市场数据,辅助投资者做出更明智的投资决策。 4. 客户服务:提供 24/7 的客户服务,回答客户常见问题。 例如,Hebbia 获得近 1 亿美元 B 轮融资,其 AI 技术能够一次处理多达数百万份文档,在短时间内浏览数十亿份包括 PDF、PowerPoint、电子表格和转录内容等,并返回具体答案,主要面向金融服务公司,如对冲基金和投资银行,同时也适用于律师事务所等其他专业领域。
2025-04-15
结构化思维在AI办公里的应用
结构化思维在 AI 办公中有以下应用: 在 Model Context Protocol 托管平台中: 特色功能方面,Sequential Thinking 提供动态和反思性问题解决的结构化思维过程,适用于复杂问题分析和决策。 核心功能分类包括笔记管理工具(如 Simple Notes MCP Server、Bear MCP Server、Notion 集成)、AI 对话工具(如 Autonomous Coder Agent、OpenAI 兼容 API 集成)、Google Workspace 集成(如 Gmail 和 Google Calendar 集成、多账户管理、邮件搜索和撰写、日历事件管理)、学术研究工具(如 Semantic Scholar 集成、PubMed 搜索、arXiv 论文访问、IACR 密码学文献库访问)、AI 数据库管理(如 MySQL Server 集成、知识图谱记忆服务、DuckDB 集成、Airtable 集成)。 面对 AI 幻觉问题时,可使用结构化思考工具辅助判断,如决策矩阵用于面对多个选择时做出更理性的决策,检查清单用于执行复杂任务时确保每个步骤按计划完成,风险评估模型用于做重要决策时分析不同方案的风险并制定应对措施。 在让 AI 像人类一样思考方面,构建逻辑体感轮子,包括逻辑推理功能和内容抽象功能。内容抽象功能能够高效地组织内容,体现结构化思维,通过心智单元的抽象思维高效地组织复杂任务。
2025-04-14
公共议题:AI如何助力HR业务? 研讨目标: 深入理解:深入探讨 AI在人力资源管理领域的应用、薪酬管理、员工关系、公司文化、包括人才获取与配置、学习与发展、组织与人才培、HR共享与HRIS等各模块的可应用场景 机会识别与场景落地:基于组织现状,识别出业务价值高、可落地的 A 应用场景; 研讨成果(输出物): 请输出10个业务价值高、具备可行性的AI应用场景介绍,并说明what(场景是什么)、why(为什么值得做)、How(如何落地);
以下是为您生成的 10 个业务价值高、具备可行性的 AI 应用场景介绍: 1. 人才招聘与筛选 What:利用 AI 技术对求职者的简历进行自动筛选和分析,评估其与岗位的匹配度。 Why:节省 HR 大量的时间和精力,提高招聘效率和准确性。 How:通过自然语言处理和机器学习算法,训练模型识别关键信息和技能。 2. 员工培训与发展 What:根据员工的技能水平和职业发展目标,定制个性化的培训计划。 Why:提升员工的能力和绩效,增强员工对企业的忠诚度。 How:利用大数据分析员工的工作表现和学习需求,推荐相关课程和学习资源。 3. 薪酬福利管理 What:运用 AI 预测市场薪酬趋势,为企业制定合理的薪酬策略。 Why:保持企业薪酬的竞争力,吸引和留住优秀人才。 How:收集和分析行业薪酬数据,结合企业的财务状况和战略目标进行优化。 4. 员工绩效评估 What:借助 AI 实时监测员工的工作表现,提供客观的绩效评估。 Why:减少人为偏差,确保评估的公正性和准确性。 How:利用工作流程数据和行为分析模型进行评估。 5. 员工关系管理 What:通过 AI 分析员工的情绪和满意度,及时发现问题并解决。 Why:营造良好的工作氛围,提高员工的工作积极性和创造力。 How:使用情感分析技术处理员工的反馈和交流信息。 6. 组织架构优化 What:利用 AI 分析企业的业务流程和人员配置,提供组织架构调整建议。 Why:提高企业的运营效率和灵活性,适应市场变化。 How:基于数据分析和模拟优化算法进行评估和推荐。 7. 人力资源规划 What:根据企业的战略目标和业务发展预测人力资源需求。 Why:提前做好人才储备和招聘计划,保障企业的正常运营。 How:运用数据分析和预测模型进行规划。 8. 企业文化传播 What:使用 AI 生成个性化的企业文化宣传内容,提高传播效果。 Why:增强员工对企业文化的认同感和归属感。 How:利用自然语言生成技术和个性化推荐算法。 9. 智能客服 What:在 HR 服务中引入 AI 客服,解答员工常见问题。 Why:快速响应员工需求,提高服务质量。 How:训练智能客服模型,涵盖常见的 HR 问题和解决方案。 10. 人才库管理 What:利用 AI 对人才库进行分类和更新,提高人才库的利用效率。 Why:方便快速找到合适的人才,降低招聘成本。 How:运用数据挖掘和分类算法进行管理。
2025-04-14
公共议题:AI如何助力HR业务? 研讨目标: 深入理解:深入探讨 AI在人力资源管理领域的应用、薪酬管理、员工关系、公司文化、包括人才获取与配置、学习与发展、组织与人才培、HR共享与HRIS等各模块的可应用场景 机会识别与场景落地:基于组织现状,识别出业务价值高、可落地的 A 应用场景; 研讨成果(输出物): 请输出3-5个业务价值高、具备可行性的AI应用场景介绍,并说明what(场景是什么)、why(为什么值得做)、How(如何落地);
以下是为您提供的 3 个业务价值高、具备可行性的 AI 应用场景介绍: 场景一:AI 在企业招聘中的应用 What:利用 AI 技术进行简历筛选、人才匹配和面试评估。 Why:能够快速处理大量简历,提高招聘效率和准确性,节省人力和时间成本,同时更精准地找到符合岗位需求的人才。 How:通过引入相关的 AI 招聘软件,与企业现有的招聘系统集成,对简历进行关键词提取和分析,利用机器学习算法进行人才匹配,并通过视频面试中的语音和表情分析辅助评估候选人。 场景二:AI 助力个性化人力资源管理 What:根据员工的个人特点和工作表现,提供个性化的培训计划、职业发展建议和绩效评估。 Why:能够充分发挥员工的潜力,提高员工满意度和忠诚度,促进企业的长期发展。 How:收集员工的工作数据、学习记录和绩效表现等信息,运用 AI 算法进行分析和预测,为员工制定专属的发展方案,并通过移动应用或内部系统向员工推送相关建议和培训课程。 场景三:AI 打造无人值守的 HR 平台 What:实现 HR 业务的自动化处理,如员工请假审批、薪酬计算和福利发放等。 Why:减少人工操作的错误和繁琐流程,提高 HR 工作的效率和准确性,使 HR 人员能够专注于更有价值的战略工作。 How:整合企业内部的各种 HR 系统和数据,利用 RPA 和 AI 技术实现流程的自动化,同时建立监控和预警机制,确保平台的稳定运行。
2025-04-14
飞书+AI的应用案例
以下是飞书+AI的应用案例: 在企业运营方面,包括日常办公文档材料撰写整理、营销对话机器人、市场分析、销售策略咨询,以及法律文书起草、案例分析、法律条文梳理和人力资源简历筛选、预招聘、员工培训等。 在教育领域,协助评估学生学习情况,为职业规划提供建议,针对学生情况以及兴趣定制化学习内容,论文初稿搭建及论文审核,帮助低收入国家/家庭通过 GPT 获得平等的教育资源。 在游戏/媒体行业,有定制化游戏、动态生成 NPC 互动、自定义剧情、开放式结局,出海文案内容生成、语言翻译及辅助广告投放和运营,数字虚拟人直播,游戏平台代码重构,AI 自动生成副本。 在零售/电商领域,包括舆情、投诉、突发事件监测及分析,品牌营销内容撰写及投放,自动化库存管理,自动生成或完成 SKU 类别选择、数量和价格分配,以及客户购物趋势分析及洞察。 在金融/保险行业,有个人金融理财顾问、贷款信息摘要及初始批复、识别并检测欺诈活动风险、客服中心分析及内容洞。 线下活动方面: 活动宣传:用飞书文档制作活动宣传页面,用 AI 快速制作海报,用 GPTs 写人员分配和主持人台词,活动从策划到开始仅用 2 天时间。 活动报名:使用飞书的多维表格完成报名表及数据统计。 活动过程:大家在线协同,一起编辑文档,演示时共同展示一个文档。 活动记录:有相关的记录页面。 办活动的初衷是宣扬 AI 不只是降本增效的工具,还有很多乐趣等待挖掘,例如大理户外圆桌讨论、清迈的 AI 逛古城、杭州的 AI 玄学小组。
2025-04-13
如何本地部署大模型,如何选择是否使用云服务商
以下是关于本地部署大模型以及选择是否使用云服务商的相关内容: 本地部署大模型的主要步骤: 1. 选择合适的部署方式,包括本地环境部署、云计算平台部署、分布式部署、模型压缩和量化、公共云服务商部署等,根据自身的资源、安全和性能需求进行选择。 2. 准备训练所需的数据和计算资源,确保有足够的训练数据覆盖目标应用场景,并准备足够的计算资源,如 GPU 服务器或云计算资源。 3. 选择合适的预训练模型作为基础,可以使用开源的预训练模型如 BERT、GPT 等,也可以自行训练一个基础模型。 4. 针对目标任务进行模型微调训练,根据具体应用场景对预训练模型进行微调训练,优化模型结构和训练过程以提高性能。 5. 部署和调试模型,将训练好的模型部署到生产环境,对部署的模型进行在线调试和性能优化。 6. 注意安全性和隐私保护,大模型涉及大量数据和隐私信息,需要重视安全性和合规性。 以 SDXL 为例的本地部署步骤: 1. SDXL 的大模型分为两个部分,base+refiner 是必须下载的,base 是基础模型,用于文生图操作;refiner 是精炼模型,用于对生成的模型进行细化,生成细节更丰富的图片。还有一个配套的 VAE 模型,用于调节图片的画面效果和色彩。 2. 想要在 webUI 中使用 SDXL 的大模型,首先要在秋叶启动器中将 webUI 的版本升级到 1.5 以上。 3. 将模型放入对应的文件夹中,base 和 refiner 放在“……\\sdwebuiakiv4.2\\models\\Stablediffusion”路径下;vae 放在“……\\sdwebuiakiv4.2\\models\\VAE”路径下。完成之后,启动 webUI,就可以在模型中看到 SDXL 的模型。 以 LLM 大语言模型为例的本地部署步骤: 1. 下载并安装 Ollama,点击进入根据电脑系统下载 Ollama:https://ollama.com/download ,下载完成后,双击打开,点击“Install”,安装完成后,将下方地址复制进浏览器中。如果出现下方字样,表示安装完成:http://127.0.0.1:11434/ 。 2. 下载 qwen2:0.5b 模型(0.5b 是为了方便测试,下载快,自己设备充足的话,可以下载更大的模型)。如果是 windows 电脑,点击 win+R,输入 cmd,点击回车;如果是 Mac 电脑,按下 Command(⌘)+Space 键打开 Spotlight 搜索,输入“Terminal”或“终端”,然后从搜索结果中选择“终端”应用程序。复制相关命令行,粘贴进入,点击回车,等待下载完成。 总的来说,部署大模型需要综合考虑多方面因素,包括部署方式、数据准备、模型训练、部署调试以及安全性等。需要根据具体需求选择合适的方法,并注意优化各个环节以提高模型性能和应用效果。
2025-04-14
AI服务器配置
以下是关于 AI 服务器配置的相关内容: 对于 Coze AI 机器人对接微信的服务器配置: 1. 如果按照上一篇教程操作,此次配置只需修改容器编排模板。最新的容器编排模板如下,同时提供无描述性的参考配置方便新手直接参考使用。 2. 若之前没有容器编排模板,新建一个即可,新建和修改逻辑类似。 3. 更新后的编排模板,若之前创建过相似机器人容器编排服务,建议先删除以防冲突,删除步骤如下。 4. 基于新的编排模板创建新的容器编排,然后启动服务。 5. 服务启动成功后,进入 COW 服务扫码绑定微信机器人,具体步骤参考上一篇入门教程。 对于视频相关的 AI 服务器配置: 1. 购买服务器:直接点击去购买:https://buy.cloud.tencent.com/lighthouse?blueprintType=APP_OS&blueprintOfficialId=lhbpr8j2ftq0&regionId=8&zone=apbeijing3&bundleId=bundle_rs_mc_med1_02&loginSet=AUTO&from=lhconsole ,并根据以下配置购买。 2. 购买并付款完成后,回到服务器“控制台”。 3. 点击服务器卡片空白处添加防火墙,添加 8887、8080 端口。 4. 点击右上角“登录”按钮,扫码验证后在命令行窗口中操作,注意复制粘贴代码的方式和命令执行完毕的标志。 5. 在命令行中依次输入相关命令。 6. 保存并打开外网面板地址,输入账号和密码。
2025-04-10
如何利用AIGC技术给企业提供咨询服务
利用 AIGC 技术为企业提供咨询服务可以从以下几个方面入手: 1. 招募具备实战经验的 AI 讲师与咨询专家:工信部大数据产业人才基地依托丰富的企业渠道资源,计划为传统行业客户提供 AI 技术培训、场景化咨询与解决方案落地服务,并面向社区招募相关人才。 2. 开展公开课:针对 B 端渠道持续展开公益科普,形式免费,部分渠道有一定经费,内容为企业端的 AI 应用场景案例和 AI 通识类的科普分享,目的是建立与企业渠道之间的信任,构建收费培训/咨询的转化通道。 3. 组织线下培训:通过培训转化或直接招生,开设两天一夜、三天两夜的培训班,一般 50 人以上开班,建议 100 人。 4. 提供咨询陪跑服务:包括 AI 营销能力搭建,企业客服机器人搭建、企业端内容分析智能体搭建、企业运营数据大盘搭建、无人直播/数字人直播间搭建等。 此外,一些成功的案例和产品也可供参考: 1. 为阿里妈妈、阿里国际、搜狗、途虎、太平洋保险、哔哩哔哩、滴滴、百度金融、浦发银行、花旗银行、振华重工、中国电信、中国移动、中兴通讯、SMG 等企业提供设计咨询与训练。 2. Runway 上线文字生成语音功能,英文效果好,中文存在外国人口音问题,功能可选择语音模型多。 3. Delphi 可以将个人的所有视频、播客、PDF、博客文章等信息训练为一个分身,并能用分身对外提供咨询服务,支持文字、语音甚至视频沟通,还支持对话内容的数据分析以优化交流。 4. Osum 是一款人工智能市场研究工具,可通过按下按钮获取产品或企业的详细研究、SWOT 分析、买家人物画像、增长机会等信息,还提供销售前景分析器,并能在几秒钟内为任何商务或产品提供完整 SWOT 分析。
2025-04-01
mcp服务是什么
MCP(模型上下文协议)是一项创新标准,由 Anthropic 于 2024 年 11 月推出并开源。它是为 AI 模型统一连接数据与工具的标准接口,旨在让大语言模型能够无缝连接至第三方的数据源。 MCP 的好处包括: 简化开发:一次整合,多次复用,不再重复开发。 灵活性强:轻松切换 AI 模型或工具,无需复杂的重新配置。 实时互动:长连接保证数据实时更新。 安全可靠:内置标准化安全和权限控制。 扩展性强:AI 系统扩展时,只需连接新的 MCP 服务器。 MCP 与传统 API 的关键区别在于: 单一协议:MCP 像一个统一接口,只要一次整合,就能连接多个服务。 动态发现:AI 模型能自动识别并使用可用的工具,不用提前写死每个接口。 双向通信:MCP 支持类似 WebSockets 的实时双向通信,模型不仅能查询数据,还能主动触发操作。 传统 API 更适合的场景包括: 需要细粒度控制、功能严格限制。 更偏好紧耦合以提升性能。 希望最大化交互的可预测性。 快速集成 MCP 的步骤: 1. 定义能力:明确 MCP 服务器提供的功能。 2. 实现 MCP 层:按照协议标准进行开发。 3. 选择通信方式:本地连接(标准输入输出)或远程连接(如 WebSockets)。 4. 创建资源/工具:开发或连接数据源和服务。 5. 建立客户端连接:与 MCP 服务器建立安全稳定的连接。 通过 MCP,我们可以让 AI 使用各种强大工具,比如查询实时天气、联网搜索最新信息、调用私人数据库等。
2025-03-27
我公司想部署一个deepseek-R1,用云服务器请问大概需要多少钱?
部署 DeepSeekR1 模型使用云服务器的价格因云计算厂商而异: 华为昇腾社区:部署 DeepSeekR1 模型用 BF16 权重进行推理至少需要 4 台 Atlas 800I A2(864G)服务器,用 W8A8 量化权重进行推理则至少需要 2 台 Atlas 800I A2。服务器调用 Docker 下载部署权重资源,非 API 调用模式。 阿里云(人工智能平台 PAI):以 R1 为例,所需计算资源价格 316.25/小时。模型部署成在线服务,在人工智能平台 PAI 下的模型部署下的模型在线服务 EAS。 阿里云(阿里云百炼):免费额度:10000000/10000000,通过 API 调用。 腾讯云(自建服务器):多机分布式部署,节点数量:2 个,单节点配置:HCCPNV6 机型,可在线体验(需开通 T1 平台服务)。 腾讯云(调用 API):API 调用 DeepSeek 系列模型限时免费。即日起至北京时间 2025 年 2 月 25 日 23:59:59,所有腾讯云用户均可享受 DeepSeekV3、DeepSeekR1 模型限时免费服务,单账号限制接口并发上限为 5。在此之后,模型价格将恢复至原价。 京东云:“deepseekr1:1.5b、“deepseekr1:7b”、“deepseekr1:32b”,1.89/小时起;服务器部署的方式。 gitee ai:R1 价格 0.1 元/次,基于沐曦曦云 GPU 及曦源一号国产替代算力集群,有在线体验。 需要注意的是,价格可能会有所变动,具体以各云计算厂商的最新公布为准。
2025-03-25
可以为我找到在线更换图片颜色服务的AI网站吗
以下是一些可以在线更换图片颜色服务的 AI 网站相关信息: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,能在显存不够的情况下将图片放大到足够的倍数。 在最近新上线的 controlnet 模型中,Recolor 新模型可将黑白图片重新上色。 对于人物照片还原,可选择 realisian 的写实大模型,通过提示词描述颜色和对应内容,如黑色的头发、黄色的皮肤、深蓝色的衣服、浅蓝色的背景等。ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 您可以通过以下网址获取更详细内容:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw
2025-03-25