直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
“AI治理与法律”的维度
以下是关于“AI 治理与法律”维度的相关内容: 在全球范围内,对于 AI 的立法、监管、伦理讨论大范围落后于技术发展。 美国方面,对于中国的硬件科技限制进一步升级。最先进的 AGI 世界模型不开源,开源模型会落后闭源一个代际,但会服务更广泛的各种专业应用。AGI 将对全行业科技发展起到推动作用,有更好 AGI 的国家会有更快的全面技术进步。 欧洲是目前唯一对 AI 治理有一定讨论的地区,但也大多停留在纸面。 英国的情况是,AI 可能增加不公平偏见或歧视的风险,可能会削弱公众对 AI 的信任。产品安全法确保在英国制造和投放市场的商品是安全的,特定产品的立法可能适用于一些包含集成 AI 的产品,但 AI 技术的特定安全风险应密切监测。消费者权利法可能在消费者签订基于 AI 的产品和服务销售合同时提供保护。 欧盟方面,自 1956 年“人工智能”概念提出后,其理论范围和技术方法不断扩展。2021 年《AI 法案》提案对人工智能的定义更宽泛,而 2022 年《AI 法案》妥协版本中,欧盟理事会及欧洲议会认为“AI 系统”的定义范围应适当缩窄,并侧重强调机器学习的方法。 我国相关法规讨论的出发点完全在于“对于舆论的影响”,根本没有触及 AGI 本身的伦理问题,决策路径大概是政治>经济>>AI 伦理。
2024-10-01
网站内的agi工具,是在手机上用还是在电脑上运用
目前在 AI 领域,网站内的 AGI 工具在手机和电脑上的运用情况如下: 手机和 PC 厂商如华为、荣耀、小米、OPPO、VIVO、三星、联想等都已宣布会在手机/PC 端侧搭载大模型。但仔细看来,除了很弱的 Nvidia Chat with RTX,目前并没有真正全离线版的大模型产品,端上智能暂时还是噱头。手机和电脑厂商们的打法基本都是大模型还是放在线上,手机和电脑来调用,然后搭配一个小 AI 做总结等服务。 短期内的端上智能仍然会停留在一些个别小市场里,原因包括:离线小模型永远都会和在线大模型有一个代际的能力差距;即使是小模型,其目前的耗能和生热仍然难以达到手机要求;目前的 AI 还不是刚需,猎奇成分比较多;技术上还不能确认小型化的模型是“真 AGI”还是“聊天机器”。 同时,为您推荐一些在线 TTS 工具: Eleven Labs:https://elevenlabs.io/ ,是一款功能强大且多功能的 AI 语音软件,使创作者和出版商能够生成逼真、高品质的音频。人工智能模型能够高保真地呈现人类语调和语调变化,并能够根据上下文调整表达方式。 Speechify:https://speechify.com/ ,是一款人工智能驱动的文本转语音工具,使用户能够将文本转换为音频文件。它可作为 Chrome 扩展、Mac 应用程序、iOS 和 Android 应用程序使用,可用于收听网页、文档、PDF 和有声读物。 Azure AI Speech Studio:https://speech.microsoft.com/portal ,Microsoft Azure Speech Studio 是一套服务,它赋予应用程序能力,让它们能够“听懂、理解并与客户进行对话”。 以下是一些 GitHubDaily 开源项目列表中的 AIGC 相关项目: |名称|简述| ||| ||一个可打造成企业内部知识库的私人专属 GPT!可以将任何文档、资源或内容转换为大语言模型(LLM)知识库,使得在对话过程中可引用到里面的内容。| ||有获取 GPTs 的 Prompt、Knowledge 以及如何防护的教程,另外单独对破解官方 GPTs 的 Prompt 进行分类。| ||收集了超级多被破解的 GPTs Prompt| ||一份精心收集整理的优秀 AI 助手列表。| ||只需一张角色图片,即可生成与角色一致且动作可控的生动视频。| ||一个可以安装在电脑(和安卓手机)上的用户界面,让你可以与文本生成的人工智能互动,并与社区创建的角色聊天/玩角色扮演游戏。| ||微软在 GitHub 开源的一套 AI 工具,可用于简化大模型应用的开发周期。打通了从项目构思、原型设计、测试、评估到生产部署和监控的全流程,让开发者可以快速构建出高质量的大语言模型应用。| ||一个在 GitHub 开源的计算机视觉 AI 工具箱,安装简便,可供开发者重复使用,大幅提升效率。|
2024-10-01
提示词有没有规律可循
提示词是有规律可循的。 提示工程是人工智能领域中,特别是在自然语言处理和大型语言模型的上下文中一个相对较新的概念,它涉及设计和优化输入提示以引导 AI 模型生成特定类型的输出或执行特定的任务。提示工程的关键点包括精确性、创造性、迭代和上下文理解。提示词通常指直接输入到 AI 模型中的问题、请求或指示,是提示工程的一部分。 在 Stable Diffusion 中,Embedding 相当于提示词打包的功能,能把很多提示词汇总到一个文件里,负向提示词在某些情况下会有大量且固定不变的文本量,此时可使用打包好的负向提示词 Embedding,达到一词顶一百词的效果。 从应用者角度看,提示词应客观对待,它可能只是一个中间阶段。对于企业,追求稳定性和确定性,提示词可能并非可靠工具。提示词技巧具有阶段性和时效性,普通人不必花费过多时间,因为其变化很快。对于大部分人,追求所谓技巧可能意义不大。是否使用提示词框架,应视具体情况而定。
2024-10-01
AI生图的提示词或技巧,请讲一讲
以下是关于 AI 生图的提示词和技巧: 1. 描述逻辑:人物及主体特征(包括服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。通过这些详细的提示词,能更精确地控制绘图。 2. 辅助工具: http://www.atoolbox.net/ :通过选项卡的方式快速填写关键词信息。 https://ai.dawnmark.cn/ :每种参数都有缩略图参考,方便直观选择提示词。 C 站(https://civitai.com/):可以抄作业,每一张图都有详细参数,点击复制数据按钮,粘贴到正向提示词栏,然后点击生成按钮下的第一个按键,Stable Diffusion 就可以将所有参数自动匹配。但要注意图像作者使用的大模型和 LORA,不然即使参数一样,生成的图也会不同。也可以只取其中好的描述词,如人物描写、背景描述、小元素或者画面质感等。 3. 对于 PixVerse: 提示词(Prompt)在文生视频、图生视频和角色生视频中广泛使用,准确写出提示词可使生成您想要的视频,减少试错成本。 Prompt 一般包含描述性文字、指令参数、情感氛围、参考风格几个方面。 推荐使用英文输入,PixVerse 对英文的理解能力最佳,效果最好。若不熟悉英文,也可用自己的语言,模型可以处理任何语言输入。 4. 优化和润色提示词的方法: 明确具体的描述,使用更具体、细节的词语和短语。 添加视觉参考,在 Prompt 中插入相关图片参考。 注意语气和情感,用合适的形容词、语气词等调整整体语气和情感色彩。 优化关键词组合,尝试不同的搭配和语序。 增加约束条件,如分辨率、比例等。 分步骤构建 Prompt,将复杂需求拆解为逐步的子 Prompt。 参考优秀案例,研究流行、有效的 Prompt 范例。 反复试验、迭代优化,根据输出效果反馈持续完善。 总之,编写高质量 Prompt 需要不断实践、总结经验,熟悉 AI 模型的能力边界,保持开放思维尝试创新描述方式。
2024-10-01
用AI分析总结单个视频
要使用 AI 分析总结单个视频,可以按照以下步骤进行: 1. 对于有字幕的 B 站视频: 确认视频栏下有字幕按钮,说明视频作者已上传字幕或后台适配了 AI 字幕。 安装油猴脚本: 。 刷新浏览器,点击字幕,会出现“下载”按钮。 选择多种字幕格式,如带时间或不带时间的。 将字幕文字内容全选复制发送给 GPTs 进行总结。 2. 对于用 Gemini 分析视频: 可使用 Gemini 1.5 Pro 进行视频分析和拆解,如通过 。 不同测试者有不同的拆解体验,如阿强将功夫熊猫版如来神掌进行分析,效果很好,能准确认出“如来神掌”等。 另外,如果想用 AI 把小说做成视频,制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-10-01
AI治理的维度
AI 治理涵盖多个维度,以下为您梳理的相关内容: 国际合作:拜登政府在推进国内 AI 议程的同时,将与国外盟友和伙伴合作,构建强有力的国际框架来管理 AI 的开发和使用。过去几个月已与多国广泛协商 AI 治理框架。 政策发展:英国在 AI 治理方面,参与者提到了隐私原则,该原则嵌入在更广泛的监管考虑中,要求监管机构和 AI 生命周期参与者遵守英国的数据保护框架。 安全与治理:监管机构可能需要考虑解决安全性、稳健性和安全性的技术标准,以对 AI 系统的安全和稳健性能进行基准测试,并为 AI 生命周期参与者提供实施原则的指导。 透明度和可解释性:AI 系统应具有适当的透明度和可解释性,透明度指向相关人员传达适当的信息,解释性指相关方能够访问、解释和理解决策过程。 公平性:AI 可能增加在一系列指标或特征上的不公平偏见或歧视风险,可能会破坏公众对 AI 的信任。 法律保护:产品安全法确保在英国制造和投放市场的商品是安全的,消费者权益法可能在消费者签订基于 AI 的产品和服务销售合同时提供保护。
2024-10-01
实时语音转文字
以下是为您整理的关于实时语音转文字的相关信息: 开箱即用语音产品: 微软:WIN11 自带 科大讯飞:讯飞语记,链接:,优势:领先的语音识别技术,多种人声选择 百度:百度语音,链接:百度语音,优势:高精度语音合成和识别,多场景应用支持 腾讯:腾讯云智聆,链接:腾讯云智聆,优势:强大的语音合成技术,支持多种中文方言 阿里巴巴:阿里云语音,链接:阿里云语音,优势:语音合成效果好,支持实时语音转换 思必驰:思必驰语音,链接:,优势:语音合成自然流畅,适用于智能硬件和应用 在线 TTS 工具: 该服务提供了支持 100 多种语言和方言的语音转文本和文本转语音功能。此外,它还提供了自定义的语音模型,这些模型能够适应特定领域的术语、背景噪声以及不同的口音。 Voicemaker:https://voicemaker.in/ ,AI 工具可将文本转换为各种区域语言的语音,并允许您创建自定义语音模型。Voicemaker 易于使用,非常适合为视频制作画外音或帮助视障人士。内容由 AI 大模型生成,请仔细甄别。 人工智能音频初创公司: :为聋人和重听者提供专业和基于 AI 的字幕(转录和说话人识别)。 :专业的基于 AI 的转录和字幕。 :混合团队高效协作会议所需的一切。 :音频转录软件 从语音到文本到魔法。 :99%准确的字幕、转录和字幕服务。 :为语音不标准的人群提供的应用程序。 :通过 AI 语音识别实现更快速、更准确的语音应用。 :会议的 AI 助手。 :让孩子们的声音被听见的语音技术。 :使用语音识别自动将音频和视频转换为文本和字幕的 SaaS 解决方案。 :实时字幕记录面对面小组会议中的发言内容。 :理解每个声音的自主语音识别技术。 :支持 35 多种语言的自动转录。 :端到端的边缘语音 AI,设备上的语音识别。 :清晰自信地说英语。 :使用单一 API 为您的产品提供最先进的 AI 转录、翻译和音频智能。
2024-10-01
请问在coze寄如何将url格式的图片内容转换成image图片
在 Coze 中将 URL 格式的图片内容转换成 Image 图片,主要通过以下步骤实现: 1. 生成图片时没有使用图像流里的工具,而是采用工作流,并调用插件来完成。 2. 运用 ByteArtist 插件中的 ImageToolPro 工具。 3. 将 model_type 选 2,这样能够根据用户图片风格进行生成。 4. 关键在于输入一个参考丑图,例如从 glif 官网别人的作品中选取一个 10241024 的老大爷图片,将其 URL 传到 Coze 中后,将其 URL 输入给 image_url。
2024-10-01
手机怎么运行ai模型
以下是在手机上运行 AI 模型的方法: 1. AnLinux 安装:AnLinux 是一个能让安卓手机或平板电脑变身为小型 Linux 电脑的工具,有条件可自行下载 termux,软件地址为 https://github.com/EXALAB/AnLinuxApp,也可选择安装包自行安装,如 file:apprelease.apk 。 2. termux 安装:termux 是一款基于 Android 平台的开源终端模拟器,可使用手机操作相关命令以跑通大模型。有条件可自行下载,软件地址 https://termux.dev/en/ ,也可选择安装包自行安装,如 file:termuxapp_v0.118.0+githubdebug_arm64v8a.apk 。 此外,Phi3mini 是微软发布的一个小语言模型,有 38 亿参数,能在端侧流畅运行。可以使用开源工具 Ollama,从官网下载安装包后一路点下一步进行安装。之后打开终端,运行“ollama run phi3”系统就会自动下载 Phi3 并安装。还可以通过套一层 Web UI 解决终端里给出答案无法格式化 markdown 的内容,如开源社区的 Open WebUI 就可以与 Ollama 无缝集成。相关链接:Ollama.https://ollama.com Open WebUI.https://github.com/openwebui/openwebui 。 更多报道介绍: 微软发布 Phi3,性能超 Llama3,可手机端运行 https://mp.weixin.qq.com/s/kb_gfaYkXiW_cR22K2bX9g 微软发布 Phi3 Mini:3.8B 参数小到能塞进手机,性能媲美 GPT3.5 https://mp.weixin.qq.com/s/lfDqYBLTaZ5D4IUW18NJQ 微软的 SLMs 之路:对 Phi3 的看法&使用体验 https://mp.weixin.qq.com/s/wnAeBG5AYPCkpMNtlF1IQ Phi3:小模型,大未来!(附魔搭社区推理、微调实战教程) https://mp.weixin.qq.com/s/pgvt5m4JnpX3kCkVI_wK8g 大语言模型的深度比较:Mixtral 8x22B、Llama 3 与 Phi3 https://mp.weixin.qq.com/s/KiXKc_Xbs5g0XMhF96ICEA 在 Macbook 上运行 Phi3 https://mp.weixin.qq.com/s/akoUNFJe8gAlC5xLI8vlIw
2024-09-30
短视频生成
以下是关于短视频生成的相关信息: 使用video参数可以创建短视频,展示初始图形的生成过程。该参数仅适用于图像网格,可与版本为 1、2、3、test 和 testp 的模型版本一起使用。例如,Prompt example:/imagine prompt Vibrant California Poppies video 。获取视频链接的步骤为:添加video 到提示词结尾,等任务结束后点击表情符号,选择✉️ emoji,会在私信中收到视频链接,单击链接在浏览器中查看视频,右键单击或长按下载视频。但需注意,视频处理可能需时,且大小可能较大,要确保设备有足够存储空间。 腾讯运营可通过 ChatGPT 生成文案,将其复制到支持 AI 文字转视频的工具(如腾讯智影的数字人播报功能、手机版剪映的图文成片功能)内,实现短视频自动生成。这类工具操作相对简单,让大众更易上手。 一些根据视频脚本生成短视频的 AI 工具包括:ChatGPT + 剪映,ChatGPT 生成视频小说脚本,剪映根据脚本自动分析并生成素材和文本框架;PixVerse AI ,在线 AI 视频生成工具,支持多模态输入转化为视频;Pictory ,AI 视频生成器,用户提供文本描述即可生成相应视频;VEED.IO ,提供 AI 图像和脚本生成器,帮助从图像制作视频并规划内容;Runway ,AI 视频创作工具,能将文本转化为风格化视频内容。
2024-09-30