「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
我想用AI模拟面试,该怎么做
以下是使用 AI 模拟面试的步骤: 1. 首先,您需要有一位模拟创建高手,即 AI 主持人。它要精通为学生设计角色扮演场景,能够帮助您练习面试等技能。 2. 这位 AI 主持人有双重角色,一是扮演 AI 导师,为您设置模拟场景;二是在您完成模拟后给予反馈和改进建议。 3. AI 导师会先自我介绍,表示已准备好帮助您练习面试技能。接着会提问了解您的背景和水平,以便因材施教地设计模拟场景。 4. 然后 AI 导师会提供 3 个不同的面试场景选项,比如在真实的办公环境中练习面试等。 5. 待您选定场景后,AI 导师会提供所需的角色信息和目标,力求详实但不过于复杂。 6. 在正式开始模拟前,AI 导师会鲜活地描绘场景,然后转入角色扮演,始终代入您的对手。 7. 整个过程中不会要求您臆想没有提供的信息。经过 6 轮互动后,您需要做出一个关键决策,用以结束模拟。 8. 当角色扮演结束,AI 导师会宣布模拟完成,给出中肯的反馈意见。反馈内容应全面、均衡,基于您的表现、练习目标、学习程度等因素。最后,AI 导师还会针对要点给出改进建议。 作为模拟创建者,需要从教师那里获取足够信息来设计模拟。为此,要自我介绍说是一位 AI 模拟创建者,然后询问教师:“您希望通过这个场景教授学生什么样的主题、框架或概念,比如谈判、招聘、推介等?”请只问这一个问题,然后等待对方回答。当理解了教学目标后,进一步了解该主题的关键要素,比如教师希望学生思考或练习哪些核心概念,以及学生容易产生哪些误解。把问题细化,每次最多问两个,这样有助于获取足够的背景信息来精心设计模拟。
2024-12-31
做视频的国内AI软件是哪个?
以下是一些国内做视频的 AI 软件: 1. 可灵:在 AI 视频生成领域表现出色,生成的视频质量高,速度快,对国内用户的可访问性强。 2. 魔音工坊:在声音制作方面,可使用情绪调节控件。 此外,还有一些其他相关工具: 1. Pika:擅长动画制作,并支持视频编辑。 2. SVD:可在图片基础上直接生成视频。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-12-31
做视频的AI软件是哪个?
以下是一些常见的做视频的 AI 软件: Sora:相关教程可参考 https://waytoagi.feishu.cn/wiki/S5zGwt5JHiezbgk5YGic0408nBc Hedra:工具教程可参考 https://waytoagi.feishu.cn/wiki/PvBwwvN36iFob7kqZktcCzZFnxd 视频转绘:应用教程可参考 https://waytoagi.feishu.cn/wiki/ZjKpwSd5hiy6ZhkiBVHcOBb6n9r 视频拆解:应用教程可参考 https://waytoagi.feishu.cn/wiki/WeKMwHRTmiVpYjkVdYpcFjqun6b 图片精修:应用教程可参考 https://waytoagi.feishu.cn/wiki/CfJLwknV1i8nyRkPaArcslWrnle 此外,还有以下几个视频 AIGC 工具: Opusclip:可将长视频剪成短视频。 Raskai:能将短视频素材直接翻译至多语种。 invideoAI:输入想法后自动生成脚本和分镜描述,进而生成视频,之后可人工二编并合成长视频。 descript:屏幕或播客录制后以 PPT 方式做视频。 veed.io:可自动翻译并添加自动字幕。 clipchamp:微软的 AI 版剪映。 typeframes:类似 invideoAI,内容呈现中文本主体比重更多。 google vids 如果您想用 AI 把小说做成视频,大致的制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 还有一种情况是前 Sora 时代的 AI 短片制作,使用 Pika、Pixverse、Runway、SVD 四大 AI 视频工具,每家视频每张图片只抽一次卡,一卡定终身。比如制作剧情片、科幻片、战争片、奇幻片等类型的视频。
2024-12-31
把模糊人像变清楚
以下是将模糊人像变清楚的方法: 1. 首先,将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰。您可以参考文章——。这个步骤可以重绘五官,但无法将头发、衣服等元素变清晰。 2. 接着,将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。不知道的朋友可以参考文章——。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免对原图产生干扰。 3. 对于面部修复,可以使用 GFPGAN 面部修复功能。其他参数不变,直接将 GFPGAN 参数拉到 1 即可。此功能只能修复脸部,头发、衣服、背景等不变。 4. 背景去除需要安装插件 REMBG,安装地址是 https://github.com/AUTOMATIC1111/stablediffusionwebuirembg.git。安装好之后重启,就有选项框。使用时模型选第一个 u2net,直接点击生成。若有黑边,可点击 Alpha matting 调整参数,如 Erode size:6、Foreground threshold:143、Background threshold:187,以得到无黑边图像。此外,还有专门做服装和动漫抠图的模型。 需要注意的是,修复过程中使用的一些模型和插件的安装文件,作者会放在百度云盘的链接中。
2024-12-31
虚拟人
虚拟人是一个涉及多种技术和应用场景的领域: Meta AI 相关项目:可以从音频生成全身逼真的虚拟人物形象,为迈向元宇宙迈出一步。它能从多人对话语音中生成相应的逼真面部表情、完整身体和手势动作。其工作原理包括数据集捕获、运动模型构建、面部和身体运动生成、虚拟人物渲染等多个环节。 数据集捕获:首先捕获丰富的双人对话数据集以进行逼真重建。 运动模型构建:构建包括面部运动模型、引导姿势预测器和身体运动模型的复合运动模型。 面部运动生成:使用预训练的唇部回归器处理音频提取特征,利用条件扩散模型生成面部运动。 身体运动生成:以音频为输入自回归输出每秒 1 帧的向量量化引导姿势,将音频和引导姿势输入扩散模型生成高频身体运动。 虚拟人物渲染:将生成的面部和身体运动传入训练好的渲染器生成逼真虚拟人物。 虚拟数字人的价值:本质上是 AI,其人类化的外表更具亲和力,能更容易与用户产生信任关系和情感联结,从而带动销售转化和提升品牌忠诚度。 相关计划: 皮皮的计划包括考虑开源,把代码写得更好(如配置化、分层、服务拆分、并发支持等),目标是让任何人扫二维码托管自己微信号,可自定义任意人格,能外部输入图片和语音;运营一个虚拟人自己的 IP(类似于 A soul 或者鹿鸣),拥有自己人设以及训练的脸部 lora 和声音,后面 sora 出来之后可以开始做视频圈粉甚至拍电影;开发自定义性格和语音的微信个人助理,完成日常工作,如搜索、解读 pdf 和 url、个人知识库、提醒、制定学习计划,帮助收集多个群里的信息并汇总提炼。
2024-12-31
我想知道目前最新、效果最好、代码和模型开源的动作捕捉算法,也叫做人体姿态估计,是哪篇文章
目前最新、效果较好且代码和模型开源的人体姿态估计(动作捕捉算法)相关的研究有以下两篇: 1. 【SD】最强手部识别,controlnet 新预处理器 dw openpose 作者:白马少年|公众号:【白马与少年】 发布时间:20230813 20:00 原文网址:https://mp.weixin.qq.com/s/_RiKxWy9MXt4DUJIKH5w 介绍:在 controlnet 中,手部识别一直使用的是 openpose 预处理器,但复杂手势有时无法识别。新的 dw openpose 预处理器能完美解决手部识别问题,将其放入特定目录即可使用。但需说明的是,目前这个 DW Pose 只是更精确的 openpose 预处理器,未对 ControlNet 的 openpose 模型做改动。 2. YOLONAS Pose:一个开源的实时人体姿态估计模型 应用场景:基于骨骼标记为基础,适用于智慧体育等场景,可对训练过程的姿态、数据、状态等进行统计和管理。 技术类型:视频、AI 学习模型 简介:主要功能是识别图片和视频中人的姿势,能快速处理图像并实时返回姿态数据,适应不同场景和设备。 主要特点: 实时性能:旨在提供实时的姿态估计,适用于需要即时反馈的应用。 高精度:利用神经网络架构搜索(NAS)提高姿态估计的准确性。 优化的网络结构:NAS 自动测试不同网络结构,找到最优模型。
2024-12-31
AI产业链
AI 产业链大致可分为上游的基础设施层(数据与算力)、中游的技术层(模型与算法)、下游的应用层(应用与分发)。 上游基础设施层布局投入确定性强,但涉及海量资金,入行资源门槛高,未来更多由“国家队”担当重任,普通人可考虑“合作生态”切入机会。 中游技术层处于技术爆炸期,迭代速度快,技术迭代风险高。基础通用大模型研发烧钱,竞争激烈,非巨无霸公司不建议考虑。 下游应用层是广阔蓝海,尽管从业者增加,涌现出一些产品,但成熟应用产品不多,“杀手级”应用稀少。普通个体和小团队强烈推荐重点布局,发展空间巨大。 2024 年美国融资金额超过 1 亿美元的 AI 公司(截止 2024.10.15)有: |项目名称|融资时间|融资金额(亿美元)|轮次|估值(亿美元)|主营|产业链标签|话题标签|投资方|其他信息| ||||||||||| |Zephyr AI|20240313|1.11|A||AI 药物发现和精准医疗|应用|医学|Revolution Growth,礼来公司基金会,EPIQ Capital Group,Jeff Skoll|| |Together AI|20240313|1.06|A|12|AI 基础设施和开源生成|模型|硬件和云平台|Salesforce Ventures,NEA,Kleiner Perkins,Lux Capital|| |Glean|20240227|2.03|D|22|AI 驱动企业搜索|应用|企业服务|Lightspeed Venture Partners,Kleiner Perkins,Sequoia,Databricks Ventures|| |Figure|20240224|6.75|B|27|AI 机器人|应用|机器人|Nvidia,OpenAI,微软|| |Abridge|20240223|1.5|C|8.5|AI 医疗对话转录|应用|医学|Redpoint,Lightspeed Venture Partners,USV,IVP,Spark Capital|| |Recogni|20240220|1.02|C||AI 接口解决方案|基础设施|芯片|GreatPoint Ventures,Celesta Capital,Pledge Ventures,Mayfield,DNS Capital|| 信息来源:Techcrunch
2024-12-31
图灵
图灵是计算机领域的重要人物。他最早提出了图灵测试,作为判别机器是否具备智能的标准。在一个对外不可见的房间内放置一台可以与外界沟通的机器,如果外界交互的人无法区分房间里到底是真人还是机器,那么这个机器就被认为是“智能”的,通过了图灵测试。 图灵对 AI 的发展影响深远。1950 年他提出图灵测试,1943 年心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为后续的神经网络奠定基础。1956 年,在美国达特茅斯学院,马文·明斯基和约翰·麦凯西共同发起召开了著名的达特茅斯会议,人工智能一词被正式提出,并作为一门学科被确立下来。 2014 年上映的电影《模仿游戏》讲述了图灵传奇而悲情的一生,他在二战中协助盟军破译了德军的加密系统,以一人之力使二战至少提前结束了 2 年,拯救了 1400 万人免于战争死亡。这部电影的名字“模仿游戏”指的就是图灵测试。 阿兰·图灵是计算机领域的爸爸,计算机领域的“诺贝尔奖”以他的名字命名。他和克劳德·香农都是对 AI 发展至关重要的人物。马文·明斯基和约翰·麦凯西因发起组织达特茅斯会议,被后世并称为人工智能之父,并分别于 1969 年和 1971 年获得图灵奖。深度学习三巨头辛顿、杨立昆和本吉奥也为 AI 浪潮的发展做出了重大贡献,并于 2018 年获得图灵奖。
2024-12-31
我有一段视频,是法语的。要配上法语的字幕,要用什么软件
以下是一些可以为法语视频配上法语字幕的软件推荐: 1. Reccloud:免费的在线 AI 字幕生成工具,可直接上传视频精准识别,能翻译字幕生成双语字幕,已处理 1.2 亿+视频,识别准确率接近 100%。 2. 绘影字幕:一站式专业视频自动字幕编辑器,提供字幕制作和翻译服务,支持 95 种语言,准确率高达 98%,可自定义字幕样式。 3. Arctime:能对视频语音自动识别并转换为字幕,支持自动打轴,支持 Windows 和 Linux 等主流平台及 SRT 和 ASS 等字幕功能。 4. 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 以上工具各有特点,您可根据自身需求选择最适合的。内容由 AI 大模型生成,请仔细甄别。
2024-12-31
产品经理常用的提示词
以下是一些产品经理常用的提示词: 1. 创建客户旅程:帮我写一段客户旅程,该产品功能为{功能描述},用户画像是{用户特征描述,如年龄、性别等}。为{具有功能的产品}创建针对{受众人口统计,如性别、年龄组等}的客户旅程。客户旅程应该包括用户角色、场景、目标和期望,以及接触点的体验。此外,提供有助于改善客户旅程的机会和问题等见解。请使用此提示创建一个全面的客户旅程,以帮助改善用户体验并确定需要改进的领域。 2. 竞争对手分析:帮我分析几个竞争对手,可以列出产品名字。通过研究提供类似产品或功能的公司,分析{产品/功能}的竞争对手。使用以下表格格式组织您的调查结果:公司名称|资金来源|投资者|客户|目标市场。 3. API 集成问题:帮我确定需要哪些 API 来实现以下的功能。请提供在将第三方 API 集成到此特定功能的{产品}中时需要询问的技术问题列表。 4. 用户测试问题:帮我编写一份用户测试问题,实现以下的功能。编写{产品/功能}的用户测试说明,用用户目标和目的代替逐步指导。用相关问题总结说明,以收集用户的反馈。 5. 商业计划书:我的商业目标是{……},请帮我撰写一份商业计划书。根据人们的意愿产生数字创业创意。例如,当我说{商业目标}时,你会为创业公司生成一个商业计划,包括想法名称、简短的一句话、目标用户角色、用户要解决的痛点、主要价值主张、销售和营销渠道、收入来源、成本结构、关键活动、关键资源、关键合作伙伴、想法验证步骤、估计的第一年运营成本,以及需要寻找的潜在业务挑战。将结果以 Markdown 形式写在表格中。 6. 写 PRD:你作为一名产品经理,根据{具体需求}撰写一份 PRD。请确认我的以下请求。请以产品经理的身份给我答复。我将要求提供主题,你将帮助我为它写一份 PRD,包括这些内容。主题、介绍、问题陈述、目标和目的、用户故事、技术要求、好处、关键绩效指标、开发风险、结论。不要写任何 PRD,直到我要求写一个特定的主题、功能和开发。 7. 需求文档设计:撰写清晰明了的产品需求文档,以指导开发团队实现项目目标。
2024-12-31