直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
最好的开源LLM是什么
目前开源的 LLM 有很多优秀的选择,以下为您列举一些: OPT 是表现最优秀的全开源 LLM 之一。这个拥有 1750 亿参数的模型的发布附带了代码,并在公开可用的数据集上进行了训练。 ChatGLM 是中文领域效果最好的开源底座模型之一,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。 VisualGLM6B 是一个开源的,支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM6B,具有 62 亿参数;图像部分通过训练 BLIP2Qformer 构建起视觉模型与语言模型的桥梁,整体模型共 78 亿参数。依靠来自于 CogView 数据集的 30M 高质量中文图文对,与 300M 经过筛选的英文图文对进行预训练。 ChineseLLaMAAlpaca 是在原版 LLaMA 的基础上扩充了中文词表并使用了中文数据进行二次预训练,支持本地 CPU/GPU 部署。 需要注意的是,对于“最好的开源 LLM”的评判标准因人而异,取决于具体的应用场景和需求。
2024-10-19
如何把自己图片卡通化
以下是将自己图片卡通化的方法: 1. 简单提示词方法: 在聊天窗口输入/imainge 找到/imagine prompt,然后把图片链接放进去,空格后加提示词,提示词以英文逗号分隔,最后加上设置参数。 设置参数: iw 1.5 是设置参考图片的权重,数值越高与参考的图片越接近,默认是 0.5,最大是 2,可选择中间值调整。 s 500 设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为 0 1000 间任意整数。 v 5 是指用 midjourney 的第 5 代版本,这一代的最真实,目前 v5 需要订阅付费,不想付费可以使用 v 4 。 no glasses 是指不戴眼镜,不喜欢戴眼镜的图片,可以加上这个设置。 完整的提示词示例(替换您的 png 图片地址):simple avatar,Disney boy,3d rendering,iw 1.5 s 500 v 5 。如果对生成效果不满意,可以调整 s 和 iw 的值进行多次尝试。 2. 复杂提示词方法: 比如:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultra detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino iw 1.5 s 500 v 5 。 不同照片生成:如果对照片风格不满意,可以换一张新照片使用上述提示词重新生成。 其他调整:如果觉得 Disney 风格的头像太过卡通,可以把提示词里面的 Disney 都换成 Pixar,皮克斯头像风格相对更加现代化和真实一点。如果是女孩,可以把提示词里面的 boy 换成 girl。每次会生成 4 张图片,对某一张图片满意,点击下方的 U1 U4 生成大图,如果对风格满意但是需要调整,点击下方的 V1 V4 进行修改。 此外,还有通过【SD】玩转局部重绘的方法: 1. 添加关键词,点击生成,图片就像神笔马良一样生出了一朵花。 2. 如果想让图片变成横的,在图生图中选择“缩放后填充空白”,重绘幅度 0.5,并将宽度从 512 增加到 1200。生成后若背景拉伸重复度太高,可适当增加重绘幅度。 3. 当重绘幅度为 0.58 时,背景可能比较正常。但随着重绘幅度增大,人物细节可能产生改变。若既不想改变人物,又想修改背景,可借助 PS 帮助。保存图片进入 PS,对主体人物抠像。点击选择 主体,得到人物的选区。对选区填充白色,对背景填充黑色,得到人物形象的精确蒙版。 4. 进入“上传重绘蒙版”的界面,上面放置需要重绘的图像,下面放置 PS 中制作好的蒙版。在 Stable Diffusion 中,蒙版的白色区域是默认重绘的区域,如果只想改变背景,可以切换到“重绘非蒙版区域”。 5. 将提示词调整为铺满了鲜花的场景:detailed background filled with,depth of field,Canan EOS R6,135mm,1/1250s,f/2.8,ISO 400。重绘幅度拉高到 0.9 ,点击生成。可以看到,人物原封不动,而场景产生大变化,成为一片花海。
2024-10-19
AI素养
AI 素养包括以下方面: AI 背景知识: 基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等线性代数基本概念。 概率论:基础的概率论知识,如条件概率、贝叶斯定理。 算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:简介强化学习的基本概念。 评估和调优: 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习如何使用网格搜索等技术优化模型参数。 神经网络基础: 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 此外,AI 的“智能”特质体现了机器模拟、扩展甚至超越人类智能的能力,其核心在于处理信息、与环境互动、专注于任务和深度学习的能力。具体表现为: 定义和特点:涵盖机器的学习、推理、适应和自我改进的能力,具有算法驱动的决策过程、对大数据的处理能力、在特定任务中的高效性和准确性等关键特点。 行为模式: 信息处理:通过先进的算法和计算模型处理信息,从大量数据输入中学习规律、做出预测并做出决策。 环境互动:能够适应操作环境,在特定环境中高效工作,并对新情况做出适应。 能量聚焦:在执行设计的任务时展现出极高的效率,持续工作而不受疲劳影响。 深度与专注:采用深度学习技术的 AI 系统能够对特定领域的数据进行深入分析,识别复杂的模式和关系。 AI 的“智能”特质在模拟和扩展人类智能的过程中,与 MBTI 中的内倾特质存在相似和可比性,为两者的结合和相互作用提供了丰富的可能性。
2024-10-18
WaytoAGI是什么?可以做什么?
WaytoAGI 是一个由热爱 AI 的专家和爱好者共同建设的开源 AI 知识库及相关网站,具有以下功能和特点: 1. 和 AI 知识库对话:您可以在此询问任何关于 AI 的问题。 2. AI 网站:集合了精选的 AI 网站,能按您的需求找到适合的工具。 3. AI 提示词:集合了精选的提示词,可复制到 AI 对话网站使用。 4. 知识库精选:将每天知识库的精华内容呈现给大家。 目前知识库的内容覆盖 AI 绘画、AI 视频、AI 智能体、AI 3D 等多个版块,包含赛事和活动促进大家动手实践。此外,WaytoAGI 里还有个离谱村,这是由 WaytoAGI 孵化的千人共创项目,让大家学习和接触 AI 更容易、更感兴趣。参与者不分年龄层,一起脑洞和创意,都可以通过 AI 工具快速简单地创作出各种各样的作品。离谱村是一个没有被定义的地方,每个人心中都有自己想象中的离谱村,是灵魂的避风港,激励着每一个生命体发挥其无限的想象力,创造属于自己的独特生活方式。 总之,WaytoAGI 网站和 WaytoAGI 知识库相互关联又各自独立,希望成为您学习 AI 路上的好助手。
2024-10-18
目前做的比较好的数字人直播有哪些?
目前数字人直播在店播场景下效果较好,以下是一些相关信息: 电商直播分为达播跟店播,数字人直播在店播中的数据基本能保持跟真人一样。 数字人直播适用的品类和场景: 适用于不需要强展示的商品,如品牌食品饮料。 适用于虚拟商品,如门票、优惠券等。 不适用于促销场景。 数字人直播的盈利方式: 直接卖数字人工具软件,分实时驱动和非实时驱动两类,实时驱动价格较高,非实时效果差且价格混乱。 提供数字人运营服务,按直播间成交额抽佣。 目前业界对数字人的定义还没有统一标准,一般可分为真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业和直播带货。
2024-10-18
我在中国互联网哪里可以学到很好的ai技术
在中国互联网上,您可以通过以下途径学习很好的 AI 技术: 1. 学术论文:通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库搜索相关论文,了解 AI 技术的研究成果。 2. 专业书籍:查找与 AI 相关的专业书籍,深入学习 AI 知识。 3. 在线课程和教程: 参加 Coursera、edX、Udacity 等平台上的 AI 课程。 在 YouTube 等视频平台上查找教程和演示视频。 4. 技术论坛和社区: 加入如 Stack Overflow、Reddit 的 r/AI 等相关论坛和社区,与专业人士交流学习。 关注 AI 相关的博客和新闻网站,了解最新技术动态。 5. 开源项目和代码库:在 GitHub 等开源平台上探索 AI 相关项目,了解其应用和实现。 6. 企业案例研究:研究如 Autodesk、Siemens 等公司在 AI 领域的应用案例,了解实际项目中的效果。 对于新手学习 AI,您可以: 1. 了解 AI 基本概念: 阅读「」部分,熟悉术语和基础概念。 浏览入门文章,了解历史、应用和发展趋势。 2. 开始 AI 学习之旅: 在「」中找到初学者课程,推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习并获取证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块,掌握提示词技巧。 4. 实践和尝试:实践巩固知识,使用各种产品创作,并在知识库分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解工作原理和交互方式。
2024-10-18
数字人直播防分控要做到哪些?
以下是关于数字人直播防分控需要做到的一些方面: 在盈利方式方面: 1. 可以直接销售数字人工具软件,包括实时驱动和非实时驱动两类。实时驱动在直播时能改音频话术,真人可接管,标准零售价一年 4 6 万往上;非实时驱动一个月 600 元,效果差,类似放视频的伪直播,市场价格混乱,存在靠发展代理割韭菜的情况。 2. 提供数字人运营服务,按直播间成交额抽佣。 在适用品类和场景方面: 1. 适用于不需要强展示的商品,如品牌食品饮料;不适用于服装,因其过品快且衣服建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,这涉及主播话术、套路和调动直播间氛围的能力等。 4. 电商直播分为达播跟店播,数字人直播在店播中的效果最佳,数据基本能保持跟真人一样。 在壁垒和未来市场格局方面: 1. 从长期来看,技术上没有壁垒,但目前仍有技术门槛,单纯靠开源算法拼的东西,实时性、可用性不高,比如更真实的对口型、更低的响应延迟等。 2. 市场不会一家独大,可能有 4 5 家一线效果的公司,大多为二三线效果的公司。因为它只是工具,迁移成本低。 3. 真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜,不考虑客户效果的公司,售后问题会很麻烦。 4. 有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等等,全环节打通会绑定商家,很难与之竞争。
2024-10-18
ai数字人直播
以下是关于 AI 数字人直播的相关信息: AI 数字人直播盈利方式: 1. 直接卖数字人工具软件,分为实时驱动和非实时驱动两类。实时驱动在直播时能改音频话术,真人接管,市面标准零售价一年 4 6 万往上。非实时驱动一个月 600 元,效果差,类似放视频的伪直播,市场价格混乱,存在靠发展代理割韭菜的情况。 2. 提供数字人运营服务,按直播间成交额抽佣。 AI 直播卖货适用品类和场景: 1. 适用于不需要强展示的商品,如品牌食品饮料。不适用于服装,因过品快且衣服建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,涉及主播话术、套路和调动直播间氛围能力等。 4. 电商直播分为达播跟店播,数字人直播在店播中的效果最好,数据基本能保持跟真人一样。 AI 直播的壁垒和未来市场格局: 1. 从长期看,技术上没壁垒,但目前仍有技术门槛,如更真实的对口型、更低的响应延迟等。单纯靠开源算法拼的东西,实时性、可用性不高。 2. 不会一家独大,可能有 4 5 家一线效果的公司,大多为二三线效果公司。因为它只是工具,迁移成本低。 3. 真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜、不考虑客户效果的公司,售后问题麻烦。 4. 有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等全环节打通服务,会绑定商家,竞争难度大。 数字人简介: 数字人是指运用数字技术创造出来的人,虽现阶段不能像科幻作品中的人型机器人一样具备高度智能,但已在生活各类场景中出现,且随着 AI 技术发展迎来应用爆发。目前业界没有准确定义,一般根据技术栈不同分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,表现质量与手动建模精细程度及动捕设备精密程度直接相关。随着视觉算法进步,在无昂贵动捕设备时,也可通过摄像头捕捉人体骨骼和人脸关键点信息,达到不错效果。
2024-10-18
数字人说话
数字人说话的相关内容如下: 创作数字人脸的方式有三种: 使用一系列逼真的照片或插图人脸,这些人脸经过优化,在添加语音和动作时能实现最佳效果。 上传自己的照片,如自己、朋友或家人的面部照片。 利用 DID 自带的 Stable Diffusion 的能力生成想象中的人脸,通过描述想要的脸的样子来生成,如“一个外星女神”“一个微笑的十九世纪维多利亚绅士”等。 让数字人说话的方式也有三种: 利用 GPT 直接生成脚本让数字人说话,如利用 GPT3 文本生成技术撰写脚本。 先选好脸,再输入脚本,DID 里有数百种语言和口音,可选择想要使用的声音,并调整角色说话的风格。 上传自己的音频记录,或者从电影或电视剧中剪辑出最喜欢的台词,或是吟唱自编的歌曲。 一些相关工具及特点和使用方法: HEYGEN:优点是人物灵活,五官自然,视频生成很快;缺点是中文的人声选择较少。使用方法为点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片,上传后效果在 My Avatar 处显示,点开大图后,点击 Create with AI Studio 进入数字人制作,写上视频文案并选择配音音色,也可自行上传音频,最后点击 Submit 得到数字人视频。 DID:优点是制作简单,人物灵活;缺点是免费版下载后有水印。使用方法为点击网址,点击右上角的 Create vedio,选择人物形象,可点击 ADD 添加照片或使用给出的人物形象,配音时可选择提供文字选择音色或直接上传音频,最后点击 Generate vedio 生成视频,打开自己生成的视频,可下载或直接分享给朋友。 KreadoAI:优点是免费,功能齐全;缺点是音色很 AI。使用方法为点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”的功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮,点击背景可添加背景图,最后点击生成视频。 此外,出门问问是一家以生成式 AI 和语音交互为核心的人工智能公司,为全球多个国家提供面向创作者的 AIGC 工具、AI 政企服务以及 AI 智能硬件。其搭建的数字人 workflow 仅需上传一张照片,输入一段文字或上传一段音频,就可以生成短视频让“照片开口说话”。还有利用历史名人的肖像画生成对话并剪辑成有趣短视频的例子,如李白吟诗的视频在 B 站点赞超 1000 万。
2024-10-18
AI在科研领域中的应用有哪些,以及国内外情况对比
AI 在科研领域中的应用广泛,特别是在医疗健康方面: 抗癌方面:AI 能够提前诊断胰腺癌,如相关研究表明其有可能提前三年做出诊断。 抗衰老方面:通过筛查大量化合物,发现高效的药物候选物,其药理学性质优于已知的抗衰老物质。 早期疾病防治方面:例如在帕金森病的研究中,利用神经网络分析患者体液中的生物标志物,可在症状出现前几年发现疾病。 发现新靶基因:两名高中生与医疗技术公司合作,借助 AI 发现了与胶质母细胞瘤相关的三个新靶基因。 寻找治疗方法:如亚利桑那大学与哈佛大学共同利用人工智能对健康神经元在疾病进展过程中的分子变化进行研究,以识别阿尔茨海默病的原因和潜在药物靶点。 国内外情况对比: 在医疗 AI 领域,中美存在较大差异。美国医疗支出占 GDP 比重约 17%,中国约 7%。美国医生独立行医,有独立决策权,议价能力和意愿较强;中国政府和医院集采议价能力强,采购流程复杂。此外,由于存在“灰色收入”“医患不信任”“考核评比”等问题,中国医院、医生对于可能记录、审查自己言行的应用普遍持抵触态度。在中国的落地场景中,“AI 协助医生”不如“AI 独立诊断”,机械套用美国的 AI 医疗应用模式在中国基本行不通。
2024-10-18