Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

国内医疗行业的大模型有哪些,关于慢性病领域的有和进展

Answer

在国内医疗行业,大模型的应用主要涵盖疾病的诊断与预测、药物研发以及个性化医疗等方向。目前很多医疗研究机构都在进行医疗大模型的开发研究。

在慢性病领域,AI 随访/答疑助手方面有一定进展。例如腾讯健康智能随访、讯飞家庭医生随访系统等随访系统,目前主要起到数据库的作用,记录患者信息等,主要的随访和答疑工作仍由医护人员完成,但随着就诊人数增长,工作量超负荷。大模型为这类产品提供了基础,预计短期内能够实现 AI 提供大部分建议,医生护士做少量修改即可发送,不过仍需要按照科室进行精调,如骨科关注康复进度、疼痛发炎情况,肿瘤关注用药指导、药品之间的相互作用等。

Content generated by AI large model, please carefully verify (powered by aily)

References

开发:AI应用大模型商业化落地现状与思考

首先来看医疗行业,这是关乎每个人生命健康的重要领域。大模型在医疗行业的应用主要涵盖三个方向:疾病的诊断与预测、药物研发以及个性化医疗。从医疗前期的图像诊断,基因组学和精准医疗到药物研发阶段再到最后病人的个性化医疗,人工智能都有其适合的应用场景。例如,在2020年,麻省理工学院利用AI发现了一种名为Halicin的新型广谱抗生素,它不仅能有效杀灭对现有抗生素产生耐药性的细菌,而且不会使细菌产生新的耐药性。这一突破性发现源于AI的助力。研究者先搞了一个由两千个性能已知的分子组成的训练集,这些分子都被标记好了是不是可以抑制细菌生长,用它们去训练AI。AI自己学习这些分子都有什么特点,总结了一套“什么样的分子能抗菌”的规律。之后又对美国FDA已通过的六万多个分子中进行分析,最终成功识别出了一个符合所有要求的分子,这就是Halicin。之后研究者开始做实验证明,它真的非常好使,大概很快就会用于临床,造福人类。这个例子充分展示了AI大模型在医疗领域的巨大潜力,目前很多医疗研究机构都进行医疗大模型的开发研究,大模型在医疗领域大有可为!

健康:AI x 医疗 | 难解的必答题

短期内技术能够实现,适合医美、妇产科、口腔、骨科等咨询量大但较少危及生命的细分领域慢性病、术后康复通常需要定期随访,了解患者康复情况。患者也会持续咨询康复过程中遇到的情况,医护人员需要做出解答。目前的随访系统(如腾讯健康智能随访、讯飞家庭医生随访系统等)主要起到的还是数据库的作用,记录患者信息、随访次数、指标变动情况等,主要的随访和答疑工作仍是需要医护人员完成,随着就诊人数的快速增长,工作量严重超负荷。大模型为AI随访/答疑助手产品提供了基础,但仍需要按照科室进行精调,如骨科关注康复进度、疼痛发炎情况,肿瘤关注用药指导、药品之间的相互作用等,预计短期内能够实现AI提供大部分的建议,医生护士做少量修改即可发送。医美问答bot,大模型短期内可实现

Others are asking
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
在本地环境下要搭建一个医疗数据分析的BI智能体,应该怎么做
抱歉,您提供的内容中没有关于在本地环境下搭建医疗数据分析的 BI 智能体的相关有效信息。一般来说,要在本地环境搭建这样的智能体,您可以考虑以下步骤: 1. 明确需求和目标:确定您希望通过智能体实现的具体医疗数据分析功能和目标。 2. 选择合适的技术和工具:例如,选择适合数据分析的编程语言(如 Python)、数据库管理系统(如 MySQL、SQL Server 等)、数据分析库(如 Pandas、NumPy 等)。 3. 数据收集和预处理:获取相关的医疗数据,并进行数据清洗、转换和归一化等预处理操作,以确保数据的质量和可用性。 4. 模型选择和训练:根据需求选择合适的机器学习或深度学习模型,如分类模型、回归模型等,并使用预处理后的数据进行训练。 5. 智能体的开发和集成:使用所选的技术和工具,开发智能体的逻辑和功能,并将其与数据处理和模型预测部分进行集成。 6. 测试和优化:对搭建好的智能体进行测试,根据测试结果对其进行优化和改进。 7. 部署和维护:将智能体部署到本地环境中,并定期进行维护和更新,以适应新的数据和需求变化。
2025-03-11
AI怎么应用于医疗门诊问题
AI 在医疗门诊中有以下应用: 1. 医学影像分析:用于分析 X 射线、CT 扫描和 MRI 等医学图像,辅助诊断疾病。 2. 药物研发:加速药物研发进程,比如识别潜在的药物候选物和设计新的治疗方法。 3. 个性化医疗:通过分析患者数据,为每位患者提供个性化的治疗方案。 4. 机器人辅助手术:控制手术机器人,提升手术的精度和安全性。 需要注意的是,湖南省医保局明确禁止使用人工智能生成医疗处方。
2025-03-07
AI医疗
AI 在医疗领域有广泛的应用,包括以下方面: 1. 医学影像分析:AI 可用于分析 X 射线、CT 扫描和 MRI 等医学图像,辅助诊断疾病。 2. 药物研发:加速药物研发过程,如识别潜在药物候选物和设计新治疗方法。 3. 个性化医疗:分析患者数据,为每个患者提供个性化治疗方案。 4. 机器人辅助手术:控制手术机器人,提高手术精度和安全性。 在医疗健康生物制药的研究方面,AI 也发挥着重要作用,取得了以下最新进展: 1. AI 提前三年诊断胰腺癌。 2. 两名高中生与医疗技术公司合作,发现与胶质母细胞瘤相关的新靶基因。 3. AI 帮助抗衰老,筛查出高效的药物候选物。 4. 使用 AI 寻找阿尔兹海默症的治疗方法。 5. AI 帮助早期诊断帕金森。 在蛋白质结构预测和蛋白质合成方面,过去两周有大量突破: 1. AlphaFold 是一种表现出色的 AI 系统,为科学家和药物开发提供巨大帮助。 2. Meta 的蛋白质结构预测 AI 模型 ESMFold 已进行 7 亿次预测。 3. 多伦多大学研究人员开发新的 AI 系统,创造出自然界中不存在的蛋白质。 4. 华盛顿大学的 David Baker 教授团队开发基于 DALLE 的人工智能系统 RF Diffusion,用于生成合适的蛋白质结构。 5. 洛桑联邦理工学院的科学家们开发基于神经网络的新工具 PeSTo,可预测蛋白质相互作用。 6. 萨里大学开发人工智能系统,用于识别个体细胞中的蛋白质模式。 7. 肯特大学的研究团队使用名为 talin 的蛋白质制成凝胶,目标是将其制成防弹材料。 相关文献参考: 1. https://www.sciencedaily.com/releases/2023/05/230504121014.htm 2. https://www.wevolver.com/article/pestoanewaitoolforpredictingproteininteractions 3. https://www.sciencedirect.com/science/article/pii/S0958166923000514
2025-03-05
临床医疗deepseek使用手册
以下是关于 DeepSeek 在临床医疗方面的使用手册: 使用案例: 借助 AI 分析好的文章: 找出最喜欢的文章,投喂给 deepseek R1(适合大多数有推理模型的 AI)。 第一次询问:请从写作角度分析这篇文章。 第二次询问:请再从读者角度分析这篇文章。 第三次询问:这篇文章还存在什么缺点和不足,有什么改善和提升的空间。 对作者进行侧写,分析成长背景、个人经历和知识结构对文章的影响。 让 AI 对自己写的文章点评:“现在我希望你是一名资深中文写作教师/小学语文老师/中学语文老师/公文写作培训师,拥有 30 年教育经验,是一名传授写作技巧的专家。请先阅读我提供给你的文章,然后对文章进行分析,然后教我如何提升写作水平。请给出详细的优缺点分析,指出问题所在,并且给出具体的指导和建议。为了方便我能理解,请尽量多举例子而非理论陈述。” 根据文章内容对作者心理侧写:“我希望你扮演一个从业 20 多年,临床诊治过两千多例心理分析案例的人性洞察和意识分析方面的专家,精通心理学、人类学、文史、文化比较。先阅读后附文章全文,然后对作者进行人格侧写。要尖锐深刻,不要吹捧包装,不要提出一些只能充当心理安慰的肤浅的见解。包括作者的基本画像、核心性格特质、认知与价值观、潜在心理动机、行为模式推测、矛盾与盲点、文化符号映射。” 提升 DeepSeek 能力的方法: 用 Coze 做效果对比测试。 使用步骤: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 Deepseek。 认真阅读开场白之后,正式开始对话。 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 用 XML 来进行更为规范的设定,而不是用 Lisp(有难度)和 Markdown(运行不太稳定)。 特别鸣谢: 李继刚:【思考的七把武器】在前期为我提供了很多思考方向。 Thinking Claude:这个项目是我现在最喜欢使用的 Claude 提示词,也是我设计 HiDeepSeek 的灵感来源。 Claude 3.5 Sonnet:最得力的助手。
2025-02-13
目前最好的用于医疗的AI
目前在医疗领域,有以下一些出色的 AI 应用: 1. 蛋白质结构预测和合成方面: AlphaFold 是由 DeepMind 开发的 AI 系统,在蛋白质结构预测方面准确度超过其他系统,为科学家和药物开发提供巨大帮助。 Meta 的蛋白质结构预测 AI 模型 ESMFold 截至目前已经进行了 7 亿次预测。 多伦多大学研究人员开发了利用类似 Stable Diffusion、Midjourney 的生成扩散技术创造出自然界中不存在的蛋白质的新 AI 系统。 华盛顿大学的 David Baker 教授的团队开发了基于 DALLE 的人工智能系统 RF Diffusion,用于根据科学家的需求生成合适的蛋白质结构。 洛桑联邦理工学院的科学家们开发了基于神经网络的新工具 PeSTo,可以预测蛋白质如何与其他物质相互作用,速度快且通用性强。 在 Surrey 大学开发了一种人工智能系统,用于识别个体细胞中的蛋白质模式,这一进展可用于理解肿瘤的差异并开发药物。 肯特大学的研究团队使用名为 talin 的蛋白质制成凝胶,该凝胶具有吸收冲击的能力,目标是将其制成防弹材料。 2. 疾病诊断与预测、药物研发以及个性化医疗方面: 麻省理工学院利用 AI 发现了新型广谱抗生素 Halicin,它能有效杀灭对现有抗生素产生耐药性的细菌,且不会使细菌产生新的耐药性。研究者通过训练集让 AI 学习分子特点,总结规律,从大量分子中识别出符合要求的分子,之后实验证明其有效性,很快将用于临床。 为了在医疗保健中产生真正的改变,AI 应像人类一样学习,投资创建模型生态系统,例如“专家”AI,通过学校教育和经验获得有助于在复杂情况下确定最佳答案的直觉。不应仅仅依靠大量数据和生成模型解决所有问题,而应通过堆叠模型进行训练,如先训练生物学、化学模型,再添加特定于医疗保健或药物设计的数据点。
2025-02-10
在医疗场景,现在有哪些应用
在医疗场景中,AI 有以下应用: 1. 医学影像分析:可用于分析 X 射线、CT 扫描和 MRI 等医学图像,辅助诊断疾病。 2. 药物研发:能够加速药物研发过程,比如识别潜在的药物候选物和设计新的治疗方法。 3. 个性化医疗:通过分析患者数据,为每个患者提供个性化的治疗方案。 4. 机器人辅助手术:用于控制手术机器人,提高手术的精度和安全性。 5. 疾病的诊断与预测:例如利用大模型进行疾病的早期诊断和病情发展预测。 6. 新药物发现:如麻省理工学院利用 AI 发现新型广谱抗生素 Halicin。 7. 中医应用:将人工智能与中医结合,辅助看诊,提高诊疗效率,未来有望实现 24 小时独立问诊开药。 8. 医学问答:像 DoctorGPT 这样的模型,能够准确回答各种医学问题。
2025-01-20
目前deepseek的进展
目前 DeepSeek 的进展如下: 持续 5 天的“开源周”已进行到第 3 天。周一开源了专为英伟达 Hopper GPU 打造的高效 MLA 解码内核 FlashMLA,已正式投产使用。周二开源了专为混合专家系统(MoE)和专家并行(EP)设计的通信库 DeepEP。周三开源了支持稠密和 MoE 模型的 FP8 GEMM(通用矩阵乘法)计算库 DeepGEMM,可为 V3/R1 的训练和推理提供强大支持。总的来说,英伟达和 DeepSeek 开源的内容都是通过对英伟达 GPU 和集群的优化,来推动 AI 模型的高效计算和部署。 华尔街分析师对 DeepSeek 的反应:展示出媲美领先 AI 产品性能的模型,但成本仅为其一小部分,在全球主要市场的 App Store 登顶。Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局,降低 AI 行业进入门槛。 DeepSeek 的实际使用体验:在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化,表现不错;编程能力略逊于 GPT,据用户反馈。GRPO 算法替代传统 PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。
2025-04-01
上一周 ai有什么新的进展
以下是上一周 AI 的一些新进展: 应用形态的重构方面,AI Agent 取得突破,为机器人赋予自主行动能力,AI 编程工具的进展或预示人机协作模式的变革。 2 月,OpenAI 发布视频生成模型 Sora,实现高质量文本生成视频,开创 AI 视频生成新纪元。 3 月,Suno 发布 V3 版本,AI 音乐生成进入生产力可用状态。 4 月,Meta 发布高性能开源大模型 Llama3,降低了 AI 技术的准入门槛。 5 月,GPT4 发布,RayBan 与 Meta 合作的智能眼镜销量突破百万,字节上线即梦 AI。 6 月,快手发布可灵,Apple Intelligence 发布。 9 月,OpenAI 发布 o1 预览版。 10 月,Rosetta 和 AlphaFold 算法的研发者因在蛋白质结构设计和预测中的突破性贡献获得诺贝尔化学奖,约翰·霍普菲尔德和杰弗里·辛顿因人工神经网络和深度学习的开创性贡献获诺贝尔物理学奖,Anthropic 大模型 Claude 3.5 Sonnet 获得“computer use”功能。 12 月,OpenAI 发布 o3 系列模型。 此外,还有一些关于 AI 的讨论和话题,如把 350 万条 Midjourney 提示词放进一张可视化图里,2 套权威的 AI 术语表,天工新功能的定位靠近元宇宙,NotebookLM 与 AI 播客的关系,Bob 类似于更轻巧的能选多种大模型的桌面端应用“豆包”,Monica.im 的发展,物圆 TreLoop 的情况,对 AGI 距离的讨论,Arc 浏览器的状态,李开复关于 AI 应用爆发和 AGI 的观点,李继刚的 Prompt 玩法,OpenAI 研究副总裁离职,15 岁开发者的开源项目被收购,关于 AI 编程效率的讨论等。
2025-03-17
请推荐最新的AI相关进展新闻
以下是一些最新的 AI 相关进展新闻: 在医疗领域: ChatGPT 和 Google Bard 等技术极大加速了医疗健康生物制药的研究,AI 在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。例如,AI 提前三年诊断胰腺癌;两名高中生与医疗技术公司合作发现与胶质母细胞瘤相关的新靶基因;AI 帮助抗衰老,筛查出高效的药物候选物;利用 AI 寻找阿尔兹海默症的治疗方法;使用神经网络分析患者体液中的生物标志物以早期诊断帕金森。 在技术应用方面: AI Agent 的突破让行业看到更多可能性,如机器人获得自主行动能力。AI 编程工具的进展预示着人机协作模式的变革。 2024 年 AI 关键进展时间线包括:2 月 OpenAI 发布视频生成模型 Sora;3 月 Suno 发布 V3 版本;4 月 Meta 发布高性能开源大模型 Llama3;5 月 GPT4 发布等。 赛博月刊显示,AI 音频公司在效果和延迟方面取得突破,3D 世界生成领域处于初级阶段但有望在明年取得巨大进步,AI 应用的更新集中在搜索、知识库、编程等领域,越来越多应用公司受到资本青睐。
2025-03-16
transformer是通往AGI的必经之路吗?什么是世界模型,当前有哪些进展
Transformer 并非通往 AGI 的必经之路。在已知的 token space 中,Transformer 符合一些条件,但在更通用的场景中不太符合。AI 本质包含一堆 scaling law,一个值得被 scale up 的架构是基础,且架构要支持不断加入更多数据。当前在数据方面,如限定问题的数据生成有进展,但通用问题还没有完全的解法。 世界模型方面,目前的研究正在以指数级别的速度增长。对于语言这种有结构、有规则的指令系统,其逻辑受指向描述变化,如早期语言模型建模中用到的 RNN、LSTM 及当前 LLM 的 Transformer 模型结构,都是对语言序列性所体现逻辑结构的适配。同时也在思考是否存在其他形式的符号化表征及相应的建模结构,以及对于非碳基生物语言的使用情况等。未来通往 AGI 的道路并非简单,需要探寻 RL 与 LLM 的本质普遍性。
2025-03-16
请帮我整理关于AI最新进展和应用的介绍内容
以下是关于 AI 最新进展和应用的介绍: 医疗领域: ChatGPT 和 Google Bard 等技术极大加速了医疗健康生物制药的研究。AI 在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。 提前三年诊断胰腺癌。 两名高中生与医疗技术公司合作发现与胶质母细胞瘤相关的新靶基因。 帮助抗衰老,筛查超过 80 万种化合物发现高效药物候选物。 用于寻找阿尔兹海默症的治疗方法。 帮助早期诊断帕金森。 法律法规方面: AI 在许多领域已经取得重大进展和效率提升,如交通监控、银行账户欺诈检测、工业大规模安全关键实践等。 AI 具有巨大的潜力来改变社会和经济,可能产生与电力或互联网相当的影响。 大型语言模型等技术进步带来了变革性的发展机会。 基础通识课方面: 流式训练方式提升了训练速度和质量,基于 Transformer 模型进行流匹配优于扩大模型。 有多种 AI 生成工具,如能创作音乐的 so no 音频生成工具、创建个人 AI 智能体的豆包、生成播客的 Notebook LN。 端侧大模型能部署在手机端等设备,通过压缩解决存储和性能问题。 AI 工程平台对模型和应用有要求,如 define 平台,coach 平台有新版本模板和众多插件工具,还有工作流。 有魔搭社区等为大模型提供服务的平台。 预告了 AI 建站,需安装基础软件帮助文科生和无基础人员建站。
2025-03-15
新手如何更好使用该网站,主要了解人工智能或者AGI进展,主流软件的学习和应用
对于新手想要更好地使用该网站来了解人工智能或 AGI 进展以及主流软件的学习和应用,以下是一些相关内容: AE 软件: 基本功能:可通过图层软件抠元素加插件做特效,如利用 auto field 自动填充工具,轨道遮罩功能让图层按特定形状变化等。 与 AI 结合运用:如用 runway 生成烟花爆炸素材,结合 AE 的图层混合模式、遮罩等功能实现特效可控的画面。 其他应用:用内容识别填充功能处理视频画面,如抹掉入镜的人;从素材网站获取粒子素材为画面添加氛围感。 学习路径:可在 B 站找丰富的 AE 软件入门课程自学,也可从包图网下载工程文件学习。 学习方法:通过拆解视频、留意路边广告特效、按层级逻辑思考画面运动来学习 AE,还可参考模板。 与 AI 的关系:AI 出现后,AE 使用减少,有些动效可用 AI 完成。 在短剧中的应用:在火焰、文字、光线等方面有少量应用。 AI 相关技术与活动: AI 音乐创作:通过输入更高级的词汇与 AI 音乐对话能产生更好效果,有 AI 音乐的版块、挑战、分享会和教程,可通过王贝加入 AI 音乐社区。 数字人语音合成:介绍了声音克隆技术,提到了微软、阿里等的相关成果,常用的是 JPT service。 Config UI 的应用:能降低成本、提高效率,在图书出版、引流等方面有应用,岗位稀缺,社区有相关共学课程。 社区共创项目:包括东京的 confii 生态大会、AI 文旅视频、娃卡奖、李普村共创故事、AI 春晚等活动。 作业与报名:作业是询问对 AI 方向的兴趣和想做的项目,活动报名可通过填写名字和申请新增学校参与。 线下寄送物料组织活动:会给大家寄送线下活动物料,在学校内组织。 AI 春晚即将开始:去年 300 人 30 天共创了 AI 春晚,今年的也即将开始,可报名参与多种岗位。 AIPO 活动及相关挑战:10 月 20 日的 AIPO 活动,可提前构思展示项目,有会话和视频相关的挑战赛。 共学活动与技能提升:接下来 10 天有从零基础到建站等内容的讲解,回放会放在链接里,可先从练习提示词入手。 硬件机器人材料购买:若搞硬件机器人,部分材料需尽快购买。 自媒体发布与流量扶持:在小红书发布活动内容带特定标签有流量扶持,作品也可发布在 GitHub 等平台。 活动奖项与历史玩法:设最佳创业奖和最佳投资奖各四个,有线下摆摊展示交流、IPO 路演等玩法,之前在多个城市举办过 AI 切磋大会。 工具使用与新大赛预告:可使用多种 AI 工具,新的大赛即将开启,有百万奖金池,相关动态会在社区活动栏目公布。 AI 音乐和数字人语音合成: AI 音乐方面,提到草爷、格林 king、狗哥带大家入门,有相关课程与教程,且淘宝上有套壳工具抄袭。社区伙伴做的 AI 音乐专辑不错。 数字人语音合成部分提到声音克隆,有新的声音克隆且音质很不错。 提到了微软新出的成果、阿里的 Cozy voice(指出其泛化能力不强)、大家常用的 GPT solve it、刚举办的 AI 3D 活动。 以小田的 config UI 基础工作流一日谈展开,讲述了多个案例,如许建拍摄场景图成本降低,郭佑萌在图书出版行业提升效率,影楼可进行换装等操作,文旅文创场景有有趣的合影生成方式,还提到该工作流岗位稀缺且社区有课程可供学习。 AJ 介绍平台资源,包括共学课程、专栏报告、数据等,还提及就业创业及一些企业专栏的内容。
2025-02-28