Navigate to WaytoAGI Wiki →

小互日报-2 月 15 日

·2024-02-15·#news
小互日报-2 月 15 日

1⃣️

? ConsiStory:无需额外训练的连续一致图像生成工具。

  • 根据多个文本提示生成一致主题与布局多样的图像系列。
  • 类似于一键生成一组风格一致的漫画不同场景。
  • 项目及演示:https://consistory-paper.github.io
  • 论文:https://arxiv.org/abs/2402.03286

? https://x.com/xiaohuggg/status/1758131675094274089?s=20

2⃣️

? Vicarious:创新的腹部手术机器人。

  • 通过1.5厘米小切口完成手术,减少伤害和恢复时间。
  • 28个传感器装备的机器人手臂模仿医生上半身动作,提供360度3D视野。
  • 官网:http://vicarioussurgical.com

? https://x.com/xiaohuggg/status/1758062271409053935?s=20

3⃣️

? 美国专利商标局(USPTO):AI不能作为专利发明者。

  • 明确只有真人可申请专利,强调人类创造性和智慧的重要性。
  • 提供AI在发明过程中的角色示例,明确什么情况下的发明可获专利资格。

? https://edition.cnn.com/2024/02/14/tech/billions-in-ai-patents-get-new-regulations/index.html

? https://x.com/xiaohuggg/status/1758056275219567020?s=20

4⃣️

? Lumos:端到端多模态问答系统。

  • 利用STR技术从复杂场景图像中准确提取文本。
  • 整合图像理解与语言处理,准确回答基于图像的查询。
  • 论文:https://arxiv.org/abs/2402.08017

? https://x.com/xiaohuggg/status/1758028721486021055?s=20

5⃣️

? GeneGPT:NCBI开发的生物医学专业知识处理工具。

  • 改进大语言模型对生物医学知识的处理能力。
  • 支持基因组DNA比对、蛋白编码基因识别等任务。
  • 论文:https://arxiv.org/abs/2304.09667
  • GitHub:https://github.com/ncbi/GeneGPT

? https://x.com/xiaohuggg/status/1758012243529330923?s=20

6⃣️

?? FaceFusion 2.3.0:高精度面部识别技术更新。

  • 68点面部标记模型提升口型同步效果。
  • 优化算法处理面部边缘,增强稳定性和准确性。
  • 68点转5点简化模型,提高面部识别效率。
  • GitHub:https://github.com/facefusion/facefusion

? https://x.com/xiaohuggg/status/1757998515308106186?s=20

7⃣️

?️ WhisperKit v0.2:让Whisper运行在Apple Watch。

  • 更高效,资源占用更少,优化语音识别处理。
  • GitHub:https://github.com/argmaxinc/WhisperKit
  • 模型:https://huggingface.co/argmaxinc/whisperkit-coreml

? https://x.com/xiaohuggg/status/1757955251293082061?s=20

news
相关推荐