Navigate to WaytoAGI Wiki →

小互日报-1 月 3 日

·2024-01-03·#news
小互日报-1 月 3 日

? Xiaohu.AI日报「1月3日」

✨✨✨✨✨✨✨✨

1⃣️ ? 微软研究团队的新进展:

  • 微软利用合成数据训练AI,减少成本和偏见。
  • 生成了100种语言的文本数据,提高AI训练效率。
  • 论文链接:https://arxiv.org/abs/2401.00368 ? https://x.com/xiaohuggg/status/1742473942252855795?s=20

https://assets.waytoagi.com/usercontent/1280_X1280_1_6d89c0eb37.PNG

2⃣️ ? Pile:AI日记软件介绍:

  • 开源界面美观,助力日记撰写和记录。
  • 集成OpenAI API,扩展思想和日记。
  • AI搜索和问题解答功能,保证安全隐私。
  • 下载链接:https://udara.io/pile/
  • 项目源码:https://github.com/UdaraJay/Pile ? https://x.com/xiaohuggg/status/1742427654006202439?s=20

3⃣️ ? VCoder:视觉编码器增强模型:

  • 增强LLM的视觉理解和分析能力。
  • 处理分割图和深度图,改善对象感知。
  • 在对象识别任务中表现优于GPT-4V。
  • 项目链接:https://praeclarumjj3.github.io/vcoder/
  • 代码库:https://github.com/SHI-Labs/VCoder ? https://x.com/xiaohuggg/status/1742410353198416282?s=20

https://assets.waytoagi.com/usercontent/1280_X1280_2_c23141f1fc.PNG

4⃣️ ? M2UGen:多模态音乐理解生成模型:

  • 理解音乐风格、乐器、情感,进行音乐问答。
  • 根据文本、图像、视频生成音乐。
  • 编辑音乐仅需文字描述。
  • 该模型由腾讯与新加坡国立大学开发 ? https://x.com/xiaohuggg/status/1742392202482061509?s=20

https://assets.waytoagi.com/usercontent/1280_X1280_3_81733152d3.PNG

5⃣️ ?️ DreamTalk:人物头像动画生成开源了

  • 使人物照片头像根据音频说话或唱歌。
  • 保持嘴型和表情一致。
  • 代码库:https://github.com/ali-vilab/dreamtalk ? https://x.com/xiaohuggg/status/1742382786990969226?s=20

https://assets.waytoagi.com/usercontent/1280_X1280_4_2ff8b9b84b.PNG

6⃣️ ? SVG-Loaders:纯SVG格式加载图标和动画:

  • 免费下载,适用于网页和应用。
  • 高质量、多样设计,易于使用和自定义。 ?https://x.com/xiaohuggg/status/1742377903818711044?s=20

7️⃣

? Mickey-1928:专注米老鼠图像生成模型:

https://assets.waytoagi.com/usercontent/bae84d62_e2f5_4600_b8d0_2dd85b01b198_8b36665069.png

news
相关推荐