1⃣️
?Large World Model (LWM) 探索:
- 介绍了百万Token的通用世界大模型,旨在理解长视频和超长文本。
- LWM在100万个令牌的上下文中超越GPT-4V和Gemini Pro的检索精度。
- 特色能力包括长视频理解、高精度事实检索和多格式内容生成。
? https://largeworldmodel.github.io
? https://github.com/LargeWorldModel/LWM
? https://x.com/xiaohuggg/status/1759566391693504940?s=20
https://assets.waytoagi.com/usercontent/X2_Twitter_com_1759564834239373312_746p_d84bcc36b5.mp4
2⃣️
⚡世界上最快的大型语言模型(LLM)
- Mixtral 8X7B 500 token/s的输出速度
- Llama 2 7B的速度是750 tokens/s
- 速度快但准确性有待提高。
? http://groq.com
? http://wow.groq.com
? https://x.com/xiaohuggg/status/1759457147962941852?s=20
https://assets.waytoagi.com/usercontent/X2_Twitter_com_1759455624101081088_720p_15b85a0db2.mp4
3⃣️
?Reddit用户自制GLIGEN GUI:
- 由于缺少直观的GUI,一个Reddit大佬自己动手制作了一个。
- 用户可以自定义图像中对象的大小、位置和空间关系。
- 强调了用户对生成图像细节的控制能力。
? https://github.com/mut-ex/gligen-gui
? https://gligen.github.io
? https://x.com/xiaohuggg/status/1759431911951450437?s=20
https://assets.waytoagi.com/usercontent/X2_Twitter_com_1759431013225336832_720p_edcb29277d.mp4
4⃣️
?马斯克揭示特斯拉视频生成技术:
- 马斯克展示了特斯拉一年前掌握的生成真实世界视频技术。
- 讨论了特斯拉和OpenAI在视频生成领域的努力及成果。
- 特斯拉生成视频的独特之处在于其“动态生成世界”的能力。
? https://x.com/xiaohuggg/status/1759420372355805430?s=20
https://assets.waytoagi.com/usercontent/X2_Twitt_d7dda0f1fa.mp4
5⃣️
?ChatCell:单细胞分析的自然语言界面:
- ChatCell通过自然语言简化单细胞分析过程,无需编程或专业知识。
- 支持细胞类型注释、药物敏感性预测等多种分析任务。
- 强调了单细胞生物学的研究重要性和挑战。
? https://zjukg.org/project/ChatCell/
? https://arxiv.org/abs/2402.08303
? https://x.com/xiaohuggg/status/1759413341909598348?s=20
https://assets.waytoagi.com/usercontent/X2_Twitter_com_G_Gqv7a_Zak_AA_Fy_Le_gif_5668c855eb.mp4






