1⃣️
? Google MusicFX的DJ打碟模式:
- 允许用户选择多个音乐风格生成音乐。
- 可调整风格强度控制节奏和曲调。
- 实现类似DJ的音乐编辑生成。
? https://aitestkitchen.withgoogle.com/tools/music-fx?isMusicFxLive=true
? https://x.com/xiaohuggg/status/1762825532650172472?s=20
https://assets.waytoagi.com/usercontent/X2_Twitter_com_1p6z_Qw3_Qv7uc20kf_834p_06de8e596d.mp4
2⃣️
? AutoPrompt的提示优化框架:
- 设计用于优化提示词,自动生成定制化提示。
- 解决敏感性和模糊性问题,提升提示质量。
- 通过迭代构建挑战性数据集,理解用户意图。
? https://x.com/xiaohuggg/status/1762786980721832233?s=20
https://assets.waytoagi.com/usercontent/X2_Twitter_com_1762786293388574720_720p_905102f9ce.mp4
3⃣️
? EMO动态视频生成技术:
- 通过照片和音频生成动态视频。
- 视频长度与音频匹配,表情非常到位。
- 支持任意语音、速度、图像。
? https://humanaigc.github.io/emote-portrait-alive/
? https://arxiv.org/abs/2402.17485
? https://x.com/xiaohuggg/status/1762726320008823186?s=20
https://assets.waytoagi.com/usercontent/X2_Twitter_com_1762725882450571264_720p_f58e0ff19c.mp4
4⃣️
? ChatMusician音乐生成模型:
- 理解和生成结构完整、风格多样的音乐。
- 使用ABC符号,让模型“阅读”和“写作”音乐。
- 结合了文本和音乐的表示方式。
? https://shanghaicannon.github.io/ChatMusician/
? https://arxiv.org/abs/2402.16153
? https://x.com/xiaohuggg/status/1762698955249569941?s=20
https://assets.waytoagi.com/usercontent/X2_Twitter_com_1762463444970942464_720p_34a0414f71.mp4
5⃣️
?️ GPT生成器的“历史记录”功能:
- 新增“版本历史记录”按钮,防止Prompt丢失。
- 允许恢复到自定义GPT的任意先前版本。
? https://x.com/xiaohuggg/status/1762659489273299313?s=20

6⃣️
? X的语音和视频通话功能全面开放:
- 今天开始向所有用户开放语音视频通话。
- 马斯克宣布未来只能通过X联系他。
? https://x.com/xiaohuggg/status/1762658710403657732?s=20

7⃣️
? Playground v2.5文本到图像模型:
- 显著提升图像美学质量,包括颜色和对比度。
- 改进多纵横比图像生成和人像细节。
- 性能大幅超越其他主流模型。
? https://playground.com/blog/playground-v2-5
? http://playground.com
? https://x.com/xiaohuggg/status/1762649962113114458?s=20
https://assets.waytoagi.com/usercontent/X2_Twitter_com_o5le2c_W_Cjllc2h_H_720p_f646198227.mp4
8⃣️
? Pika的Lip Sync唇部同步功能:
- 通过语音或文字同步生成视频中的嘴部动画。
? https://x.com/xiaohuggg/status/1762614742198403507?s=20
https://assets.waytoagi.com/usercontent/X2_Twitter_com_ECXS_Yt_Ze_X_Ew_Uoh_I_720p_be7884e3fc.mp4






