以下是关于生成词云的相关信息:
【Zho】简单测试了一下DragNUWA的ComfyUI插件:DragNUWA效果非常好,可控的SVD就是最牛逼的,生成时间比普通的SVD慢一点但不多,对此插件来说,唯一麻烦的是路径绘制需要用一个单独的网页工具,然后将数据手动复制到节点中,项目地址:https://github.com/chaojie/ComfyUI-DragNUWA[15607_1705079697.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/GY4SbjiOIoVI3wxlAHtcucfjnQb?allow_redirect=1)[heading2]1月12日WordCloud[content]【Zho】发现一个好玩的ComfyUI新项目:WordCloud,可以结合图像生成来创造主题词云,非常有趣!项目地址:https://github.com/chflame163/ComfyUI_WordCloud工作流:如下另外,需要注意wordcloud节点的mask输入只接受RGBA的图像,所以要不采用抠图节点,要不使用AlphaChanelAddByMask将RGB变成RGBA(Allor套装或我自己的Text_Image-Composite里都有)[WordCloud_T2I【Zho】.json](https://bytedance.feishu.cn/space/api/box/stream/download/all/VxSJbOPXmoUwiYxhZiDcq3ixnCg?allow_redirect=1)[heading2]1月12日谷歌版的IPA[content]谷歌版的IPA:文本及时对齐PALP https://arxiv.org/pdf/2401.06105.pdf
【Zho】简单测试了一下DragNUWA的ComfyUI插件:DragNUWA效果非常好,可控的SVD就是最牛逼的,生成时间比普通的SVD慢一点但不多,对此插件来说,唯一麻烦的是路径绘制需要用一个单独的网页工具,然后将数据手动复制到节点中,项目地址:https://github.com/chaojie/ComfyUI-DragNUWA[15607_1705079697.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/GY4SbjiOIoVI3wxlAHtcucfjnQb?allow_redirect=1)[heading2]1月12日WordCloud[content]【Zho】发现一个好玩的ComfyUI新项目:WordCloud,可以结合图像生成来创造主题词云,非常有趣!项目地址:https://github.com/chflame163/ComfyUI_WordCloud工作流:如下另外,需要注意wordcloud节点的mask输入只接受RGBA的图像,所以要不采用抠图节点,要不使用AlphaChanelAddByMask将RGB变成RGBA(Allor套装或我自己的Text_Image-Composite里都有)[WordCloud_T2I【Zho】.json](https://bytedance.feishu.cn/space/api/box/stream/download/all/VxSJbOPXmoUwiYxhZiDcq3ixnCg?allow_redirect=1)[heading2]1月12日谷歌版的IPA[content]谷歌版的IPA:文本及时对齐PALP https://arxiv.org/pdf/2401.06105.pdf
我将展示如何使用word2vec生成词嵌入并使用这些嵌入来查找相似词和通过[PCA](https://pyshark.com/principal-component-analysis-in-python/)实现嵌入的可视化。PCA(主成分分析)是一种常用的数据降维算法。它的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征¹。简而言之,PCA的目的是减少数据集中变量的数量,同时保留尽可能多的信息²。[heading2]数据Data[content]为了本教程的目的,我们将使用莎士比亚数据集。您可以在[这里](https://github.com/vatsal220/medium_articles/blob/main/w2v/data/shakespeare.txt)找到我用于本教程的文件,它包括莎士比亚为他的戏剧所写的所有台词。莎士比亚数据集包含了莎士比亚所有的戏剧,角色,台词和幕。每个样本对应一个角色在某个戏剧中连续说的台词。[heading2]要求Requirement[content]nltk==3.6.1 node2vec==0.4.3 pandas==1.2.4 matplotlib==3.3.4 gensim==4.0.1 scikit-learn=0.24.1注意:您需要下载NLTK语料库才能继续本教程。您可以通过以下命令轻松完成下载: