本文的標(biāo)題是《可視化 | 如何制作“文字云”(Words Cloud)效果呢?》來(lái)源于:由作者:陳開(kāi)啟采編而成,主要講述了“ 想起來(lái)2018年已過(guò)去近半,想起來(lái)年初總結(jié)挖下的坑還基本沒(méi)填,現(xiàn)在開(kāi)始第一
“ 想起來(lái)2018年已過(guò)去近半,想起來(lái)年初總結(jié)挖下的坑還基本沒(méi)填,現(xiàn)在開(kāi)始第一更,目標(biāo)是先把去年的坑填完吧。”
什么是文字云呢?它的英文其實(shí)是words cloud,是可視化的一種表現(xiàn)形式,一般用來(lái)直觀(guān)展示大段文字中詞語(yǔ)出現(xiàn)的頻率。
那其實(shí)涉及到兩個(gè)問(wèn)題,一個(gè)是一大段的文字怎么分成相對(duì)**的一個(gè)個(gè)單詞?另一個(gè)是如何統(tǒng)計(jì)每個(gè)詞語(yǔ)出現(xiàn)的頻率并依據(jù)頻率來(lái)可視化呈現(xiàn)?
先說(shuō)結(jié)論:
文字云可視化:https://wordart.com
在線(xiàn)分詞:http://www.78901.net/participle/
01 文字云可視化
其實(shí)有很多在線(xiàn)的網(wǎng)站可以實(shí)現(xiàn)“文字云”的效果,最初接觸的時(shí)候我用的是tagxedo這個(gè)網(wǎng)站(http://www.tagxedo.com/app.html),大概在2013年左右,最初還不需要**就可以登上,特點(diǎn)是支持中文,但現(xiàn)在這個(gè)網(wǎng)站需要科學(xué)上網(wǎng)才能使用,所以不推薦再用。
下面是之前用tagxedo做的一些案例:
比如摳圖后結(jié)合項(xiàng)目理念用來(lái)作為封面——
比如利用關(guān)鍵詞做成鳥(niǎo)瞰圖的襯底做封面——
沒(méi)有tagxedo后其實(shí)有更好的選擇,就是上面提到的wordart網(wǎng)站(完整網(wǎng)址是:https://wordart.com),可以直接訪(fǎng)問(wèn),不需要**。
制作步驟也很簡(jiǎn)單,跟tagxedo的邏輯是一樣的,頁(yè)面左側(cè)分為words、shapes、fonts、layout和style,右側(cè)是文字云生成界面,基本上就是“插入文字——可視化——自定義樣式”三步。
words——插入需要生成為文字云的文字,值得提醒的是wordart網(wǎng)站支持導(dǎo)入csv格式的文件,那么有什么優(yōu)勢(shì)呢?這樣說(shuō)吧,excel格式的表格xls最大支持6553行,xlsx最大支持1048576行,而csv格式其實(shí)和txt一樣,是屬于純文本文件,是沒(méi)有行數(shù)限制的。
shapes——不用多說(shuō),支持添加自定義的形狀文件,建議做成黑白對(duì)比的png圖導(dǎo)入。
fonts——字體,如果要生成中文的話(huà)需要自己上傳中文字體,不然默認(rèn)都是英文字體,導(dǎo)入中文是生成不了的。
layout——輸出,建議導(dǎo)出png格式。
style——主題樣式,可以選擇各種配色,多試兩次就能了解。
02 中文分詞
為什么要分詞呢?
其實(shí)也很好理解,不分詞的話(huà)全都是一段一段的話(huà),無(wú)法統(tǒng)計(jì)單個(gè)詞語(yǔ)出現(xiàn)的頻率,分詞就是為了更好地統(tǒng)計(jì)不同的詞語(yǔ)。
在線(xiàn)分詞網(wǎng)站其實(shí)不止http://www.78901.net/participle/,之外還有很多很多,基本上都大同小異,輸入一段文本后會(huì)自動(dòng)生成分詞完的結(jié)果。
導(dǎo)入到wordart網(wǎng)站的words里面后可以看到各個(gè)詞語(yǔ)的詞頻。
然后會(huì)自動(dòng)根據(jù)詞頻生成文字云的效果,如下:
其實(shí)**作上不需要講太多,網(wǎng)上也很多教程,我覺(jué)得更重要的是摸索一些應(yīng)用方向,現(xiàn)在多集中在:?jiǎn)柧碚{(diào)查中主觀(guān)題目的可視化展示、封面或?qū)n}圖的制作這兩個(gè)方面,但我認(rèn)為應(yīng)該能夠有更多發(fā)揮的空間。
比如可以通過(guò)網(wǎng)絡(luò)爬取類(lèi)似大眾點(diǎn)評(píng)的店鋪點(diǎn)評(píng)數(shù)據(jù),將其存儲(chǔ)成csv格式文件導(dǎo)入并迅速生成該店鋪的評(píng)論文字云,可以很直觀(guān)地體現(xiàn)出點(diǎn)評(píng)的關(guān)注點(diǎn)集中在哪里。
更多的是需要發(fā)揮自己的想象力。
暫時(shí)介紹到這里,希望能夠幫助到需要的人,以上。
P.S.小小期待下端午節(jié)的十年城規(guī)聚會(huì)。
歡迎關(guān)注公眾號(hào):平紙雜貨鋪
本文原作者為陳開(kāi)啟,轉(zhuǎn)載請(qǐng)注明:出處!如該文有不妥之處,請(qǐng)聯(lián)系站長(zhǎng)刪除,謝謝合作~
原創(chuàng)文章,作者:陳開(kāi)啟,如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.uuuxu.com/20220512316187.html