川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据,第1张

概述前言本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。以下文章源于萝卜大杂烩作者:周萝卜Python爬虫、数据分析、网站开发等案例教程视频免费在线观看https://space.bilibili.com/523606542数据简单处理数据数据纽约 前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

以下文章源于萝卜大杂烩

作者:周萝卜

Python爬虫、数据分析、网站开发等案例教程视频免费在线观看

https://space.bilibili.com/523606542

数据简单处理

数据数据纽约时报,由于正常情况下我们无法访问该网站,所以数据的提取过程就不展示了,总之我们得到了一份如下数据,由于某些空值和重复值,我们进行简单的处理
纽约时报数据

 

import pandas as pddf = pd.read_csv('trump.csv')df.drop_duplicates(inplace=True)df.fillna('unkown',inplace=True)df['date']=pd.to_datetime(df['date'])df['year'] = df['date'].dt.year

我们最终得到的数据如下

 

数据分析

被攻击最多

首先我们看下,是谁被川神攻击的最多

from pyecharts.charts import bar,Map,line,Page,Scatterfrom pyecharts import options as optsfrom pyecharts.globals import SymbolType,themeTypefrom pyecharts.charts import GrIDresult = df['target'].value_counts()[:10].sort_values()x_data = result.index.toList()y_data = result.values.toList()b = (bar()     .add_xaxis(x_data)     .add_yaxis('',y_data)     .set_global_opts(Title_opts = opts.TitleOpts(Title='被侮辱次数前十'))     .set_serIEs_opts(label_opts=opts.LabelOpts(is_show=True,position='right'))     .reversal_axis())grID = GrID(init_opts=opts.Initopts(theme=themeType.VINTAGE))grID.add(b, grID_opts=opts.GrIDOpts(pos_left="20%"))grID.render_notebook()

 

 

可以看到,the-media是被攻击最多的,当然了,这有可能是媒体的统称,毕竟川神的攻击,可都是无差异攻击啊

而高居第二的就是民主dang,嗯,攻击zhengdi是提升自己的最好方式!

当然榜单里也少不了Joe BIDen呀,绝对的“生死”对头

媒体情况

作为被diss最多的第三方,我们来看看media的情况
不同年份,川神diss的情况

result = df[df['target'] == 'the-media']result1 = result.groupby('year').year.count()x_data = result1.index.toList()y_data = result1.values.toList()b = (    bar(init_opts=opts.Initopts(theme=themeType.VINTAGE))    .add_xaxis(xaxis_data=x_data)    .add_yaxis(        '',        y_data,        label_opts=opts.LabelOpts(is_show=True),    )    .set_global_opts(Title_opts = opts.TitleOpts(Title='侮辱the-media推特数量的变化')))b.render_notebook()

 

 

可以看到2019年和2020年是川神疯狂diss the media的时候,真的是怼天怼地啊尤其是2019年,竟然有361次,这是每天怼一次也不为过啊

再来看看怼媒体的时候,都用了某种侮辱

from wordcloud import WordCloud,StopWORDSimport matplotlib.pyplot as pltfrom imageio import imread# result = df[df['target'] == 'the-media']media_text = " ".join(df[df.target=="the-media"].insult)mask = imread('1.jpg')wordcloud = WordCloud(background_@R_419_6004@ = 'white',mask=mask,wIDth=1200,height=1200).generate(media_text)plt.figure(figsize=(16,8))plt.imshow(wordcloud)plt.axis("off")plt.show()

 

 

再来看看怼Joe BIDen的情况

 

 

每年侮辱推特数量

接下来是每年侮辱性推特的发布数量

result1 = df.groupby('year').year.count()x_data = result1.index.toList()y_data = result1.values.toList()b = (    bar(init_opts=opts.Initopts(theme=themeType.VINTAGE))    .add_xaxis(xaxis_data=x_data)    .add_yaxis(        '',        y_data,        label_opts=opts.LabelOpts(is_show=True),    )    .set_global_opts(Title_opts = opts.TitleOpts(Title='侮辱推特数量的变化')))b.render_notebook()

 

 

真的是勤奋啊,一年发了上千的欺诈性推特,尤其是近两年时间,都发了两千多推特,真的是推特治国呀!

每天发推特数量

发推特数量日期前前十

 

数量最多的一天,发了45条,真是疯狂啊,这是把推特当成笔记来用了吗?

再来看下发推特数量前三中,分别都是diss某种

2020-10-12

 

Joe BIDen绝对是被针对的第一人,一天骂了14次,哈哈哈

2020-10-07

 

2020-09-02

 

此处,求Joe BIDen的心理阴影面积

最后我们再看几个词云,看看川神的癖好

diss目标词云

 

diss用语词云

 

diss Joe BIDen用语词云

总结

以上是内存溢出为你收集整理的川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据全部内容,希望文章能够帮你解决川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://www.outofmemory.cn/langs/1189436.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存