Python检查EDGvsDK第11次决赛,并告诉你如何玩EDG。
来源:http://www.tudoupe.com时间:2021-11-12
我们是冠军,伙计们,EDG是S11全球冠军!
世界上没有不可征服的高地 只有骑士拒绝退缩!
我在比赛前的心理期望很低 我一直在想 EDG能赢一局 两轮血 第五局结束

整个游戏引起了整个互联网的好奇心:
微博是最受欢迎的热搜索,有8 119万观众;
Bilibili平台吸引了3 500万人,并装满了显示器;
有600万人在录像中看到。
捕鱼和乳房平台也很受欢迎。
在比赛后, EDG 团队也通过媒体推文受到祝贺。
竞争激烈,大家都怎么说?
我们利用Python分析3100个包含观众祝福和情感的屏幕数据点。

最初,我们查看B站的热名单,然后检查网页,以确定评论数据的位置。

目标获取
我们的目标是EDG。我们是冠军视频的600+审查员。
![]()

网页分析
最初,我们发现了下列F12审查数据。
发现我们通过的所有评论 都存放在一个不稳定的json档案里
这是不寻常的,因为有 一串jQuerys在前面 和一个在后面。
实际内容是一套json数据集。


![]()
发送请求
在我们接收浏览器页眉信息之前, 我们需要先获取单页数据 。 这将防止网站在接收浏览器页眉信息前 重新爬回来, 我们需要先获取单页数据 。 这将防止网站再爬回来 。

![]()
正如我们预计的那样,我们获得的数据是非常规的json,我们随后将其转变为传统的json。

我们有一个标准的json数据收集, 我们将从它接收我们的审查数据。
届时将获得以下信息:评论员、性别、时间、赞扬和评论的数量。
数据存储
我们需要清理数据并显示它, 所以我们用开盘的pyxl 将它保存在Excel。
我认为这是过时的;毕竟,我们曾经将数据保存在Excel上。
直接看代码
效果如下:
![]()

多页获取
我们只有一页数据,然后我们评估无数页的数据。你一般如何分析这些数据?
我只是要收集一帮骨髓灰质炎 并比较趋势。




规律如下:

我们发现了这个图案, 所以我们正在建立一个多页链接, 我们会得到它100页。
在Excel中,成功保存了100页数据,具体如下:

![]()
数据预处理
我们先清理我们的评论中的数据
刷新页面,然后随机选择五个数据点显示。
词频展示
根据我们的审查数据,前10个高频字如下:
对于可视化、大比例图、树图、饼图、亮点表和直线图,单独使用。




![]()

词云展示
之后,我们用时尚圆球来创造几种词云。

![]()


一. 本文介绍如何使用Python从B站获取评论信息,并保存处理数据供最后显示。
有兴趣自己练习的读者可以自己练习。
二. 本文件专供读者阅读,不应用于任何其他目的!
上一篇:" 表面 " 一词的起源是什么?
下一篇:invalidmand
相关新闻
- 2023-05-07 小白u盘启动盘软件下载(u盘启动盘
- 2023-05-07 u盘启动盘里的iso文件需要解压(is
- 2023-05-07 k555lu盘启动盘(u盘启动盘怎么进入
- 2023-05-07 u盘启动盘cmos(U盘启动盘装系统)
- 2023-05-07 电脑pe制作u盘启动盘(微pe制作u盘启
- 2023-05-07 u盘启动盘改ntfs格式化吗(u盘格式化
- 2023-05-07 深度装机大师恢复u盘启动盘(深度装
- 2023-05-07 win7系统制作到u盘启动盘(如何制作
- 2023-05-06 u盘启动盘制作工具efi(U盘启动盘制
- 2023-05-06 u盘启动盘修复win7系统(如何用u盘启
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
