一、大作业要求
结合所选专业方向(信息处理、嵌入式、人工智能、大数据处理),用所学Python技术设计并实现一个与专业方向技术相关的、功能完整的系统,并撰写总结报告。
- 图形界面、
- 多线程、
- 文件 *** 作、
- 数据库编程、
- 网页爬虫、
- 异常处理。
A可侧重于应用系统,结合爬虫丰富系统功能,提升用户体验。
B可考虑实现物联网。
C可侧重于爬取网站图片,并进行图形或图像识别。
D可侧重于基于爬虫进行数据采集,并进行数据的统计分析。
爬取图片不少于500张。
采集数据不少于1000条,统计分析的目标不能少于3个。
其中每项均可根据需求进行增添或删减。
二、设计方案
1、设计了虎牙主页的爬虫,包括直播间封面、主播名、人气、直播间标题、主播id、主播房间号等信息。
另附虎牙直播分类页面进行对比查阅:虎牙直播分类
2、使用python3实现爬取数据,使用sqlite3模块进行数据存储,本地化存储,不需要额外安装数据库软件,但相应的不能可视化 *** 作数据库内容;使用plt模块进行数据的绘图,使用tkinter模块实现界面。3、通过tkinter的绑定事件,实现了单击列名可使列表按字符升序(降序)排列;实现了单击某一主播会在软件主页面更新页面图片,双击时会在浏览器打开该主播的直播间;实现了快捷键绑定,如F5刷新列表,Ctrl+F聚焦搜索框;实现了主播列表里的搜索功能,可通过Ctrl+F快捷键快速搜索;实现了单击页面图片可在浏览器跳转到对应主播的直播间
三、软件支持
- Windows 10 *** 作系统(理论上对Windows版本无要求)
- Visual Studio 2022 Community(2017发行版及以上)
- Python3开发环境(笔者本人版本号为3.9.5)
四、作业实现成果
运行代码前需要更改图中所示的变量,确保路径有效,文件存在,否则运行会报错。
代码及文件:代码及附件
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)