习惯了一个人面对所有
码龄7年
求更新 关注
提问 私信
  • 博客:77,129
    社区:477
    77,606
    总访问量
  • 48
    原创
  • 17
    粉丝
  • 23
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:重庆市
加入CSDN时间: 2019-09-15
博客简介:

习惯一个人面对所有

博客描述:
习惯一个人面对所有风雨
查看详细资料
个人成就
  • 获得25次点赞
  • 内容获得15次评论
  • 获得123次收藏
  • 代码片获得396次分享
  • 博客总排名1,420,036名
创作历程
  • 35篇
    2020年
  • 13篇
    2019年
成就勋章
TA的专栏
  • hadoop
    10篇
  • 爬虫
    10篇
  • python
    4篇
  • 数据可视化
    13篇
  • mongodb
    9篇
  • spark
    1篇
  • 常见的电脑问题
    1篇
  • 数据清洗
    3篇

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 4

TA参与的活动 0

兴趣领域 设置
  • 大数据
    hadoop
创作活动更多

「谁说嵌入式只是调包和焊板子?」—— 2026嵌入式全栈技术征锋令

谁说嵌入式只会“Ctrl+C 调包”和“拿电烙铁焊板子”?2026嵌入式全栈技术征锋令正式启幕! 本次活动专为硬核硬件/软件开发者打造,无论你是刚玩转裸机外设的萌新,还是精通RTOS调度、死磕底层驱动的行业老手,亦或是执掌系统架构的大神,这里都是你证明实力的舞台! 拒绝表面功夫,每一行代码,都有撬动硬件的力量!晒出你的硬核工程实战,为嵌入式开发者的全栈硬实力正名!

213人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

爬虫基本库的使用.pdf

发布资源 2020.09.06 ·
pdf

爬虫数据提取.pdf

发布资源 2020.09.16 ·
pdf

多线程爬取王者荣耀壁纸

发布资源 2020.09.18 ·
zip

gsww.zip|古诗文网爬取代码

发布资源 2020.10.07 ·
zip

Linux系统JDK配置

配置文件 ~/.bash_profile 配置内容 export JAVA_HOME=/usr/java/jdk1.8.0_161 export PATH=JAVAHOME/bin:JAVA_HOME/bin:JAVAH​OME/bin:PATH 检验是否配置好:查一下Java版本 java -version ...
原创
博文更新于 2020.11.11 ·
139 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

使用scrapy爬取古诗文网的前十页数据

内容简介使用scrapy爬取古诗文网的前十页数据创建scrapy框架设置scrapy项目写爬虫类设置爬取的内容保存数据标题设置多页爬取(在gsww_spider.py里面设置) 使用scrapy爬取古诗文网的前十页数据 创建scrapy框架 使用cmd创建一个爬虫项目 scrapy startproject gsww #创建新项目 然后进入目录中,创建spider cd gsww scrapy genspider gsww_spider www.gushiwen.cn 设置scrapy项目 在s
原创
博文更新于 2020.10.07 ·
1535 阅读 ·
0 点赞 ·
0 评论 ·
23 收藏

12306抢票一(登录)

12306抢票一(登录) 找到登录的页面,由于账号密码登录比较麻烦就直接扫码登录所以要先找到登录页面的url,利用selenium进行登录。 在实战中一般要先把框架给搭好,好后面添加代码。为了代码得简洁,可读性较高,所以整个过程在一个类中实现,类中又定义了不同的函数来实现不同的功能 搭框架:有一个执行的入口,有一个主函数可以调用定义的类。 class TrainSpider(object): def __init__(self, *args, **kwargs) pass def run(self
原创
博文更新于 2020.09.22 ·
552 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

09爬取段子作业.py

发布资源 2020.09.20 ·
py

多线程爬取段子

使用多线程爬取段子 请求网页响应获取源码 由于使用多线程代码比较多,所以定义一个采集类 class CrawlThread(threading.Thread): def __init__(self, name, url_queue, data_queue): super(CrawlThread, self).__init__() self.name = name self.url_queue = url_queue self.data_
原创
博文更新于 2020.09.20 ·
266 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

多线程爬取王者荣耀游戏壁纸

多线程爬取王者荣耀游戏壁纸 https://pvp.qq.com/web201605/wallpaper.shtml 王者荣耀游戏壁纸的下载页面 右键检查 但是在网页源代码里找不到壁纸的链接 这个文件是还需要进行一个解码操作,再提取壁纸的下载链接 进行多线程爬虫时, 把生产者和消费者各自创建一个类 这个类要继承threading.Thread类 还要写入run方法, 类中需要传入参数需要重写父类的__init__()方法 使用队列需要定义用到的队列 1.定义生产者类 class Producer
原创
博文更新于 2020.09.18 ·
969 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

使用navicate11连接mysql8报错的解决方法

使用navicate11连接mysql8报错的解决方法 使用navicate11连接mysql8,报错1251的错误 1251- Client does not support authentication protocol requested by server consider upgrading MySQL client 网上查找原因发现是mysql8 之前的版本中加密规则是mysql_native_password,而在mysql8之后,加密规则是caching_sha2_password, 解决
原创
博文更新于 2020.09.16 ·
1575 阅读 ·
2 点赞 ·
0 评论 ·
5 收藏

爬取快代理的ip地址

爬取快代理的ip地址 导入必备的库包 import requests from bs4 import BeautifulSoup 准备url地址 url = 'https://www.kuaidaili.com/free/inha/{}/' 请求网页响应 data = requests.get(url, headers=headers) 使用Beautifulsoup解析网页并提取内容 data = requests.get(url, headers=headers) html =
原创
博文更新于 2020.09.13 ·
519 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

scrapy 小项目——爬取豆瓣排行榜250

scrapy startproject douban #创建一个新的项目 scrapy genspider Top250 douban.com #创建爬虫 打开items.py,在DoubanItem中添加属性
原创
博文更新于 2020.06.23 ·
317 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

from sklearn.linear_model import RandomizedLogisticRegression as RLR导入报错

遇到的问题:from sklearn.linear_model import RandomizedLogisticRegression as RLR导入报错 from sklearn.linear_model import RandomizedLogisticRegression as RLR ImportError: cannot import name ‘RandomizedLogisticRegression’ from ‘sklearn.linear_model’ (D:\anaconda\li
原创
博文更新于 2020.06.19 ·
7121 阅读 ·
8 点赞 ·
10 评论 ·
16 收藏

爬取博客的发帖信息保存在csv文件中

使用xpath爬取我的博客的发帖信息并保存在csv文件中 #! /usr/bin/env python # -*- coding:utf8 -*- import requests import csv from lxml import etree url = 'https://blog.csdn.net/qiaoenshi' headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWeb
原创
博文更新于 2020.06.11 ·
303 阅读 ·
1 点赞 ·
1 评论 ·
0 收藏

pyecharts数据可视化应用

内容简介pyecharts的应用绘制树图绘制矩形树图绘制散点图矩阵绘制地图,标出销售数据绘制地理热点图绘制词云图绘制主题河流图 pyecharts的应用 绘制树图 from pyecharts.charts import Tree, TreeMap import pyecharts.options as opts from pyecharts.globals import ThemeType import json #导入json模块 with open('lianxi.json', 'r', enc
原创
博文更新于 2020.06.10 ·
817 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

爬虫偷懒小插件——Katalon Recorder

简介Katalon Recorder——火狐浏览器中的小插件下载插件使用插件 Katalon Recorder——火狐浏览器中的小插件 此处附上一个莫烦python的教学视频有操作介绍:[https://morvanzhou.github.io/tutorials/data-manipulation/scraping/5-01-selenium/ 下载插件 打开火狐浏览器 如下图,点击附加组件 然后,进入插件页面下载安装即可 使用插件 打开插件 点击Record,开始录制 录制完成后,点击stop
原创
博文更新于 2020.06.06 ·
1177 阅读 ·
2 点赞 ·
0 评论 ·
3 收藏

pyecharts在数据可视化中的应用

内容简介pycharts在数据可视化中的应用使用pychats需要导入的几个必要的库包折线图阶梯图堆叠柱状图极坐标系堆积柱状图 pycharts在数据可视化中的应用 附上pyecharts中文文档链接http://pyecharts.org/#/zh-cn/intro 使用pychats需要导入的几个必要的库包 #从pyecharts.charts导入绘制图表的类型 from pyecharts.charts import Line, Bar , Pie, Polar from pyecharts.rend
原创
博文更新于 2020.06.05 ·
1193 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏

pycharm和numpy不匹配

pycharm和numpy不匹配 报错信息 ImportError: Importing the multiarray numpy extension module failed. Most likely you are trying to import a failed build of numpy. If you're working with a numpy git repo, try ...
原创
博文更新于 2020.05.05 ·
1759 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

两种limit和skip的比较

查询中limit、skip的顺序不影响结果 db.movie.find().limit(2).skip(2) db.movie.find().skip(2).limit(2) #顺序不一样不影响结果 管道操作中limit、skip的顺序影响结果 db.movie.aggregate([{$skip:5},{$limit:2}]) db.movie.aggregate([{$limit...
原创
博文更新于 2020.04.22 ·
562 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多