个人博客

记录工作中的点点滴滴


  • 首页

  • 标签

  • 分类

  • 归档

  • 关于

  • 搜索

爬取干货集中营的图片

发表于 2019-12-31 | 更新于: 2019-12-31 | 分类于 Python
| 字数统计: 718 字 | 阅读时长 ≈ 3 分钟

网站地址

http://gank.io/

分析网站

网站地址:https://gank.io/, 要爬取的是网站首页上展示出来的图片

阅读全文 »

爬取美图录网站图片

发表于 2019-12-31 | 更新于: 2019-12-31 | 分类于 Python
| 字数统计: 2.4k 字 | 阅读时长 ≈ 10 分钟

网站地址

https://www.meitulu.com/

分析该网站

1. 打开网站地址后,查看网站右侧导航菜单,目标是提取出爬取网站图片所需的链接地址,这些链接地址最好是包含整个网站的链接地址。

阅读全文 »

多任务_进程

发表于 2019-12-31 | 更新于: 2019-12-31 | 分类于 Python
| 字数统计: 3.4k 字 | 阅读时长 ≈ 13 分钟

进程以及状态

进程

程序:例如xxx.py这是程序,是一个静态的
进程:一个程序运行起来后,代码+用到的资源 称之为进程,它是操作系统分配资源的基本单元。
不仅可以通过线程完成多任务,进程也是可以的

进程的状态

工作中,任务数往往大于cpu的核数,即一定有一些任务正在执行,而另外一些任务在等待cpu进行执行,因此导致了有了不同的状态

阅读全文 »

多任务_线程

发表于 2019-12-31 | 更新于: 2019-12-31 | 分类于 Python
| 字数统计: 4.5k 字 | 阅读时长 ≈ 18 分钟

多任务的概念

简单地说,就是操作系统可以同时运行多个任务。

现在,多核CPU已经非常普及了,但是,即使过去的单核CPU,也可以执行多任务。由于CPU执行代码都是顺序执行的,那么,单核CPU是怎么执行多任务的呢?

答案就是操作系统轮流让各个任务交替执行,任务1执行0.01秒,切换到任务2,任务2执行0.01秒,再切换到任务3,执行0.01秒……这样反复执行下去。表面上看,每个任务都是交替执行的,但是,由于CPU的执行速度实在是太快了,我们感觉就像所有任务都在同时执行一样。

真正的并行执行多任务只能在多核CPU上实现,但是,由于任务数量远远多于CPU的核心数量,所以,操作系统也会自动把很多任务轮流调度到每个核心上执行。

注意:

  • 并发:指的是任务数多于cpu核数,通过操作系统的各种任务调度算法,实现用多个任务“一起”执行(实际上总有一些任务不在执行,因为切换任务的速度相当快,看上去一起执行而已)
  • 并行:指的是任务数小于等于cpu核数,即任务真的是一起执行的

线程

python的thread模块是比较底层的模块,python的threading模块是对thread做了一些包装的,可以更加方便的被使用

使用threading模块

单线程执行

1
2
3
4
5
6
7
8
9
10
#coding=utf-8
import time

def saySorry():
print("亲爱的,我错了,我能吃饭了吗?")
time.sleep(1)

if __name__ == "__main__":
for i in range(5):
saySorry()
阅读全文 »

多任务_协程

发表于 2019-12-31 | 更新于: 2019-12-31 | 分类于 Python
| 字数统计: 6k 字 | 阅读时长 ≈ 25 分钟

迭代器

迭代是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。

1. 可迭代对象

我们已经知道可以对list、tuple、str等类型的数据使用for…in…的循环语法从其中依次拿到数据进行使用,我们把这样的过程称为遍历,也叫迭代。

但是,是否所有的数据类型都可以放到for…in…的语句中,然后让for…in…每次从中取出一条数据供我们使用,即供我们迭代吗?

阅读全文 »
1…192021…29
永夜初晗凝碧天

永夜初晗凝碧天

Linux,Python,MySQL,ELK Stack,K8S,Docker

141 日志
55 分类
60 标签
RSS
QQ E-Mail
友情链接
  • 博客园
  • 百度
近期文章
  • Elasticsearch IK 分词器
  • 为Elasticsearch启动https访问
  • FastAPI框架入门 基本使用, 模版渲染, form表单数据交互, 上传文件, 静态文件配置
  • Elasticsearch:使用_update_by_query更新文档
  • Solutions:安全的APM服务器访问
© 2019 — 2020 永夜初晗凝碧天
博客全站字数统计 : 412.1k 字 ||载入天数...载入时分秒...
本文总阅读量次 || 本站访客数人次 || 本站总访问量次