博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python学习笔记——Web服务器-并发服务器2
阅读量:4218 次
发布时间:2019-05-26

本文共 14566 字,大约阅读时间需要 48 分钟。

目录


Web静态服务器-5-非堵塞模式

单进程非堵塞 模型

#coding=utf-8from socket import *import time# 用来存储所有的新链接的socketg_socket_list = list()def main():    server_socket = socket(AF_INET, SOCK_STREAM)    server_socket.setsockopt(SOL_SOCKET, SO_REUSEADDR  , 1)    server_socket.bind(('', 7890))    server_socket.listen(128)    # 将套接字设置为非堵塞    # 设置为非堵塞后,如果accept时,恰巧没有客户端connect,那么accept会    # 产生一个异常,所以需要try来进行处理    server_socket.setblocking(False)    while True:        # 用来测试        time.sleep(0.5)        try:            newClientInfo = server_socket.accept()        except Exception as result:            pass        else:            print("一个新的客户端到来:%s" % str(newClientInfo))            newClientInfo[0].setblocking(False)  # 设置为非堵塞            g_socket_list.append(newClientInfo)        for client_socket, client_addr in g_socket_list:            try:                recvData = client_socket.recv(1024)                if recvData:                    print('recv[%s]:%s' % (str(client_addr), recvData))                else:                    print('[%s]客户端已经关闭' % str(client_addr))                    client_socket.close()                    g_socket_list.remove((client_socket,client_addr))            except Exception as result:                pass        print(g_socket_list)  # for testif __name__ == '__main__':    main()

web静态服务器-单进程非堵塞

import timeimport socketimport sysimport reclass WSGIServer(object):    """定义一个WSGI服务器的类"""    def __init__(self, port, documents_root):        # 1. 创建套接字        self.server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)        # 2. 绑定本地信息        self.server_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)        self.server_socket.bind(("", port))        # 3. 变为监听套接字        self.server_socket.listen(128)        self.server_socket.setblocking(False)        self.client_socket_list = list()        self.documents_root = documents_root    def run_forever(self):        """运行服务器"""        # 等待对方链接        while True:            # time.sleep(0.5)  # for test            try:                new_socket, new_addr = self.server_socket.accept()            except Exception as ret:                print("-----1----", ret)  # for test            else:                new_socket.setblocking(False)                self.client_socket_list.append(new_socket)            for client_socket in self.client_socket_list:                try:                    request = client_socket.recv(1024).decode('utf-8')                except Exception as ret:                    print("------2----", ret)  # for test                else:                    if request:                        self.deal_with_request(request, client_socket)                    else:                        client_socket.close()                        self.client_socket_list.remove(client_socket)            print(self.client_socket_list)    def deal_with_request(self, request, client_socket):        """为这个浏览器服务器"""        if not request:            return        request_lines = request.splitlines()        for i, line in enumerate(request_lines):            print(i, line)        # 提取请求的文件(index.html)        # GET /a/b/c/d/e/index.html HTTP/1.1        ret = re.match(r"([^/]*)([^ ]+)", request_lines[0])        if ret:            print("正则提取数据:", ret.group(1))            print("正则提取数据:", ret.group(2))            file_name = ret.group(2)            if file_name == "/":                file_name = "/index.html"        # 读取文件数据        try:            f = open(self.documents_root+file_name, "rb")        except:            response_body = "file not found, 请输入正确的url"            response_header = "HTTP/1.1 404 not found\r\n"            response_header += "Content-Type: text/html; charset=utf-8\r\n"            response_header += "Content-Length: %d\r\n" % (len(response_body))            response_header += "\r\n"            # 将header返回给浏览器            client_socket.send(response_header.encode('utf-8'))            # 将body返回给浏览器            client_socket.send(response_body.encode("utf-8"))        else:            content = f.read()            f.close()            response_body = content            response_header = "HTTP/1.1 200 OK\r\n"            response_header += "Content-Length: %d\r\n" % (len(response_body))            response_header += "\r\n"            # 将header返回给浏览器            client_socket.send( response_header.encode('utf-8') + response_body)# 设置服务器服务静态资源时的路径DOCUMENTS_ROOT = "./html"def main():    """控制web服务器整体"""    # python3 xxxx.py 7890    if len(sys.argv) == 2:        port = sys.argv[1]        if port.isdigit():            port = int(port)    else:        print("运行方式如: python3 xxx.py 7890")        return    print("http服务器使用的port:%s" % port)    http_server = WSGIServer(port, DOCUMENTS_ROOT)    http_server.run_forever()if __name__ == "__main__":    main()

Web静态服务器-6-epoll

IO 多路复用

就是我们说的select,poll,epoll,有些地方也称这种IO方式为event driven IO。

select/epoll的好处就在于单个process就可以同时处理多个网络连接的IO。

它的基本原理就是select,poll,epoll这个function会不断的轮询所负责的所有socket,当某个socket有数据到达了,就通知用户进程。

epoll简单模型

import socketimport select# 创建套接字s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)# 设置可以重复使用绑定的信息s.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR,1)# 绑定本机信息s.bind(("",7788))# 变为被动s.listen(10)# 创建一个epoll对象epoll = select.epoll()# 测试,用来打印套接字对应的文件描述符# print(s.fileno())# print(select.EPOLLIN|select.EPOLLET)# 注册事件到epoll中# epoll.register(fd[, eventmask])# 注意,如果fd已经注册过,则会发生异常# 将创建的套接字添加到epoll的事件监听中epoll.register(s.fileno(), select.EPOLLIN|select.EPOLLET)connections = {}addresses = {}# 循环等待客户端的到来或者对方发送数据while True:    # epoll 进行 fd 扫描的地方 -- 未指定超时时间则为阻塞等待    epoll_list = epoll.poll()    # 对事件进行判断    for fd, events in epoll_list:        # print fd        # print events        # 如果是socket创建的套接字被激活        if fd == s.fileno():            new_socket, new_addr = s.accept()            print('有新的客户端到来%s' % str(new_addr))            # 将 conn 和 addr 信息分别保存起来            connections[new_socket.fileno()] = new_socket            addresses[new_socket.fileno()] = new_addr            # 向 epoll 中注册 新socket 的 可读 事件            epoll.register(new_socket.fileno(), select.EPOLLIN|select.EPOLLET)        # 如果是客户端发送数据        elif events == select.EPOLLIN:            # 从激活 fd 上接收            recvData = connections[fd].recv(1024).decode("utf-8")            if recvData:                print('recv:%s' % recvData)            else:                # 从 epoll 中移除该 连接 fd                epoll.unregister(fd)                # server 侧主动关闭该 连接 fd                connections[fd].close()                print("%s---offline---" % str(addresses[fd]))                del connections[fd]                del addresses[fd]

说明

  • EPOLLIN (可读)
  • EPOLLOUT (可写)
  • EPOLLET (ET模式)

epoll对文件描述符的操作有两种模式:LT(level trigger)和ET(edge trigger)。LT模式是默认模式,LT模式与ET模式的区别如下:

LT模式:当epoll检测到描述符事件发生并将此事件通知应用程序,应用程序可以不立即处理该事件。下次调用epoll时,会再次响应应用程序并通知此事件。ET模式:当epoll检测到描述符事件发生并将此事件通知应用程序,应用程序必须立即处理该事件。如果不处理,下次调用epoll时,不会再次响应应用程序并通知此事件。

web静态服务器-epool

以下代码,支持http的长连接,即使用了Content-Length

import socketimport timeimport sysimport reimport selectclass WSGIServer(object):    """定义一个WSGI服务器的类"""    def __init__(self, port, documents_root):        # 1. 创建套接字        self.server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)        # 2. 绑定本地信息        self.server_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)        self.server_socket.bind(("", port))        # 3. 变为监听套接字        self.server_socket.listen(128)        self.documents_root = documents_root        # 创建epoll对象        self.epoll = select.epoll()        # 将tcp服务器套接字加入到epoll中进行监听        self.epoll.register(self.server_socket.fileno(), select.EPOLLIN|select.EPOLLET)        # 创建添加的fd对应的套接字        self.fd_socket = dict()    def run_forever(self):        """运行服务器"""        # 等待对方链接        while True:            # epoll 进行 fd 扫描的地方 -- 未指定超时时间则为阻塞等待            epoll_list = self.epoll.poll()            # 对事件进行判断            for fd, event in epoll_list:                # 如果是服务器套接字可以收数据,那么意味着可以进行accept                if fd == self.server_socket.fileno():                    new_socket, new_addr = self.server_socket.accept()                    # 向 epoll 中注册 连接 socket 的 可读 事件                    self.epoll.register(new_socket.fileno(), select.EPOLLIN | select.EPOLLET)                    # 记录这个信息                    self.fd_socket[new_socket.fileno()] = new_socket                # 接收到数据                elif event == select.EPOLLIN:                    request = self.fd_socket[fd].recv(1024).decode("utf-8")                    if request:                        self.deal_with_request(request, self.fd_socket[fd])                    else:                        # 在epoll中注销客户端的信息                        self.epoll.unregister(fd)                        # 关闭客户端的文件句柄                        self.fd_socket[fd].close()                        # 在字典中删除与已关闭客户端相关的信息                        del self.fd_socket[fd]    def deal_with_request(self, request, client_socket):        """为这个浏览器服务器"""        if not request:            return        request_lines = request.splitlines()        for i, line in enumerate(request_lines):            print(i, line)        # 提取请求的文件(index.html)        # GET /a/b/c/d/e/index.html HTTP/1.1        ret = re.match(r"([^/]*)([^ ]+)", request_lines[0])        if ret:            print("正则提取数据:", ret.group(1))            print("正则提取数据:", ret.group(2))            file_name = ret.group(2)            if file_name == "/":                file_name = "/index.html"        # 读取文件数据        try:            f = open(self.documents_root+file_name, "rb")        except:            response_body = "file not found, 请输入正确的url"            response_header = "HTTP/1.1 404 not found\r\n"            response_header += "Content-Type: text/html; charset=utf-8\r\n"            response_header += "Content-Length: %d\r\n" % len(response_body)            response_header += "\r\n"            # 将header返回给浏览器            client_socket.send(response_header.encode('utf-8'))            # 将body返回给浏览器            client_socket.send(response_body.encode("utf-8"))        else:            content = f.read()            f.close()            response_body = content            response_header = "HTTP/1.1 200 OK\r\n"            response_header += "Content-Length: %d\r\n" % len(response_body)            response_header += "\r\n"            # 将数据返回给浏览器            client_socket.send(response_header.encode("utf-8")+response_body)# 设置服务器服务静态资源时的路径DOCUMENTS_ROOT = "./html"def main():    """控制web服务器整体"""    # python3 xxxx.py 7890    if len(sys.argv) == 2:        port = sys.argv[1]        if port.isdigit():            port = int(port)    else:        print("运行方式如: python3 xxx.py 7890")        return    print("http服务器使用的port:%s" % port)    http_server = WSGIServer(port, DOCUMENTS_ROOT)    http_server.run_forever()if __name__ == "__main__":    main()

小总结

I/O 多路复用的特点:

通过一种机制使一个进程能同时等待多个文件描述符,而这些文件描述符(套接字描述符)其中的任意一个进入读就绪状态,epoll()函数就可以返回。 所以, IO多路复用,本质上不会有并发的功能,因为任何时候还是只有一个进程或线程进行工作,它之所以能提高效率是因为select\epoll 把进来的socket放到他们的 '监视' 列表里面,当任何socket有可读可写数据立马处理,那如果select\epoll 手里同时检测着很多socket, 一有动静马上返回给进程处理,总比一个一个socket过来,阻塞等待,处理高效率。

当然也可以多线程/多进程方式,一个连接过来开一个进程/线程处理,这样消耗的内存和进程切换页会耗掉更多的系统资源。 所以我们可以结合IO多路复用和多进程/多线程 来高性能并发,IO复用负责提高接受socket的通知效率,收到请求后,交给进程池/线程池来处理逻辑。

参考资料

  • 如果想了解下epoll在Linux中的实现过程可以参考:

Web静态服务器-7-gevent版

from gevent import monkeyimport geventimport socketimport sysimport remonkey.patch_all()class WSGIServer(object):    """定义一个WSGI服务器的类"""    def __init__(self, port, documents_root):        # 1. 创建套接字        self.server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)        # 2. 绑定本地信息        self.server_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)        self.server_socket.bind(("", port))        # 3. 变为监听套接字        self.server_socket.listen(128)        self.documents_root = documents_root    def run_forever(self):        """运行服务器"""        # 等待对方链接        while True:            new_socket, new_addr = self.server_socket.accept()            gevent.spawn(self.deal_with_request, new_socket)  # 创建一个协程准备运行它    def deal_with_request(self, client_socket):        """为这个浏览器服务器"""        while True:            # 接收数据            request = client_socket.recv(1024).decode('utf-8')            # print(gevent.getcurrent())            # print(request)            # 当浏览器接收完数据后,会自动调用close进行关闭,因此当其关闭时,web也要关闭这个套接字            if not request:                new_socket.close()                break            request_lines = request.splitlines()            for i, line in enumerate(request_lines):                print(i, line)            # 提取请求的文件(index.html)            # GET /a/b/c/d/e/index.html HTTP/1.1            ret = re.match(r"([^/]*)([^ ]+)", request_lines[0])            if ret:                print("正则提取数据:", ret.group(1))                print("正则提取数据:", ret.group(2))                file_name = ret.group(2)                if file_name == "/":                    file_name = "/index.html"            file_path_name = self.documents_root + file_name            try:                f = open(file_path_name, "rb")            except:                # 如果不能打开这个文件,那么意味着没有这个资源,没有资源 那么也得需要告诉浏览器 一些数据才行                # 404                response_body = "没有你需要的文件......".encode("utf-8")                response_headers = "HTTP/1.1 404 not found\r\n"                response_headers += "Content-Type:text/html;charset=utf-8\r\n"                response_headers += "Content-Length:%d\r\n" % len(response_body)                response_headers += "\r\n"                send_data = response_headers.encode("utf-8") + response_body                client_socket.send(send_data)            else:                content = f.read()                f.close()                # 响应的body信息                response_body = content                # 响应头信息                response_headers = "HTTP/1.1 200 OK\r\n"                response_headers += "Content-Type:text/html;charset=utf-8\r\n"                response_headers += "Content-Length:%d\r\n" % len(response_body)                response_headers += "\r\n"                send_data = response_headers.encode("utf-8") + response_body                client_socket.send(send_data)# 设置服务器服务静态资源时的路径DOCUMENTS_ROOT = "./html"def main():    """控制web服务器整体"""    # python3 xxxx.py 7890    if len(sys.argv) == 2:        port = sys.argv[1]        if port.isdigit():            port = int(port)    else:        print("运行方式如: python3 xxx.py 7890")        return    print("http服务器使用的port:%s" % port)    http_server = WSGIServer(port, DOCUMENTS_ROOT")    http_server.run_forever()if __name__ == "__main__":    main()

 

知识扩展-C10K问题

参考文章 :

《单台服务器并发TCP连接数到底可以有多少》 

《上一个10年,著名的C10K并发连接问题》 

转载地址:http://wdxmi.baihongyu.com/

你可能感兴趣的文章
游戏设计的艺术:一本透镜的书——第十二章 游戏机制支撑谜题
查看>>
游戏设计的艺术:一本透镜的书——第十三章 玩家通过界面玩游戏
查看>>
编写苹果游戏中心应用程序(翻译 1.3 为iOS应用程序设置游戏中心)
查看>>
编写苹果游戏中心应用程序(翻译 1.4 添加游戏工具包框架)
查看>>
编写苹果游戏中心应用程序(翻译 1.5 在游戏中心验证本地玩家)
查看>>
编写苹果游戏中心应用程序(翻译 1.6 获取本地玩家的信息)
查看>>
编写苹果游戏中心应用程序(翻译 1.7 在游戏中心添加朋友)
查看>>
编写苹果游戏中心应用程序(翻译 1.8 获取本地玩家的好友信息)
查看>>
WebGL自学教程《OpenGL ES 2.0编程指南》翻译——勘误表
查看>>
WebGL自学教程——WebGL示例:12. 要有光
查看>>
WebGL自学教程——WebGL示例:13.0 代码整理
查看>>
WebGL自学教程——WebGL示例:14.0 代码整理
查看>>
恶心的社会
查看>>
中国式危机公关9加1策略(第五章 慎用信息控制策略)
查看>>
展现自己的人生智慧
查看>>
深入理解java多态性
查看>>
Java新手进阶:细说引用类型
查看>>
osg中使用MatrixTransform来实现模型的平移/旋转/缩放
查看>>
(一) Qt Model/View 的简单说明
查看>>
(二)使用预定义模型 QStringListModel例子
查看>>