代理ip

>

换ip软件

>

http代理

>

ip代理

您的位置:首页 > 新闻资讯 > 文章内容
HTTP代理服务器的四种架构
来源:网连代理 作者:admin 时间:2019-07-19 16:49:50

  HTTP架构师一般都会使用很多种复杂的机制来将多个子模块组合建成一个HTTP服务。现在的网络爬虫中,已经形成了4种最基本的模式。如果已经编写了用于生成动态内容的网络爬虫Python代码,并且已经选择了某个支持WSGI的API或框架,应该如何将HTTP服务部署到线上呢?下面我们来了解一下HTTP代理服务器的四种架构。


HTTP代理服务器的四种架构


  第一步、运行一个使用网络爬虫Python编写的服务器,服务器的代码中可以直接调用WSGI接口。现在最流行的是Green Unicorn(Gunicorn)服务器,不过也有其他已经可以用于生产环境的纯Python服务器。


  第二步、配置mod_wsgi并运行Apache,在一个独立的WSFIDaemonProcess中运行Python代码,由mod_wsgi启动守护进程。


  第三步、在后端运行一个类似于Gunicorn的Python HTTP服务器(或者支持所选异步框架的任何服务器),然后在前端运行一个既能返回静态文件,又能对Python编写的动态资源服务进行反向代理的Web服务器。


  第四部、在最前端运行一个纯粹的反向代理(如Varnish),在该反向代理后端运行Apache或者nginx,在后端运行Python编写的HTTP服务器。这是一个三层的架构。这些反向代理可以分布在不同的地理位置,这样子就能够将离客户端最近的反向代理上的缓存资源返回给发送请求的客户端。


  长期以来,对这4个架构的选择主要基于CPython的3个运行时的特性,即解释器占用内存大、解释器运行慢、全局解释器(GIL,Global Interpreter Lock)禁止多个线程同时运行Python字节码。但同时带来了内存中只能载入一定数量的Python实例。


  智游代理ip提供HTTP代理、HTTPS代理、Socks5代理等,智游代理是一家专业的企业级高质量代理IP供应平台,真实高匿名IP代理软件,千万IP库存量自动去重!欢迎大家免费注册领取试用IP。


相关文章内容简介
推荐阅读
  • 29 2019-09
    动态IP代理爬取网站都是哪些爬虫

    动态IP代理爬取网站都是哪些爬虫?在写爬虫程序的时候,当抓取频率较快或者抓取一些robots.txt禁爬路径,肯定会碰到被网站屏蔽的情况,这时候目标服务器要么直接返回404,要么就是返回禁止

  • 20 2019-11
    怎样使用HTTP代理IP进行注册?

    怎样使用HTTP代理IP进行注册?当我们访问某网站,查看或者进行某项业务时,往往会被提示先注册登录,基本一个IP地址只能注册一个账号。对于每天有大量注册业务的网友来说,需要大量的HTTP

  • 10 2019-08
    代理IP为什么速度慢

    网络发展迅速,很多人在工作和生活遇到要换IP的情况,需求增大,代理IP也越来越多。很多人不知道该怎么选择,还有很多用户选择后用的代理IP并不合心。那么,代理IP为什么速度慢?特别对

  • 18 2020-02
    代理服务器都有哪些用途

    代理服务器是什么?跟我们主机使用的服务器是不是一样的?代理服务器有什么功能呢?简单来说,代理服务器是一个第三方一样的存在,下面网连代理让大家认识一下代理服务器的作用。

  • 23 2019-08
    HTTP代理IP有什么作用

    对于经常接触网络的小伙伴来说,IP想必是大家十分熟悉的一个词汇。但是你真的对HTTP代理IP了解吗?今天小编来简单普及一下关于HTTP代理IP的相关小常识,让大家更明确的知晓它的用途。所谓I

  • 09 2019-02