为什么Celery Async Task的工作速度比同步任务慢?

时间:2019-04-02 03:18:07

标签: django redis django-celery

我正在开发一个使用Celery异步运行某些任务的Django应用程序。我尝试使用Apache Bench执行负载测试并检查响应时间。从结果可以看出,没有celery异步任务,响应时间会更快。

我正在使用:

  • Django:2.1.0
  • 芹菜:4.2.1
  • Redis(经纪人):2.10.5
  • django-redis:4.9.0
  • Django settings.py中的Celery配置:

    BROKER_URL = 'redis://127.0.0.1:6379/1'
    CELERY_RESULT_BACKEND = 'django-db' # Using django_celery_results
    CELERY_ACCEPT_CONTENT = ['application/json']
    CELERY_TASK_SERIALIZER = 'json'
    CELERY_RESULT_SERIALIZER = 'json'
    CELERY_TIMEZONE = 'Asia/Kolkata'
    

    以下是我的代码(系统公开的API):

    class CustomerSearch(APIView):
    
        def post(self, request):
            request_dict = {# Request parameters}
            # Async Block
            response = celery_search_customer_task.delay(request_dict)
            response = response.get()
            # Synchronous Block (uncomment following to make synchronous call)
            # api_obj = ApiCall(request=request_dict)
            # response = api_obj.search_customer() # this makes an API call to 
            return Response(response)
    

    tasks.py中的celery任务:

    @app.task(bind=True)
    def celery_search_customer_task(self, req_data={}):
        api_obj = ApiCall(request=req_data)
        response = api_obj.search_customer() # this makes an API call to another system
        return response
    

    Apache Bench命令:

    ab -p req_data.data -T application/x-www-form-urlencoded -l -r -n 10 -c 10 -k -H "Authorization: Token <my_token>" http://<my_host_name>/<api_end_point>/
    

    以下是ab的结果:
    没有芹菜异步任务

    Concurrency Level:      10
    Time taken for tests:   1.264 seconds
    Complete requests:      10
    Failed requests:        0
    Keep-Alive requests:    0
    Total transferred:      3960 bytes
    Total body sent:        3200
    HTML transferred:       1760 bytes
    Requests per second:    7.91 [#/sec] (mean)
    Time per request:       1264.011 [ms] (mean)
    Time per request:       126.401 [ms] (mean, across all concurrent requests)
    Transfer rate:          3.06 [Kbytes/sec] received
                            2.47 kb/s sent
                            5.53 kb/s total
    
    Connection Times (ms)
                  min  mean[+/-sd] median   max
    Connect:      259  270  10.7    266     298
    Processing:   875  928  36.9    955     967
    Waiting:      875  926  35.3    950     962
    Total:       1141 1198  43.4   1224    1263
    
    Percentage of the requests served within a certain time (ms)
      50%   1224
      66%   1225
      75%   1231
      80%   1233
      90%   1263
      95%   1263
      98%   1263
      99%   1263
     100%   1263 (longest request)
    

    使用芹菜异步任务

    Concurrency Level:      10
    Time taken for tests:   10.776 seconds
    Complete requests:      10
    Failed requests:        0
    Keep-Alive requests:    0
    Total transferred:      3960 bytes
    Total body sent:        3200
    HTML transferred:       1760 bytes
    Requests per second:    0.93 [#/sec] (mean)
    Time per request:       10775.688 [ms] (mean)
    Time per request:       1077.569 [ms] (mean, across all concurrent requests)
    Transfer rate:          0.36 [Kbytes/sec] received
                            0.29 kb/s sent
                            0.65 kb/s total
    
    Connection Times (ms)
                  min  mean[+/-sd] median   max
    Connect:      259  271   9.2    268     284
    Processing:  1132 6128 4091.9   8976   10492
    Waiting:     1132 6127 4091.3   8975   10491
    Total:       1397 6399 4099.3   9244   10775
    
    Percentage of the requests served within a certain time (ms)
      50%   9244
      66%   9252
      75%  10188
      80%  10196
      90%  10775
      95%  10775
      98%  10775
      99%  10775
     100%  10775 (longest request)
    

    芹菜异步任务不是应该使任务比同步任务更快地工作吗?我在这里可能会想念什么?

    任何帮助将不胜感激。谢谢。

    2 个答案:

    答案 0 :(得分:2)

    同步运行代码是直接在主线程上阻塞代码,而celery类似于 producer Consumer 机制。 Celery将任务转发到诸如 RabbitMQ Redis 之类的代理消息队列,这在此处增加了额外的处理时间。根据芹菜的运行位置,如果不在本地运行,则可以考虑增加网络延迟。如果您正在呼叫getdelay,则返回一个保证金,该保证金可用于监视状态并在准备就绪时获得结果。 所以架构基本上变成了

    • web

    • 经纪人

    • 工作者
    • 结果后端

    考虑到大量的处理芹菜任务比在主线程上运行慢

    答案 1 :(得分:1)

    我认为您的问题中存在多个误解,应该予以回答。

      

    芹菜异步任务不是应该使任务比同步任务更快地工作吗?

    正如@Yugandhar在回答中指出的那样,通过使用诸如Celery之类的东西,您在处理过程中增加了额外的开销。您实际上不是在执行代码的相同过程,而是在执行以下操作:

    • 客户向经纪人发送消息。
    • 工人拿起消息并执行。
    • 工人对经纪人的回应。
    • 客户端获取响应并进行处理。

    您可以看到,相对于同步执行,使用Celery显然涉及额外的开销。因此,不一定要说“异步任务比同步任务快”。

    然后的问题是,为什么要使用异步任务?如果它增加了额外的开销并可能减慢执行速度,那么它的好处是什么?好处是您无需等待响应!

    让我们以您的ApiCall()为例。假设调用本身需要10秒才能执行。通过同步执行它,意味着您将阻止任何其他操作,直到调用完成。例如,如果您有一个触发此操作的表单提交,则意味着用户必须等待其浏览器加载10秒钟才能获得响应。这是非常糟糕的用户体验。

    通过在后台异步执行它,调用本身可能需要10.01秒才能执行(由于开销而变慢),但是不必等待那些秒过去,您可以(如果选择)立即返回反馈给用户,使用户体验更好。

    等待结果与回调

    您的代码示例的问题在于,同步代码和“异步”代码基本上执行相同的操作。两者都以阻塞的方式等待结果,您并没有真正获得不同步执行结果的好处。

    通过使用.get()方法,您告诉AsyncResult对象等待结果。这意味着它将阻塞(就像您同步执行一样)任何东西,直到C​​elery worker返回响应为止。

    task.delay()        # Async, don't await any response.
    task.delay().get()  # Blocks execution until response is returned.
    

    有时候这就是您想要的,但是在其他情况下,您无需等待响应,可以完成HTTP请求的执行,而使用回调处理您触发的任务的响应。