Presentamos Inferencia asíncrona de Amazon SageMaker, una nueva opción de inferencia para cargas de trabajo con tamaños de carga grandes y tiempos de procesado de inferencia largos

Presentamos Inferencia asíncrona de Amazon SageMaker, una nueva opción de inferencia para cargas de trabajo con tamaños de carga grandes y tiempos de procesado de inferencia largos

Presentamos Inferencia asíncrona de Amazon SageMaker, una nueva opción de inferencia de Amazon SageMaker que pone en cola solicitudes entrantes y las procesa de forma asíncrona. Esta opción es ideal para inferencias con tamaños de carga grandes (hasta 1 GB) y/o tiempos de procesado largos (hasta 15 minutos) que necesitan procesarse a medida que llegan las solicitudes. Inferencia asíncrona le permite ahorrar en costos al escalar de manera automática el contador de instancias a cero cuando no hay solicitudes que procesar, de modo que solo paga cuando su punto de enlace está procesando solicitudes.

About The Author

No Comments

Leave a Reply