ecosyste.ms

Repos

An open API service providing repository metadata for many open source software ecosystems.

GitHub topics: large-model-inference

Repositories

aws-samples/amazon-sagemaker-llama2-response-streaming-recipes

Amazon SageMaker Llama 2 Inference via Response Streaming

Language: Jupyter Notebook - Size: 565 KB - Last synced at: 7 days ago - Pushed at: 11 months ago - Stars: 13 - Forks: 4

windson/inferentia-deployments

Deploy Large Models on AWS Inferentia (Inf2) instances.

Language: Jupyter Notebook - Size: 28.3 KB - Last synced at: about 1 year ago - Pushed at: over 1 year ago - Stars: 0 - Forks: 0

Related Keywords

large-model-inference 2 large-language-models 1 llama2 1 response-streaming 1 sagemaker 1 sagemaker-endpoint 1 text-generation-inference 1 aws 1 aws-inferentia 1 inf2 1 inferentia 1 inferentia-2 1 large-language-model 1 large-model 1 llm 1 lmi 1