# Amvera LLM Inference Общая доступность LLM планируется 15 июля 2025 года. Мы предлагаем вам несколько больших языковых моделей в одном месте через наш публичный API. ## Аутентификация Чтобы использовать Amvera LLM Inference API, необходимо пройти аутентификацию: Для этого в ЛК, нужно зайти в любую модель в разделе LLM, и скопировать токен доступа. Затем, при обращении к моделе, укажите токен доступа в заголовке ```X-Auth-Token``` в следующем формате: [```X-Auth-Token: Bearer ```] ## API #### Доступные модели 1. **`llama8b`** — модель с 8 миллиардами параметров, оптимизированная для эффективной обработки текста. 2. **`llama70b`** — модель с 70 миллиардами параметров, обеспечивающая более высокое качество генерации и обработки текста. #### Конечная точка модели Для отправки запросов к моделям используйте следующую конечную точку: `POST /yandex-foundation-models` Эта конечная точка позволяет отправлять запросы к выбранной модели. В зависимости от ваших нужд, в теле запроса можно выбрать одну из доступных моделей (`llama8b` или `llama70b`). #### Пример запроса/ответа: Request: ```json { "model": "llama8b", "messages": [ { "role": "user", "text": "Hi, how are you?" } ] }