Version 2.3.1#

Вышел новый релиз Sherpa AI Server: Version 2.3.1.

1. Object Folders for Models#

A new column with Object Folders (Access Folders) has been added to the Models table on the Models screen.

Now you can specify a folder that a model belongs to.

When creating or editing a model, select the desired folder in the "Access folder" field.

This helps administrators separate access to models and show users only the models that are available within the selected Access Folders.

The change is also available via API v1:

в запросах к моделям добавлено поле object_folder_guid,
в списке моделей можно использовать фильтр filters[object_folder_guids][].

2. Transcription of Stored Audio Files#

The API now supports transcribing audio files that are already uploaded in the Documents screen.

You no longer need to upload the audio file again. If the file is already stored in a folder, it can be submitted for recognition by folder GUID and file GUID:

POST /api/v1/folders/{folder_guid}/files/{file_guid}/transcription

В API прямой транскрибации аудио также обновлен формат запроса: POST /api/v1/audio/transcriptions теперь принимает файл только через multipart/form-data.

The request body may also include the Whisper model and the recognition language.

3. Reindexing Files in Documents #

A "Reindex" button has been added to the file edit dialog on the Documents screen.

If a file needs to be reindexed, an administrator can do this manually. After pressing the button, the file is added to the indexing queue.

Также на экране Документы улучшен предпросмотр файла: появился корректный индикатор загрузки, убрано отображение null и выровнены отступы в диалоге просмотра.

Это помогает быстрее обновлять данные для поиска, если содержимое файла изменилось или предыдущая индексация завершилась некорректно.

4. Using a Reranker to Improve Search #

A reranker option has been added in Chat and Assistant settings to improve document search results.

Если настройка включена, Sherpa AI Server после обычного поиска дополнительно оценивает найденные фрагменты документов и выбирает наиболее подходящие для запроса пользователя. Это помогает Ассистенту точнее использовать документы при подготовке ответа.

Если сервис повторной оценки временно недоступен, Sherpa AI Server продолжит работу без него.

5. Улучшенные результаты поиска по документам в ответах Ассистента #

На экране Чат улучшено отображение фрагментов документов, которые используются при подготовке ответа Ассистента. Теперь Sherpa AI Server сохраняет и показывает фрагменты текста, которые близки по смыслу к запросу пользователя.

Найденные фрагменты документов отображаются рядом с ответом Ассистента. Полный текст фрагмента можно посмотреть во всплывающей подсказке при наведении курсора.

6. Новые методы для работы с системными ошибками#

В API добавлены методы для работы со списком системных ошибок:

GET /api/v1/system_errors

GET /api/v1/system_errors/export/csv

GET /api/v1/system_errors/export/xlsx

GET /api/v1/system_errors/export/{csv|xlsx}

Список поддерживает фильтрацию, сортировку, пагинацию и экспорт до 10 000 строк.

Для администраторов также добавлена скрытая страница /main/errors со списком системных ошибок, просмотром деталей записи и экспортом в CSV или XLSX.

В ответах API исправлена работа метаданных пагинации: служебные метаданные запроса больше не перезаписывают данные о страницах списка.

Это помогает быстрее анализировать ошибки системы без прямого обращения к логам сервера.

7. Улучшенная запись ошибок API и системных исключений #

Sherpa AI Server теперь подробнее сохраняет ошибки API и системные исключения.

В журнал системных ошибок записываются ошибки проверки OpenAPI, HTTP-ошибки Slim, контекст запроса, маршрут, тело запроса, заголовки и трассировка стека. Секретные данные в заголовках и теле запроса маскируются.

Сообщения об ошибках 400 и 500 в интерфейсе стали проще и понятнее для пользователя.

Это помогает администраторам и команде сопровождения быстрее понять причину ошибки и восстановить последовательность событий.

8. Обновленное управление правами доступа#

На экране Роли обновлен диалог создания и редактирования роли.

Теперь если в таблице "Роли" выбрать нужную строку и перейти на окно редактирования, то на вкладке "Доступ" можно найти инструменты для быстрого выбора и снятия прав: можно отметить все права сразу при помощи чекбокса "Выбрать все" или очистить выбранные права чекбоксом "Снять все". Также есть возможность выбрать все права в отдельной строке или столбце.

Это упрощает настройку ролей, если для нее требуется много прав доступа.

9. Улучшения на экране Чат #

В Чате обновлена работа с ответами Ассистента. Ответ теперь может отображаться постепенно, по мере формирования, без ожидания полной готовности текста. Поле ввода сообщения теперь занимает одну строку по умолчанию и увеличивается вверх по мере набора текста, до десяти строк.

Также обновлена панель "Размышления": она встроена в область ответа Ассистента, отображает анимированные точки во время формирования ответа и плавно показывает текст рассуждений.

Технические фрагменты рассуждений больше не попадают в заголовки чатов и сообщения. Быстрые кнопки ответа теперь отображаются отдельным блоком под ответом Ассистента, а не внутри текста сообщения.

Дополнительно улучшена прокрутка: после отправки сообщения Чат перемещает сообщение пользователя к верхней части области переписки, чтобы было удобнее следить за дальнейшим ответом Ассистента.

В API обновлены имена методов выполнения запросов: теперь используются execute_sync и execute_async. Старые варианты написания заменены в маршрутах и документации API.

Метод execute_sync теперь поддерживает параметр stream: true. Если передать этот параметр в запросе, ответ языковой модели возвращается не одним готовым блоком, а постепенно, по мере формирования текста (используется формат ответа text/event-stream).

Также улучшена работа с файлами: файлы загружаются и отправляются на индексацию сразу после прикрепления, а рядом с файлом отображается статус индексации.

Сообщение можно отправить до завершения индексации всех файлов: к запросу будут прикреплены только готовые файлы.

Улучшена работа с вложениями: файлы и папки пользователя и Ассистента корректно отображаются карточками над сообщением, а скачивание вложений использует правильную папку файла.

Также улучшена работа с изображениями: если сообщение содержит и текст, и изображение, Sherpa AI Server корректно передает изображение Ассистенту. При постепенном формировании ответа JPG и другие изображения снова передаются Ассистенту как изображения, а не только как имена файлов.

В Чате с Ассистентом Sherpa AI Server корректно использует модель, системный промпт и температуру, указанные в настройках Ассистента, даже если модель не передана отдельно при создании Чата.

10. Улучшения на экране Ассистенты#

На экране Ассистенты улучшено отображение списка Ассистентов: карточки сохраняют ровные колонки и лучше подстраиваются под размер экрана.

Также улучшено окно редактирования Ассистента: выбранные файлы и папки корректно отображаются после открытия, а элементы выбора недоступны до завершения загрузки данных.

В диалоге создания и редактирования Ассистента скрыта вкладка настройки Telegram-бота.

11. Улучшения на экранах Аккаунты и Пользователи#

На экранах Пользователи и Аккаунты улучшены формы создания: кнопка "OK" становится активной только после заполнения обязательных полей. Также исправлено редактирование существующих записей: неизмененные login и email больше не вызывают ошибку "Login/Email is already in use".

В API Аккаунтов усилена защита корневого аккаунта: для него нельзя изменить параметр can_create_accounts через PUT/PATCH-запросы.

12. Улучшения на экране Лицензии#

На экране Лицензии исправлен импорт лицензий из CSV: файлы без response_code больше не приводят к ошибке обработки.

13. OpenAI-совместимый API для чата#

В API добавлен OpenAI-совместимый метод для чата:

POST /api/v1/threads/chat/completions

Метод поддерживает сообщения, параметры генерации и потоковую передачу ответа.

Также улучшен выбор модели: Sherpa AI Server может автоматически находить экземпляр модели по имени модели в базе данных.

Это упрощает интеграции с внешними системами, которые уже используют OpenAI-совместимый формат запросов.

14. Раздел API и Ключ API#

На экране API обновлена работа с документацией и ключом доступа.

Раздел API разделен на подразделы Swagger, ReDoc и Ключ. В подразделе Ключ в поле Bearer-токена добавлен префикс Authorization: для удобного копирования полного заголовка.

Это помогает интеграторам быстрее находить документацию, проверять методы API и использовать ключ доступа без ручной сборки заголовка.

15. Улучшения пользовательской сессии#

В API улучшена работа пользовательской сессии при долгих операциях. Теперь длительные запросы не блокируют выполнение других параллельных запросов пользователя.

В API сессии GET /api/v1/auth/me возвращаются актуальные данные аккаунта, пользователя и прав доступа.

После входа пользователи с ограниченными правами остаются в интерфейсе Sherpa AI Server: недоступные разделы отображаются как неактивные, а меню обновляется с учетом актуальных прав.

После входа пользователь с правом доступа к Чату автоматически переходит на экран нового чата. Раздел Чат также расположен в боковом меню выше Истории чатов.

Это делает интерфейс отзывчивее, например при долгих операциях с моделями, файлами или внешними сервисами.

16. Model Instance Improvements#

На экране Модели обновлено окно редактирования экземпляра модели.

В таблице "Экземпляры модели" можно выбрать нужную строку и перейти в окно редактирования, где доступен выбор через всплывающий список в поле "Модель провайдера".

Также на экране Модели исправлена работа списка моделей провайдера: при настройке экземпляра модели список доступных моделей корректно открывается в интерфейсе. Улучшена проверка подключения экземпляра модели.

Это помогает администратору быстрее выбрать нужную модель провайдера.

17. LDAP and Connection Settings#

В настройках LDAP добавлен параметр времени ожидания подключения. Теперь администратор может задать его через переменную окружения LDAP_TIMEOUT. По умолчанию используется значение 5 секунд.

Также улучшена работа с защищенным подключением LDAPS и обработка ошибок при поиске пользователей. Если поиск или подключение к LDAP завершается ошибкой, Sherpa AI Server фиксирует более понятную техническую причину проблемы.

В LDAP улучшен список пользователей для импорта: логин отображается без префикса домена. При создании Аккаунта список LDAP-пользователей загружается только после выбора типа "LDAP".

Это помогает быстрее находить ошибки в настройках LDAP, например недоступный сервер, слишком долгий ответ каталога или проблему с подключением через LDAPS.

18. Code Interpreter Mode Improvements#

Улучшенная работа с файлами в режиме интерпретатора кода.

Выбранные файлы корректно отображаются перед отправкой, не очищаются при переключении режима, а список поддерживаемых расширений расширен. Также перед удалением файла теперь появляется подтверждение.

19. Docker Image Update for Python Code Execution#

В поставку добавлена автоматическая сборка Docker-образа, который используется для выполнения Python-кода в режиме интерпретатора кода.

Администратор может заранее собрать или скачать готовый Docker-образ, перенести его в закрытый контур и установить без доступа к интернету.

Это упрощает работу с Sherpa AI Server в изолированных средах.

20. Updated Installation Scenarios#

В документации по установке добавлен рекомендуемый способ запуска Sherpa AI Server через install.sh. Также уточнены профили запуска, порты nginx и состав базовых сервисов.

Это помогает администраторам быстрее выбрать подходящий вариант установки под свою инфраструктуру.