О Базах знаний

Базы знаний
Базы знаний — это файлы большого объема, которые можно загружать в систему и добавлять к чат-ботам и Ассистентам. Рассказываем, какие особенности нужно учитывать при создании Баз знаний и подключении их к нейросотрудникам.
Содержание:

Особенности работы с Базами знаний

  • Вы можете выбрать, куда будет загружаться и где храниться База знаний — в хранилище OpenAI или NeuroSpace, выбрав тип Базы знаний.
  • При загрузке файлы конвертируются в векторные базы данных, за каждой закрепляется свой ID.
  • Базу знаний «OpenAI» нельзя добавить к чат-боту. Если вы хотите это сделать, то создайте Ассистента, добавьте к нему Базу знаний «OpenAI», а затем создайте чат-бота на основе Ассистента. Обратите внимание, что к уже существующему чат-боту ассистента добавить нельзя.
  • Если вы используете тщательно прописанный prompt, в котором чат-бот находит соответствие для ответа, то он может проигнорировать подходящую информацию в Базе знаний. Чтобы уменьшить риск ошибок со стороны нейросотрудника при генерации ответов, постарайтесь составить prompt на минимальный объем, а дополнительную информацию укажите в Базе знаний.

Допустимые форматы

Вы можете загрузить текстовые документы в форматах .doc(-x), .txt, .json, .xml (зависит от типа Базы знаний).

Тип «NeuroSpace»

  • TXT
  • XML
  • DOCX

Тип «OpenAI»

  • DOCX
  • TXT
  • JSON

Ключи

  • Для Базы знаний, так же, как и для чат-бота, нужен ключ, без которого она работать не будет.
  • При создании Базы знаний нужно выбирать тот ключ, который используется чат-ботом или Ассистентом, для которого она предназначена.
  • C ключом NeuroSpace можно создавать только Базы знаний «NeuroSpace». С ключом OpenAI — как «NeuroSpace», так и «OpenAI».
Пробуйте разные форматы и типы Баз знаний. Внимательно отнеситесь к предварительному тестированию, поскольку алгоритмы при обработке вопросов и генерации ответов на основе базы знаний работают несколько нестандартно - не так, как это происходит у обычных чат-ботов.

Типы и отличия

На платформе есть два типа Баз знаний: «NeuroSpace» и «OpenAI». Обе представляют собой векторные базы, однако отличаются принципом обработки файлов и другими возможностями.

Как нейросотрудник обращается к Базе знаний

Если к чат-боту или Ассистенту подключена База знаний, то алгоритм обработки запросов к ней выглядит так:

  1. База знаний делится на чанки (отрезки).
  2. Клиент задает вопрос чат-боту.
  3. Чат-бот преобразовывает вопрос в векторный формат и сопоставляет с промптом и Базой знаний по нужным отрезкам текста и на основе этого генерирует ответ.
При подключении Базы знаний к чат-боту можно указать количество последних сообщений из диалога, которые будут переданы для поиска чанков по базе, а также настроить параметры поиска.

Пример разметки Базы знаний «NeuroSpace»

DOC- и TXT-файлы

Если вы загружаете Базу знаний по типу NeuroSpace в формате TXT или DOCX, для разделения текста на чанки, то есть на смысловые куски текста, перед каждым таким разделом необходимо ставить десять решеток (#).

Например:
XML-файлы

Если вы прикрепляете файл(-ы) или указываете ссылку на файл в формате XML, ниже появится дополнительное поле «Разбивающий тег». Укажите элемент (тег), который разделяет в файле чанки с данными.

Например:
Полезные материалы по теме:

Создать своего нейросотрудника

Создавайте нейросотрудников и интегрируйте в свой бизнес для оптимизации процессов
Свяжитесь с нами
Если у вас возникли вопросы или трудности, свяжитесь с нами любым удобным для вас способом
Эл. почта
Стать партнером
Контакты
Республика Казахстан, г.Алматы,
ул. Ауэзова, д.175, н.п. 9а