Релиз Dataherald для работы с SQL на естественном языке
2026-02-21 17:53 Diff

Онлайн-журнал для тех, кто влюблён в код и информационные технологии. Пишем для айтишников и об айтишниках.

Dataherald представила одноимённый ИИ-инструмент для работы с SQL с помощью естественного языка. Он поддерживает работу с популярными базами данных — PostgreSQL, BigQuery, Snowflake и Databricks.

Dataherald — это движок перевода естественного языка в SQL-запросы, работающий с помощью искусственного интеллекта. Компания разработала его, так как не смогла получить хороших результатов по работе с базами данных от существующих LLM-моделей, включая GPT-4.

Пример запроса к базе данных с ответом в виде текста и визуализации
Изображение: Dataherald

Текущая версия Dataherald позволяет работать с PostgreSQL, Databricks, BigQuery или Snowflake и настраивать API для взаимодействия с хранилищами структурированных данных. После первичной настройки можно задать дополнительный контекст об используемых данных и продукте, над которым работает компания. Это позволит повысить точность текстовых подсказок Dataherald и выводов на основе данных.

Но это не всё. Компания отмечает несколько фич нового продукта.

Dataherald построен на модульной архитектуре. В него отдельно интегрирована одна из лучших моделей для перевода естественного языка в SQL-запросы, агент для оценки точности SQL на основе LLM и другие модули. Их можно заменять или добавлять новые при необходимости.

В продукте реализовано контекстное хранилище, которое хранит ранее введённую информацию для LLM. Например, описание таблиц, примеры перевода запросов с естественного языка на SQL и другие данные. Благодаря этому движок становится быстрее при каждом использовании.

Исходный код Dataherald опубликован на GitHub, а документация — на сайте компании. Его уже можно интегрировать в свои проекты.